1. Trang chủ
  2. » Giáo Dục - Đào Tạo

slide thiết kế điều tra chọn mẫu phân tích dữ liệu

67 587 3

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 67
Dung lượng 227,61 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Khái ni m v đi u tra ch n m u ệ ề ề ọ ẫChọn mẫu làm giảm chi phí nghiên cứu; Chọn mẫu đúng cách làm tăng độ chính xác của nghiên cứu; Tăng tốc độ thu thập thông tin dữ liệu; Có những

Trang 1

TS Trần Tiến Khai Khoa Kinh Tế Phát Triển Đại Học Kinh Tế TP.HCM

Trang 2

N i dung ộ

2

Trang 3

1 Các khái ni m c b n ệ ơ ả

Trang 4

Khái ni m v đi u tra ch n m u ệ ề ề ọ ẫ

 Chọn mẫu là việc chọn một số đơn vị trong tổng thể (population), nhằm rút ra các kết luận về tổng thể đó

 Một đơn vị của mẫu là một cá thể hoặc một thành viên mà chúng ta đo lường Đây chính là đơn vị nghiên

cứu

 Một tổng thể là tập hợp của tất cả các đơn vị.

 Điều tra tổng thể (census) là việc đo lường tất cả các đơn vị có trong tổng thể

 Danh sách tất cả các đơn vị có trong tổng thể để giúp chúng ta rút mẫu là Khung mẫu (sample frame).

4

Trang 5

Khái ni m v đi u tra ch n m u ệ ề ề ọ ẫ

Chọn mẫu làm giảm chi phí nghiên cứu;

Chọn mẫu đúng cách làm tăng độ chính xác của nghiên cứu;

Tăng tốc độ thu thập thông tin dữ liệu;

Có những tổng thể mà ta không thể nghiên cứu tổng thể

5

Trang 6

M u nh th nào là t t? ẫ ư ế ố

Tính đúng đắn: mẫu phải đại diện cho tính chất của tổng thể tổng thể hoặc phần lớn các đơn vị có trong tổng thể;

Tính chính xác: không thể có mẫu đại diện cho tổng thể ở tất cả mọi khía cạnh

Do đó, luôn có sai số sinh ra từ việc chọn mẫu (sampling error)

Đo lường tính chính xác bằng chỉ tiêu thống kê sai số chuẩn (standard error of estimate)

6

Trang 7

2 Thi t k đi u tra ch n m u ế ế ề ọ ẫ

Trang 8

Các cân nh c khi l a ch n thi t k ắ ự ọ ế ế

 Tổng thể mục tiêu: gắn tổng thể với mục tiêu nghiên cứu

 Tổng thể nghiên cứu: chứa các đơn vị nghiên cứu nào?

8

Trang 9

Các cân nh c khi l a ch n thi t k ắ ự ọ ế ế

 Bản chất của Tổng thể:

 Phải hiểu rõ về các đặc điểm của tổng thể cần nghiên cứu

 Phải biết tổng thể bao gồm các đơn vị như thế nào (cá nhân, hộ gia đình,

loại khác)

 Phải nắm rõ định hướng nghiên cứu như thế nào, dự định tiến hành và

các điều kiện liên quan

 Có thể có được Khung mẫu hay không?

9

Trang 10

Các cân nh c khi l a ch n thi t k ắ ự ọ ế ế

 Các chỉ tiêu cần nghiên cứu:

 Các chỉ tiêu mô tả các đặc điểm chung của tổng thể;

 Các chỉ tiêu thể hiện các đặc điểm riêng mà ta quan tâm;

 Nên lường trước các dạng dữ liệu của chỉ tiêu (danh nghĩa, thứ bậc,

khoảng cách, tỷ số)

 Nếu tổng thể bao gồm các nhóm phụ riêng biệt, nên định hướng xác định

các dữ liệu danh nghĩa để chia nhóm theo tỷ lệ

10

Trang 11

Các cân nh c khi l a ch n thi t k ắ ự ọ ế ế

 Thiết kế điều tra xác suất hay phi xác suất?

11

Trang 12

Các cân nh c khi l a ch n thi t k ắ ự ọ ế ế

12

XÁC SUẤT PHI XÁC SUẤT

Biết quy mô của tổng thể (N) Không biết quy mô của tổng thể (N)

Tính được xác suất chọn mẫu (n/N) Không tính được xác suất chọn mẫu (n/N)

Chọn mẫu nhằm rút ra kết quả để phỏng đoán cho tổng thể Không cần suy đoán cho tổng thể; Nghiên cứu có mục đích

Chỉ lựa chọn đơn vị nghiên cứu từ khung mẫu Có thể lựa chọn một cách tùy ý

Không thể tùy tiện thay thế đơn vị nghiên cứu Có thể thay đổi nếu thấy phù hợp với mục đích nghiên cứu

Tiến trình chọn mẫu phải được tuân thủ nghiêm túc Có sự linh động trong chọn mẫu

Trang 13

Xác định tổng thể liên quan

Chọn kỹ thuật lấy mẫu Xác định các khung mẫu hiện có

Đánh giá khung mẫu

Trang 14

Các thi t k ch n m u đi u tra ế ế ọ ẫ ề

14

Chọn mẫu xác suất (probability sampling) Chọn mẫu phi xác suất (non-probability sampling)

Chọn mẫu ngẫu nhiên đơn giản (simple random sampling)

Chọn mẫu hệ thống (systematic sampling)

Chọn mẫu phân tầng (stratified sampling)

Chọn mẫu phân nhóm (cluster sampling)

Chọn mẫu hạn ngạch (quota sampling) Chọn mẫu phán đoán (judment sampling)

Chọn mẫu nhiều giai đoạn (multistage sampling)

Chọn mẫu thuận tiện (convienience sampling)

Chọn mẫu quả cầu tuyết (snowball sampling)

Chọn mẫu phân tầng không theo tỷ lệ (dispropotionate stratified

sampling) Chọn mẫu phân tầng theo tỷ lệ (propotionate stratified sampling)

Các kiểu chọn mẫu (Types of sampling design)

Chọn mẫu hạn ngạch theo tỷ lệ (propotionate quota sampling)

Chọn mẫu hạn ngạch không theo tỷ lệ (dispropotionate quota

sampling)

Trang 15

Ch n m u xác su t: ọ ẫ ấ

 Xác định xác suất chọn đơn vị:

 Xác suất chọn lựa = cỡ mẫu (n)/tổng thể (N) (%)

 Lập danh sách (Khung mẫu)

 Chọn ngẫu nhiên theo danh sách

Excel

quan tâm đến đặc trưng chung của tổng thể

15

Trang 16

Mẫu

Trang 17

Ch n m u xác su t: ọ ẫ ấ

 Các nguyên tắc xác định:

 Xác định bước nhảy k

 Bước nhảy = tổng thể (N)/cỡ mẫu (n)

 Lập danh sách (Khung mẫu) chính xác, hoặc có số thứ tự

 Chọn ngẫu nhiên đơn vị khởi đầu

 Chọn các đơn vị kế tiếp bằng bước nhảy k

 Áp dụng: khi tổng thể tương đối đồng nhất; người nghiên

cứu quan tâm đến đặc trưng chung của tổng thể17

Trang 18

Ch n m u xác su t: ọ ẫ ấ

 Các lưu ý để tránh lệch mẫu (bias) :

 Trộn ngẫu nhiên danh sách trong Khung mẫu

 Chọn ngẫu nhiên đơn vị khởi đầu vài lần

 Nếu thực hiện tốt, phương pháp này cho hiệu quả cao hơn phương pháp

ngẫu nhiên đơn giản

18

Trang 21

Ch n m u xác su t: phân t ng ọ ẫ ấ ầ

21

Tổng thể (N)

Mẫu (n)

Trang 22

Ch n m u xác su t: ọ ẫ ấ

 Theo tỷ lệ (proportionate) hay không theo tỷ lệ (disproportionate)?

 Theo tỷ lệ: số mẫu của mỗi nhóm phụ sẽ được quyết định theo tỷ lệ của

tổng thể của mỗi nhóm phụ so với tổng tổng thể

Trang 23

Ch n m u xác su t: ọ ẫ ấ

 Quá trình chọn mẫu phân tầng:

 Chọn các biến (danh nghĩa) để chia nhóm, phân tầng

 Quyết định tỷ lệ của từng nhóm so với tổng thể chung

 Chọn cách lấy mẫu tỷ lệ hay không tỷ lệ

 Xác định các Khung mẫu riêng biệt cho từng nhóm phụ

 Trộn ngẫu nhiên danh sách trong Khung mẫu

 Chọn đơn vị ngẫu nhiên hay hệ thống trong từng nhóm phụ (tầng)

23

Trang 24

Ch n m u xác su t: ọ ẫ ấ

 Tổng mẫu cần là bao nhiêu?

 Tổng mẫu sẽ được phân bố cho từng nhóm phụ như thế nào?

24

Trang 25

Ch n m u xác su t: ọ ẫ ấ

phân nhóm

 Chọn mẫu phân nhóm: chia tổng thể ra các nhóm mang tính đa dạng như

tổng thể chung

 Nhiều nghiên cứu liên quan tới tổng thể được xác định theo khu vực địa lý

hoặc địa giới hành chính

 Cách chia nhóm này phù hợp với các nghiên cứu có tổng thể ở các cấp

quốc gia, tỉnh, thành phố, hoặc như lãnh thổ nhỏ hơn

25

Trang 27

-Mỗi nhóm phụ có nhiều đơn vị.

-Chia nhóm phụ theo các biến quan trọng.

1 Chia tổng thể thành nhiều nhóm phụ

-Mỗi nhóm phụ chứa ít đơn vị.

-Chia nhóm phụ theo thuận tiện hoặc địa lý, khu vực

2 Bảo đảm tính đồng nhất homogeneity trong nội bộ

Trang 28

Ch n m u phi xác su t ọ ẫ ấ

 Khi chọn mẫu phi xác suất, không biết được xác suất để chọn một đơn vị nghiên cứu.

 Là chọn mẫu có mục đích (purposive sampling).

 Mẫu được chọn có xu hướng bị thiên lệch (bias).

 Thường dùng bởi vì:

 Phù hợp với việc chọn mẫu theo một mục đích nào đó.

 Không cần xác định các chỉ số liên quan đến tổng thể, do đó không cần quan tâm

nhiều đến tính đại diện.

 Giảm thời gian và chi phí nghiên cứu.

 Thuận tiện trên thực tế, nhất là khi ta không biết chính xác tổng thể và các đặc điểm

của nó.

28

Trang 29

Ch n m u phi xác su t: kinh ọ ẫ ấ

Chọn mẫu phán đoán (chọn mẫu theo kinh nghiệm):

 Là một dạng chọn mẫu có mục đích (purposive sampling)

 Người nghiên cứu chọn mẫu theo kinh nghiệm của mình, hoặc theo kinh nghiệm của người

khác, để có mẫu thích hợp nhất giúp chỉ ra được thông tin cần thu thập

Trang 30

Ch n m u phi xác su t ọ ẫ ấ

Chọn mẫu theo sự thuận tiện

Việc chọn mẫu tùy thuộc vào cơ hội tiếp xúc đối tượng nghiên cứu của nhà nghiên

cứu Không có tiêu chuẩn cụ thể cho việc chọn mẫu thuận tiện

Nguyên tắc: chọn bất kỳ đối tượng nào có thể được.

Thích hợp cho các nghiên cứu khám phá.

30

Trang 31

Ch n m u phi xác su t: h n ng ch ọ ẫ ấ ạ ạ

Chọn mẫu theo hạn ngạch

 Là dạng chọn mẫu có mục đích (theo tỷ lệ, không theo tỷ lệ)

 Chọn mẫu dựa trên các nhóm phụ của tổng thể theo các tiêu chí cho trước

 Tăng tính đại diện, vì có thể mô tả được các nhóm phụ

 Mỗi nhóm phụ phải thỏa mãn hai điều kiện:

 có một phân phối trong tổng thể mà ta có thể phỏng đoán được;

 Thích đáng với chủ đề nghiên cứu.

31

Trang 32

Chọn mẫu quả cầu tuyết (matched/snowball sampling)

 Trong những nghiên cứu đánh giá tác động thường sử dụng kỹ thuật chọn mẫu giống nhau để làm cơ

Trang 33

3 Ph ươ ng pháp xác đ nh c m u ị ỡ ẫ

Trang 34

Xác đ nh c m u ị ỡ ẫ

Chúng ta cần bao nhiêu đơn vị nghiên cứu (cỡ mẫu)?

 Có hai câu chuyện không chính xác:

 Mẫu phải lớn, nếu không sẽ không có tính đại diện;

 Mẫu phải tương ứng với một tỷ lệ nào đó so với tổng thể

 Nếu lấy mẫu phi xác suất: xác định các nhóm phụ (subgroups), nguyên tắc lựa chọn,

kinh phí có được

 Nếu lấy mẫu xác suất: cỡ mẫu tùy thuộc vào độ biến thiên của tổng thể và độ chính

xác ta muốn có của kết quả

34

Trang 35

Xác định cỡ mẫu

Chúng ta cần bao nhiêu đơn vị nghiên cứu (cỡ mẫu)?

- Các nguyên tắc xác định cỡ mẫu :

- Tổng thể càng biến thiên nhiều thì số mẫu phải càng lớn để đạt tính chính xác;

- Độ chính xác càng tăng thì số mẫu phải càng lớn.

- Phạm vi sai số càng nhỏ thì số mẫu phải càng lớn

- Khi tổng thể có nhiều nhóm phụ, thì số mẫu phải lớn để mẫu của từng nhóm phụ phải đạt yêu

cầu tối thiểu

35

Trang 36

Xác đ nh c m u theo giá tr ị ỡ ẫ ị

trung bình

Phỏng đoán khoảng tin cậy

• Ta dùng khoảng tin cậy để phỏng đoán khoảng mà giá trị trung bình của tổng thể µ rơi vào

Dùng chỉ số thống kê sai số chuẩn standard error of the mean (σx hay là se) Với :

– σx = sai số chuẩn.

– σ = độ lệch chuẩn của tổng thể– n = cỡ mẫu

36

Trang 37

Xác đ nh c m u theo giá tr ị ỡ ẫ ị

trung bình

Phỏng định Giá trị trung bình của tổng thể:

• Trung bình của tổng thể, µ, có thể được ước lượng theo công thức sau:

µ = xtb ± Z*se

• Theo ví dụ trên:

µ = xtb ± se = 3.0 ± Z*0.36

• Z = 1 cho mức tin cậy = 68%

• Z = 1.96 cho mức tin cậy = 95%

• Z = 3 cho mức tin cậy = 99%

37

Trang 39

Xác đ nh c m u theo giá tr ị ỡ ẫ ị

trung bình

Tính cỡ mẫu liên quan đến các giá trị Trung bình

Cần các thông tin sau:

 Độ chính xác mong muốn và làm sao lượng hóa nó:

 Mức tin cậy (confidence level) mà ta muốn có

 Độ lớn của khoảng tin cậy

 Độ biến thiên kỳ vọng trong tổng thể (expected dispersion in the population)

39

Trang 40

=

Trang 41

Xác đ nh c m u theo giá tr ị ỡ ẫ ị

trung bình

41

Ví dụ: tính cỡ mẫu cho nghiên cứu thu nhập của SV

 Độ chính xác mong muốn và làm sao lượng hóa nó:

Mức tin cậy (confidence level): 95% (Z=1.96)

 Độ lớn của khoảng tin cậy ± 0.25 (tr.đồng) = se*Z

Độ biến thiên kỳ vọng trong tổng thể (expected dispersion in the population): độ lệch

chuẩn = 0.7 (tr.đồng)

 Phỏng định sai số chuẩn: se = 0.25/1.96 = 0.127

 cỡ mẫu n = 0.72/0.1272 = 30.38 = 30

Trang 42

Xác đ nh c m u theo giá tr ị ỡ ẫ ị

trung bình

42

Ví dụ: tính cỡ mẫu cho nghiên cứu thu nhập của SV

• Độ chính xác mong muốn và làm sao lượng hóa nó:

Mức tin cậy (confidence level): 99% (Z=3.0)

– Độ lớn của khoảng tin cậy ± 0.25 (tr.đồng) = se*Z

Độ biến thiên kỳ vọng trong tổng thể (expected dispersion in the population): độ lệch chuẩn =

0.7 (tr.đồng)

• Phỏng định sai số chuẩn: se = 0.25/3.0 = 0.083

• cỡ mẫu n = 0.72/0.0832 = 71,02 = 71

Trang 43

Xác đ nh c m u theo giá tr ị ỡ ẫ ị

trung bình

43

Ví dụ: tính cỡ mẫu cho nghiên cứu thu nhập của SV

• Độ chính xác mong muốn và làm sao lượng hóa nó:

Mức tin cậy (confidence level): 95% (Z=1.96)

– Độ lớn của khoảng tin cậy ± 0.1 (tr.đồng) = se*Z

Độ biến thiên kỳ vọng trong tổng thể (expected dispersion in the population): độ lệch chuẩn =

0.7 (tr.đồng)

• Phỏng định sai số chuẩn: se = 0.1/1.96 = 0.051

• cỡ mẫu n = 0.72/0.0512 = 188,38 = 188

Trang 44

Xác đ nh c m u theo giá tr ị ỡ ẫ ị

trung bình

• Phương sai của tổng thể và kích cỡ mẫu

Phương sai (s2) càng lớn thì kích cỡ mẫu cũng phải càng lớn

Tuy nhiên, phương sai tổng thể không phải lúc nào cũng có sẵn  có các giải pháp sau:

– Sử dụng kết quả tính toán phương sai từ các nghiên cứu trước.

– Tính phương sai dựa vào kết quả khảo sát thử nghiệm (pilot survey).

44

Trang 45

Xác đ nh c m u theo giá tr t ị ỡ ẫ ị ỷ

lệ

• Ta phải xác định tỷ lệ của tổng thể mà chúng có một thuộc tính cho trước, tỷ lệ này gọi là p

q là tỷ lệ của tổng thể không có thuộc tính đó, tức là q = (1 – p)

Độ lệch chuẩn trong trường hợp này được xác định bằng tích số pq

Sai số chuẩn của trung bình được thay thế bằng sai số chuẩn của tỷ lệ, σp

45

Trang 46

Xác đ nh c m u theo giá tr t ị ỡ ẫ ị ỷ

lệ

Giả sử rằng từ một khảo sát sơ khởi, ta biết p = 30%.

Ta quyết định ước lượng tỷ lệ thực đúng của tổng thể trong phạm vi sai số 10% (p = 0.30 ±

0.10)

 Giả sử là ta muốn đạt mức tin cậy 95%.

46

Trang 47

Xác đ nh c m u theo giá tr t ị ỡ ẫ ị ỷ

lệ

• Cách tính được thực hiện như sau:

• Sai số mong muốn mà ta kỳ vọng tỷ lệ tổng thể đạt được (quyết định mục tiêu) = ± 0,10

• Mức tin cậy 95% để ước lượng khoảng tin cậy mà ta kỳ vọng tỷ lệ tổng thể đạt được (quyết

định mục tiêu)  Z = 1,96

Sai số ± 0,10 = 1,96 σp

σp= 0.051 = sai số chuẩn của tỷ lệ (= 0,10/1,96)

pq =Chỉ thị độ biến thiên của mẫu, được dùng như là một ước lượng của độ biến thiên của

tổng thể

• n= Cỡ mẫu

47

Trang 48

0 (

7 0 3

0 x

n =

Trang 49

4 Thu th p d li u ậ ữ ệ

Trang 50

 Sơ cấp (primary data)

 Thứ cấp (secondary data)

 Tam cấp (tertiary sources)

Ngu n d li u ồ ữ ệ50

Trang 51

Các cấp độ của thông tin dữ liệu

Dữ liệu sơ cấp (primary data):

 Các kết quả nguyên thủy của các nghiên cứu hoặc các dữ liệu thô chưa được

giải thích hoặc phát biểu đại diện cho một quan điểm hoặc vị trí chính thức nào đó

 Hầu hết có căn cứ đích xác vì chưa được lọc hoặc diễn giải bởi một người thứ

hai

 Nguồn dữ liệu sơ cấp: thường là các số liệu ghi nhận trong nghiên cứu, các số

liệu cá nhân, các bảng số liệu thô được mua, các bảng, biểu đồ số liệu thống kê

Ngu n d li u ồ ữ ệ51

Trang 52

 Dữ liệu sơ cấp

 Do người nghiên cứu trực tiếp thu thập

 Phù hợp với mục tiêu nghiên cứu

 Có tính độc nhất

Ngu n d li u ồ ữ ệ52

Trang 53

Các cấp độ của thông tin dữ liệu

Dữ liệu thứ cấp (secondary data):

 Các thông tin diễn dịch, giải thích của các dữ liệu sơ cấp

 Hầu hết các dữ liệu tham khảo đều thuộc nhóm này

Dữ liệu tam cấp (tertiary sources):

 Có thể là các thông tin diễn dịch, giải thích của các dữ liệu thứ cấp;

 Thông thường là các chỉ mục (indexes), danh mục tài liệu tham khảo

(bibliographies), và các nguồn trợ giúp tìm kiếm thông tin khác, ví dụ các trang Web tìm kiếm thông tin Internet (Internet search engine)

Ngu n d li u ồ ữ ệ53

Trang 54

 Dữ liệu thứ cấp

 các báo cáo của chính phủ, bộ ngành, số liệu của các cơ quan thống kê

 dữ liệu của các công ty về báo cáo kết quả tình hình hoạt động kinh

doanh, nghiên cứu thị trường…

 các báo cáo nghiên cứu của cơ quan, viện, trường đại học;

Ngu n d li u ồ ữ ệ54

Trang 55

 Dữ liệu thứ cấp

 các báo cáo nghiên cứu của cơ quan, viện, trường đại học;

 các bài viết đăng trên báo hoặc các tạp chí khoa học chuyên ngành và

tạp chí mang tính hàn lâm có liên quan;

Ngu n d li u ồ ữ ệ55

Trang 56

 Dữ liệu thứ cấp

 tài liệu giáo trình hoặc các xuất bản khoa học liên quan đến vấn đề

nghiên cứu;

 các bài báo cáo hay luận văn của các sinh viên khác (khóa trước) trong

trường hoặc ở các trường khác

Ngu n d li u ồ ữ ệ56

Trang 57

 Dữ liệu thứ cấp

 Mục tiêu

 Độ tin cậyNgu n d li u ồ ữ ệ57

Trang 58

 Thu thập dữ liệu sơ cấp

Ngu n d li u ồ ữ ệ58

Trang 59

D li u đ nh tính – đ nh l ữ ệ ị ị ượ ng

59

Mục đích Mô tả sự kiện bằng những con số Xác định ý nghĩ, quan điểm, cảm xúc, xu hướng bằng lời

Trình bày Quan điểm, ngôn ngữ của nhà nghiên cứu Quan điểm, ngôn ngữ của người được nghiên cứu

Chọn mẫu Ngẫu nhiên hoặc ngẫu nhiên có phân tầng Có mục đích

Câu hỏi Đóng, trắc nghiệm, câu trả lời định sẵn Mở, câu trả lời tự do không định sẵn

Phỏng vấn Cấu trúc Bảng hỏi được sọan sẵn theo một cấu trúc cố

định, không thay đổi

Bán cấu trúc Bảng hỏi chỉ mang tính chất gợi ý Các câu hỏi được phát triển từ trả lời của người được phỏng vấn

Ngày đăng: 20/11/2014, 15:26

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w