Khái ni m v đi u tra ch n m u ệ ề ề ọ ẫChọn mẫu làm giảm chi phí nghiên cứu; Chọn mẫu đúng cách làm tăng độ chính xác của nghiên cứu; Tăng tốc độ thu thập thông tin dữ liệu; Có những
Trang 1TS Trần Tiến Khai Khoa Kinh Tế Phát Triển Đại Học Kinh Tế TP.HCM
Trang 2N i dung ộ
2
Trang 31 Các khái ni m c b n ệ ơ ả
Trang 4Khái ni m v đi u tra ch n m u ệ ề ề ọ ẫ
Chọn mẫu là việc chọn một số đơn vị trong tổng thể (population), nhằm rút ra các kết luận về tổng thể đó
Một đơn vị của mẫu là một cá thể hoặc một thành viên mà chúng ta đo lường Đây chính là đơn vị nghiên
cứu
Một tổng thể là tập hợp của tất cả các đơn vị.
Điều tra tổng thể (census) là việc đo lường tất cả các đơn vị có trong tổng thể
Danh sách tất cả các đơn vị có trong tổng thể để giúp chúng ta rút mẫu là Khung mẫu (sample frame).
4
Trang 5Khái ni m v đi u tra ch n m u ệ ề ề ọ ẫ
Chọn mẫu làm giảm chi phí nghiên cứu;
Chọn mẫu đúng cách làm tăng độ chính xác của nghiên cứu;
Tăng tốc độ thu thập thông tin dữ liệu;
Có những tổng thể mà ta không thể nghiên cứu tổng thể
5
Trang 6M u nh th nào là t t? ẫ ư ế ố
Tính đúng đắn: mẫu phải đại diện cho tính chất của tổng thể tổng thể hoặc phần lớn các đơn vị có trong tổng thể;
Tính chính xác: không thể có mẫu đại diện cho tổng thể ở tất cả mọi khía cạnh
Do đó, luôn có sai số sinh ra từ việc chọn mẫu (sampling error)
Đo lường tính chính xác bằng chỉ tiêu thống kê sai số chuẩn (standard error of estimate)
6
Trang 72 Thi t k đi u tra ch n m u ế ế ề ọ ẫ
Trang 8Các cân nh c khi l a ch n thi t k ắ ự ọ ế ế
Tổng thể mục tiêu: gắn tổng thể với mục tiêu nghiên cứu
Tổng thể nghiên cứu: chứa các đơn vị nghiên cứu nào?
8
Trang 9Các cân nh c khi l a ch n thi t k ắ ự ọ ế ế
Bản chất của Tổng thể:
Phải hiểu rõ về các đặc điểm của tổng thể cần nghiên cứu
Phải biết tổng thể bao gồm các đơn vị như thế nào (cá nhân, hộ gia đình,
loại khác)
Phải nắm rõ định hướng nghiên cứu như thế nào, dự định tiến hành và
các điều kiện liên quan
Có thể có được Khung mẫu hay không?
9
Trang 10Các cân nh c khi l a ch n thi t k ắ ự ọ ế ế
Các chỉ tiêu cần nghiên cứu:
Các chỉ tiêu mô tả các đặc điểm chung của tổng thể;
Các chỉ tiêu thể hiện các đặc điểm riêng mà ta quan tâm;
Nên lường trước các dạng dữ liệu của chỉ tiêu (danh nghĩa, thứ bậc,
khoảng cách, tỷ số)
Nếu tổng thể bao gồm các nhóm phụ riêng biệt, nên định hướng xác định
các dữ liệu danh nghĩa để chia nhóm theo tỷ lệ
10
Trang 11Các cân nh c khi l a ch n thi t k ắ ự ọ ế ế
Thiết kế điều tra xác suất hay phi xác suất?
11
Trang 12Các cân nh c khi l a ch n thi t k ắ ự ọ ế ế
12
XÁC SUẤT PHI XÁC SUẤT
Biết quy mô của tổng thể (N) Không biết quy mô của tổng thể (N)
Tính được xác suất chọn mẫu (n/N) Không tính được xác suất chọn mẫu (n/N)
Chọn mẫu nhằm rút ra kết quả để phỏng đoán cho tổng thể Không cần suy đoán cho tổng thể; Nghiên cứu có mục đích
Chỉ lựa chọn đơn vị nghiên cứu từ khung mẫu Có thể lựa chọn một cách tùy ý
Không thể tùy tiện thay thế đơn vị nghiên cứu Có thể thay đổi nếu thấy phù hợp với mục đích nghiên cứu
Tiến trình chọn mẫu phải được tuân thủ nghiêm túc Có sự linh động trong chọn mẫu
Trang 13Xác định tổng thể liên quan
Chọn kỹ thuật lấy mẫu Xác định các khung mẫu hiện có
Đánh giá khung mẫu
Trang 14Các thi t k ch n m u đi u tra ế ế ọ ẫ ề
14
Chọn mẫu xác suất (probability sampling) Chọn mẫu phi xác suất (non-probability sampling)
Chọn mẫu ngẫu nhiên đơn giản (simple random sampling)
Chọn mẫu hệ thống (systematic sampling)
Chọn mẫu phân tầng (stratified sampling)
Chọn mẫu phân nhóm (cluster sampling)
Chọn mẫu hạn ngạch (quota sampling) Chọn mẫu phán đoán (judment sampling)
Chọn mẫu nhiều giai đoạn (multistage sampling)
Chọn mẫu thuận tiện (convienience sampling)
Chọn mẫu quả cầu tuyết (snowball sampling)
Chọn mẫu phân tầng không theo tỷ lệ (dispropotionate stratified
sampling) Chọn mẫu phân tầng theo tỷ lệ (propotionate stratified sampling)
Các kiểu chọn mẫu (Types of sampling design)
Chọn mẫu hạn ngạch theo tỷ lệ (propotionate quota sampling)
Chọn mẫu hạn ngạch không theo tỷ lệ (dispropotionate quota
sampling)
Trang 15Ch n m u xác su t: ọ ẫ ấ
Xác định xác suất chọn đơn vị:
Xác suất chọn lựa = cỡ mẫu (n)/tổng thể (N) (%)
Lập danh sách (Khung mẫu)
Chọn ngẫu nhiên theo danh sách
Excel
quan tâm đến đặc trưng chung của tổng thể
15
Trang 16Mẫu
Trang 17Ch n m u xác su t: ọ ẫ ấ
Các nguyên tắc xác định:
Xác định bước nhảy k
Bước nhảy = tổng thể (N)/cỡ mẫu (n)
Lập danh sách (Khung mẫu) chính xác, hoặc có số thứ tự
Chọn ngẫu nhiên đơn vị khởi đầu
Chọn các đơn vị kế tiếp bằng bước nhảy k
Áp dụng: khi tổng thể tương đối đồng nhất; người nghiên
cứu quan tâm đến đặc trưng chung của tổng thể17
Trang 18Ch n m u xác su t: ọ ẫ ấ
Các lưu ý để tránh lệch mẫu (bias) :
Trộn ngẫu nhiên danh sách trong Khung mẫu
Chọn ngẫu nhiên đơn vị khởi đầu vài lần
Nếu thực hiện tốt, phương pháp này cho hiệu quả cao hơn phương pháp
ngẫu nhiên đơn giản
18
Trang 21Ch n m u xác su t: phân t ng ọ ẫ ấ ầ
21
Tổng thể (N)
Mẫu (n)
Trang 22Ch n m u xác su t: ọ ẫ ấ
Theo tỷ lệ (proportionate) hay không theo tỷ lệ (disproportionate)?
Theo tỷ lệ: số mẫu của mỗi nhóm phụ sẽ được quyết định theo tỷ lệ của
tổng thể của mỗi nhóm phụ so với tổng tổng thể
Trang 23Ch n m u xác su t: ọ ẫ ấ
Quá trình chọn mẫu phân tầng:
Chọn các biến (danh nghĩa) để chia nhóm, phân tầng
Quyết định tỷ lệ của từng nhóm so với tổng thể chung
Chọn cách lấy mẫu tỷ lệ hay không tỷ lệ
Xác định các Khung mẫu riêng biệt cho từng nhóm phụ
Trộn ngẫu nhiên danh sách trong Khung mẫu
Chọn đơn vị ngẫu nhiên hay hệ thống trong từng nhóm phụ (tầng)
23
Trang 24Ch n m u xác su t: ọ ẫ ấ
Tổng mẫu cần là bao nhiêu?
Tổng mẫu sẽ được phân bố cho từng nhóm phụ như thế nào?
24
Trang 25Ch n m u xác su t: ọ ẫ ấ
phân nhóm
Chọn mẫu phân nhóm: chia tổng thể ra các nhóm mang tính đa dạng như
tổng thể chung
Nhiều nghiên cứu liên quan tới tổng thể được xác định theo khu vực địa lý
hoặc địa giới hành chính
Cách chia nhóm này phù hợp với các nghiên cứu có tổng thể ở các cấp
quốc gia, tỉnh, thành phố, hoặc như lãnh thổ nhỏ hơn
25
Trang 27-Mỗi nhóm phụ có nhiều đơn vị.
-Chia nhóm phụ theo các biến quan trọng.
1 Chia tổng thể thành nhiều nhóm phụ
-Mỗi nhóm phụ chứa ít đơn vị.
-Chia nhóm phụ theo thuận tiện hoặc địa lý, khu vực
2 Bảo đảm tính đồng nhất homogeneity trong nội bộ
Trang 28Ch n m u phi xác su t ọ ẫ ấ
Khi chọn mẫu phi xác suất, không biết được xác suất để chọn một đơn vị nghiên cứu.
Là chọn mẫu có mục đích (purposive sampling).
Mẫu được chọn có xu hướng bị thiên lệch (bias).
Thường dùng bởi vì:
Phù hợp với việc chọn mẫu theo một mục đích nào đó.
Không cần xác định các chỉ số liên quan đến tổng thể, do đó không cần quan tâm
nhiều đến tính đại diện.
Giảm thời gian và chi phí nghiên cứu.
Thuận tiện trên thực tế, nhất là khi ta không biết chính xác tổng thể và các đặc điểm
của nó.
28
Trang 29Ch n m u phi xác su t: kinh ọ ẫ ấ
Chọn mẫu phán đoán (chọn mẫu theo kinh nghiệm):
Là một dạng chọn mẫu có mục đích (purposive sampling)
Người nghiên cứu chọn mẫu theo kinh nghiệm của mình, hoặc theo kinh nghiệm của người
khác, để có mẫu thích hợp nhất giúp chỉ ra được thông tin cần thu thập
Trang 30Ch n m u phi xác su t ọ ẫ ấ
Chọn mẫu theo sự thuận tiện
Việc chọn mẫu tùy thuộc vào cơ hội tiếp xúc đối tượng nghiên cứu của nhà nghiên
cứu Không có tiêu chuẩn cụ thể cho việc chọn mẫu thuận tiện
Nguyên tắc: chọn bất kỳ đối tượng nào có thể được.
Thích hợp cho các nghiên cứu khám phá.
30
Trang 31Ch n m u phi xác su t: h n ng ch ọ ẫ ấ ạ ạ
Chọn mẫu theo hạn ngạch
Là dạng chọn mẫu có mục đích (theo tỷ lệ, không theo tỷ lệ)
Chọn mẫu dựa trên các nhóm phụ của tổng thể theo các tiêu chí cho trước
Tăng tính đại diện, vì có thể mô tả được các nhóm phụ
Mỗi nhóm phụ phải thỏa mãn hai điều kiện:
có một phân phối trong tổng thể mà ta có thể phỏng đoán được;
Thích đáng với chủ đề nghiên cứu.
31
Trang 32 Chọn mẫu quả cầu tuyết (matched/snowball sampling)
Trong những nghiên cứu đánh giá tác động thường sử dụng kỹ thuật chọn mẫu giống nhau để làm cơ
Trang 333 Ph ươ ng pháp xác đ nh c m u ị ỡ ẫ
Trang 34Xác đ nh c m u ị ỡ ẫ
Chúng ta cần bao nhiêu đơn vị nghiên cứu (cỡ mẫu)?
Có hai câu chuyện không chính xác:
Mẫu phải lớn, nếu không sẽ không có tính đại diện;
Mẫu phải tương ứng với một tỷ lệ nào đó so với tổng thể
Nếu lấy mẫu phi xác suất: xác định các nhóm phụ (subgroups), nguyên tắc lựa chọn,
kinh phí có được
Nếu lấy mẫu xác suất: cỡ mẫu tùy thuộc vào độ biến thiên của tổng thể và độ chính
xác ta muốn có của kết quả
34
Trang 35Xác định cỡ mẫu
Chúng ta cần bao nhiêu đơn vị nghiên cứu (cỡ mẫu)?
- Các nguyên tắc xác định cỡ mẫu :
- Tổng thể càng biến thiên nhiều thì số mẫu phải càng lớn để đạt tính chính xác;
- Độ chính xác càng tăng thì số mẫu phải càng lớn.
- Phạm vi sai số càng nhỏ thì số mẫu phải càng lớn
- Khi tổng thể có nhiều nhóm phụ, thì số mẫu phải lớn để mẫu của từng nhóm phụ phải đạt yêu
cầu tối thiểu
35
Trang 36Xác đ nh c m u theo giá tr ị ỡ ẫ ị
trung bình
Phỏng đoán khoảng tin cậy
• Ta dùng khoảng tin cậy để phỏng đoán khoảng mà giá trị trung bình của tổng thể µ rơi vào
• Dùng chỉ số thống kê sai số chuẩn standard error of the mean (σx hay là se) Với :
– σx = sai số chuẩn.
– σ = độ lệch chuẩn của tổng thể– n = cỡ mẫu
36
Trang 37Xác đ nh c m u theo giá tr ị ỡ ẫ ị
trung bình
Phỏng định Giá trị trung bình của tổng thể:
• Trung bình của tổng thể, µ, có thể được ước lượng theo công thức sau:
µ = xtb ± Z*se
• Theo ví dụ trên:
µ = xtb ± se = 3.0 ± Z*0.36
• Z = 1 cho mức tin cậy = 68%
• Z = 1.96 cho mức tin cậy = 95%
• Z = 3 cho mức tin cậy = 99%
37
Trang 39Xác đ nh c m u theo giá tr ị ỡ ẫ ị
trung bình
Tính cỡ mẫu liên quan đến các giá trị Trung bình
Cần các thông tin sau:
Độ chính xác mong muốn và làm sao lượng hóa nó:
Mức tin cậy (confidence level) mà ta muốn có
Độ lớn của khoảng tin cậy
Độ biến thiên kỳ vọng trong tổng thể (expected dispersion in the population)
39
Trang 40=
Trang 41Xác đ nh c m u theo giá tr ị ỡ ẫ ị
trung bình
41
Ví dụ: tính cỡ mẫu cho nghiên cứu thu nhập của SV
Độ chính xác mong muốn và làm sao lượng hóa nó:
Mức tin cậy (confidence level): 95% (Z=1.96)
Độ lớn của khoảng tin cậy ± 0.25 (tr.đồng) = se*Z
Độ biến thiên kỳ vọng trong tổng thể (expected dispersion in the population): độ lệch
chuẩn = 0.7 (tr.đồng)
Phỏng định sai số chuẩn: se = 0.25/1.96 = 0.127
cỡ mẫu n = 0.72/0.1272 = 30.38 = 30
Trang 42Xác đ nh c m u theo giá tr ị ỡ ẫ ị
trung bình
42
Ví dụ: tính cỡ mẫu cho nghiên cứu thu nhập của SV
• Độ chính xác mong muốn và làm sao lượng hóa nó:
– Mức tin cậy (confidence level): 99% (Z=3.0)
– Độ lớn của khoảng tin cậy ± 0.25 (tr.đồng) = se*Z
• Độ biến thiên kỳ vọng trong tổng thể (expected dispersion in the population): độ lệch chuẩn =
0.7 (tr.đồng)
• Phỏng định sai số chuẩn: se = 0.25/3.0 = 0.083
• cỡ mẫu n = 0.72/0.0832 = 71,02 = 71
Trang 43Xác đ nh c m u theo giá tr ị ỡ ẫ ị
trung bình
43
Ví dụ: tính cỡ mẫu cho nghiên cứu thu nhập của SV
• Độ chính xác mong muốn và làm sao lượng hóa nó:
– Mức tin cậy (confidence level): 95% (Z=1.96)
– Độ lớn của khoảng tin cậy ± 0.1 (tr.đồng) = se*Z
• Độ biến thiên kỳ vọng trong tổng thể (expected dispersion in the population): độ lệch chuẩn =
0.7 (tr.đồng)
• Phỏng định sai số chuẩn: se = 0.1/1.96 = 0.051
• cỡ mẫu n = 0.72/0.0512 = 188,38 = 188
Trang 44Xác đ nh c m u theo giá tr ị ỡ ẫ ị
trung bình
• Phương sai của tổng thể và kích cỡ mẫu
Phương sai (s2) càng lớn thì kích cỡ mẫu cũng phải càng lớn
Tuy nhiên, phương sai tổng thể không phải lúc nào cũng có sẵn có các giải pháp sau:
– Sử dụng kết quả tính toán phương sai từ các nghiên cứu trước.
– Tính phương sai dựa vào kết quả khảo sát thử nghiệm (pilot survey).
44
Trang 45Xác đ nh c m u theo giá tr t ị ỡ ẫ ị ỷ
lệ
• Ta phải xác định tỷ lệ của tổng thể mà chúng có một thuộc tính cho trước, tỷ lệ này gọi là p
• q là tỷ lệ của tổng thể không có thuộc tính đó, tức là q = (1 – p)
• Độ lệch chuẩn trong trường hợp này được xác định bằng tích số pq
• Sai số chuẩn của trung bình được thay thế bằng sai số chuẩn của tỷ lệ, σp
45
Trang 46Xác đ nh c m u theo giá tr t ị ỡ ẫ ị ỷ
lệ
Giả sử rằng từ một khảo sát sơ khởi, ta biết p = 30%.
Ta quyết định ước lượng tỷ lệ thực đúng của tổng thể trong phạm vi sai số 10% (p = 0.30 ±
0.10)
Giả sử là ta muốn đạt mức tin cậy 95%.
46
Trang 47Xác đ nh c m u theo giá tr t ị ỡ ẫ ị ỷ
lệ
• Cách tính được thực hiện như sau:
• Sai số mong muốn mà ta kỳ vọng tỷ lệ tổng thể đạt được (quyết định mục tiêu) = ± 0,10
• Mức tin cậy 95% để ước lượng khoảng tin cậy mà ta kỳ vọng tỷ lệ tổng thể đạt được (quyết
định mục tiêu) Z = 1,96
• Sai số ± 0,10 = 1,96 σp
• σp= 0.051 = sai số chuẩn của tỷ lệ (= 0,10/1,96)
• pq =Chỉ thị độ biến thiên của mẫu, được dùng như là một ước lượng của độ biến thiên của
tổng thể
• n= Cỡ mẫu
47
Trang 480 (
7 0 3
0 x
n =
Trang 494 Thu th p d li u ậ ữ ệ
Trang 50 Sơ cấp (primary data)
Thứ cấp (secondary data)
Tam cấp (tertiary sources)
Ngu n d li u ồ ữ ệ50
Trang 51Các cấp độ của thông tin dữ liệu
Dữ liệu sơ cấp (primary data):
Các kết quả nguyên thủy của các nghiên cứu hoặc các dữ liệu thô chưa được
giải thích hoặc phát biểu đại diện cho một quan điểm hoặc vị trí chính thức nào đó
Hầu hết có căn cứ đích xác vì chưa được lọc hoặc diễn giải bởi một người thứ
hai
Nguồn dữ liệu sơ cấp: thường là các số liệu ghi nhận trong nghiên cứu, các số
liệu cá nhân, các bảng số liệu thô được mua, các bảng, biểu đồ số liệu thống kê
Ngu n d li u ồ ữ ệ51
Trang 52 Dữ liệu sơ cấp
Do người nghiên cứu trực tiếp thu thập
Phù hợp với mục tiêu nghiên cứu
Có tính độc nhất
Ngu n d li u ồ ữ ệ52
Trang 53Các cấp độ của thông tin dữ liệu
Dữ liệu thứ cấp (secondary data):
Các thông tin diễn dịch, giải thích của các dữ liệu sơ cấp
Hầu hết các dữ liệu tham khảo đều thuộc nhóm này
Dữ liệu tam cấp (tertiary sources):
Có thể là các thông tin diễn dịch, giải thích của các dữ liệu thứ cấp;
Thông thường là các chỉ mục (indexes), danh mục tài liệu tham khảo
(bibliographies), và các nguồn trợ giúp tìm kiếm thông tin khác, ví dụ các trang Web tìm kiếm thông tin Internet (Internet search engine)
Ngu n d li u ồ ữ ệ53
Trang 54 Dữ liệu thứ cấp
các báo cáo của chính phủ, bộ ngành, số liệu của các cơ quan thống kê
dữ liệu của các công ty về báo cáo kết quả tình hình hoạt động kinh
doanh, nghiên cứu thị trường…
các báo cáo nghiên cứu của cơ quan, viện, trường đại học;
Ngu n d li u ồ ữ ệ54
Trang 55 Dữ liệu thứ cấp
các báo cáo nghiên cứu của cơ quan, viện, trường đại học;
các bài viết đăng trên báo hoặc các tạp chí khoa học chuyên ngành và
tạp chí mang tính hàn lâm có liên quan;
Ngu n d li u ồ ữ ệ55
Trang 56 Dữ liệu thứ cấp
tài liệu giáo trình hoặc các xuất bản khoa học liên quan đến vấn đề
nghiên cứu;
các bài báo cáo hay luận văn của các sinh viên khác (khóa trước) trong
trường hoặc ở các trường khác
Ngu n d li u ồ ữ ệ56
Trang 57 Dữ liệu thứ cấp
Mục tiêu
Độ tin cậyNgu n d li u ồ ữ ệ57
Trang 58 Thu thập dữ liệu sơ cấp
Ngu n d li u ồ ữ ệ58
Trang 59D li u đ nh tính – đ nh l ữ ệ ị ị ượ ng
59
Mục đích Mô tả sự kiện bằng những con số Xác định ý nghĩ, quan điểm, cảm xúc, xu hướng bằng lời
Trình bày Quan điểm, ngôn ngữ của nhà nghiên cứu Quan điểm, ngôn ngữ của người được nghiên cứu
Chọn mẫu Ngẫu nhiên hoặc ngẫu nhiên có phân tầng Có mục đích
Câu hỏi Đóng, trắc nghiệm, câu trả lời định sẵn Mở, câu trả lời tự do không định sẵn
Phỏng vấn Cấu trúc Bảng hỏi được sọan sẵn theo một cấu trúc cố
định, không thay đổi
Bán cấu trúc Bảng hỏi chỉ mang tính chất gợi ý Các câu hỏi được phát triển từ trả lời của người được phỏng vấn