•Chọn mẫu là việc chọn một số đơn vị trong dân số population, nhằm rút ra các kết luận về dân số đó.. Tại sao chọn mẫu ?•Chọn mẫu làm giảm chi phí nghiên cứu; •Chọn mẫu đúng cách làm tăn
Trang 1Bài 7: Phương pháp chọn mẫu và
xác định cỡ mẫu
Trang 22 Slide
Tại sao chọn mẫu ?
•Chọn mẫu là việc chọn một số đơn vị trong dân số
(population), nhằm rút ra các kết luận về dân số đó
•Một đơn vị của mẫu là một cá thể hoặc một thành viên
mà chúng ta đo lường Đây chính là đơn vị nghiên
cứu
•Một dân số là tổng thể của tất cả các đơn vị
•Điều tra tổng thể (census) là việc đo lường tất cả các
đơn vị có trong dân số
•Danh sách tất cả các đơn vị có trong dân số để giúp
chúng ta rút mẫu là Khung mẫu (sample frame).
Trang 3Tại sao chọn mẫu ?
•Chọn mẫu làm giảm chi phí nghiên cứu;
•Chọn mẫu đúng cách làm tăng độ chính xác của
nghiên cứu;
•Tăng tốc độ thu thập thông tin dữ liệu;
•Có những dân số mà ta không thể nghiên cứu tổng thể;
Trang 44 Slide
Mẫu như thế nào là TỐT?
•Tính đúng đắn: mẫu phải đại diện cho tính chất của
tổng thể dân số hoặc phần lớn các đơn vị có trong dân
số;
•Tính chính xác: không thể có mẫu đại diện cho dân số
ở tất cả mọi khía cạnh Do đó, luôn có sai số sinh ra từ
việc chọn mẫu (sampling error)
•Đo lường tính chính xác bằng chỉ tiêu thống kê sai số
chuẩn (standard error of estimate)
Trang 5Các phương pháp ch ọ n m ẫ u trong nghiên c ứ u
Trang 66 Slide
Lựa chọn phương pháp chọn mẫu
Phải trả lời các câu hỏi sau đây:
1 Dân số mục tiêu là gì?
2 Các chỉ tiêu cần quan tâm là gì?
3 Phương pháp chọn mẫu nào là phù hợp?
4 Cần cở mẫu bao nhiêu?
Trang 7Lựa chọn phương pháp chọn mẫu
- Phải nắm rõ định hướng nghiên cứu như thế nào,
dự định tiến hành và các điều kiện liên quan
Trang 88 Slide
Lựa chọn phương pháp chọn mẫu
2 Các chỉ tiêu cần nghiên cứu là gì?
- Các chỉ tiêu mô tả các đặc điểm chung của dân số;
- Các chỉ tiêu thể hiện các đặc điểm riêng mà ta quan
tâm;
- Nên lường trước các dạng dữ liệu của chỉ tiêu (danh
nghĩa, thứ bậc, khoảng cách, tỷ số)
- Nếu dân số bao gồm các nhóm phụ riêng biệt, nên
định hướng xác định các dữ liệu danh nghĩa để
chia nhóm theo tỷ lệ
Trang 9Lựa chọn phương pháp chọn mẫu
3 Chúng ta có thể có Khung mẫu hay không?
- Khung mẫu là danh sách tất cả các đơn vị, cá thể có
trong mẫu (lý tưởng)
- Có nhiều trường hợp ta không thể có được Khung
mẫu;
- Cố gắng có được Khung mẫu
Trang 1010 Slide
Lựa chọn phương pháp chọn mẫu
3 Chọn lựa phương pháp chọn mẫu phù hợp?
- Có hai chọn lựa chính: chọn mẫu theo xác suất hoặc
phi xác suất
- Nếu chọn theo xác suất:, chọn mẫu phải thỏa các
điều kiện sau:
- Người điều tra không thể thay đổi sự lựa chọn
các đơn vị điều tra;
- Chỉ lựa chọn các đơn vị từ Khung mẫu;
- Việc thay thế các đơn vị phải được thực hiện rõ
ràng và được kiểm theo theo các điều kiện cho trước
Trang 11Lựa chọn phương pháp chọn mẫu
4 Chúng ta cần bao nhiêu đơn vị nghiên cứu (cỡ
mẫu)?
- Có hai câu chuyện không chính xác:
- Mẫu phải lớn, nếu không sẽ không có tính đại
diện;
- Mẫu phải tương ứng với một tỷ lệ nào đó so với
dân số
- Nếu lấy mẫu phi xác suất: xác định các nhóm phụ
(subgroups), nguyên tắc lựa chọn, kinh phí có
được
- Nếu lấy mẫu xác suất: cở mẫu tùy thuộc vào độ
biến thiên của dân số và độ chính xác ta muốn có
của kết quả
Trang 1212 Slide
Lựa chọn phương pháp chọn mẫu
4 Chúng ta cần bao nhiêu đơn vị nghiên cứu (cỡ
mẫu)?
- Có hai câu chuyện không chính xác:
- Mẫu phải lớn, nếu không sẽ không có tính đại
diện;
- Mẫu phải tương ứng với một tỷ lệ nào đó so với
dân số
- Nếu lấy mẫu phi xác suất: xác định các nhóm phụ
(subgroups), nguyên tắc lựa chọn, kinh phí có
được
- Nếu lấy mẫu xác suất: cở mẫu tùy thuộc vào độ
biến thiên của dân số và độ chính xác ta muốn có
của kết quả
Trang 13Lựa chọn phương pháp chọn mẫu
4 Chúng ta cần bao nhiêu đơn vị nghiên cứu (cỡ
- Khi dân số có nhiều nhóm phụ, thì số mẫu phải
lớn để mẫu của từng nhóm phụ phải đạt yêu cầu tối thiểu
Trang 1414 Slide
Các phương pháp ch ọ n m ẫ u trong nghiên c ứ u
1 Ch ọ n m ẫ u theo xác su ấ t: ph ả i bi ế t thông tin v ề s ố quan sát c ủ a
t ổ ng th ể đ ể tính xác su ấ t đư ợ c l ự a ch ọ n c ủ a m ỗ i quan sát trong mẫu.
Trang 15Xác suất chọn lựa = cở mẫu/dân số
- Lập danh sách (Khung mẫu)
- Chọn ngẫu nhiên theo danh sách
Trang 1616 Slide
Chọn mẫu xác suất
2 Chọn mẫu hệ thống (systematic sampling)
- Các nguyên tắc xác định :
- Xác định bước nhảy k
Bước nhảy = cở mẫu/dân số
- Lập danh sách (Khung mẫu) chính xác, hoặc có
số thứ tự
- Chọn ngẫu nhiên đơn vị khởi đầu
- Chọn các đơn vị kế tiếp bằng bước nhảy k
Trang 17Chọn mẫu xác suất
2 Chọn mẫu hệ thống (systematic sampling)
- Các lưu ý để tránh lệch mẫu (bias) :
- Trộn ngẫu nhiên danh sách trong Khung mẫu
- Chọn ngẫu nhiên đơn vị khởi đầu vài lần
- Nếu thực hiện tốt, phương pháp này cho hiệu quả
cao hơn phương pháp ngẫu nhiên đơn giản
Trang 1818 Slide
Chọn mẫu xác suất
3 Chọn mẫu phân tầng (stratified sampling)
- Hầu hết các dân số đều chứa đựng các nhóm phụ
Trang 19Chọn mẫu xác suất
3 Chọn mẫu phân tầng (stratified sampling)
- Cở mẫu tùy thuộc vào hai vấn đề:
- Tổng mẫu cần là bao nhiêu?
- Tổng mẫu sẽ được phân bố cho từng nhóm phụ
như thế nào?
Trang 2020 Slide
Chọn mẫu xác suất
3 Chọn mẫu phân tầng (stratified sampling)
- Theo tỷ lệ (proportionate) hay không theo tỷ lệ
(disproportionate)?
- Theo tỷ lệ: số mẫu của mỗi nhóm phụ sẽ được
quyết định theo tỷ lệ của dân số của mỗi nhóm phụ so với tổng dân số
- Cách này lý tưởng vì:
- Có độ chính xác về thống kê cao;
- Dễ chọn mẫu;
- Có được trọng số
Trang 21Chọn mẫu xác suất
3 Chọn mẫu phân tầng (stratified sampling)
- Quá trình chọn mẫu phân tầng:
- Chọn các biến (danh nghĩa) để chia nhóm,
phân tầng
- Quyết định tỷ lệ của từng nhóm so với dân số
chung
- Chọn cách lấy mẫu tỷ lệ hay không tỳ lệ
- Xác định các Khung mẫu riêng biệt cho từng
nhóm phụ
- Trộn ngẫu nhiên danh sách trong Khung mẫu
- Chọn đơn vị ngẫu nhiên hay hệ thống trong
từng nhóm phụ (tầng)
Trang 2222 Slide
Chọn mẫu xác suất
4 Chọn mẫu theo nhóm (clustering sampling)
- Khác với chọn mẫu phân tầng (chia ra các nhóm
phụ đồng nhất nhau) là chia ra các nhóm mang
tính đa dạng như dân số chung
Trang 23Chọn mẫu xác suất
Chọn mẫu phân tầng Chọn mẫu theo nhóm
1 Chia dân số thành một ít nhóm
phụ
- Mỗi nhóm phụ có nhiều đơn vị.
- Chia nhóm phụ theo các biến quan
trọng.
1 Chia dân số thành nhiều nhóm phụ
- Mỗi nhóm phụ chứa ít đơn vị.
- Chia nhóm phụ theo thuận tiện hoặc địa lý, khu vực
2 Bảo đảm tính đồng nhất
homogeneity trong nội bộ từng nhóm. 2 Bảo đảm tính dịtrong từng nhóm. biệt heterogeneity
3 Bảo đảm tính dị biệt heterogeneity
giữa các nhóm. 3 Bảo đảm tính đồng nhất homogeneity giữa các nhóm.
4 Chọn ngẫu nhiên các đơn vị trong
từng nhóm phụ 4 Chọn ngẫu nhiên vài nhóm phụ đểnghiên cứu.
Trang 2424 Slide
Chọn mẫu xác suất
4 Chọn mẫu theo nhóm (clustering sampling)
- Nhiều nghiên cứu liên quan tới dân số được xác
định theo khu vực địa lý hoặc địa giới hành chính
- Khi việc này xảy ra, chia nhóm theo khu vực địa lý
hoặc địa giới hành chính là rất quan trọng
- Cách chia nhóm này phù hợp với các nghiên cứu
có dân số ở các cấp quốc gia, tỉnh, thành phố, hoặc
như lãnh thổ nhỏ hơn
Trang 25Chọn mẫu xác suất
4 Chọn mẫu theo nhóm (clustering sampling)
Khi thiết kế chọn mẫu phân nhóm, phải trả lời các câu
hỏi sau:
1 Các nhóm đồng nhất với nhau như thế nào?
2 Các nhóm có kích cỡ bằng nhau hay không bằng
nhau?
3 Chúng ta nên xác định một nhóm lớn như thế
nào?
4 Chúng ta sẽ sử dụng việc phân nhóm một giai
đoạn (single-stage) hay nhiều giai đoạn
(multistage)?
5 Một mẫu lớn bao nhiêu là vừa?
Trang 2626 Slide
• Khi chọn mẫu phi xác suất, không biết được xác suất để
chọn một đơn vị nghiên cứu
• Là chọn mẫu có mục đích (purposive sampling)
• Mẫu được chọn có xu hướng bị thiên lệch (bias)
Chọn mẫu phi xác suất
Trang 27• Thường dùng bởi vì:
• Phù hợp với việc chọn mẫu theo một mục đích nào
đó
• Không cần xác định các chỉ số liên quan đến dân số,
do đó không cần quan tâm nhiều đến tính đại diện
• Giảm thời gian và chi phí nghiên cứu
• Thuận tiện trên thực tế, nhất là khi ta không biết
chính xác dân số và các đặc điểm của nó
Chọn mẫu phi xác suất
Trang 2828 Slide
5 Chọn mẫu theo kinh nghiệm:
• Là một dạng chọn mẫu có mục đích (purposive sampling).
• Người nghiên cứu chọn mẫu theo kinh nghiệm của mình,
hoặc theo kinh nghiệm của người khác.
• Thường dùng khi:
• người nghiên cứu muốn lựa chọn mẫu theo một tiêu
chuẩn nào đó.
• Nghiên cứu khám phá.
• Nghiên cứu 1 mẫu lệch theo 1 hướng nào đó.
Chọn mẫu phi xác suất
Trang 296 Chọn mẫu theo hạn ngạch
• Là dạng chọn mẫu có mục đích (theo phần trăm, không theo phần trăm)
• Chúng ta dùng phương pháp này để tăng tính đại diện
vì một số đặc điểm mô tả các chiều của dân số, và có thể
dùng để đại diện cho dân số
Chọn mẫu phi xác suất
Trang 3030 Slide
(2) Thích đáng với chủ đề nghiên cứu
Chọn mẫu phi xác suất
Trang 316 Chọn mẫu theo hạn ngạch
• Ví dụ:
• Gi ớ i tính : 2 l oại – nam, nữ
• Tr ình độ: 2 mức - đại học, dưới đại học
• Ng ành học : 6 l oại – ngh ệ thuật và khoa học , n ông nghiệp , ki ế n
trúc , kinh doanh, k ỹ nghệ, ngành khác
• T ôn giáo : 4 l oại - Ph ậ t giáo, Thiên chúa giáo, Tin l ành , l oại
khác
• Th ành viên hiệp hội : 2 l oại – th ành viên, không thành viên
• T ầ ng lớp kinh tế - xã hội hộ gia đình: 3 mức – gi àu có, trung
lưu, nghèo
Chọn mẫu phi xác suất
Trang 3232 Slide
7 Chọn mẫu theo sự thuận tiện
• Việc chọn mẫu tùy thuộc vào cơ hội tiếp xúc đối tượng
nghiên cứu của nhà nghiên cứu Không có tiêu chuẩn cụ
thể cho việc chọn mẫu thuận tiện
• Thích hợp cho các nghiên cứu khám phá
Trang 338 Chọn mẫu giống nhau (matched samples)
Trong những nghiên cứu đánh giá tác động thường sử dụng
kỹ thuật chọn mẫu giống nhau để làm cơ sở cho các phân
tích
• Chọn mẫu giống nhau bằng pp ngẫu nhiên
• Chọn mẫu giống nhau bằng thống kê
Chọn mẫu phi xác suất
Trang 3434 Slide
Ư u v
Ư u v à nh ượ c đi ể m c ủ a các phương pháp ch ọ n m ẫ u
M ứ c đ ộ chính xác
c ủ a k ế t qu ả tính toán
Gi ả m chi phí thu th ậ p S
ự đ ơ ơ n gi n gi ả n trong vi ệ c lên k ế ho ạ ch thu th ậ p
Trang 35-Xác định cỡ mẫu trong nghiên cứu
Q Xác định cỡ mẫu là việc xác định số quan sát tối thiểu cần phải thu thập để kết quả ước lượng có độ tin cậy chấp nhận được
Q Theo quy luật chung, trong trường hợp các yếu tố khác
không đổi, kích cỡ mẫu càng lớn thì độ tin cậy của kết quảcàng cao
Trang 3636 Slide
Q Tuy nhiên, kích cỡ mẫu lớn cũng đặt ra vấn đề về tính khảthi vì tốn kém chi phí và thời gian
Q Ngoài ra, độ tin cậy của dữ liệu thu thập được với cỡ mẫu lớn cũng là một điều khó khăn, vì khi số quan sát nhiều Î
tổ chức thu thập khó khăn và phức tạp hơn Î sai sót dễ
xuất hiện hơn
Q Xác định cỡ mẫu thích hợp trước khi thu thập dữ liệu rất quan trọng, là cơ sở để xây dựng thiết kế nghiên cứu
(research design)
Trang 37Q Nghiên cứu mô tả
Tiêu chuẩn để đánh giá độ chính xác của nghiên cứu
mô tả bao gồm các nhân tố: độ tin cậy mong muốn,
phương sai của tổng thể và kỹ thuật lấy mẫu được sử
dụng
Để xem xét mối tương quan của các nhân tố này đối
với kích cỡ mẫu, chúng ta xem xét 1 ví dụ thống kê
quen thuộc: giá trị trung bình
Xác định cỡ mẫu cho nghiên cứu định
lượng
Trang 3838 Slide
Xác đ ị nh c ỡ m ẫ u cho nghiên c ứ u mô t ả
(đ ị nh lư ợ ng):
Áp d ụ ng cho m ẫ u đư ợ c l ấ y theo xác su ấ t
Trang 39Giả sử một mẫu được thu thập bằng phương pháp ngẫu nhiên đơn giản có thay thế hoặc không có thay thế với
30 quan sát Nếu số quan sát trong mẫu chiếm tỷ lệ nhỏ
hơn 10% số quan sát trong tổng thể, để đạt được độ tin
cậy mong muốn, số quan sát tối thiểu phải là:
n: kích cỡ mẫu
l: độ tin cậy
s: độ lệch chuẩn của tổng thể
z: giá trị của mức ý nghĩa khi phân phối chuẩn (ví dụ:
Xác đ ị nh c ỡ m ẫ u cho nghiên c ứ u mô t ả
Trang 4040 Slide
Xác định cỡ mẫu cho nghiên cứu mô tả
(tính trung bình)
Q Ta có thể áp dụng công thức sau dựa trên độ lệch
chuẩn và sai số chuẩn của dân số:
σ
=
Trang 41Xác đ ị nh c ỡ m ẫ u cho nghiên c ứ u mô t ả
• Tính phương sai dựa vào kết quả khảo sát thử
nghiệm (pilot survey)
• Giả sử các biến quan sát sẽ tuân theo phân phối
chuẩn Î độ lệch chuẩn = 1/6 khoảng dao động của
dữ liệu (max – min)
Trang 4242 Slide
Xác đ ị nh c ỡ m ẫ u cho nghiên c ứ u mô t ả
(tính trung bình)
• Trường hợp sử dụng thang đo trong nghiên cứu hành vi,
số khoảng cách càng nhiều thì phươương sai cng sai càng lớn
Î Theo kinh nghiệm, nên chọn phương sai lớn nhất
Số khoảng cách Phương sai dự kiến
Trang 43Xác đ ị nh c ỡ m ẫ u cho nghiên c ứ u mô t ả
(tính trung bình)
Q Mức ý nghĩa và kích cỡ mẫu
Có ba mức ý nghĩa thường được sử dụng: 1%, 5% và
10%, trong đó 1% là mức ý nghĩa thường áp dụng cho nghiên cứu trong phòng thí nghiệm, trong khi đó các nghiên cứu thực địa có thể chấp nhận mức ý nghĩa 10%
Mức ý nghĩa càng thấp Î kích cỡ mẫu càng lớn
Trang 4444 Slide
Xác đ ị nh c ỡ m ẫ u cho nghiên c ứ u mô t ả
(tính trung bình)
Q Độ chính xác và kích cỡ mẫu
Độ chính xác càng kỳ vọng cao thì yêu cầu cỡ mẫu càng lớn Việc tăng độ chính xác rất tốn kém Tăng độ chính xác 2 lần thì số mẫu phải tăng 4 lần
Trang 45Xác đ ị nh c ỡ m ẫ u cho nghiên c ứ u mô t ả
s’2 = s2× deff
Trang 4646 Slide
Xác đ ị nh c ỡ m ẫ u cho nghiên c ứ u mô t ả
0,5 – 0,95
Ngẫu nhiên theo nhóm(cluster sampling)
1,25 – 1,5
Trang 47XÁC Đ Ị NH C Ỡ M Ẫ U CHO NGHIÊN C Ứ U
Đ Ị NH TÍNH (nghiên c ứ u tình hu ố ng)
Q Dựa vào sự lặp lại của thông tin
Q Dựa vào các kết luận rút ra
Trang 4848 Slide
1 Sai số do kích thước mẫu (sampling variability)
2 Sai số do cách chọn mẫu:
• Do quá trình chọn mẫu không phù hợp (dễ xảy ra trong
kỹ thuật chọn mẫu theo hạn ngạch)
• Do công cụ tính toán không phù hợp
Trang 493 Sai số không do chọn mẫu
3.1 Không quan sát được:
• Đối tượng khảo sát không phù hợp với đối tượng dự
kiến trong nghiên cứu
• Đối tượng khảo sát không trả lời đầy đủ thông tin
3.2 Quan sát được
• Đối tượng được khảo sát trả lời sai
• Thang đo sai
• Ghi chép sai