Tài liệu giới thiệu về cách chọn mẫu trong nghiên cứu của khoa học Xã hội nói chung và khoa học Xã hội học nói riêng
Trang 1Chọn mẫu
Nguyễn Hữu Minh
Viện NC Gia đình và Giới
Trang 2Sù cÇn thiÕt ph¶i chän mÉu
Lý tưởng là có thể khảo sát toàn bộ những người có
Trang 3C¸c kh¸i niÖm chñ yÕu (1)
Trang 4C¸c kh¸i niÖm chñ yÕu (2)
Độ tin cậy (mức ý nghĩa) & Khoảng tin cậy: kết quả
ước lượng của một chỉ báo nhất định từ mẫu là một
biến xác suất nên có khác biệt (sai số) nhất định so với giá trị thực tế của tổng thể Ví dụ, từ khảo sát mẫu, ta
kết luận “95% khả năng là tỷ lệ người thất nghiệp của
dân số mục tiêu nằm trong khoảng 12% 1.5%”
Trong trường hợp này, ước lượng mẫu là 12% với
mức ý nghĩa 95% và khoảng tin cậy là [10.5% -
13.5%]
Trang 5C¸c kh¸i niÖm chñ yÕu (3)
Sai số của một ước lượng từ khảo sát chọn mẫu là
tổng của sai số chọn mẫu (hay sai số ngẫu nhiên) và
sai số phi chọn mẫu
Nếu là chọn mẫu xác suất thì có thể ước lượng được
sai số chọn mẫu
Sai số phi chọn mẫu khá đa dạng, phức tạp và không
có công thức chung để ước lượng.
Trang 6Các hình thức chọn mẫu
Có nhiều loại thông tin khác nhau cần thu thập: thông
tin cá nhân, ý kiến của các chuyên gia, v.v.
Có các hình thức chọn mẫu tương ứng: xác suất và phi xác suất.
Mẫu xác suất: ngẫu nhiên đơn giản, ngẫu nhiên hệ
thống, phân tầng, cụm.
Mẫu phi xác suất: định mức (quota), hướng đích
(purposive), thuận tiện (convenien ce), bóng tuyết
(snowball).
Trang 7MÉu x¸c suÊt (1)
Khái niệm: Là phương pháp chọn mẫu mà tất cả đơn vị nghiên
cứu cơ bản trong tổng thể có xác suất được chọn lớn hơn 0 và
xác suất đó phải tính được
Một số nguyên tắc:
Tổng thể nghiên cứu phải hữu hạn và xác định, tức là ta có thể đếm
và quan sát được.
Mọi đơn vị mẫu của tổng thể phải được đưa vào khung lấy mẫu.
Bảo đảm tính ”ngẫu nghiên” và ”đại diện” của việc lấy mẫu từ tổng
thể.
Nếu xác suất chọn các đơn vị mẫu không bằng nhau, phải tiến hành
“cân bằng xác suất” (gia quyền) khi tính toán ra các số đo đặc trưng
cho tổng thể.
Trang 8MÉu x¸c suÊt (2)
Ưu điểm chính:
Có cơ sở khoa học vững chắc
Có thể dễ dàng suy rộng cho tổng thể với sai số xác định
Có thể thực hiện các phân tích định lượng với độ tin cậy
nhất định
Hạn chế:
Phải tuân thủ nghiêm ngặt một số nguyên tắc
Cần có nhiều thông tin, thời gian, kinh phí hơn
Trang 9Mẫu xác suất (3)
Mẫu xác suất dựa trên việc chọn một số cho tr ớc các
đơn vị phân tích từ danh sách gọi là khung mẫu.
Khung mẫu (sampling frame) thể hiện tổng thể mẫu
nghiên cứu Cần có một khung mẫu (hay tổng thể
mẫu) tốt nếu muốn có mẫu tốt
Trong mẫu xác suất mỗi cá nhân có cùng cơ hội nh
các cá nhân khác đ ợc chọn.
Chỳ ý đến kớch thước mẫu (cụng thức và bảng kớch
thước mẫu).
Trang 10Mẫu xác suất (4)
Mẫu ngẫu nhiên đơn giản
Đánh số và chọn ngẫu nhiên (máy tính hoặc bảng số ngẫu nhiên).
Tr ờng hợp ng ời đ ợc phỏng vấn không ở nhà.
Chọn cú lặp lại: Khi một đơn vị được chọn vào mẫu xong, đơn vị
đú khụng bị loại khỏi danh sỏch chọn mẫu nờn vẫn cú thể được chọn trong cỏc lần chọn đơn vị tiếp theo.
Chọn khụng lặp: Khi một đơn vị được chọn vào mẫu xong, đơn vị
đú bị loại khỏi danh sỏch chọn mẫu nờn khụng thể được chọn trong cỏc lần chọn đơn vị tiếp theo.
Chọn mẫu ngẫu nhiờn trong khảo sỏt nghiờn cứu khoa học xó hội
thường là chọn khụng lặp
Tớnh kớch thước mẫu: Xem cụng thức kốm theo.
Trang 11MÉu x¸c suÊt (5)
MÉu ngÉu nhiªn hÖ thèng
Chän mÉu ngÉu nhiªn hÖ thèng lµ dÔ h¬n vµ tiÕt kiÖm
h¬n
CÇn cã sè ® îc chän ban ®Çu vµ kho¶ng c¸ch mÉu
Tính k= n/N
Chọn số ngẫu nhiên bất kỳ a k
Chọn các phần tử thứ a, a+k, a+2k, , a+(n-1)k trong
khung lấy mẫu
Khi k không phải là số nguyên => làm tròn k, nối danh
sách chọn mẫu thành 1 vòng tròn, thực hiện tương tự như trên cho đến khi chọn đủ n phần tử
Trang 12Mẫu xác suất (6)
Mẫu ngẫu nhiên phân tầng
Mẫu ngẫu nhiên phân tầng bảo đảm rằng các nhóm dân
số chủ yếu đều có mặt trong mẫu
Chia khung mẫu ra thành các tiểu khung mẫu dựa trên
một số biến độc lập chủ yếu Sau đó chọn mẫu ngẫu nhiên đơn giản/hệ thống từ mỗi một nhóm này
Trang 13Mẫu xác suất (7)
Mẫu cụm
Mẫu cụm là cách chọn mẫu khi không có danh sách mẫu
hoặc khung mẫu
Mẫu cụm dựa trên cơ sở vùng địa lý hoặc các tổ chức
Tổng thể được chia thành cỏc cụm tương đối giống nhau
Sử dụng phương phỏp ngẫu nhiờn đơn giản hoặc hệ thống
để chọn một số “cụm” nhất định
Trang 14MÉu x¸c suÊt (8)
So s¸nh mÉu côm vµ ph©n tÇng
Ph©n tÇng:
Chi phÝ cao h¬n (lËp danh s¸ch, ph©n tÇng, v.v.)
HiÖu qu¶ h¬n so víi mÉu côm.
MÉu côm:
Chi phÝ thÊp h¬n: Không cần lập danh sách tất cả các đơn
vị cơ bản trong tổng thể (mà chỉ cần danh sách đơn vị cơ
bản trong các cụm được chọn)
HiÖu qu¶ thÊp h¬n
Trang 15MÉu phi x¸c suÊt (1)
Chọn mẫu xác suất đảm bảo được tính chính xác và đại diện,
nhưng phải có khung mẫu (danh sách đầy đủ các thành viên của
tổng thể để từ đó chọn ra một mẫu).
Tuy nhiên, trong nhiều truờng hợp chọn mẫu xác suất là điều
không thể được Những trường hợp sau đây thậm chí không nên
nghĩ đến việc chọn mẫu:
Khi tổng thể nghiên cứu rất nhỏ, chọn mẫu là điều không cần thiết
Khi hiện tượng mới xuất hiện và còn chưa rõ, chọn mẫu là không
phù hợp
Khi dữ liệu dễ tiếp cận, cũng không cần phải chọn mẫu.
Trang 16MÉu phi x¸c suÊt (2)
Chọn mẫu phi xác suất là phương pháp chọn mẫu mà không
phải tất cả các đơn vị trong tổng thể đều có khả năng được
chọn vào mẫu nghiên cứu hoặc không thể tính xác xuất được
chọn cho tất cả các đơn vị trong tổng thể
Ưu điểm: Đơn giản, dễ tiến hành; Cần ít thông tin, thời gian,
kinh phí
Nhược điểm:
Phụ thuộc vào kinh nghiệm và sự hiểu biết về tổng thể của người
nghiên cứu => kết quả mang tính chủ quan của người nghiên cứu
Không thể tính được sai số do chọn mẫu => không thể áp dụng
phương pháp ước lượng thống kê để suy rộng kết quả trên mẫu cho
Trang 17Mẫu phi xác suất (3)
Mẫu định mức (quota sampling)
Dựa vào số l ợng các nhóm nhỏ cần quan tâm nghiên cứu
và tỉ lệ các nhóm đó trong mẫu phải chọn
Mẫu định mức gần giống nh mẫu phân tầng Điểm khác
biệt cơ bản là ng ời đ ợc phỏng vấn không đ ợc chọn ngẫu nhiên
Mẫu h ớng đích (purposive sampling)
Xác định tr ớc mục đích muốn ng ời đ ợc PV trả lời, sau
đó tìm ng ời đ ợc phỏng vấn
Gần giống mẫu định mức nh ng không có thiết kế mẫu
chung cho phép biết đ ợc bao nhiêu ng ời của mỗi nhóm
Trang 18Mẫu phi xác suất (4)
Mẫu thuận tiện (convenience sampling)
Sử dụng cho bất kỳ ng ời nào gặp Thuận tiện để thử bảng hỏi.
Chỉ nờn sử dụng khi NC cú mục đớch khỏm phỏ hoặc khi cỏc biến
thể cụ thể trong tổng thể khụng cú/cú ớt tỏc động đến hiện tượng đang được nghiờn cứu.
Nguy hiểm trong nhiều tình huống khác Ví dụ, hỏi sinh viên trong
th viện về những vấn đề xảy ra trong ký túc xá, mà không hỏi những sinh viên đang đánh bài trong quán cà phê.
Mẫu quả bóng tuyết (snowball sampling)
Chọn một hay vài nhân vật chủ yếu và yêu cầu họ giới thiệu tiếp.
Đặc biệt hiệu quả trong tổng thể nghiên cứu nhỏ v đề tài nhạy à đề tài nhạy
cảm.
Trang 19MÉu phi x¸c suÊt (5)
Chọn mẫu phán đoán (judgement sampling):
Phỏng vấn viên tự đưa ra phán đoán về đối tượng cần
chọn vào mẫu
Tính đại diện của mẫu phụ thuộc nhiều vào kinh nghiệm
và sự hiểu biết của người tổ chức việc điều tra và cả
người đi thu thập dữ liệu
Ví dụ: nhân viên phỏng vấn được yêu cầu tìm đến ký túc
xá đại học phỏng vấn những nữ sinh viên có hình thức
“ưa nhìn” => không có tiêu chuẩn cụ thể thế nào là “hình thức ưa nhìn” mà hoàn toàn dựa vào phán đoán để chọn
ra người cần phỏng vấn.
Trang 20MÉu phi x¸c suÊt (6)
Chọn mẫu gần xác xuất (quasi-propbability
sampling)
Cố gắng áp dụng các nguyên tắc và thủ tục của chọn mẫu
xác xuất một cách tối đa nhưng vẫn phải bỏ qua một số
nguyên tắc nào đó (do hạn chế về thông tin, hay thời gian, kinh phí )
Cần có bằng chứng hay lý giải việc bỏ qua một số nguyên tắc này không ảnh hưởng nhiều đến mục tiêu nghiên cứu
Trang 21MÉu phi x¸c suÊt (7)
Chọn mẫu gần xác xuất (quasi-propbability
sampling)
Ví dụ: Khung lấy mẫu có thể thiếu một tỷ lệ nhỏ đơn vị
mẫu; Không tính được xác suất được chọn cho một tỷ lệ
nhỏ đơn vị mẫu
Nhiều nghiên cứu sử dụng phương pháp này, nhất là khi
mục tiêu nghiên cứu là đánh giá mối quan hệ giữa các
biến số chứ không phải là ước lượng cho tổng thể