Mẫu điều tra là gì Là một phần của tổng thể tập con – subset đươc lựa chọn ra theo một cách nhất định Thông tin thu được từ mẫu trong nghiên cứu định lượng được dùng để suy luận
Trang 1VẤN ĐỀ MẪU KHẢO SÁT (mẫu ngẫu nhiên)
Trang 3Các mục tiêu của nghiên cứu Mức độ chính xác
Các nhu cầu phân tích thống kê
CÁC YẾU TỐ CẦN CÂN NHẮC KHI THIẾT KẾ MẪU
Trang 5Mẫu điều tra là gì
Là một phần của tổng
thể (tập con – subset)
đươc lựa chọn ra theo
một cách nhất định
Thông tin thu được từ
mẫu trong nghiên cứu
định lượng được dùng để
suy luận về tông thể
Dung lượng/kích thước/
qui mô mẫu thưừong
được ký hiệu bằng chữ n
Tổng thể
Mẫu
Trang 6Tại sao chọn mẫu?
Ít tốn kém kinh phí
Nhanh chóng có kết quả
Tổ chức điều tra, tập huấn
điều tra viên thuận lợi hơn
Chính xác hơn (sai số phi
Trang 71 Làm rõ tổng thể
2 Làm rõ khung chọn mẫu (nếu có thể)
3 Lựa chọn phương pháp chọn mẫu
4 Tính toán qui mô/kích thước của mẫu
5 Tiến hành việc chọn mẫu
CÁC BƯỚC CỦA CHỌN MẪU
Trang 8Khung mẫu (sampling frame)
Là cơ sở để chọn mẫu ngẫu nhiên
Là danh sách chứa đựng toàn bộ các
đơn vị nghiên cứu trong tổng thể.
Những yêu cầu đối với khung mẫu này
là:
Trang 9HAI CÂU HỎI THƯỜNG GẶP
1 Điều tra bao nhiêu là đủ? Hoặc điều
tra với số lượng là X đã đủ hay chưa?
2 Cách chọn như thế nào mới là đúng?
ngẫu nhiên là thế nào?
Trang 10KÍCH THỨC MẪU (SAMPLE SIZE)
Sai số tối thiểu là bao nhiêu?
Độ tin cậy tối thiểu là bao nhiêu?
Cơ cấu tổng thể có phức tạp không?
Kinh phí khảo sát là bao nhiêu?
Trang 11Công thức tính qui mô mẫu của kiểu chọn mẫu lặp
t=1 khi độ tin cậy là 68.2%, t=2 khi độ tin cậy là 95.4% và t=3 khi
đô tin cây là 99.7%
Trang 12Công thức tính qui mô mẫu của kiểu chọn mẫu không lặp
N*t 2 *p*q N*ε 2 +tt 2 *p*q
Tính toán giá trị trung bình n =
N*t 2* δ 2
N*ε 2 +tt 2* δ 2
Trang 14Bài tập
1 Tính toán dung lượng mẫu cho một
điều tra toàn quốc ở Việt Nam với độ tin cậy là 95% và 99%, sai số chọn mẫu là 3%
2 Nếu một xã có 2000 hộ dân, với
khoảng tin cậy là 95% và 99%, sai
số là 3%, cần phải chọn bao nhiêu
Trang 15Vấn đề mẫu dự trữ
Mẫu dự trữ dùng để bổ sung cho
trường hợp từ chối hoặc vì lý do
khách quan không gặp được đúng
người đã chọn
Kích thước của mẫu dự trữ tuỳ thuộc
vào tổng thể và tỷ lệ rủi ro có thể có
Ở Việt Nam kích thước mẫu dự trữ
khoảng dưới 10% mẫu chính
Trang 16CÁC CÁCH CHỌN MẪU
Ngẫu nhiên đơn giản (Simple Randon
Sampling)
Ngẫu nhiên hệ thống (Systematic Sampling)
Phân tầng ngẫu nhiên (Stratified Random
Sampling)
1 theo tỷ lệ (Proportional type)
2 không theo tỷ lệ (Disproportional type)
Mẫu ngẫu nhiên theo cụm (Cluster sampling)
1 Một giai đoạn
2 nhiều giai đoạn (multistage cluster sampling)
Trang 17Ngẫu nhiên đơn giản
Trang 18Thí dụ một phần của bảng số ngẫu nhiều (contingency table)
Trang 19Ví dụ
Trong một xã có 1700 hộ, cần chọn ngẫu nhiên 16 hộ:
Các hộ này sẽ có số thứ tự từ 0001 cho đến 2000 trong khung
mẫu
Lấy một phần bất kỳ của bảng số ngẫu nhiên để bắt đầu ví dụ
cột thứ 1;
Xem xét các số trong bảng, có thể chọn theo hàng hoặc theo
cột, nếu số nào lớn hơn các số thứ tự trong khung mẫu sẽ bị loại bỏ, số nào trùng lặp thì chỉ lấy một lần, lấy cho tới khi nào
đủ số lượng mẫu cần chọn thì dừng lại
Trường hợp đầu tiện được chọn có số thứ tự là 0097, tiếp là
0822; 0935; 1665; 0344; 0157; 1060; 1199; 0715; 0805; 1805; 1165 (bỏ); 0200; 0959; 0636; 0553; 0402
Trang 20Ưu điểm của mẫu ngẫu nhiên đơn giản
Đảm bảo được tính khách quan
Không đòi hỏi quá nhiều thông tin chi
tiết về tổng thể
Có hiệu quả cao với tổng thể thuần
nhất
Trang 21Nhược điểm của mẫu ngẫu nhiên đơn giản
Việc lập khung mẫu trong điều kiện
Việt Nam không dễ
Việc dùng bảng số ngẫu nhiên không
phải là cách làm quen thuộc với nhiều người
Chí phí để lập khung mẫu khá tốn
kém
Trang 22Ngẫu nhiên hệ thống
1 Lập danh sách tổng thể
2 Gán cho mỗi đơn vị của tổng thể một
mã (số thứ tự)
3 Căn cứ vào kích thước của tổng thể
N và qui mô của mẫu cần chọn n
Trang 23Bài tập
Một xã có 3000 hộ dân, với sai số
3%, độ tin cậy 95% thì cần phải chọn điều tra 787 hộ Hay tính bước chọn với khối lượng mẫu dự trữ là 10%
Có thể áp dung cách chọn mẫu này
trong thực tế ở Việt Nam như thế
nào?
Trang 24Ưu điểm của mẫu ngẫu nhiên hệ thống
Đảm bảo được tính khách quan
Không đòi hỏi quá nhiều thông tin chi
Trang 25Nhược điểm của mẫu ngẫu nhiên hệ thống
Việc lập khung mẫu trong điều kiện
Việt Nam không dễ
Yêu cầu về khung mâu chặc chẽ hơn
Thí dụ, khung mẫu không được xếp theo bất kỳ một qui luật nào, thí dụ theo mức lương
Chí phí để lập khung mẫu tốn kém
hơn so với ngẫu nhiên đơn giản
Trang 26Mẫu phân tầng ngẫu nhiên
Dạng tỷ lệ (proportional type): tỷ lệ
thành phần trong mẫu chọn tương tự như tỷ lệ các cúa thành phần tương ứng của tông thể
Dạng không tỷ lệ (disproportional
type): mỗi tầng thường được ấn định một số lượng mẫu chọn giống nhau
Trang 27Phân tầng ngẫu nhiên
4 Dùng phương pháp ngẫu nhiên đơn giản
hoặc ngẫu nhiên cơ học để chọn đủ qui mô của mẫu
Trang 28 Nếu kích thước của mẫu là 1000 thì sẽ
phải chọn ngẫu nhiên khoảng 122 nữ nông thôn và 368 nữ ở đô thị, và 128 nam ở nông thôn và 382 nam ở đô thị
Trang 29Bài tập
Giả sử rằng cơ cấu nghề nghiệp của
một tỉnh là 60% làm nông nghiệp (nữ chiếm 60%), 25% là viên chức nhà
nước (nữ chiếm 40%), 10% là kinh
doanh buôn bán (nữ chiếm 55%), 5%
là thành phần khác (nữ chiếm 50%) Hãy vẽ sơ đồ chọn mẫu và tính toán
số lượng cho từng tầng nếu cuộc điều tra cần khảo sát 1000 người
Trang 30Phân tầng ngẫu nhiên
nhiên đơn giản hoặc ngẫu nhiên cơ học
Trang 31Ví dụ
Để so sánh ý kiến của những người dân tộc thiểu số, hoặc giữa những
người sống ở đô thị và nông thôn
người ta thường ấn định qui mô mẫu
ở mỗi tầng là bằng nhau Thí dụ, nếu qui mô của mẫu là 1000, thì sẽ điều tra 500 là người DTTS và 500 là
người kinh; hoặc 500 là người sống ở
đô thị và 500 sống ở nông thôn
Trang 32 Việc ấn định cho các tầng 1 số lượng
giống nhau làm đơn giản hơn các tính toán
Trang 34Mẫu ngẫu nhiên theo cụm
Cụm (cluster) bao gồm toàn bộ một
tập con (subset) của tổng thể có ranh giới tương đối xác định chứa đựng các phần tử của tổng thể
Việc xác định thế nào là cụm phụ
thuộc vào từng nghiên cứu, qui mô
của mẫu
Trang 35Ưu điểm
Hữu ích khi không có khung mẫu đầy
đủ đến cấp thành phần trong cụm
Điều tra viên không phải di dhuyển
nhiều, do vậy tiết kiệm kinh phí điều tra
Trang 36Nhược điểm
Sai số chọn mẫu lớn
Có thể giảm sai số này thông qua
một biến thể của cách chọn mẫu này: giảm các cấp độ xác định cụm và
tăng số lượng cụm đồng thời giảm số lượng khảo sát trong một cụm
Trang 37Mẫu ngẫu nhiên theo cụm nhiều
Chọn 1 hoặc 1 số xã theo kích thước của mẫu
Trong các lớp được chọn tiến hành điều tra toàn bộ
Trang 38SAI SỐ CHỌN MẪU (sampling
error)
Đó là độ chênh giữa kết quả điều tra với phân bố lý
thuyết của tổng thể
Nó cho biết khoảng dao động của kết quả điều tra nếu
như cuộc điều tra được thực hiện lặp lại hàng trăm lần
Chỉ có thể tính sai số chọn mẫu với mẫu ngẫu nhiên
Sai số mẫu giảm khi kích thước mẫu tăng Nó bằng 0
khi điều tra toàn bộ
Mức sai số chấp nhận được tuỳ theo nghiên cứu và
người đặt hàng
Trang 39SAI SỐ CHỌN MẪU ĐỐI VỚI TỶ LỆ
Độ tin cậy 99%
Độ tin cậy 95%
Độ tin cậy 90%
Trang 40SAI SỐ CHỌN MẪU ĐỐI VỚI GIÁ TRỊ TRUNG BÌNH
Standard Error (SE) = δ n
Trang 41Thảo luận
Làm thế nào để lựa chọn mẫu nhiên
có hiệu quả cao nhất ở Việt Nam?