Tính chính xác của khoa học xử lý thông tin với phương pháp suy luận xử lý thông tin Vì sao phải chọn mẫu... Các yếu tố ảnh hưởng đến cỡ mẫu • Mục tiêu nghiên cứu • Yêu cầu của dữ liệu p
Trang 11 TIẾN TRÌNH CHỌN MẪU
2 CỠ MẪU
3 PHƯƠNG PHÁP CHỌN MẪU
1 TIẾN TRÌNH CHỌN MẪU
2 CỠ MẪU
3 PHƯƠNG PHÁP CHỌN MẪU
CHƯƠNG 3 CHỌN MẪU VÀ CÁC
VẤN ĐỀ CÓ LIÊN QUAN
Trang 21 Đảm bảo tính ngẫu nhiên, đại diện, chính xác
2 Vấn đề chi phí và thời gian trong nghiên cứu
3 Thiệt hại về mẫu thử
4 Tính chính xác của khoa học xử lý thông tin với phương pháp suy luận xử lý thông tin
Vì sao phải chọn mẫu
Trang 3ác đ
ịnh
tổn
g th ể
2.C
ấu t rúc
mẫ u
3 Đ
ơn v ị
3 Đ
ơn v ị
lấy m
ẫu
lấy m
ẫu
6 Sơ đ ồ
Chọn m ẫu
7 T iến
hà nh
Ch
ọn m
ẫu
5 P P
chọ n m
ẫu
4 C
ỡ m ẫu
1 TIẾN TRÌNH CHỌN MẪU
Trang 42 XÁC ĐỊNH CỠ MẪU
3 yếu tố chủ yếu ảnh hưởng đến cỡ mẫu
• Độ biến động của dữ liệu: V = p (1 – p) tỷ lệ thuận
với cỡ mẫu (p là tỷ lệ xuất hiện của các phần tử
trong đơn vị lấy mẫu) đúng như mục tiêu chọn mẫu
(0 p 1)
• Độ tin cậy liên hệ với giá trị Z (90%, 95%)
• Tỷ lệ sai số ước lượng MOE (nếu điều tra toàn bộ
tổng thể thì MOE = 0)
2 / 2
) 1
(
MOE
p p
n
Trang 52 XÁC ĐỊNH CỠ MẪU
Cỡ mẫu phụ thuộc vào tổng thể
• N: tổng thể
• e: sai số tối đa (e = 1- độ tin cậy)
• n: cỡ mẫu
) 1
N n
Trang 6Các yếu tố ảnh hưởng
đến cỡ mẫu
• Mục tiêu nghiên cứu
• Yêu cầu của dữ liệu phân tích
• Hạn chế về thời gian
• Hạn chế về chi phí
• Cỡ mẫu tương quan với độ lớn của tổng thể
• Cỡ mẫu khi chọn mẫu phi xác suất
Trang 73 PHƯƠNG PHÁP CHỌN MẪU
• Chọn mẫu xác suất - ngẫu nhiên
• Chọn mẫu phi xác suất
Save your forests !!!
Trang 8CHỌN MẪU XÁC SUẤT
(NGẪU NHIÊN)
• Ngẫu nhiên đơn giản:
+ Rút thăm, thẻ ngẫu nhiên
+ Dùng bảng số ngẫu nhiên nếu tổng thể lớn
+ Dùng hàm @ Rand ( ) * N
• Ngẫu nhiên hệ thống:
+ Chọn ngẫu nhiên mẫu đầu tiên
+ Sau đó dùng bước nhảy (lặp đi lặp lại) căn cứ vào N
và n k= N/n
+ Áp dụng tốt nếu danh sách tổng thể được xếp ngẫu nhiên (giảm sai lệch do tuần hoàn theo bước nhảy)
Trang 9• Ngẫu nhiên phân tầng:
+ Phổ biến nhất vì tính chính xác &ì đại diện cao
+ Chia tổng thể ra từng nhóm nhỏ theo 1 tiêu thức nào đó gọi là tiêu thức phân tầng (thu nhập, giới tính, tuổi tác, TĐ VH, nhân khẩu )
+ Chọn ngẫu nhiên hay hệ thống trong từng nhóm phân tầng theo tỉ lệ với độ lớn của nhóm
+ Quan trọng là chọn tiêu thức phân tầng phù hợp (trường hợp số liệu không có sẵn)
Trang 10• Ngẫu nhiên theo vùng địa giới:
Vùng 2 cấp
Ở TP có 200 Khu phố, mỗi khu phố có 20 hộ gia đình Mục tiêu chọn cỡ mẫu là 100 hộ gia đình thì tỷ lệ chọn sẽ là n/N= 1/40
Chọn mẫu ngẫu nhiên theo vùng 2 cấp:
• Cấp Khu phố: với tỷ lệ chọn 1/b
• Cấp hộ gia đình: với tỷ lệ chọn 1/h
Vậy theo yêu cầu thì tỷ lệ chọn toàn thể là: (1/b).(1/h) = 1/b.h = 1/40 và m.k = 100
Trang 11Các phương án chọn mẫu
Ph.án
chọn
mẫu
Tỷ lệ chọn Cấp 1 (1/b)
Tỷ lệ chọn Cấp 2 (1/h)
Tỷ lệ chọn toàn thể (1/b.h)
Số Kphố chọn cấp 1 (m)
Số hộ
GĐ chọn cấp 2 (k) 1
2
3
4
5
6
1/2 1/4 1/8 1/10 1/20 1/40
1/20 1/10 1/5 1/4 1/2 1
1/40 1/40 1/40 1/40 1/40 1/40
100 50 25 20 10 5
1 2 4 5 10 20
Trang 12• Chọn mẫu thuận tiện:
+ Dựa trên tính “dễ tiếp xúc” và “cơ hội thuận tiện” để chọn mẫu + Chỉ dùng cho nghiên cứu thăm dò, trắc nghiệm, không dùng cho nghiên cứu mô tả hay nhân quả vì tính đại diện không cao
• Chọn mẫu tích luỹ nhanh:
+ Các mẫu đầu tiên được chọn theo phương pháp xác suất
+ Các mẫu bổ sung tiếp theo được chọn ra từ việc cung cấp thông tin qua hình thức nhờ giới thiệu
+ Áp dụng cho các nội dung nghiên cứu khá đặc biệt, không phổ biến
CHỌN MẪU PHI XÁC SUẤT
Trang 13• Chọn mẫu theo hạn mức:
+ Tổng thể quá lớn, sự khác biệt (biến động) giữa các phần tử không lớn
+ Tổng thể đã được phân tổ nhóm trước (đồng
nhất) PVV chỉ chọn cho đủ số lượng không cần ngẫu nhiên
+ Dựa vào đặc tính kiểm soát (tiêu thức phân tổ) của từng nhóm để chọn
Trang 14SO SÁNH CHỌN MẪU XÁC SUẤT VÀ PHI XÁC SUẤT
Xác suất Phi xác suất
Ưu điểm Tính đại diện cao
Khái quát hóa cho tổng thể
Tiết kiệm thời gian
và chi phí
Nhược
điểm
Tốn kém thời gian
và chi phí
Tính đại diện thấp
Phạm vi sử
dụng
Nghiên cứu mô tả, khám phá và quan
hệ nhân quả
Nghiên cứu thử nghiệm, thăm dò
Trang 15VẼ SƠ ĐỒ CHỌN MẪU
• Trường hợp địa bàn rộng
• Cần quản lý chặt chẽ nhóm PVV
• Vẽ phác họa sơ đồ khu vực chọn mẫu, đánh dấu
các số nhà trên địa bàn
• Chia nhỏ các ô trên bản đồ Thành phố, đánh số
thứ tự các ô, chọn ngẫu nhiên 100 ô để xác định các hộ gia đình, cửa hàng được chọn làm mẫu
Trang 16GROUP
WORKING !!!