Nếu được ưu, nhược điểm của từng phương phỏp chọn mẫu và chỉ định ỏp dụng trong từng nghiờn cứu cụ thể; 3.. Lựa chọn được cụng thức tớnh cỡ mẫu thớch hợp cho một nghiờn cứu cụ thể.. Một
Trang 1CHỌN MẪU VÀ CỠ MẪU TRONG
NGHIấN CỨU Y HỌC
PGS.TS Lưu Ngọc Hoạt Viện ĐT YHDP và Y tế Cụng cộng
Đại học Y Hà Nội
Mục tiờu bài học
Kết thỳc khúa học, học viờn cú khả năng:
1. Phõn biệt được cỏc phương phỏp chọn mẫu cơ bản ỏp dụng trong nghiờn cứu khoa học;
2. Nếu được ưu, nhược điểm của từng phương phỏp chọn mẫu và chỉ định ỏp dụng trong từng nghiờn cứu cụ thể;
3. Phõn biệt được cỏc loại cụng thức tớnh cỡ mẫu thường ỏp dụng và cỏc thành phần cơ bản nờu trong cụng thức tớnh cỡ mẫu
4. Lựa chọn được cụng thức tớnh cỡ mẫu thớch hợp cho một nghiờn cứu cụ thể
Quần thể
Mẫu!
Lựa chọn
ngẫu nhiên!
Ngoại suy
ra quần thể
thông qua
các tham
số mẫu!
Quần thể!
Mẫu!
Lựa chọn
có chủ
đích!
Kết luận về quần thể thông qua ý kiến của các
đối tượng NC!
Định lượng Định tính
(Bao nhiêu? Bằng nào?) Cái gì? Như thế nào? Tại sao?
Quần thể nghiờn cứu
Mẫu
Tham số quần thể (à, σ, P )
Mẫu xỏc suất
Ngẫu nhiờn đơn
Ngẫu nhiờn hệ thống
Mẫu phõn tầng
Mẫu chựm
Mẫu nhiều bậc
Mẫu khụng xỏc suất
Mẫu kinh nghiệm
Mẫu thuận tiện
Mẫu chỉ tiờu
Mẫu cú mục đớch
Chọn mẫu
Ước lượng
• Điểm
• Khoảng
Kiểm định giả thuyết
Suy luận thống kờ(chỉ ỏp dụng cho mẫu xỏc suất với
cỡ mẫu
đủ lớn) Kết luận ngoại suy
Cỏc test thống kờ Gớa trị p Lựa chọn
Mụ tả cỏc tham số mẫu (trỡnh bày kết quả nghiờn cứu)
Tham số mẫu ( , s, p )
Biến số Thống kờ
mụ tả
Thống kờ suy luận
Vai trũ của chọn mẫu và cơ mẫu trong NC
Trang 2Mẫu trong nghiên cứu định tính
Quần thể!
Vấn đề!
Kiểm tra chéo
để hiểu sâu sắc về vấn đề
và ý kiến của các đối tượng!
Tại sao?!
Kiểm tra chộo thụng tin bằng cỏc phương phỏp thu thập số liệu khỏc nhau
Quần thể!
1 vấn đề!
Ph ỏ ng!
Kiểm tra tính trung thực của thông tin!
Tại sao?!
Các khái niệm liên quan đến quần thể
và mẫu
" Quần thể đích
" Quần thể nghiên cứu !
" Mẫu nghiên cứu !
" Đơn vị mẫu
" Đơn vị nghiên cứu.!
" Khung mẫu
" Một số khái niệm khác.!
Quần thể !
Là 1 tập hợp của nhiều đơn vị hay nhiều cá thể có cùng 1 đặc trưng nào đó
Quần thể đích!
Là quần thể mà người nghiên cứu muốn kết luận cho kết quả nghiên cứu của mình
Quần thể nghiên cứu!
Là quần thể mà từ đó 1 mẫu nghiên cứu
được lấy ra
Trang 3Mẫu nghiên cứu!
Là 1 tập hợp con của 1 quần thể nghiên
cứu
Có các đặc điểm đại diện cho quần thể
nghiên cứu !
Một mẫu tốt là mẫu có thể cho phép ngoại
suy (ước lượng) các đặc điểm cần quan tâm
của quần thể từ mẫu với độ chính xác và tính
kinh tế cao nhất
Đơn vị mẫu!
Là 1 tập hợp hay 1 cá thể thuộc quần thể nghiên cứu mà là cơ sở cho việc chọn mẫu
Đơn vị nghiên cứu:!
Là chủ thể mà các đo lường, nghiên cứu triển khai trên chủ thể đó
Khung mẫu!
Là 1 tập hợp các đơn vị mẫu
Nó có thể là 1 danh sách hay 1 bản đồ
được chuẩn bị trước cho một số kỹ thuật chọn mẫu
Bốn yêu cầu khi lấy mẫu nghiên cứu.!
Tính đại diện.!
Thực hiện nhanh
Thực thi được.!
Kinh tế!
Mỗi đơn vị hay cá thể trong quần thể có cùng cơ hội như nhau được chọn vào
mẫu (same opportunity)
Phương phỏp chọn mẫu cú thể mụ tả
được (describable)
Phương pháp ít có sai số (unbiased).!
Thích hợp với thiết kế nghiên cứu
(appropriate)
Trang 4Hai thiết kế chọn mẫu cơ bản.!
Mẫu xác suất,
Mẫu không xác suất
PP chọn mẫu xác suất chủ yếu:!
1. Ngẫu nhiên đơn
2. Ngẫu nhiên hệ thống
3. Ngẫu nhiên phân tầng
4. Ngẫu nhiên theo chùm
5. Ngẫu nhiên nhiều giai đoạn
Chọn mẫu theo phương pháp PPS
(Probability Proportionate to Size)
Phân biệt chọn mẫu và phân bổ mẫu
Quần thể nghiên cứu (10,000)
Mẫu NC (500)
Chọn mẫu
Mẫu NC (500)
Nhóm
NC (250)
Chứng (250)
Phân
bổ mẫu
"
1 Mẫu ngẫu nhiên đơn (simple random sampling)
Là mẫu mà mỗi cá thể trong quần thể có cùng cơ hội như nhau được chọn vào mẫu
Phương pháp:
Quyết định đơn vị mẫu là gì?
Lập danh sách đơn vị mẫu (khung mẫu) và
đánh số từng đơn vị mẫu
Xác định số đơn vị mẫu cần có
Xác định một số ngẫu nhiên (= PP ngẫu nhiên)
Lấy đơn vị mẫu có số trùng số ngẫu nhiên
vào mẫu
Chọn mẫu xác xuất !
Trang 5Sơ đồ chọn mẫu ngẫu nhiên đơn!
Quần thể với cỡ N!
Mẫu với cỡ n
p
s
P!
à!
σ!
X
Vớ dụ về bảng số ngẫu nhiờn
1 Mẫu ngẫu nhiên đơn (tiếp)
Ưu điểm:
Đơn giản, dễ làm
Có tính ngẫu nhiên và đại diện cao
Là kỹ thuật chọn mẫu xác suất cơ bản sử
dụng ở các kỹ thuật chọn mẫu khác
Hạn chế:
Cần cú khung mẫu và đơn vị mẫu
Đơn vị mẫu phõn tỏn nờn phải đi lại nhiều
Do yếu tố may rủi nờn nhiều khi số cỏ thể
chọn vào mẫu khụng đại diện cho dõn số
2 Mẫu hệ thống!
Đơn vị mẫu đầu được chọn ngẫu nhiên Đơn vị mẫu tiếp theo được chọn có hệ thống (một khoảng hằng định theo sau 1 sự bắt đầu ngẫu nhiên)
Phương pháp:
Xác định và đánh số đơn vị mẫu (khung mẫu)
Khoảng cách mẫu k, k = Số cá thể trong quần thể N/ cỡ mẫu n, (k= N/n)
Đơn vị mẫu đầu tiên (i) nằm giữa 1 và k bằng PP
ngẫu nhiên đơn
Đơn vị mẫu tiếp theo: Cộng k với đơn vị mẫu đầu
tiên, tiếp tục cho đến khi đủ số mẫu:
i + 1k; i + 2k; i + 3k
Trang 6Sơ đồ chọn mẫu ngẫu nhiên hệ thống!
Số ngẫu nhiên được
chọn gi ữ a 1 và k
i i + k i + 2k i + 3k i + (n-1)k
k k k k k k
2 Mẫu hệ thống (tiếp) !
Ưu điểm:
Nhanh và dễ áp dụng
Không cần có khung mẫu trước
Đơn giản trong điều kiện thực địa
Hạn chế:
Số liệu có tính chu kỳ, ước tính sẽ hạn chế
Đơn vị mẫu không xếp ngẫu nhiên hoặc
trùng với k, thiếu đại diện
3 Chọn mẫu ngẫu nhiên phân tầng!
• Chia cá thể từ quần thể thành các nhóm được
gọi là tầng (strata) hay lớp (layer) có chung
các đặc điểm và chọn 1 mẫu ngẫu nhiên
trong mỗi tầng
Phương pháp:
Phân quần thể thành tầng đồng nhất tùy đặc
điểm
Chọn đơn vị mẫu trong mỗi tầng bằng PP
ngẫu nhiên đơn
Sơ đồ chọn mẫu phân tầng!
Tất cả
bệnh viện!
Trang 73 Chọn mẫu ngẫu nhiên phân tầng (tiếp)!
Ưu điểm:
Dễ phân các tầng với các yếu tố đồng nhất
Tham số mẫu dễ tính
Có tính đại diện cao
Hạn chế:
Thiếu chính xác khi đơn vị mẫu ít ở mỗi
tầng
Phải có trước danh sách cá thể mỗi tầng
4 Mẫu ngẫu nhiên theo chùm!
Một quần thể đã được nhóm thành các chùm theo các tiêu thức khác nhau, đơn vị mẫu là chùm, từ đó N/C trên cá thể của chùm đã được chọn ngẫu nhiên
Phương pháp
Xác định chùm thích hợp
Lập danh sách chùm (khung mẫu)
Chọn chùm ngẫu nghiên từ danh sách
Chọn các cá thể bằng 2 cách:
- Lấy tất cả các cá thể (nếu không có danh sách) của các chùm (chùm 1 bậc)!
- Lập danh sách, chọn cá thể bằng PP ngẫu nhiên đơn hoặc hệ thống (chùm 2 bậc).!
Sơ đồ chọn mẫu chùm!
n 1
n 2
n 3
4 Mẫu ngẫu nhiên theo chùm (tiếp) !
Ưu điểm:
Có thể điều tra phạm vi rộng, phân tán, không
có được danh sách các đơn vị nghiên cứu
Khung mẫu đơn giản (danh sách các chùm),
dễ lập
điều tra dễ & nhanh vì đối tượng nghiên cứu
được nhóm lại theo cụm
Có hiệu quả kinh tế (kinh phí, thời gian)
WHO khuyến cáo dùng trong TCMR, CDD, lao và sốt rét
Trang 84 Mẫu ngẫu nhiên theo chùm (tiếp) !
Hạn chế:
Tính chính xác và tính đại diện thấp
Cỡ chùm lớn tính đại diện thấp, đặc biệt
bệnh hiếm
Số chùm > 30 là tốt nhất
Khó xác định mối quan hệ căn nguyên
Không phù hợp trong đo lường thay đổi về
tình trạng SK, dịch vụ y tế, nguồn lực
Phương pháp WHO khuyến nghị (PPS)
áp dụng trong N/C cộng đồng khi P lớn và không đều
1 Chọn huyện
2 Chọn xã
i + 2k; i + 3k; ) đến khi đạt 30 chùm.
Phương phỏp PPS (tiếp)
3 Chọn cá thể.!
Xác định số cá thể cần cho mỗi chùm =
Cỡ mẫu/ 30
Chọn các cá thể bằng 2 cách:
- Lấy tất cả các cá thể (nếu không có
danh sách) của các chùm!
- Lập danh sách, chọn cá thể bằng PP
ngẫu nhiên đơn hoặc hệ thống.!
5 Mẫu ngẫu nhiên nhiều giai đọan!
Nhóm tất cả các đơn vị mẫu trong quần thể thành các nhóm có thứ bậc
Ví dụ: Các hộ gia đình, các thôn, các huyện, các tỉnh
Lấy ra: %1 mẫu tỉnh
1 mẫu huyện
1 mẫu thôn,
1 mẫu hộ gia đình,
1 mẫu các cá thể
Trang 9II/ Cỡ mẫu và cỏch ước tớnh cỡ mẫu
cho một nghiờn cứu cụ thể
Yếu tố ảnh hưởng đến cỡ mẫu
tham số quần thể càng nhỏ thì cỡ mẫu càng lớn
Một số nguyên tắc tính cỡ mẫu
" Cỡ mẫu chỉ tính cho biến phụ thuộc, trừ
nghiên cứu bệnh chứng
" Khi 1 nghiên cứu có nhiều biến phụ thuộc
thì phải tính cỡ mẫu cho tất cả các biến,
sau đó chọn cỡ mẫu lớn nhất
Cỡ mẫu ước lượng 1 tỷ lệ
• (1-p): Tỷ lệ đối tượng không có bệnh
và tham số quần thể.!
• α: Mức ý nghĩa thống kê thường là 0,05 hoặc 0,01.!
• Giá trị Z thu được từ bảng Z ứng với giá trị α
hoặc
Trang 10Cỡ mẫu ước lượng 1 giá trị trung bình
và tham số quần thể.!
• α: Mức ý nghĩa thống kê thường là 0,05 hoặc 0,01.!
• Giá trị Z thu được từ bảng Z ứng với giá trị α
• Giá trị trung bình (từ NC trước hoặc NC thử)
hoặc
• n 1 = n 2 = n: Cỡ mẫu nghiên cứu cần có!
• p 1 ,p 2 : Tỷ lệ mắc bệnh tương tự như nhóm 1 và 2
(theo NC trước hoặc nghiên cứu thử)
• Δ: Khoảng sai lệch mong muốn giữa 2 tham số quần
• thể (P1 – P2)!
• α: Mức ý nghĩa thống kê thường là 0,05 hoặc 0,01.!
• Mức sai lầm loại 2 cho phép
• Giá trị Z thu được từ bảng Z ứng với giá trị
Cỡ mẫu kiểm định 2 tỷ lệ
hoặc
Cỡ mẫu kiểm định 2 giá trị trung bình
• n 1 =n 2 =n: Cỡ mẫu nghiên cứu cần có!
• Δ: Khoảng sai lệch mong muốn giữa 2 tham số quần
• thể!
• α: Mức ý nghĩa thống kê thường là 0,05 hoặc 0,01.!
• Mức sai lầm loại 2 cho phép
• Giá trị Z thu được từ bảng Z ứng với giá trị
hoặc
Điều chỉnh cỡ mẫu với QT hữu hạn
nờu trờn là cỡ mẫu tớnh cho cỏc nghiờn cứu khi quần thể nghiờn cứu lớn (cũn gọi là quần thể vụ hạn) Trong trường hợp cỡ mẫu này vượt quỏ 5%
kớch thước của quần thể thỡ khi đú quần thể được gọi là hữu hạn và cỡ mẫu trờn cần được điều chỉnh cho hợp lý hơn
– nf: Cỡ mẫu điều chỉnh cho quần thể hữu hạn – N: Kớch thước của quần thể hữu hạn – n: Cỡ mẫu tớnh theo cụng thức
Trang 11Cỡ mẫu trong nghiên cứu bệnh chứng
- p 1 : Tỷ lệ phơi nhiễm với yếu tố nguy cơ được ước lượng
cho nhóm bệnh
- p 0 : Tỷ lệ phơi nhiễm với yếu tố nguy cơ được ước lượng
nghiên cứu trước hoặc nghiên cứu thử)
- ε: %Mức độ chính xác mong muốn (chênh lệch cho phép
giữa tỷ suất chênh (OR) thực của quần thể OR thu
được từ mẫu)
Cỡ mẫu trong nghiên cứu thuần tập
p1: Tỷ lệ mắc bệnh được ước lượng trong nhóm tiếp xúc với yếu tố nguy cơ
p0: Tỷ lệ mắc bệnh được ước lượng cho nhóm không tiếp xúc với yếu tố nguy cơ Tỷ lệ p1 và p0 được lấy
từ kết quả của NC trước hoặc NC thử
ε: Mức độ chính xác mong muốn (chênh lệch cho phép giữa nguy cơ tương đối (RR) thực của quần thể và RR thu được từ mẫu)