Mẫu (sample) Tập hợp con của quần thể (population), đại diện cho quần thể Quy trình chọn mẫu phù hợp sẽ tạo ra mẫu đại diện cho quần thể Chọn ngẫu nhiên từ quần thể Nghiên cứu trên mẫu Không nhất thiết NC toàn bộ quần thể Chỉ cần NC trên mẫu Kết quả của MẪU khái quát chung cho QUẦN THỂ Kết quả của mẫu không giống hoàn toàn kết quả thật trong quần thể. Cần chấp nhận sai số này. Quy trình chọn mẫu phù hợp giúp giảmloại trừ sai số này.
Trang 1Nghiên cứu trên mẫu
Trang 2Xác định tỉ lệ bệnh đái tháo đường
ở người trưởng thành tại Đà Nẵng
Dân số: 1 triệu người
1 triệu bộ câu hỏi in, phát, thu về, kiểm tra, nhập liệu
1 triệu xét nghiệm đường máu
Tìm gặp tất cả 1 triệu người
Trang 3Mẫu (sample)
•Tập hợp con của quần thể (population), đại diện
cho quần thể
•Quy trình chọn mẫu phù hợp sẽ tạo ra mẫu đại
diện cho quần thể
•Chọn ngẫu nhiên từ quần thể
Trang 4Nghiên cứu trên mẫu
• Không nhất thiết NC toàn bộ quần thể
• Chỉ cần NC trên mẫu
• Kết quả của MẪU khái quát chung cho QUẦN THỂ
• Kết quả của mẫu không giống hoàn toàn kết quả thật
trong quần thể Cần chấp nhận sai số này Quy trình chọn mẫu phù hợp giúp giảm/loại trừ sai số này.
Trang 5Chọn mẫu đại diện cho quần thể
• Cỡ mẫu: bao nhiêu đối tượng là đủ?
Tính khả thi
Kinh phí
Đạo đức (quá ít >< quá nhiều)
• Quy trình chọn mẫu: đảm bảo tính ngẫu nhiên
và đại diện (gần giống nhất với quần thể)
Trang 6α và β
• α: thường được xác định ở mức 0.05 hay 0.01 Nếu α = 0.05
chúng ta chấp nhận 5% cơ hội phát hiện sự khác biệt giữa
các nhóm nghiên cứu khi trên thực tế không có sự khác biệt nào tồn tại (dương tính giả).
• β: thường chấp nhận 0.2 hay 0.1
• Power (1- β): xác suất mà nghiên cứu KHÔNG tìm ra sự khác
biệt giữa các nhóm nghiên cứu khi trên thực tế có sự khác biệt giữa các nhóm nghiên cứu (âm tính giả)
Ví dụ: power =80% tức là chúng ta đang chấp nhận cứ 5 lần có sự khác biệt thực tế, thì chúng ta có 1 lần không
phát hiện ra sự khác biệt này
Trang 9Bài tập
Ước tính cỡ mẫu để xác định tỉ lệ sinh viên
KYD bị cận thị Công thức
•
Trang 10Ước tính cỡ mẫu để xác định số trung bình
• Công thức
SD (standard deviation): độ lệch chuẩn (NC trước
đó, báo cáo, kinh nghiệm, NC thăm dò)
= 1.96 nếu chọn α=0.05 (p<0.05)
= 2.56 nếu chọn α = 0.01 (p<0.01)
e: sai số tuyệt đối (do nhà NC quyết định)
•
Trang 12Bài tập
Ước tính cỡ mẫu để xác định cân nặng trung
bình của sinh viên KYD
Công thức
•
Trang 13Ước tính cỡ mẫu cho NC
bệnh chứng
•Công thức
•
Trang 14NC bệnh chứng xác định mối liên quan giữa
•
Trang 16Phương pháp chọn mẫu
• Mẫu ngẫu nhiên đơn (random sample)
• Mẫu phân tầng (stratified sample)
• Mẫu phân tầng tỉ lệ
• Mẫu cụm (cluster sampling)
• Mẫu nhiều giai đoạn (multi-stage sample)
• Mẫu thuận tiện (convenient sample)
Trang 17Mẫu ngẫu nhiên đơn
• Mỗi cá nhân trong quần thể có cơ hội được chọn như nhau
• 2 bước
Lập danh sách toàn bộ quần thể
Chọn ngẫu nhiên từ danh sách (phần mềm máy tính)
• Ngẫu nhiên ≠ Tùy tiện
Tùy tiện: chọn 10 bệnh nhân đang chờ khám bệnh mà
không tuân theo quy trình nào cụ thể
Ngẫu nhiên: Lập danh sách tất cả bệnh nhân đang chờ khám từ 7-11 giờ sáng, mỗi bệnh nhân cho 1 mã số, dùng phần mềm máy tính chọn ra 10 bệnh nhân
Trang 18Mẫu ngẫu nhiên đơn
• Ví dụ: Chọn mẫu để tính chiều cao trung bình của SV KYD
Phần mềm (R: sample (c (1:100), size=
30, replace=T)
Trang 19 Nam
Nữ
Trang 20 Nam 40%
Nữ 60%
Trang 21Có khả thi không khi lập danh sách 1 triệu dân Đà Nẵng để chọn ngẫu nhiên?
Trang 22Danh sách
TTH ở Đà Nẵng
Mỗi TTH
có 1 mã riêng
Phương pháp ngẫu nhiên chọn ra 10 TTH
Trang 23Mẫu nhiều giai đoạn
Thường dùng cho các nghiên cứu cộng đồng
Giai đoạn 1
mỗi TTH trong 10 trường được chọn
Mỗi HS có mã riêng
Phương pháp ngẫu nhiên chọn 100 HS
ở mỗi trường
Giai đoạn 2 Ngẫu nhiên đơn
Phân tầng
Trang 24Tài liệu tham khảo
• Y học thực chứng (Nguyễn Văn Tuấn)
• How to Calculate Sample Size for Different Study Designs in Medical Research?: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3775042 /
• Methodology Series Module 5: Sampling Strategies