Bài giảng trình bày các phương pháp chọn mẫu xác suất và mẫu không xác suất, ưu điểm và nhược điểm của từng phương pháp chọn mẫu; phương pháp tính cỡ mẫu dựa trên các công thức cơ bản. Mời các bạn cùng tham khảo bài giảng để nắm chi tiết nội dung các kiến thức.
Trang 1Chọn mẫu và tính cỡ mẫu
ThS Đinh Thái Sơn
Viện Đào tạo Y học dự phòng và Y tế công cộng
Trường Đại học Y Hà Nội
Mục tiêu
nhược điểm của từng phương pháp chọn mẫu
mẫu dựa trên các công thức cơ bản
QUẦN THỂ
• Quần thể (population): tất cả các cá thể có các đặc
điểm chung nhất định
• Quần thể đích (target population): quần thể mà người
nghiên cứu muốn kết luận
• Quần thể nghiên cứu (study population): mẫu nghiên
cứu được rút ra
MẪU NGHIÊN CỨU
nghiên cứu
suy (ước lượng) các đặc điểm cần quan tâm
Trang 2ĐƠN VỊ QUAN SÁT VÀ ĐƠN VỊ MẪU
• Đơn vị quan sát: là chủ thể hoặc người mà sự quan
sát hoặc đo lường sẽ được tiến hành khi thực hiện
nghiên cứu
• Đơn vị mẫu: Là chủ thể thuộc quần thể nghiên cứu là
cơ sở cho việc chọn mẫu.
KHUNG MẪU
chọn mẫu
CHỌN MẪU
sampling)
CHỌN MẪU XÁC SUẤT
Trang 3MẪU NGẪU NHIÊN ĐƠN
thể trong quần thể có cùng cơ hội (cùng xác
suất) để được chọn vào mẫu
CHỌN NGẪU NHIÊN ĐƠN
đánh số từng đơn vị mẫu
Ưu điểm:
dụng ở các kỹ thuật chọn mẫu khác
Hạn chế:
mẫu và đơn vị chuẩn bị sẵn
Trang 4CHỌN MẪU NGẪU NHIÊN HỆ THỐNG
bằng cách áp dụng một khoảng hằng định
3k sẽ được chọn vào mẫu cho đến khi kết
Sơ đồ chọn mẫu hệ thống
ƯU ĐIỂM VÀ NHƯỢC ĐỂM CỦA CHỌN MẪU
NGẪU NHIÊN HỆ THỐNG
Ưu điểm:
Hạn chế:
với k, thiếu đại diện
CHỌN MẪU PHÂN TẦNG
thể của quần thể nghiên cứu thành các nhóm
tầng khác nhau
thể bằng nhau hay tỷ lệ với số cá thể của mỗi tầng
Trang 5Sơ đồ chọn mẫu phân tầng ƯU ĐIỂM VÀ HẠN CHẾ MẪU PHÂN TẦNG
Ưu điểm:
Hạn chế:
CHỌN MẪU CHÙM
nhiều chùm trong một quần thể NC
1 bậc)
Sơ đồ chọn mẫu chùm / cụm
Trang 6ƯU ĐIỂM VÀ HẠN CHẾ CỦA CHỌN MẪU CHÙM
Ưu điểm:
•Điều tra dễ & nhanh
Hạn chế của mẫu chùm
Mẫu ngẫu nhiên nhiều giai đoạn
thành các nhóm có thứ bậc
các tỉnh
Lấy ra:1 mẫu tỉnh
1 mẫu huyện
1 mẫu thôn,
1 mẫu hộ gia đình,
1 mẫu các cá thể
CHỌN MẪU KHÔNG XÁC SUẤT
Mẫu có mục đích
• Lấy mẫu có mục đích dựa vào quyết định của các
nhà NC
Mẫu thuận tiện
• Mẫu thuận tiện là mẫu thu được trên cơ sở các cá
thể có sẵn
Một số phương pháp chọn mẫu không xác suất
khác
• Mẫu tình nguyện
• Mẫu chỉ tiêu: đảm bảo có các đối tượng NC đến từ
các nhóm đặc trưng khác nhau.
• Mẫu bóng tuyết: hay áp dụng với các quần thể ẩn
Mẫu có mục đích (purposive sampling)
nhau
Trang 7Mẫu thuận tiện
Ưu điểm và nhược điểm chọn mẫu thuận tiện
Mẫu chỉ tiêu
• Đảm bảo rằng một số nhất định các đơn vị mẫu với
các tính chất đặc trưng sẽ có mặt trong mẫu
• Ưu điểm:
Dễ dàng quản lý
Lấy mẫu nhanh và đủ mẫu
Chi phí không cao
Tương ứng với tỷ lệ trong quần thể, nếu muốn
Có thể thực hiện nếu mẫu xác suất không thực hiện
được
TÍNH TOÁN CỠ MẪU
phân tích)
Trang 8SAI SỐ CHO PHÉP CỦA ƯỚC LƯỢNG, SAI
LẦM LOẠI 1 VÀ ĐỘ TIN CẬY
của huyện A
lầm loại 1 là 5%
YẾU TỐ ẢNH HƯỞNG ĐẾN TÍNH TOÁN CỠ MẪU
càng lớn
và tham số quần thể càng nhỏ thì cỡ mẫu càng lớn
lớn hơn
Nghiên cứu
ngang
Ước tính một tỷ lệ
Ước tính một trung bình
So sánh hai tỷ lệ
So sánh hai trung bình
Nghiên cứu bệnh
chứng
Nghiên cứu thuần
tập
Cỡ mẫu ước tính một tỷ lệ
•Ví dụ: Cỡ mẫu cho việc xác định tỷ lệ mắc lao ở trẻ em 5 tuổi tại huyện Hương Trà, Huế.
•Trong đó:
•p: Tỷ lệ mắc lao tại một cộng đồng
•: Khoảng sai lệch mong muốn giữa tỷ lệ thu được từ mẫu (p) và tỷ
lệ của quấn thể (P)
•: Mức ý nghĩa thống kê (được quy ước bởi người nghiên cứu).
•Z /2: Giátrị Z thu được từ Bảng Z ứng với giá trị được chọn
• được chọn là một tỷ lệ nào đó so với tỷ lệ bệnh p
Trang 9Cỡ mẫu ước tính một giá trị trung bình
• Ví dụ: Cỡ mẫu cho việc xác định nồng độ Cholesterol trung bình
của sinh viên trường Đại học Y Hà Nội
•n: Cỡ mẫu nghiên cứu cần có
•s: Độ lệch chuẩn (từ một NC trước đó hoặc một NC thử)
• : Khoảng sai lệch cho phép giữa hàm lượng Cholesterol thu
được từ mẫu nghiên cứu và tham số của quần thể
• : Mức ý nghĩa thống kê (được quy ước bởi người nghiên cứu)
•Z /2 : Giá trị Z thu được từ bảng Z ứng với giá trị được chọn
Ước tính cỡ mẫu so sánh hai tỷ lệ
•Ví dụ: Cỡ mẫu để so sánh tỷ lệ bệnh bướu cổ đơn
thuần giữa hai huyện Gia Lâm và Đông Anh, Hà Nội
• p1: Tỷ lệ mắc bướu cổ tại huyện tương tự như Gia Lâm
• p2: Tỷ lệ mắc bướu cổ tại huyện tương tự như Đông Anh
• : Mức ý nghĩa thống kê
• : Xác suất của việc phạm phải sai lầm loại II (chấp nhận Ho khi Ho sai
• Z 2 (,): được tra từ bảng
Cỡ mẫu so sánh hai trung bình
Ví dụ: Cỡ mẫu xác định sự khác nhau của hàm lượng đường huyết
giữa nhóm ĐT thuốc mới và nhóm đối chứng tại khoa Nội tiết bệnh
viện Bạch Mai
•n: Cỡ mẫu nghiên cứu cần có
•s: Độ lệch chuẩn Trong trường hợp này, độ lệch chuẩn của hai
nhóm được giả sử là như nhau.
•: Sự khác biệt của hàm lượng đường huyết trung bình giữa hai
nhóm mong muốn của nhà nghiên cứu
•: Mức ý nghĩa thống kê
Cỡ mẫu nghiên cứu bệnh chứng
•p 1 :Tỷ lệ các cá thể phơi nhiễm với yếu tố nguy cơ được ước lượng cho nhóm bệnh
•p 0 : Tỷ lệ các cá thể phơi nhiễm với yếu tố nguy cơ được ước lượng cho nhóm chứng
của quần thể và OR thu được từ mẫu)
Trang 10Cỡ mẫu cho nghiên cứu thuần tập
•p 1 : Tỷ lệ các cá thể mắc bệnh được ước lượng trong
nhóm tiếp xúc với yếu tố nguy cơ
•p 0 : Tỷ lệ các cá thể mắc bệnh được ước lượng cho
nhóm không tiếp xúc với yếu tố nguy cơ
: Mức độ chính xác mong muốn (chênh lệch cho
phép giữa nguy cơ tương đối (RR) thực của quần thể và
RR thu được từ mẫu)
Trận trọng cảm ơn!
ThS Đinh Thái Sơn Viện Y học Dự phòng và Y tế công cộng