ĐẶT VẤN ĐỀ Khi thực hiện nghiên cứu mẫu , để đạt được mục tiêu nghiên cứu, người nghiên cứu cần làm gì để có được 1 mẫu nghiên cứu tốt?. Chọn ngẫu nhiên 5 huyện trong 12 huyện để thực
Trang 1ĐẶT VẤN ĐỀ
Khi thực hiện nghiên cứu mẫu , để đạt được mục tiêu nghiên cứu, người nghiên cứu cần làm gì để
có được 1 mẫu nghiên cứu tốt?
1 Xác định quần thể nghiên cứu?
2 Cỡ mẫu bao nhiêu là đủ lớn?
3 Chọn mẫu đúng kỹ thuật?
Trang 2 Phần 2: THỐNG KÊ
BÀI 8 MỘT SỐ PHƯƠNG PHÁP CHỌN MẪU
VÀ XÁC ĐỊNH CỠ MẪU NGHIÊN CỨU
(02 LT- 02TH)
Trang 4NỘI DUNG
1 ĐẶT VẤN ĐỀ
Trong 1 nghiên cứu điều tra về tình trạng SDD của trẻ ≤ 5 tuổi tại tỉnh Hải Dương năm 2018 Chọn ngẫu nhiên
5 huyện trong 12 huyện để thực hiện nghiên cứu Mỗi
huyện chọn ra 20 hộ gia đình Tất cả trẻ ≤ 5 tuổi trong các
hộ gia đình được chọn đều được thăm khám trực tiếp.
Phương pháp chọn mẫu nào phù hợp ?
Trang 5• Quần thể đích: { Trẻ ≤ 5 tuổi tại Hải Dương
năm 2018 }
• Quần thể nghiên cứu: { Trẻ ≤ 5 tuổi trong 5 huyện
của tỉnh Hải Dương }
• Mẫu: {Trẻ ≤ 5 tuổi trong 100 hộ gia đình của 5 huyện}
• Đơn vị mẫu: hộ gia đình
→ Khung chọn mẫu = { danh sách 100 hộ gia đình }
• Đơn vị quan sát: trẻ ≤ 5 tuổi/100 hộ gia đình
Trang 6Ngẫu
nhiên
đơn
Ngẫu nhiên hệ thống
Ngẫu nhiên phân tầng
Mẫu chùm
Mẫu mục đích
Mẫu thuận tiện
Mẫu chỉ tiêu
Trang 7PHÂN BIỆT MẪU XÁC SUẤT VÀ MẪU KHÔNG XÁC SUẤT
cá thể → tính đại diện cao
Trang 8* Các cá thể có cùng 1 cơ hội được chọn vào mẫu với xác suất nhất định (xác suất chọn ngẫu nhiên đơn)
Mẫu cỡ n
Quần thể cỡ N
n p
Trang 9 Bước 1: Lập khung chọn mẫu của quần thể nghiên cứu
(hay: danh sách các cá thể của
quần thể nghiên cứu)
Mẫu ngẫu nhiên đơn: Đơn giản, dễ thực hiện, hiệu quả
nhưng chỉ áp dụng cho quần thể nghiên cứu nhỏ, các cá thể gần nhau
Trang 10 Bước 1: Lập khung chọn mẫu Cách chọn
Bước 3: Chọn số ngẫu nhiên đầu
tiên i sao cho: 1< i < k
Bước 4: Chọn các cá thể tiếp theo:
i+k ; i+2k ; i+3k ;…; i+ (n-1)k;…
cho đến hết khung chọn mẫu
i i+k i+2k i+3k i+(n-1)k
Số ngẫu nhiên đầu tiên i chọn giữa 1 và k
Trang 11 Lập khung chọn mẫu: danh sách 400 cá thể
Trang 12? Tại sao không chọn số ngẫu nhiên đầu tiên i = 1 hay i = k
Khu chung cư
Trang 13 Mẫu sẽ thiếu tính đại diện về
phân bố không gian
đối với các đặc trưng nghiên cứu có
tính chu kỳ
Nếu chọn
số ngẫu nhiên đầu tiên
i= 1 hoặc i= k
Nhược điểm của mẫu ngẫu nhiên hệ thống:
Không phù hợp với các đặc trưng nghiên cứu có tính chu kỳ
Trang 14* Sơ đồ: Chọn mẫu phân tầng trong điều tra bệnh viện với tiêu thức phân
tầng là quy mô bệnh viện
ngẫu nhiên đơn
Phân tầng
ngẫu nhiên đơn
n n n n
Trang 15 Bước 1: Phân tầng (giữa các tầng không có sự
Trên từng phân tầng: Mẫu có tính đại diện, khái quát cao
nhưng đòi hỏi phải có khung chọn mẫu của từng tầng
→ khó thực hiện.
Trang 16• B1: Xác định các chùm thích hợp
(chùm có thể là: huyện, xã, khoa phòng, bệnh viện,…)
đơn vị mẫu = chùm (= 1 tập hợp các cá thể)
Trang 17 Ví dụ: Lựa chọn phương pháp chọn mẫu phù
hợp cho nghiên cứu sau:
Trong 1 nghiên cứu điều tra về tình trạng SDD
của trẻ ≤ 5 tuổi tại tỉnh Hải Dương năm 2018
Chọn ngẫu nhiên 5 huyện trong 12 huyện để thực hiện nghiên cứu Mỗi huyện chọn ra 20 hộ gia đình.Tất cả trẻ ≤ 5 tuổi trong các hộ gia đình được chọn đều được thăm khám trực tiếp
Trang 18 Ví dụ: Chọn mẫu chùm (Cluster sampling)
1 chùm = 1 huyện: là đơn vị mẫu
→ Khung chọn mẫu = {danh sách 12 huyện}
Chọn ngẫu nhiên đơn: 5 huyện/ 12 huyện
( bằng hình thức bốc thăm ngẫu nhiên)
Chọn ngẫu nhiên hệ thống trong từng chùm:
- Lập khung chọn mẫu của huyện 1(ds các hộ gia đình) →
chọn ra 20 hộ gia đình
- ……….
- Lập khung chọn mẫu của huyện 5(ds các hộ gia đình) →
chọn ra 20 hộ gia đình
Người n/c có được ds 100 hộ gia đình của 5 huyện → tất cả
trẻ ≤ 5 tuổi trong các hộ gia đình được chọn đều được thăm khám trực tiếp
Trang 193.1.Các yếu tố ảnh hưởng đến cỡ mẫu
• Loại thiết kế nghiên cứu
• Kỹ thuật chọn mẫu
• Sự kiện nghiên cứu
• Tham số nghiên cứu
• Mức độ sai lệch giữa tham số mẫu và tham số quần thể
• Kế hoạch phân tích số liệu
• Số lượng biến nghiên cứu
• Kinh phí hiện có, nhân lực, thời gian
3 CỠ MẪU VÀ CÁCH TÍNH CỠ MẪU
Trang 20• p: tỷ lệ mẫu ( tính từ 1 nghiên cứu thử)
Khi p = 0,5 thì cỡ mẫu đạt tối đa.
• Sai số tuyệt đối
• α : mức ý nghĩa thống kê (Significance)
• 1- α : độ tin cậy (Reliability)
2
2
2 / 1
) 1
(
Trang 213.2 CÔNG THỨC TÍNH CỠ MẪU 3.2 CÔNG THỨC TÍNH CỠ MẪU
: là hệ số giới hạn tin cậy
Bảng hệ số giới hạn tin cậy theo mức ý nghĩa thống kê
1 / 2
Z
Trang 23Một nhóm nghiên cứu được thông báo là tỷ lệ trẻ
Trang 24Hỏi phải điều tra bao nhiêu em để đạt được tỷ lệ chênh
lệch 5% so với tỷ lệ chung với độ tin cậy 95%?
Trang 25• n: cỡ mẫu
• S: độ lệch chuẩn ( tính từ 1 nghiên cứu thử)
• : sai số tuyệt đối
• α: mức ý nghĩa thống kê (α = 0,1; 0,05; 0,01)
tương ứng với độ tin cậy (1- α ) là 90%; 95%; 99%
2
2 2
2 /
Trang 26: giá trị trung bình tính từ 1 nghiên cứu thử
• ε: sai số tương đối
(ε dao động từ 0,05 – 0,5; thường lấy ε = 0,2 hoặc 0,3)
X
2
2 2
2 / 1
) (
3.2 CÔNG THỨC TÍNH CỠ MẪU
Cỡ mẫu cho ước tính 1 giá trị trung bình quần thể
Hoặc:
Trang 27• p 1 , p 2 : là 2 tỷ lệ tính từ 1 nghiên cứu thử
• α : mức ý nghĩa thống kê (sai lầm loại I)
• β : sai lầm loại II (thường lấy β = 0,1)
Trang 28Bảng giá trị Z 2
(α,β) khi biết 2 giá trị α , β
6,611,7
14,917,8
0,01
5,410,0
13,015,8
0,02
3,87,9
10,5
Z 2 (α,β) = 13,0
2,76,2
8,610,8
0,1
0,50,2
Trang 29 Ví dụ 2:
Nghiên cứu về ảnh hưởng của hút thuốc lá đến
ung thư phổi Tiến hành nghiên cứu thăm dò trên
90 người hút thuốc lá thấy 60% có nguy cơ bị ung thư phổi
80 người không hút thuốc lá thấy tỷ lệ nguy cơ bị ung thư phổi là 35%
Hỏi phải nghiên cứu với cỡ mẫu bằng bao nhiêu để
có thế kết luận một cách đáng tin cậy 95% là nhóm hút thuốc lá có nguy cơ bị ung thư phổi cao hơn nhóm
không hút thuốc lá biết sai lầm loại II là . 0 , 05
Trang 30 Hướng dẫn
ung thư phổi
Trang 31 Hướng dẫn
ung thư phổi
Trang 32 Hướng dẫn
ung thư phổi
Trang 33• S: độ lệch chuẩn (của 2 nhóm như nhau)
• : sai số tuyệt đối
( trong đó: µ 1 , µ 2 là 2 giá trị trung bình của 2 nhóm theo
mong muốn của người nghiên cứu)
• α : mức ý nghĩa thống kê (sai lầm loại I)
• β : sai lầm loại II (thường lấy β =0,1)
2
2 2
) , (
2
Cỡ mẫu cho kiểm định sự khác nhau giữa 2 giá trị
trung bình (so sánh 2 giá trị TB)
Trang 34TỔNG KẾT - HƯỚNG DẪN VỀ NHÀ
1 Một số nội dung cần nhớ
• Một số phương pháp chọn mẫu xác suất:
Mẫu ngẫu nhiên đơn, ngẫu nhiên hệ thống, ngẫu nhiên phân tầng, mẫu chùm;
• Công thức tính cỡ mẫu cho 4 thiết kế nghiên cứu
2 Hướng dẫn về nhà
Làm bài tập: Bài 2.1 → 2.13
(Giáo trình trang 104 - 106)