Xác định được quần thể đích, quần thể nghiên cứu, đơn vị mẫu 2.. Đơ n vị lấy mẫu, khung mẫuĐơn vị lấy mẫu: là đơn vị của quần thể được chọn vào mẫu Đơn vị nghiên cứu: là một chủ thể mà s
Trang 1MẪU VÀ PHƯƠNG PHÁP
CHỌN MẪU
Ths Lê Minh Hữu
Trang 2Mục tiêu học tập
1 Xác định được quần thể đích, quần thể
nghiên cứu, đơn vị mẫu
2 Lựa chọn được phương pháp chọn mẫu
Trang 5Quần thể nghiên cứu
Quần thể đích
Suy diễn
Tham số (Parameter)
Kỹ thuật chọn mẫu
Trang 6Tại Sao Phải Ước Lượng Cỡ Mẫu
Giới hạn thời gian, kinh phí, nhân lực
Trang 7CÁC PHƯƠNG PHÁP
CHỌN MẪU
Trang 9Ví dụ
DS CT
ChọnDân số
ĐBSCL
Trang 10Đơ n vị lấy mẫu, khung mẫu
Khung mẫu: Danh sách các đơn vị mẫu hoặc
bản đồ phân bố mẫu
Ví dụ:
Danh sách người cao tuổi quản lý tại trạm
Danh sách học sinh tại trường học
Danh sách tên các hộ gia đình tại ấp/kv
Danh sách sẵn có hoặc được lập ra trong quá trình chọn mẫu
Trang 11Đơ n vị lấy mẫu, khung mẫu
Đơn vị lấy mẫu: là đơn vị của quần thể
được chọn vào mẫu
Đơn vị nghiên cứu: là một chủ thể mà
sự quan sát hoặc đo lường sẽ đượcthực hiện trên chủ thể
Trang 12Nghiên cứu về sử dụng hố xí tại xã X
200 hộ
Chủ hộ Đại diện
Trang 13Nhiều giai đoạn
Chọn mẫu không xác suất
Trang 14Chọn mẫu ngẫu nhiên đơn
Trang 15Là mẫu mà tất cả các thể trong quầnthể có cùng cơ hội để chọn vào mẫu
Chọn mẫu ngẫu nhiên đơn
Trang 16Bảng số ngẫu nhiên
45069 46367 56908
77119 54141 24182
04789 53422 60063
56039 44923 87309
88134 82309 16585
87128 91872 70215
96115 08858 68671
83219
85563
04928
33540 24516 77875 96540 30842
92865 25454 87474 30331 08220
32317 45728 17976 05266 60575
42853 42768 61977 79688 86644
38994 62723 52549 48733 84837
36969 74323 27354 94373 00252
32817 38515 87760 91777 38217
02339 09086 12307 34722 50361
03811 81875 54201 93797 33383
14309 04736 39648 29847 33254
47830 63042 92342 83977 81697
54237 13387 79716 98912 33025
81242 80164 07422 68827 79784
Trang 17Chọn mẫu ngẫu nhiên đơn
Ưu điểm:
Cách làm đơn giản, tính đại diện cao
Có thể lòng vào các kỹ thuật chọn mẫu khác
Hạn chế:
Cần phải có khung mẫu
Các cá thể được chọn vào mẫu có thể phân bố tản mạn
Trang 18Chọn mẫu ngẫu nghiên hệ thống
Sampling interval’s width is determined
Trang 19Chọn mẫu ngẫu nghiên hệ thống
Những cá thể được chọn theo một khoảng
Trang 20Chọn mẫu phân tầng
Trang 21Chọn mẫu phân tầng
Lý do phân tầng: Có sự khác biệt vềđặc tính nghiên cứu của các cá thể ởcác tầng
Tầng có thể phân chia theo: Khu vựcđịa lý, giới, tuổi, nghề nghiệp
Nên biết dân số của mỗi tầng (tỷ lệ dân
số của tầng)
Trang 22Ví dụ: Để khảo sát tỷ lệ hiện mắc bệnh
và các yếu tố nguy cơ gây bệnh Đáitháo đường tại thành phố CT, nhànghiên cứu có thể phân chia tầng theo
thành thị và nông thôn
Trang 23Cách chọn mẫu tầng
Thành phố CT
Phường Xã
Trang 27Cluster sample
Chọn mẫu chùm (cụm)
Trang 29Chọn mẫu chùm (cụm)
Các cụm thường là những đơn vị địa lý
(xã, ấp/khu vực) hoặc những đơn vị tổchức (các phòng khám, trường học…)
Số lượng cụm, tuỳ vào số cụm Nênchọn 30
Ví dụ: Chọn mẫu cụm trong xác định tỷ
lệ bao phủ tiêm chủng trẻ dưới 5 tuổicủa tỉnh X
Trang 31Chọn mẫu PPS – Xác suất tỷ lệ với kích
cỡ của quần thể
Sử dụng khi nghiên cứu trên cộng đồng
lớn, kích thước các cộng đồng không đều nhau
Các bước thực hiện
1 Liệt kê các cụm và dân số
2 Xếp các cụm theo một trình tự và cộng dồn
3 Chọn khoảng cách mẫu k = Dscd/số cụm
4 Chọn ngẫu nhiên con số i nào đó, chọn
cụm đầu tiên có dân số cộng dồn lớn hơn hoặc bằng i
5 Các cụm kế tiếp tính bằng cách lấy i + k
Trang 32Ví dụ
Một nghiên cứu về tình trạng sâu răngcủa học sinh tiểu học tại quận Ninh kiềuTPCT
Cỡ mẫu: 300 học
Số lượng trường tiểu học là 10
Số lượng trường tiểu học cần chọn là 4
Các bước chọn theo PPS?
Trang 33Tên trường và số lượng học sinh
Trang 35Tính khoảng cách k
Tên
Trường Số lượng Cộng dồn
Khoảng cách k
Trang 36Chọn số ngẫu nhiên i <= k
Tên
Trường Số lượng Cộng dồn
Khoảng cách
Chọn cụm
Trang 37Chọn các cụm còn lại
Tên
Trường Số lượng Cộng dồn
Khoảng cách
Chọn cụm
Trang 38Tính tổng học sinh của các trường được chọn
Tên
Trường Số lượng Cộng dồn
Khoảng cách
Chọn cụm Mẫu
Trang 39Tính cỡ mẫu cho các trường n i = (n x N i )/N
Tên
Trường Số lượng Cộng dồn
Khoảng cách
Chọn cụm Mẫu
Trang 40Chọn mẫu nhiều giai đoạn
Trong những quần thể rất lớn và rảikhắp
Trang 41Ví dụ: ĐBSCL có 13 tỉnh, mỗi tỉnh có nhiều huyện, mỗi huyện có nhiều xã
Giai đọan 1: Chọn ngẫu nhiên 3 tỉnh;
Giai đọan 2: Chọn ngẫu nhiên 2 huyện từ các tỉnh đã được chọn ở giai đoạn 1
Giai đọan 3: Chọn ngẫu nhiên 2 xã từ các huyện đã được chọn ở giai đoạn 2,
Giai đoạn 4: Chọn ngẫu nhiên 2 ấp từ xã
Giai đoạn 5: Chọn ngẫu nhiên 30 cá thể từ mỗi ấp
Trang 42Chọn mẫu không xác suất
Hay gặp trong nghiên cứu lâm sàng
Trong nghiên cứu định tính
Chọn mẫu theo tiêu chí nhất định
Trang 43Chọn mẫu không xác suất
HIỆU QUẢ MISOPROSTOL ĐẶT ÂM
ĐẠO TRONG PHÁ THAI 3 THÁNG GIỮA THAI KỲ:
Chọn mẫu theo phương pháp thuậntiện: Đối tượng nghiên cứu là các thaiphụ có tuổi thai từ 13 đến 24 tuần có chỉđịnh chấm dứt thai kỳ: thai chết lưu, thai
dị dạng, thai bệnh lý không sống được
được mời vào tham gia nghiên cứu
Trang 45Tiêu chí đưa vào và loại raTiêu Chí Đưa Vào
Nh ữ ng thu ộ c tính cu ả dân s ố m ụ c tiêu
Tiêu Chí Loại Ra
Nh ữ ng thu ộ c tính không ph phù ù h ợ p
Không l là à ph ầ n ph ụ c ủa tiêu chí đ ư a vào
Trang 46THỰC TRẠNG BỆNH ĐÁI THÁO ĐƯỜNG VÀ CÁC YẾU TỐ NGUY CƠ Ở LỨA TUỔI 25 – 64
TẠI THÀNH PHỐ CẦN THƠ NĂM 2005
Đề tài
Trang 47MỤC TIÊU NGHIÊN CỨU
1 Xác định tỷ lệ hiện mắc bệnh ĐTĐ của
người dân trong độ tuổi từ 25 – 64 tại thành phố Cần Thơ.
2 Xác định một số yếu tố nguy cơ gây bệnh
ĐTĐ ở người dân trong độ tuổi từ 25 – 64
và đánh giá mức độ liên quan qua lại của các yếu tố nguy cơ này đối với bệnh ĐTĐ.
Trang 48Tiêu chí lựa chọn: Người dân trong độ
tuổi từ 25 – 64 tuổi, có hộ khẩu thườngtrú tại thành phố Cần Thơ
Các trường hợp loại trừ: Các đối
tượng nằm bệnh viện, bỏ địa bàn, bịgiam giữ, dị tật
Đối tượng nghiên cứu?
Trang 49Học viên thảo luận
1 Xác định quần thể đích, quần thể
nghiên cứu, khung mẫu (nếu có) chonghiên cứu của nhóm
2 Tiêu chí chọn mẫu; tiêu chí loại trừ
3 Lựa chọn phương pháp chọn mẫu
thích hợp: Mô tả cụ thể
Trang 50CỠ MẪU
Trang 51Nguyên Tắc
Xem mục tiêu nghiên cứu
Tỉ lệ Trung bình
Đnh tính
Trang 52Nguyên Tắc
• BA Tham Số Bắt Buộc Phải Biết
Độ lớn của trị số ước lượng
Độ lớn của kết quả mong đợi
Độ chính xác mong muốn
Sai số cho phép
Trang 53Giả thuyết nghiên cứu
Một chiều, hai chiều
Sức mạnh kiểm định (1 - β)
Thiết kế nghiên cứu
Dân số chọn mẫu vô hạn, hữu hạn
Kỹ thuật chọn mẫu
Những Chi Tiết Cần Biết
Thêm
Trang 54Giả thuyết và sai lầm
Giả thuyết H0 : Không có sự khác biệt
Giả thuyết Ha (H1): Có sự khác biệt; lớnhơn hay nhỏ hơn
Sai lầm loại 1: α
Sai lầm loại 2: β
Lực mẫu: 1 - β
Trang 55Sai lầm loại I và sai lầm loại II
Sai lầm loại II
(Xs = β)
Kết luận đúng (Xs = 1-β)
(Power của nghiên cứu)
Trang 56Ví dụ
Nhà nghiên cứu muốn chứng minh thuốc A (thuốc mới) tốt hơn thuốc B (thuốc đang sử dụng) để điều trị bệnh
Giả thuyết H0:Thuốc A không tốt hơnthuốc B
H1: Thuốc A tốt hơn thuốc B (1 chiều)
Với độ tin cậy là 95%; Muốn 90% khả
Trang 57Sai lầm loại I và sai lầm loại II
Sai lầm loại 1 (Xs = α = 5%)
Kết luận đúng (Xs =1-α=95%)
Sai lầm loại II (Xs = β=10%)
Kết luận đúng (Xs=1-β=90%)
(Power của nghiên cứu)
Trang 58CÔNG THỨC TÍNH CỠ
MẪU
Trang 59VẤNĐỀ
Một cán bộ y tế huyện muốn biết tỉ lệ phụ nữ có chăm sóc tiền sản đầy đủ trong huyện Nếu chọn mẫu ngẫu nhiên đơn, cỡ mẫu phải khảo sát là bao nhiêu, nếu muốn có 95% tin tưởng rằng thực tế sẽ có 80%
phụ nữ được chăm sóc tiền sản đầy đủ, với
sai số cho phép là 5%?
Trang 60rằng thực tế sẽ có 80%
phụ nữ được chăm sóc tiền sản
Trang 63Tỷ lệ ước đoán p
Từ các nghiên cứu khác (hồi cứu y văn)
Qua điều tra thử (n=30)
Trong trường hợp không có p; chọn p = 0,5 vì n sẽ là cỡ mẫu lớn nhất (Khôngquá lạm dụng)
Trang 64Sai số tuyệt đối d
Khả năng sai số khi ước tính p so vớikết quả thật của quần thể
d càng nhỏ càng có nghiên cứu càng cógiá trị ( cỡ mẫu càng lớn)
Chọn d: 0,01 – 0,1; thường 0,05
tính cỡ mẫu quần thể là 0,3 và tỷ lệ ước
Trang 65Ước lượng tỷ lệ với sai số tương
)
(
) 1
Trang 66Ví dụ
Trưởng phòng y tế huyện muốn xác định
tỷ lệ SDD của trẻ dưới 5 tuổi tronghuyện hiện tại là bao nhiêu Giả sử rằngbạn sử dụng kỷ thuật chọn mẫu ngẫunhiên, hãy tính cỡ mẫu cần thiết chocuộc điều tra này Biết rằng tỷ lệ SDD chung của quốc gia là 30%, độ tin cậy là95%, sai số tuơng đối là 20% so với p
Trang 67Cách tính cỡ mẫu
2
2
2 /
1
) (
) 1
Hệ số tin cậy
0,2 0,05
1,96
0,3
225
Trang 68Quần thể hữu hạn
P là kích thước của dân số đích và
Nhc là cỡ mẫu sau khi đã hiệu chỉnh
Với ví dụ trên, dân số trẻ dưới 5 tuổi trong huyện là 1000 thì số trẻ cần cho nghiên cứu?
P N
Trang 69Cỡ mẫu cho việc kiểm định 1 tỷ lệ
2 0
2 1
0 0
2 / 1
)(
})1
()
1({
p p
p p
Z p
p
Z n
a
a a
−
−+
−
= −α −β
p0 là tỷ lệ cần kiểm định
pa là tỷ lệ thật trong quần thể
α: là xác suất của việc phạm phải sai lầm loại I
β: Là xác suất của việc phạm phải sai lầm loại II
1- β gọi là lực mẫu
Lực mẫu là 80%; Z=0,86
Lực mẫu là 90%; Z=1,28
Lực mẫu là 95%; Z=1,65
Trang 70Giả sử tỷ lệ thành công trong phẫu thuật của một loại tim mạch đã được báo cáo trong y văn là 70% Một phương pháp mới điều trị nội khoa đang được đề nghị có hiệu quả tương đương Một bệnh viện không có phương tiện phẫu thuật nên muốn áp dụng phương pháp điều trị mới Muốn 90% khả năng để chứng minh tác dụng tương đương của phác đồ điều trị nội khoa so với phẫu thuật, với độ chính xác là 10%, ở mức tin cậy
Trang 71Cỡ mẫu cho việc kiểm định 1 tỷ lệ
2 0
2 1
0 0
2 / 1
) (
} ) 1
( )
1 ( {
p p
p p
Z p
p
Z n
a
a a
−
− +
Trang 72Cỡ mẫu cho nghiên cứu bệnh chứng
(
1)
1(
1)
1
2
2 / 1
p p
p p
Z n
ε
α
)1
( 2
2
2 1
p p
OR
p
OR p
−+
×
×
=
Trong đó
Trang 73Cỡ mẫu cho nghiên cứu bệnh chứng
Ki m đnh t s chênh
2 2 1
2 2
2 1
1 1
2 2
2 / 1
) (
} ) 1
( )
1 ( )
1 ( 2
{
p p
p p
p p
Z p
− +
−
) 1
( 2
2
2 1
p p
OR
p
OR p
− +
×
×
=
Trang 74VẤN Đ N Đ N ĐỀ Vì nghi ng ờ hi ệ u qu ả cu ả BCG trong phòng ng ừ a lao
tr ẻ con, m ộ t nhà nghiên c ứ u mu ố n so sánh t ỉ l ệ bao ph ủ cu ả tiêm ch ủ ng trong m ộ t nhóm b ệ nh nhân lao và m ộ t nhóm ch ứ ng
Y văn cho th ấ y kho ả ng 30% nhóm ch ứ ng không đ ượ c tiêm
GIẢ THUY THUY THUYẾT NGHIÊN C T NGHIÊN C T NGHIÊN CỨU U
Không ch ủ ng ng ừ a BCG có liên quan đ ế n m ắ c lao hay không?
Trang 77Cỡ mẫu cho nghiên cứu đoàn hệ
c lng nguy cơ tơng đi
1 2
2
2 /
)1
ln( p
p p
p
Z n
ε
α
Trang 78Ki m đnh nguy cơ tơng đi
Cỡ mẫu cho nghiên cứu đoàn hệ
2 2 1
2 2
2 1
1 1
*
* 2
/ 1
) (
} ) 1
( )
1 ( )
1 ( 2
{
p p
p p
p p
Z p
− +
−
p*= (p1 + p2 )/2
Trang 79Hiệu lực thiết kế (Design Effect): D
Sử dụng trong nhiều trường hợp chọn
mẫu: mẫu cụm, chọn mẫu nhiều giaiđoạn
Đễ đảm bảo tính chính xác của mẫu,
nhà nghiên cứu thường nhân cỡ mẫuvới một hệ số gọi là hiệu lực thiết kế
(ký hiệu D)
Giá trị của D: 1,5 - 2…Thông thường
chọn D = 2
Trang 81Ví dụ: Tên đề tài “Tỷ lệ tăng huyết áp và kiến thức
thái độ thực hành về phòng bệnh tăng huyết áp của người dân 30 – 70 TPCT, năm 2007”
Trang 84M Ụ C TIÊU NGHIÊN C Ứ U
2007
2007
Trang 86Chương 2 ĐỐI TƯỢNG VÀ PHƯƠNG PHÁP
Z 2
1 - α / 2 P (1 - P)
n =
d 2
Trang 872.5 Phương pháp chọn mẫu: có 4 bước
01 xã của huyện (ngẫu nhiên đơn)
Trang 88Học viên thảo luận
1 Xác định quần thể đích, quần thể
nghiên cứu, khung mẫu (nếu có) chonghiên cứu của nhóm
2 Tiêu chí chọn mẫu; tiêu chí loại trừ
3 Lựa chọn phương pháp chọn mẫu
thích hợp: Mô tả cụ thể
4 Lựa chọn công thức và tính cỡ mẫu