Nói cách khác là có th bác b Ho và ch p nh n Ha... Julious SA 2009, Sample sizes for clinical trials, CRC Press, Boca Raton.. Rosner B 2011, Fundamentals of biostatistics, Brooks/Cole, C
Trang 2TÁC GI CU N TÀI LI U (THEO TH T ABC)
PGS.TS ào Th Minh An, Tr ng i h c Y Hà N i PGS.TS Nguy n Thùy D ng, Vi n V sinh D ch t Trung ng
PGS.TS Kim B o Giang, Tr ng i h c Y Hà N i GS.TS L u Ng c Ho t, Tr ng i h c Y Hà N i PGS.TS Ph m Minh Khuê , Tr ng i h c Y d c H i Phòng
BS Ong Phúc Th nh, M ng l i Nghiên c u Khoa h c S c kh e Vi t Nam
GS.TS Hoàng V n Minh, Tr ng i h c Y t công c ng
Trang 3M C L C
CH NG I: M T S KHÁI NI M C B N 1
1 Qu n th và m u nghiên c u 1
2 Ch n m u và tính toán c m u 1
3 Ph ng pháp th ng kê 1
4 c l ng kho ng tin c y 2
5 Ki m đ nh gi thuy t 3
6 Sai l m trong ki m đ nh gi thuy t 5
7 M c ý ngh a th ng kê 6
8 L c th ng kê 6
9 M c khác bi t và m c khác bi t có ý ngh a th c t 7
10 Ki m đ nh 1 phía và 2 phía 9
CH NG II: CH N M U NGHIÊN C U 10
1 Nguyên t c chung 10
2 Ch n m u xác su t 11
2.1 Ch n m u ng u nhiên đ n (simple random sampling) 11
2.2 Ch n m u h th ng (systematic sampling) 12
2.3 Ch n m u ng u nhiên phân t ng (stratified random sampling) 14
2.4 Ch n m u chùm (cluster sampling) 16
2.5 Ch n m u nhi u giai đo n (multistage sampling) 18
3 Ch n m u không xác su t 19
3.1 Ch n m u thu n ti n (convenience or accidental sampling) 19
3.2 Ch n m u ch tiêu (quota sampling) 19
3.3 Ch n m u có m c đích (purposive sampling) 19
3.4 Các ng d ng c a các k thu t ch n m u không xác su t 19
3.5 S k t h p gi a ch n m u xác su t và không xác su t 20
4 Ch n m u trong các th nghi m lâm sàng ho c th c nghi m 20
5 o đ c trong vi c ch n m u nghiên c u 21
Trang 4CH NG III: TÍNH TOÁN C M U NGHIÊN C U 22
1 Tính toán c m u cho nghiên c u s d ng th ng kê suy lu n d a trên c l ng kho ng 22
1.1 Nghiên c u g m 1 m u, xác đ nh m t trung bình 23
1.2 Nghiên c u g m 1 m u, xác đ nh m t t l 26
1.3 Nghiên c u g m 2 m u đ c l p, xác đ nh s khác bi t gi a 2 s trung bình 29
1.4 Nghiên c u g m 2 m u ghép c p, xác đ nh s khác bi t gi a 2 s trung bình 31
1.5 Nghiên c u g m 2 m u đ c l p, xác đ nh s khác bi t gi u 2 t l 32
2 Tính toán c m u cho nghiên c u s d ng th ng kê suy lu n d a trên ki m đ nh gi thuy t 33
2.1 Nghiên c u g m 1 m u, ki m đ nh m t trung bình 35
2.2 Nghiên c u g m 1 m u, ki m đ nh m t t l 37
2.3 Nghiên c u g m 2 m u đ c l p, ki m đ nh 2 s trung bình 38
2.4 Nghiên c u g m 2 m u ghép c p, ki m đ nh 2 s trung bình 40
2.5 Nghiên c u g m 2 m u đ c l p, ki m đ nh 2 t l 42
2.6 Nghiên c u g m 2 m u ghép c p, ki m đ nh 2 t l (McNemar) 44
2.7 Nghiên c u b nh ch ng, ki m đ nh OR 46
2.8 Nghiên c u thu n t p, ki m đ nh RR 48
2.9 Nghiên c u s ng còn (survival analysis study) 50
3 Nghiên c u nghi m pháp ch n đoán 52
4 Nghiên c u t ng đ ng (Equivalence trial) 55
5 Nghiên c u không kém h n (Non-inferiority trial) 59
6 Nghiên c u th nghi m lâm sàng theo c m (Cluster randomized design) 62 7 C m u cho mô hình h i quy 64
8 M t s hi u ch nh 64
Trang 58.2 Hi u ch nh theo h s thi t k (Design effect) 65
8.3 Hi u ch nh t l không tr l i, b cu c 66
8.4 Hi u ch nh khi c m u 2 nhóm không b ng nhau 67
PH L C: CH N M U CHO QU N TH KHÓ TI P C N 69
1 Gi i thi u 69
2 Ch n m u RDS 70
3 Ch n m u TLS 77
TÀI LI U THAM KH O 81
Trang 6Ch ng I: M T S KHÁI NI M C B N
GS.TS Hoàng V n Minh, BS K h ng Qu nh Long
1 Qu n th và m u nghiên c u
Trong m i nghiên c u, qu n th nghiên c u (Population) bao g m toàn b
các cá th chúng ta đang quan tâm M u nghiên c u (Sample) bao g m các cá th
đ c nghiên c u
Do đi u ki n ngu n l c có h n, đ i v i m i nghiên c u, chúng ta th ng không th ti n hành nghiên c u trên toàn b qu n th mà th ng ch ti n hành trên m t m u
2 Ch n m u và tính toán c m u
Ch n m u (Sampling) là quá trình ch n ra các cá th đ i di n cho qu n th
đ đ a vào nghiên c u đ m b o tính đ i di n, c n áp d ng các k thu t ch n
m u xác su t (Probabilistic Sampling), hay còn g i là ch n m u ng u nhiên (Random samling)
Tính toán c m u (Sample size determination) là vi c tính toán s l ng
cá th đ c đ a vào m u nghiên c u sao cho chúng ta có th ngo i suy t các đ c
đi m c a m u ra các đ c đi m t ng ng c a qu n th (Statistical inference)
c u (các phân tích d a trên các cá th có trong m u);
Th ng kê suy lu n (Inference statistics) hay còn g i là th ng kê phân tích (Analytical statistics): Là vi c ngo i suy các đ c đi m c a m u nghiên c u ra thành các đ c đi m c a qu n th nghiên c u
Ph n l n các nghiên c u đ u có s d ng th ng kê suy lu n/phân tích (th c
Trang 7Có 2 hai lo i hình th ng kê suy lu n th ng đ c áp d ng, bao g m:
c l ng kho ng tin c y (Confidence interval): D a trên m t giá tr
tìm ra t nghiên c u đ c l ng m t kho ng giá tr trong qu n th (v i m t m c tin c y nh t đ nh)
Ki m đ nh gi thuy t (Hypothesis testing): Ki m đ nh li u s khác bi t,
m i liên quan nào đó đã tìm ra m u nghiên c u có x y ra trong qu n
th nghiên c u hay không?
Hình 1: M t s khái ni m c b n
c l ng kho ng tin c y (Confidence interval) là vi c tính toán kho ng giá
tr c a tham s qu n th (trong kho ng t X đ n Y) v i m t m c tin c y cho tr c
(các nghiên c u khoa h c s c kh e th ng dùng m c tin c y 95%)
Kho ng tin c y c a bi n đ nh l ng đ c tính theo công th c:
c l ng kho ng tin c y
Ki m đ nh gi thuy t
Trang 8 C m u nh (n < 30: Tính theo phân b t
t đ c tính tùy thu c vào b c t do (n-1) (Xem b ng giá tr c a t)
Kho ng tin c y c a bi n đ nh tính đ c tính theo công th c:
(hay còn g i là Exact methods) d a trên xác su t tích l y c a phân b nh
phân (Cumulative Probabilities of the Binomial Distribution) đ hi u
ch nh Hi n nay, ph ng pháp Clopper–Pearson (Exact methods) đ c áp
C m u nghiên c u càng l n thì kho ng tin c y càng h p, đ ng ngh a v i tính
chính xác (precision) c a nghiên c u càng cao, hay sai s ng u nhiên (random
errors) càng nh
5 Ki m đ nh gi thuy t
Gi thuy t
Gi thuy t (Hypothesis) đ c hi u đ n gi n là nh ng đi u chúng ta k
v ng nh ng ch a đ c ch ng minh là b t bi n (khác v i lý thuy t - Theory)
Trong nghiên c u khoa h c, có 2 lo i gi thuy t đ c đ a ra:
Gi thuy t Ho (Null hypothesis): Th ng đ c p đ n “không có s khác
bi t” gi a các nhóm v giá tr bi n s nghiên c u nào đó
Trang 9 Gi thuy t Ha (Alternative hypothesis): Do nhà nghiên c u đ a ra, th ng
đ c p đ n “có s khác bi t” gi a các nhóm v giá tr bi n s nghiên c u nào đó
Ki m đ nh gi thuy t
Ki m đ nh gi thuy t (Hypothesis testing) là vi c so sánh k t qu c a
nghiên c u v i gi thuy t Ho Ki m đ nh gi i thuy t đ c th c hi n d a trên các
ki m đ nh th ng kê (Test statistics)
Sau khi đ t ra các gi thuy t Ho và Ha, chúng ta c n ch ng minh Ho hay Ha đúng Theo lý thuy t c a ki m đ nh gi thuy t th ng kê, chúng ta r t khó ho c không th tr c ti p ch ng minh m t gi thuy t là đúng mà ch có th ch ng minh
nó sai (bác b ), theo đó n u có đ b ng ch ng cho th y Ho sai thì chúng ta bác
b gi thuy t Ho và ch p nh p HA, ng c l i n u không đ b ng ch ng đ bác
b Ho thì chúng ta ch p nh n r ng Ho đúng Vi c quy t đ nh bác b hay ch p
nh n Ho th ng đ c th c hi n thông qua ch s P (P-value), ch s P là m t xác
su t có đi u ki n mang ý ngh a là xác su t quan sát đ c d li u và nh ng tr ng
h p hi m h n n u gi thuy t Ho đúng – P(D|Ho) Theo đó n u ch s P càng nh càng cho th y b ng ch ng đ bác b gi thuy t Ho, và khi ch s P nh h n m c
Ki m đ nh th ng kê (Test statistics) là giá tr đ c tính toán và chu n hóa
trong quá trình th c hi n ki m đ nh gi thuy t Ki m đ nh th ng kê b ng 0 có ngh a k t qu nghiên c u đúng nh đi u đã đ c p trong gi i thuy t Ho Giá tr tuy t đ i c a ki m đ nh th ng kê càng l n có ngh a s khác bi t gi a k t qu nghiên c u và Ho càng l n
B n thân giá tr c a ki m đ nh th ng kê ít có ý ngh a đ i v i ki m đ nh gi thuy t mà ta c n so sánh nói v i phân b c a nó v i gi đ nh r ng nghiên c u này
Trang 10đ c l p l i nhi u l n và Ho đúng đ tính đ c xác su t x y ra ki m đ nh th ng
kê n u Ho đúng
N u xác su t (probability) x y ra ki m đ nh th ng kê n u Ho đúng nh (th ng ch n nh h n 5% hay 0,05), chúng ta k t lu n là k t qu nghiên c u c a chúng ta khác v i Ho Nói cách khác là có th bác b Ho và ch p nh n Ha
6 Sai l m trong ki m đ nh gi thuy t
Th ng kê là khoa h c d a vào nguyên lý xác su t, do đó không có m t k t
lu n nào là hoàn toàn đúng hay hoàn toàn sai, các k t lu n đ u đ c di n gi i trong m t s gi đ nh ho c sai s quy c (ch p nh n đ c) Khi k t lu n ch p
nh n hay bác b Ho, chúng ta đ u có th g p ph i nh ng sai s ti m tàng, và sai
s này đ c ch p nh n trong m t kho ng quy c Các tình hu ng x y ra nh
Ho sai (Có s khác bi t)
Trang 117 M c ý ngh a th ng kê
M c ý ngh a th ng kê (Significance level) đ c p đ n ng ng quy t đ nh bác
b hay ch p nh n gi thuy t Ho d a vào ch s P M c ý ngh a th ng kê th ng
đ c ch n là 0.05
8 L c th ng kê
L c th ng kê (Statistical power) là xác su t bác b gi thuy t Ho (ch p nh n
HA) khi gi thuy t Ho sai, hay có th hi u l c th ng kê chính là xác su t d ng tính th t L c th ng kê đ c p đ n kh n ng lo i b sai l m lo i 2, hay l c th ng
kê b ng 1 tr xác su t sai l m lo i 2, hay power = 1 – L c th ng kê th ng
đ c đòi h i là cao h n 80% (sai l m lo i 2 <20%) L c th ng kê c n đ c tính toán và báo cáo tr c khi nghiên c u b t đ u
Nh đã đ c p, l c th ng kê là xác su t k t lu n có s khác bi t khi th c s
có s khác bi t, hay l c th ng kê bi u hi n cho kh n ng phát hi n hi u ng khi
nó th c s t n t i Nh v y, nhà nghiên c u đ u mong mu n có đ c l c th ng
kê cao M t nghiên c u s đ c đánh giá không cao n u không đ t đ c l c th ng
kê c n thi t, th m chí là không th đ a ra k t lu n n u không đ l c th ng kê Theo nguyên lý c a ki m đ nh gi thuy t th ng kê c a Neyman và Pearson, có 3
đó chúng ta không th quy t đ nh là s không khác bi t đó là do th c
s không có khác bi t hay do phép tính toán không đ kh n ng đ phát hi n khác bi t
Nh v y l c th ng kê đóng vai trò r t l n cho tính giá tr c a m t k t lu n
th ng kê Trong th c hành, l c th ng kê th ng đ c quy c là không nh h n
Trang 1280% Do đó, trong quá trình tính c m u, nhà nghiên c u c n ph i tính toán c
m u đ đáp ng đ c đi u này H n n a, sau khi thu th p s li u, nhà nghiên c u
th ng ph i ki m tra l i (sensititive analysis) xem v i c m u nh v y, l c th ng
kê đã đ t hay ch a
9 M c khác bi t và m c khác bi t có ý ngh a th c t
Trong ph ng pháp ki m đ nh gi tuy t th ng kê đã gi i thi u trong ph n
tr c, giá tr P th ng đ c s d ng đ k t lu n s khác bi t gi a các nhóm có ý ngh a v m t th ng kê hay không Vi c k t lu n d a vào giá tr P mang ý ngh a
nh phân – có/không có ý ngh a th ng kê, giá tr P không nói lên đ c m c đ
c a s khác bi t Trong th c hành, bên c nh vi c k t lu n có hay không khác bi t, chúng ta c n bi t m c đ khác bi t là bao nhiêu, và c tác đ ng (effect size - ES)
là th hi n m c đ khác bi t đó C tác đ ng là m t thu t ng chung đ ch các
ch s khác nhau nh m đo l ng m c đ khác bi t gi a các nhóm, ví d khi so sánh huy t áp tâm thu gi a 2 nhóm dân s thì c tác đ ng chính là s chênh l ch huy t áp tâm thu trung bình gi a 2 nhóm đo b ng đ n v mmHg, ho c khi th
hi n s liên quan gi a cân n ng và chi u cao thì h s t ng quan c ng là c tác
đ ng i v i nh ng nghiên c u d ch t h c có bi n đo l ng k t qu là bi n nh giá thì các ch s nh t s nguy c RR, t s s chênh OR hay t l hi n hành PR
đi m c a c tác đ ng là khó so sánh k t qu n u đ n v đo l ng khác nhau, ví
d chúng ta s khó so sánh s khác bi t gi a chi u cao so v i s khác bi t v cân
n ng M t nh c đi m khác c a c tác đ ng là không nói lên đ c m c đ giao
đ ng Ví d s khác bi t v chi u cao gi a 2 nhóm dân s c a nghiên c u th
nh t (trung bình ± đ l ch chu n) là 3 ± 1 cm s r t khác so v i nghiên c u th 2
Trang 13đ u là 3 cm Do đó đ có th so sánh đ c các c tác đ ng v i đ n v đo l ng khác nhau và tính toán đ n s giao đ ng v k t qu , c tác đ ng chu n hóa (standardized effect size) đ c tính đ n Công th c tính c tác đ ng chu n hóa
o là k t qu nghiên c u theo gi thuy t Ha
o là k t qu nghiên c u theo gi thuy t Ho
đ nh
C tác đ ng th ng đ c tham kh o t nh ng nghiên c u t ng t đã đ c làm tr c đó Tuy nhiên, khi th c hi n m t nghiên c u m i và không có thông tin tham kh o đ c t nghiên c u tr c thì nhà nghiên c u c ng có th d a vào kinh nghi m lâm sàng, đ l a ch n ng ng th p, trung bình hay cao vì c tác
đ ng ph n ánh s khác bi t quan sát đ c trên th c t
Trang 141 Julious SA (2009), Sample sizes for clinical trials, CRC Press, Boca Raton
2 Rosner B (2011), Fundamentals of biostatistics, Brooks/Cole, Cengage Learning, Boston
3 Perezgonzalez JD Fisher, Neyman-Pearson or NHST? A tutorial for teaching data testing Frontiers in Psychology 2015;6:223
Trang 15th có th đ c ngo i suy v i k t qu thu đ c t m t m u đ c rút ra t qu n
th này Tuy nhiên s ngo i suy ch đ c th c hi n n u m u nghiên c u đ c
ch n đ i di n cho qu n th và là đ l n
Ba câu h i th ng đ c đ t ra khi ch n m u là:
Qu n th nào mà t đó m u s đ c l y ra cho nghiên c u?
Làm th nào đ m u có th đ i di n cho qu n th nghiên c u?
M u bao nhiêu là đ cho m t nghiên c u?
Tr l i cho 3 câu h i này chính là gi i quy t v n đ xác đ nh qu n th nghiên
c u (study population), ch n m u (sampling) và tính toán c m u (sample size)
cho m t nghiên c u
Vi c xác đ nh qu n th nghiên c u tu thu c vào nhi u v n đ nh ý t ng
c a ng i nghiên c u, v n đ c n đ c nghiên c u, các thông tin s n có cho vi c
ch n m u, k thu t ch n m u, s hi n di n c a các ngu n l c ph c v cho nghiên
c u, th i gian có th dành cho nghiên c u v.v Qu n th nghiên c u c n xác
đ nh rõ, bao hàm c khái ni m th i gian và không gian đ ph c v cho vi c ch n
m u
M t thi t k m u đ c coi là t t n u nh nó đáp ng m t s tiêu chu n sau:
i di n cho qu n th nghiên c u: Khi nó có t t c các tính ch t c b n c a
qu n th mà t đó nó đ c rút ra
M u là đ l n: có th cho phép khái quát hoá m t cách tin c y cho qu n
th nghiên c u
Trang 16 Tính th c t và ti n l i: vi c thu th p s li u là d dàng và thu n ti n
Tính kinh t và hi u qu : M u đ c ch n sao cho thông tin thu đ c là nhi u nh t trong khi chi phí là th p nh t
Trên th c t có r t nhi u k thu t ch n m u, tuy nhiên chúng có th đ c x p
vào hai nhóm đó là ch n m u xác su t (probability sampling) và không xác su t (non-probability sampling) M u đ c ch n theo ph ng pháp xác su t có tính
đ i di n cho qu n th h n, nh ng th ng t n kém h n khi thu th p do m u th ng phân tán và c m u l n Ph n d i đây trình bày các k thu t ch n m u theo hai nhóm này
2 Ch n m u xác su t
2.1 Ch n m u ng u nhiên đ n (simple random sampling)
Là k thu t ch n m u trong đó t t c các cá th trong qu n th có cùng c h i (cùng xác su t) đ đ c ch n vào m u
Trang 17i u này th ng không th có đ c v i m t m u l n ho c m u dao đ ng
Các cá th đ c ch n vào m u có th phân b t n m n trong qu n th , do
u đi m:
Nhanh và d áp d ng
N u danh sách cá th c a qu n th đ c x p ng u nhiên, ch n m u h
th ng t ng t nh ch n ng u nhiên đ n
Trang 18 N u danh sách cá th đ c x p theo th t t ng, đây là cách l a ch n t ng
t nh m u t ng có t l (proportionate stratified sample) t c là t ng có c
Ví d : có th thu th p đ c s li u v s o lao tr em trong m t c ng
đ ng nông thôn không bi t danh sách các h gia đình, ng i nghiên c u có
th xác đ nh m t quy lu t ch n m u tr c thu th p s li u nh sau:
H gia đình đ u tiên đ c đi u tra là h th nh t n m bên trái c a y ban nhân dân xã
Các h ti p theo s đ c ch n b ng cách ng i nghiên c u ti p t c đi v bên trái và c cách 7 gia đình l i đi u tra m t gia đình (kho ng cách các h gia đình đ c ch n vào nghiên c u đ c ch n b ng cách l y s h gia đình trong c ng đ ng chia cho s h gia đình d ki n đi u tra)
Trang 19Trong m t s tr ng h p khác, các cá th trong qu n th nghiên c u có th không c n lên danh sách đ ch n, ng i nghiên c u có th đ a ra m t quy lu t
tr c khi ch n m u nh :
T t c các b nh nhân đ n phòng khám vào ngày th n m trong tu n s
đ c tham gia vào nghiên c u
B nh nhân đ n khám ngày l s vào nhóm 1, đ n ngày ch n s vào nhóm hai đ ph c v cho m t th nghi m nào đó
Các cá th trong m u đ c ch n cho m t nghiên c u đ ng vòng tròn, sau
đó đ m l n l t 1, 2, 3; 1, 2, 3 v.v cho đ n h t Ng i đ m s 1 đ u tiên
ph i đ c ch n ng u nhiên Các cá th đ m s 1 s vào nhóm 1, s 2 vào nhóm 2, s 3 vào nhóm 3 Nh v y, ta đã có ba nhóm đ c ch n ng u nhiên
Nh v y, m u s thi u tính đ i di n v phân b không gian
2.3 Ch n m u ng u nhiên phân t ng (stratified random sampling)
Là k thu t ch n m u đ c th c hi n b i vi c phân chia các cá th c a qu n
th nghiên c u thành các nhóm riêng r đ c g i là t ng c đi m c a ch n m u
ki u này là tiêu chí nghiên c u trong t ng t ng t ng đ i đ ng nh t còn gi a các
t ng có s khác bi t Sau khi đã phân t ng xong ta v n có th áp d ng cách ch n
m u ng u nhiên đ n ho c ng u nhiên h th ng đ ch n đ i t ng c a t ng t ng vào nghiên c u:
Các b c:
Trang 20 Phân chia qu n th nghiên c u thành các t ng khác nhau d a vào m t ho c vài đ c đi m nào đó nh nhóm tu i, gi i, t ng l p xã h i, dân t c v.v
b ng tr ng: weighted) đ cho k t qu c a toàn b qu n th
Hình 5: Ch n m u phân t ng trong m t đi u tra b nh vi n v i tiêu th c
phân t ng là c c a b nh vi n
u đi m:
T o ra trong m i t ng có m t s đ ng nh t v y u t đ c ch n đ nghiên
c u, do đó s gi m s chênh l ch gi a các cá th
Khi nguyên t c m u t l đ c s d ng, t ng có kích c l n h n s có nhi u
cá th đ c ch n vào m u h n Khi đó c m u cho m t t ng i nào đó s là:
Trang 21 Nguyên t c m u không t l c ng có th đ c áp d ng trong m u t ng Khi
đó t l m u trong các t ng s khác nhau V i nh ng t ng có bi n thiên l n
gi a các cá th ho c chi phí cho ch n m u th p, ng i ta th ng áp d ng
t l m u l n Cách này giúp cho ng i đi u tra có đ s cá th trong m i
t ng đ có th phân tích đ c
M u ch n t m i t ng có tính đ i di n và khái quát hoá cao cho t ng đó
N u y u t đ c ch n đ phân t ng có tính đ ng nh t cao trong m i t ng
nh ng l i th p gi a các t ng thì k t qu nghiên c u s có đ chính xác cao
h n là m u ch n theo cách ng u nhiên đ n (2 cách ph i có cùng c m u)
Ngoài vi c tính đ c tham s m u (t l , giá tr trung bình, t su t chênh v.v ) cho toàn b m u nghiên c u, v i các ch n m u phân t ng ta có th tính riêng đ c tham s m u cho t ng t ng
Nh c đi m:
C ng nh ch n m u ng u nhiên đ n, danh sách t t c các cá th trong m i
t ng ph i đ c li t kê và đ c g n s ng u nhiên i u này th ng khó
Trong đó
n i : C m u c a t ng i Ni: Dân s t ng i
n: C m u c a t t c các t ng N: Dân s c a qu n th N
Ni n
n i
Trang 22 L p danh sách t t c các chùm, ch n ng u nhiên m t s chùm vào m u T đây s có hai cách ch n ti p tu theo ý t ng c a ng i nghiên c u:
Cách 1: T t c các cá th trong các chùm đã ch n s đ c bao g m vào
nghiên c u Trong cách này đ n v m u (sampling unit) chính là các chùm đ c ch n, trong khi y u t quan sát (observation element) l i là các cá th trong chùm (ví d nh các h gia đình trong thôn đ c ch n,
tr em trong các h gia đình đ c ch n v.v ) Cách này đ c g i là m u chùm m t b c và xác su t c a m t chùm đ c ch n vào m u b ng s chùm d ki n ch n chia cho t ng s các chùm
Cách 2: Li t kê danh sách các cá th trong các chùm đã ch n, sau đó áp
d ng cách ch n m u ng u nhiên đ n ho c ng u nhiên h th ng trong m i chùm đ ch n các cá th vào m u Trong tr ng h p này đ n v m u và
đ n v quan sát là trùng nhau (m u 2 b c)
Hình 6: M u hai giai đo n, trong đó giai đo n 1 là ch n m u chùm, giai
đo n 2 là ch n ng u nhiên đ n ho c ng u nhiên h th ng
u đi m:
Nó th ng đ c áp d ng trong các nghiên c u đi u tra trong m t ph m vi
r ng l n, đ phân tán cao, danh sách c a t t c các cá th trong qu n th
Trang 23không th có đ c (do khó ho c đ t), trong khi ch có danh sách ho c b n
đ các chùm
S l a ch n th ng d h n, chi phí cho nghiên c u v i m u chùm th ng
r h n nhi u do các cá th trong m t chùm th ng g n nhau
Nh c đi m:
Tính đ i di n cho qu n th ho c tính chính xác (precision) c a m u đ c
ch n theo ph ng pháp m u chùm th ng th p h n so v i m u đ c ch n
b ng ph ng pháp ng u nhiên đ n (n u có cùng c m u) Vì v y, đ t ng tính chính xác này ng i ta th ng t ng c m u b ng cách nhân c m u (đ c tính theo công th c cho các ch n m u ng u nhiên đ n) v i h s nh
h ng c a thi t k (design effect) H s nh h ng c a thi t k đ c tính theo công th c khá ph c t p nên ng i ta khuyên r ng n u không tính chính xác đ c h s này thì ta có th coi nó b ng 2
Có m t s t ng quan ngh ch gi a c c a chùm và tính đ i di n c a m u,
do v y, c chùm càng nh càng t t, tuy nhiên chi phí cho đi u tra s cao
h n S chùm đ c ch n vào nghiên c u t t nh t là ph i > 30
Phân tích s li u t m u chùm th ng ph c t p h n các m u khác
Vi c l a ch n chùm vào m u nghiên c u c ng khá ph c t p, đ c bi t là khi
c chùm không đ u nhau Trong tr ng h p này, ng i ta có th áp d ng ph ng pháp ch n chùm theo ph ng pháp PPS (s đ c trình bày trong ph n sau)
2.5 Ch n m u nhi u giai đo n (multistage sampling)
Trên th c t , nhi u nghiên c u v i các qu n th l n có c u trúc ph c t p c n
ph i áp d ng nhi u k thu t ch n m u trong các giai đo n khác nhau Có th k t
h p c m u xác su t và không xác su t V i các thi t k nghiên c u trên di n
r ng mà tiêu th c nghiên c u bi n đ i nhi u gi a các vùng sinh thái, các t ng l p
xã h i ho c các lo i ngh nghi p khác nhau, thông th ng ng i ta th c hi n
b c thi t k phân t ng tr c, sau đó trong m i t ng s th c hi n thi t k ch n chùm (vì khi đó tiêu th c nghiên c u gi a các chùm trong m i t ng là t ng đ i
đ ng đ u) Ti p đó trong m i chùm l i có th ch n ng u nhiên đ n, ng u nhiên
Trang 243 Ch n m u không xác su t
3.1 Ch n m u thu n ti n (convenience or accidental sampling)
t đ c trên c s các cá th có s n khi thu th p s li u (Ví d nh t t c các b nh nhân đ n khám t i phòng khám trong ngày) Ph ng pháp này không quan tâm đ n vi c s l a ch n có ng u nhiên hay không ây là cách ch n m u
r t hay g p trong các nghiên c u lâm sàng
3.2 Ch n m u ch tiêu (quota sampling)
Là ph ng pháp đ m b o r ng m t s nh t đ nh các đ n v m u t các lo i khác nhau c a qu n th nghiên c u v i các tính ch t đ c tr ng s có m t trong
m u Nó g n gi ng nh cách ch n m u t ng nh ng không ng u nhiên Ng i nghiên c u đ t k ho ch là s ch n bao nhiêu đ i t ng cho m i t ng ho c nhóm
đ i t ng và b ng cách ch n m u thu n ti n cho đ n khi đ s l ng t m i t ng
3.3 Ch n m u có m c đích (purposive sampling)
Ng i nghiên c u đã xác đ nh tr c các nhóm quan tr ng trong qu n th đ
ti n hành thu th p s li u Các nhóm khác nhau s có t l m u khác nhau ây
là cách r t hay dùng trong các đi u tra th m dò, ph ng v n sâu
3.4 Các ng d ng c a các k thu t ch n m u không xác su t
Các cách ch n m u không xác su t th ng d làm, r nh ng do l a ch n không ng u nhiên nên tính đ i di n cho qu n th nghiên c u r t th p N u nh
m c đích c a nghiên c u là đ đo l ng các bi n s và t đó khái quát hoá cho
m t qu n th thì các k t qu thu đ c t m u không xác su t th ng không đ
c s khoa h c cho vi c ngo i suy Do đó, c n ph i dè d t khi đ a ra các k t lu n
Trang 25Tuy nhiên v i m t s lo i nghiên c u đ c thi t k v i m c đích th m dò
ho c mu n tìm hi u sâu m t v n đ nào đó c a qu n th (nh ki n th c, đ ng c , thái đ , ni m tin v.v ) thì khi đó vi c ch n m u xác su t là không c n thi t và có
đ khác nh ng ng i làm nghiên c u ph i bi t đ c u đi m và h n ch trong các cách ch n m u đã s d ng
4 Ch n m u trong các th nghi m lâm sàng ho c th c nghi m
Th ng đ c áp d ng khi tác gi mu n so sánh tác d ng c a các ph ng pháp
đi u tr khác nhau, hi u qu c a các thu c m i v.v Trong tr ng h p này c n
ph i có ít nh t hai nhóm nghiên c u đ so sánh Khi nghiên c u này đ c áp d ng trên ng i, s có r t nhi u v n đ v ch n m u và đ o đ c trong nghiên c u
Ng i nghiên c u ph i đ m b o v tính an toàn c a can thi p M c đích và l i ích c a nghiên c u c n ph i đ c gi i thích rõ ràng cho các đ i t ng đ c ch n vào nghiên c u và vi c tham gia vào nghiên c u là hoàn toàn t nguy n Do đ c tính này nên m u đ c ch n trong các nghiên c u lo i này th ng thi u tính đ i
di n cho qu n th chung, tuy nhiên nó có th ph n nào đ i di n cho nhóm cá th
có cùng m i tính ch t nh các cá th đ c ch n vào th nghi m M t đi u c n
l u ý là m c đích ngo i suy đây th ng không quan tr ng b ng m c đích th nghi m, do v y, đi u quan tr ng h n là phân b đ i t ng vào các nhóm nghiên
c u sao cho ng u nhiên (randomization)
Trang 265 o đ c trong vi c ch n m u nghiên c u
V n đ đ o đ c trong nghiên c u c n ph i đ c cân nh c k nh t là trong các
th nghi m lâm sàng ho c nghiên c u can thi p N u can thi p là t t thì nhóm
ch ng s m t c h i đ đ c h ng s can thi p, còn n u can thi p có tác d ng
ph nguy hi m thì nhóm th nghi m có nguy c cao h n
Ngoài ra trong m t s lo i ch n m u đi u tra c ng đ ng, n u áp d ng ch n
m u ng u nhiên đ n, ng u nhiên h th ng v i các c ng đ ng có m t đ dân s cao nh các t , l p, tr ng h c thì vi c đ i t ng trong cùng t , l p có ng i
đ c ch n, ng i không đ c ch n c ng có th phát sinh các th c m c Trong
tr ng h p này ta có th ch n chùm toàn b đ nghiên c u, t c là t l p nào đ c
ch n thì t t c các cá th trong đó đ u đ c đi u tra, nghiên c u
Trang 27Ch ng III: TÍNH TOÁN C M U NGHIÊN C U
GS.TS Hoàng V n Minh, BS Kh ng Qu nh Long, BS Ong Phúc Th nh, PGS.TS Võ V n Th ng, PGS.TS Kim B o Giang, PGS.TS Nguy n Thùy D ng
1 Tính toán c m u cho nghiên c u s d ng th ng kê suy lu n d a trên c
l ng kho ng
Tính toán c m u nghiên c u tùy thu c vào ph ng pháp ngo i suy th ng kê (th ng kê suy lu n) đ c áp d ng là c l ng kho ng (Confidence interval) hay
ki m đ nh gi thuy t (Hypothesis testing)
Khi nghiên c u s d ng th ng kê suy lu n d a trên c l ng kho ng (Confidence interval), chúng ta c n tính c m u đ đ t đ c đ chính xác (hay
m c tin c y) đã đ c l a ch n
Kho ng tin c y 95% c a bi n đ nh l ng đ c tính theo công th c:
95% CI = c l ng đi m ± d Trong đó, d là sai s biên (Margin of error) đ c tính theo công th c:
o Z là giá tr t phân b chu n, đ c tính d a trên m c ý ngh a th ng kê
o p là t l
o n là c m u
Trang 28Nh v y, công th c tính c m u s là:
i v i bi n đ nh l ng:
Trong đó:
o n là c m u
o Z là giá tr đ c tính d a trên m c ý ngh a th ng kê (Z = 1,96 n u m c
ý ngh a th ng kê = 5%)
o là đ l ch chu n (L y t nghiên c u tr c đây ho c t nghiên c u th )
o d là m c sai s ch p nh n (Do nhà nghiên c u quy t đ nh tùy vào ý ngh a
th c ti n c a k t qu nghiên c u và ngu n l c dành cho nghiên c u) Sai
s d có th là sai s tuy t đ i ho c sai s t ng đ i ( p)]
i v i bi n đ nh tính:
= Trong đó:
o n là c m u
o Z là giá tr đ c tính d a trên m c ý ngh a th ng kê
o P là t l (L y t nghiên c u tr c đây ho c t nghiên c u th )
o d là m c sai s ch p nh n (Do nhà nghiên c u quy t đ nh tùy vào ý ngh a
th c ti n c a k t qu nghiên c u và ngu n l c dành cho nghiên c u) Sai
s d có th là sai s tuy t đ i ho c sai s t ng đ i ( p)]
1.1 Nghiên c u g m 1 m u, xác đ nh m t trung bình
Nghiên c u g m 1 m u, xác đ nh m t trung bình, s d ng sai s tuy t
đ i
* Công th c:
Trang 29* Ví d :
Tính toán c m u cho m t nghiên c u c tính tr s huy t áp tâm thu
tr em Bi t r ng, nghiên c u tr c đây báo cáo đ l ch chu n c a tr s huy t áp tâm thu là 20mmHg L y m c ý ngh a th ng kê = 5% và sai s tuy t đ i là 5mmHg C m u đ c tính toán theo công th c nh sau:
Trang 30 Nghiên c u g m 1 m u, xác đ nh m t trung bình, s d ng sai s t ng
o là giá tr trung bình c a qu n th (L y t nghiên c u tr c đây
ho c t nghiên c u th )
* Ví d :
Tính toán c m u cho m t nghiên c u c tính tr s huy t áp tâm thu
tr em Bi t r ng, nghiên c u tr c đây báo cáo giá tr trung bình và đ
l ch chu n c a tr s huy t áp tâm thu l n l t là 100mg và 20mmHg L y
Trang 31Ghi chú: Xem thêm ph n hi u ch nh c m u theo t l không tr l i và h
d d a trên giá tr c a p nh sau:
Trang 32Tính toán c m u cho m t nghiên c u c tính t l hút thu c lá nam
gi i Bi t r ng, nghiên c u tr c đây báo cáo t l hút thu c lá nam
gi i là 50% L y m c ý ngh a th ng kê = 5% và sai s tuy t đ i là 5%
C m u đ c tính toán theo công th c nh sau:
*Tính toán theo ph n m m HSS 1.0:
Ghi chú: Xem thêm ph n hi u ch nh c m u theo t l không tr l i và
h s thi t k đ tính toán c m u cu i cùng
Nghiên c u g m 1 m u, xác đ nh m t t l , s d ng sai s t ng đ i
Trang 33o là m c sai s t ng đ i ch p nh n (Do nhà nghiên c u quy t
đ nh tùy vào ý ngh a th c ti n c a k t qu nghiên c u và ngu n
l c dành cho nghiên c u)
*Ví d
Tính toán c m u cho m t nghiên c u c tính t l hút thu c lá nam
gi i Bi t r ng, nghiên c u tr c đây báo cáo t l hút thu c lá nam
gi i là 50% L y m c ý ngh a th ng kê = 5% và sai s t ng đ i là 10%
C m u đ c tính toán theo công th c nh sau:
= 385
*Tính toán theo ph n m m HSS 1.0:
Trang 34Ghi chú: Xem thêm ph n hi u ch nh c m u theo t l không tr l i và
o d là m c sai s ch p nh n (Do nhà nghiên c u quy t đ nh tùy vào ý ngh a
th c ti n c a k t qu nghiên c u và ngu n l c dành cho nghiên c u)
Trang 35 Ví d
Tính toán c m u cho m t nghiên c u so sánh m c t ng cân n ng 2 nhóm
tr Bi t r ng, nghiên c u tr c đây ti n hành trên 2 nhóm, m i nhóm 100 tr , phát hi n đ c đ l ch chu n l n l t là 8,4g và 7,7g L y m c ý ngh a th ng kê
= 5% cho ki m đ nh 2 phía và sai s là 3g C m u đ c tính toán theo công th c
Trang 36o d là m c sai s ch p nh n (Do nhà nghiên c u quy t đ nh tùy vào ý ngh a
th c ti n c a k t qu nghiên c u và ngu n l c dành cho nghiên c u)
Ví d
Tính toán c m u cho m t nghiên c u theo dõi d c m c t ng cân n ng 1 nhóm tr qua th i gian Bi t r ng, nghiên c u tr c đây ti n hành trên 100 tr , phát hi n đ c đ l ch chu n c a m c t ng cân n ng (s khác bi t v cân n ng
gi a 2 l n đo) là 9,1g L y m c ý ngh a th ng kê = 5% cho ki m đ nh 2 phía và sai s là 3g
C m u đ c tính toán theo công th c nh sau:
* Tính toán theo ph n m m HSS 1.0
Trang 37Ghi chú: Xem thêm ph n hi u ch nh c m u theo t l không tr l i và h
o d là m c sai s ch p nh n (Do nhà nghiên c u quy t đ nh tùy vào ý ngh a
th c ti n c a k t qu nghiên c u và ngu n l c dành cho nghiên c u)
Trang 38L y m c ý ngh a th ng kê = 5% cho ki m đ nh 2 phía và sai s 5% C m u đ c tính toán theo công th c nh sau:
ki m đ nh gi thuy t (Hypothesis testing)
Khi nghiên c u s d ng th ng kê suy lu n d a trên ki m đ nh gi thuy t
(Hypothesis testing), chúng ta c n tính c m u đ đ t đ c m c ý ngh a th ng kê
(Significance level) phù h p đ bác b sai l m lo i 1 (hay lo i ) và hi u l c
th ng kê (Power) phù h p đ bác b sai l m lo i 2 (hay lo i )
C m u cho các nghiên c u s d ng th ng kê suy lu n d a trên ki m đ nh
Trang 39o là k t qu nghiên c u theo gi thuy t Ha
o là k t qu nghiên c u theo gi thuy t Ho
Trang 40o p là theo gi thuy t Ho
Trên th c t , t s trong công th c tính toán c m u nêu trên chính là h ng
s (ph thu c vào giá tr c đ nh c a à ):