PowerPoint Presentation NGUYÊN LÝ KIỂM ĐỊNH KIỂM ĐỊNH THỐNG KÊ TS Nguyễn Thị Minh Trang Bộ môn Thống kê – Khoa Y tế Công cộng Đại học Y Dược TPHCM Email drminhtranggmail com 22032022 1 NỘI DUNG 22032022 2 • Khái niệm kiểm định giả thuyết1 • Khái niệm P value2 • Sai lầm và năng lực thống kê3 • Chọn lựa phương pháp thống kê4 • Kiểm định biến định tính5 • Kiểm định biến định lượng6 1 KHÁI NIỆM Giả thuyết Hypothesis Kiểm định giả thuyết Hypothesis testing 22032022 3 ➢ GIẢ THUYẾT (GT) ➢ KIỂM Đ.
Trang 1NGUYÊN LÝ KIỂM ĐỊNH
KIỂM ĐỊNH THỐNG KÊ
TS Nguyễn Thị Minh Trang
Bộ môn Thống kê – Khoa Y tế Công cộng
Đại học Y Dược TPHCM
Email: drminhtrang@gmail.com
22/03/2022
1
Trang 31 KHÁI NIỆM
Giả thuyết: Hypothesis
Kiểm định giả thuyết: Hypothesis testing
22/03/2022
Trang 4KHÁI NIỆM GIẢ THUYẾT NGHIÊN CỨU
Giả thuyết nghiên cứu:
Mệnh đề có thể kiểm định được về việc dự đoán mối liên
Trang 5KHÁI NIỆM GIẢ THUYẾT NGHIÊN CỨU
có giả thuyết nghiên cứu là
“Những người mất ngủ sẽ có điểm số thi thấp hơnnhững người ngủ đủ giấc”
5
Trang 6KHÁI NIỆM GIẢ THUYẾT NGHIÊN CỨU
Trang 7KHÁI NIỆM GIẢ THUYẾT HO - HA
• Ho (o: null hypothesis):
• Không có sự liên hệ thống kê nào giữa 2 yếu tố đang xem xét.
• Ha (a: alternative):
• Giả thuyết thay thế hay đảo thuyết.
• Có mối liên quan có ý nghĩa thống kê giữa 2 yếu tố đang xem xét.
22/03/2022 7
Trang 8KHÁI NIỆM GIẢ THUYẾT HO - HA
• Ho: Không có sự khác biệt về điểm số thi giữa 2 nhómngười mất ngủ và ngủ đủ giấc
Trang 9KHÁI NIỆM GIẢ THUYẾT HO - HA
Trang 10KHÁI NIỆM KIỂM ĐỊNH GIẢ THUYẾT
“Phương pháp phản chứng”
Nếu BN bị tắc ruột (A) thì BN sẽ không trung tiện (không B)
(không A)
Trang 11“Phương pháp phản chứng”
▪ Nếu {Ho=>T hiếm xảy ra} thì {T xảy ra=>Ho hiếm xảy ra}
▪ Nếu {Ho=>P(T) nhỏ} thì {T xảy ra=>P(Ho) nhỏ}
22/03/2022 11
KHÁI NIỆM KIỂM ĐỊNH GIẢ THUYẾT
Trang 12QUI TRÌNH KIỂM ĐỊNH GIẢ THUYẾT
Trang 13▪ Ví dụ: Nghiên cứu về mối liên quan giữa tiền căn gia đình có
1 Xây dựng GT Ho:
Tỷ lệ K vú/ nhóm tiền căn gđ = Tỷ lệ K vú/ không tiền căn
QUI TRÌNH KIỂM ĐỊNH GIẢ THUYẾT
Trang 14QUI TRÌNH KIỂM ĐỊNH GT
đình có K vú và mắc K vú Giả sử tỷ lệ K vú quan sát
2 Chọn kiểm định phù hợp:
Kiểm định Chi bình phương để so sánh 2 tỷ lệ
Trang 15QUI TRÌNH KIỂM ĐỊNH GT
đình có K vú và mắc K vú Giả sử tỷ lệ K vú quan sát
3 Tính giá trị thống kê của kiểm định đã chọn
22/03/2022 15
Trang 16QUI TRÌNH KIỂM ĐỊNH GT
đình có K vú và mắc K vú Giả sử tỷ lệ K vú quan sát
4 Tính xác suất thống kê (giá trị P) từ giá trị thống kê tínhđược
Trang 17QUI TRÌNH KIỂM ĐỊNH GT
đình có K vú và mắc K vú Giả sử tỷ lệ K vú quan sát
5 Kết luận
không có tiền căn là như nhau thì xác suất có được sự
Trang 18QUI TRÌNH KIỂM ĐỊNH GT
5 Kết luận
Giả sử P(K vú /Ho) <0.001: nếu Ho đúng hay tỷ lệ K vú ở
được sự khác biệt như chúng ta quan sát thấy là nhỏ hơn1/1000
Trang 192 KHÁI NIỆM P VALUE
22/03/2022
19
Trang 20KHÁI NIỆM VỀ P-VALUE
• Nghiên cứu về tiền căn gia đình và Ung thư vú
• Giả sử tỷ lệ mắc Ung thư vú ở phụ nữ không có tiền căn
• Câu hỏi: Vậy phụ nữ có tiền căn gia đình bị K vú có tỷ lệ
bị K vú khác so với tỷ lệ trên không?
• Đặt giả thuyết Ho và Ha
𝐻0: 𝑝 = 0.02
𝐻𝐴: 𝑝 ≠ 0.02
Trang 21• Chọn 𝑁 = 100 phụ nữ có tiền căn gia đình bị K vú
• Quan sát 𝑋 = # phụ nữ trong nhóm này bị K vú
phụ nữ này tương tự như số phụ nữ không có tiền căn
• Cụ thể, chúng ta trông đợi rằng 2 trong số 100 người phụ
• Giả sử chúng ta quan sát thấy 𝑋 = 5 ca K vú (5%)
KHÁI NIỆM VỀ P-VALUE
21
Trang 23Khái niệm: 𝟎 𝟎𝟓𝟎𝟖 là giá trị P , hay P value (p=0.0508)
Giải thích: Nếu GT Ho đúng (không có mối liên quan giữa tiền
căn gđ và K vú), cơ hội quan sát thấy có từ 5 ca trở lên trong
số 100 phụ nữ có tiền căn gia đình là 1/20
Qui ước chung:
P<0,05: Bác bỏ Ho
KHÁI NIỆM VỀ P-VALUE
23
Trang 24KHÁI NIỆM VỀ P-VALUE
● Giá trị P (P-value) đo lường khả năng (xác suất) quan
● Giá trị P nhỏ có ý nghĩa là giá trị quan sát được là bất
thường nếu GT Ho đúng
=> Bác bỏ GT Ho
● Giá trị P lớn có ý nghĩa là giá trị quan sát được không
phải là bất thường khi GT Ho đúng
=> Không bác bỏ GT Ho
Trang 26với 1 xác suất nào đó.
Trang 27SAI LẦM LOẠI 1: TYPE I ERROR
Trang 28SAI LẦM LOẠI 1: TYPE I ERROR
▪ Ví dụ:
NC về mối liên quan giữa tiền căn gđ bị K vú và K vú
Ho: P(K vú/tiền căn) = P(K vú/không tiền căn)
Ha: P(K vú/tiền căn) P(K vú/không tiền căn)
Sai lầm α là xác suất cho rằng tiền căn gia đình có liên quanvới K vú (GT Ha) trong khi thực tế không có mối liên quan
Trang 29SAI LẦM LOẠI 1: TYPE I ERROR
Tiền căn gđ (-)
22/03/2022 29
Sai lầm loại I (α) là sai lầm cho rằng tiền căn gia đình có
mối liên quan (GT Ho)
*Xem tiền căn gia đình như 1 yếu tố nguy cơ, tương tự
1 “test” tầm soát
Trang 30SAI LẦM LOẠI 2: TYPE II ERROR
Trang 31SAI LẦM LOẠI 2: TYPE II ERROR
▪ Ví dụ:
NC về mối liên quan giữa tiền căn gđ bị K vú và K vú
Ho: P(K vú/tiền căn) = P(K vú/không tiền căn)
Sai lầm β là xác suất cho rằng tiền căn gia đình không
liên quan (GT Ha)
22/03/2022 31
Trang 32SAI LẦM LOẠI 2: TYPE 2 ERROR
Tiền căn gđ (+)
Sai lầm loại II (β) là sai lầm cho rằng tiền căn gia đình
Trang 33SỨC MẠNH THỐNG KÊ: POWER
Trang 34SỨC MẠNH THỐNG KÊ: POWER
đến K vú (bác bỏ Ho) khi thực tế có mối liên quan này
Trang 374 CHỌN LỰA PHƯƠNG PHÁP THỐNG KÊ PHÂN TÍCH
22/03/2022
37
Trang 38CHỌN PP THỐNG KÊ PHÂN TÍCH
giải thích/ tiên lượng (biến độc lập):
Trang 39Danh định Thứ tự Wilcoxon
Rank sum (Mann Whitney)
Kruskal Wallis
Hồi qui Logistic Thứ tự
Định lượng
(phân phối
chuẩn)
T 2 nhóm độc lập ANOVA Tương quan Pearson/
Hồi qui tuyến tính
Định lượng
(phân phối lệch)
Wilcoxon Rank sum (Mann Whitney)
Kruskal Wallis
Tương quan Spearman
22/03/2022 39
Khi các nhóm so sánh độc lập:
Trang 40T bắt cặp ANOVA lặp/GEE GEE /Mixed Model
Định lượng (phân Wilcoxon Friedman test GEE/ GLMM22/03/2022 40
Khi các nhóm so sánh không độc lập
Trang 415 KIỂM ĐỊNH BIẾN KẾT CUỘC ĐỊNH TÍNH
22/03/2022
41
Trang 42Danh định Thứ tự Wilcoxon
Rank sum (Mann Whitney)
Kruskal Wallis
Hồi qui Logistic Thứ tự
Định lượng
(phân phối
chuẩn)
T 2 nhóm độc lập ANOVA Tương quan Pearson/
Hồi qui tuyến tính
Định lượng
(phân phối lệch)
Wilcoxon Rank sum
Kruskal Wallis
Tương quan Spearman
Khi các nhóm so sánh độc lập:
Trang 43MỤC ĐÍCH
Kiểm định Chi bình phương được sử dụng để xác
định
43
Trang 44VÍ DỤ
đường típ 2 ở cộng đồng nghiên cứu hay không?
Trang 45VÍ DỤ
45
Biến số độc lập
(yếu tố liên quan)
Giá trị biến số Loại biến số
Trang 46BẢNG PHÂN PHỐI TẦN SUẤT
trù
biến số
Trang 47BẢNG PHÂN PHỐI TẦN SUẤT
Trang 48TẦN SỐ KÌ VỌNG (VỌNG TRỊ)
của bảng dự trù khi chưa thu thập dữ liệu thực tế
bảng dự trù để tính giá trị kì vọng của mỗi ô trong
Trang 52GIẢ ĐỊNH CỦA KIỂM ĐỊNH Χ2
Trang 53CÁC BƯỚC HÌNH THÀNH KIỂM ĐỊNH THỐNG KÊ
53
Trang 54CÁC BƯỚC HÌNH THÀNH KIỂM ĐỊNH THỐNG KÊ
đường típ 2
Trang 56
Trang 60KIỂM ĐỊNH FISHER
exact test dùng thay thế Chi bình phương
Trang 616 KIỂM ĐỊNH BIẾN KẾT CUỘC ĐỊNH LƯỢNG
22/03/2022
61
Trang 62Danh định Thứ tự Wilcoxon
Rank sum (Mann Whitney)
Kruskal Wallis
Hồi qui Logistic Thứ tự
Định lượng
(phân phối
chuẩn)
T 2 nhóm độc lập ANOVA Tương quan Pearson/
Hồi qui tuyến tính
Định lượng
(phân phối lệch)
Wilcoxon Rank sum
Kruskal Wallis
Tương quan Spearman
Trang 63Friedman test GEE/ GLMM
Trang 64● Hình chuông và tập trung tại giá trị 0(giống phân phối chuẩn)
● Biến thiên lớn hơn phân phối chuẩn
● Nếu mẫu càng tăng, phân phối t trở nên gần giống hình dạng phân phối chuẩn
Trang 65CÁC LOẠI KIỂM ĐỊNH T
65
Trang 66GIẢ ĐỊNH CỦA KIỂM ĐỊNH T
1 Thang đo biến số: biến liên tục
sampling)
Trang 67KIỂM ĐỊNH T ĐỘC LẬP
(INDEPENDENT T TEST)
67
Trang 682 1
N
SD N
SD
SEdiff = +
Sai số chuẩn gộp
Trang 69KIỂM ĐỊNH T ĐỘC LẬP
Ví dụ:
Giả sử kiểm tra ảnh hưởng của cafeinne trên vận
động bằng cách ghi nhận thời gian giữ con trỏ di
động theo 1 điểm chuyển động
Trang 73KIỂM ĐỊNH T ĐỘC LẬP
2
2 2 1
2 1
N
SD N
Trang 74KIỂM ĐỊNH T ĐỘC LẬP
93
1 10
) 2805
4 ( 9
) 1164
4
2
2 2 1
SD
SEdiff
758
2 93
1
322
5 93
1
1 15 778
t
Trang 75KIỂM ĐỊNH T ĐỘC LẬP
hạn t (bảng) tạingưỡng alpha = 0.05
Trang 77KIỂM ĐỊNH T BẮT CẶP
(PAIRED T TEST)
77
Trang 78KIỂM ĐỊNH T BẮT CẶP
Kiểm định t bắt cặp được sử dụng khi so sánh 2 nhóm
dữ liệu có liên quan
Trang 79KIỂM ĐỊNH T BẮT CẶPCông thức:
diff
X
SE
D t
pairs
D diff
Trang 80KIỂM ĐỊNH T BẮT CẶP
5 người được chọn vào nghiên cứu
cảm thấy không chịu đựng được Nhà nghiên cứu ghi
nhận thời gian này Ngày hôm sau, các đối tượng đổi
Trang 81KIỂM ĐỊNH T BẮT CẶP
(time in sec)
Trang 82KIỂM ĐỊNH T BẮT CẶP
Person
Painfree(time in second)
Trang 84KIỂM ĐỊNH T BẮT CẶP
55
2 5
70
75
2 55
2
7 55
2
48 55
Trang 85KIỂM ĐỊNH T BẮT CẶP
hạn t (bảng) vớialpha=0.05
Độ tự do
df =5-1=4
85
Trang 86KIỂM ĐỊNH T BẮT CẶP
“không”
Trang 87KIỂM ĐỊNH ANOVA
22/03/2022
87
Trang 88ANOVA (ANALYSIS OF VARIANCE)
Ý tưởng:
Kiểm định sự khác biệt giữa
đối với những biến số định lượng
quả tính toán tương tự t-test)
Trang 89PHÂN TÍCH PHƯƠNG SAI MỘT CHIỀU
ONE-WAY ANOVA
Các giả định của kiểm định ANOVA
89
Trang 90GIẢ THUYẾT CỦA ONE-WAY ANOVA
nhóm các
bình Trung
:
a
H
Trang 91KIỂM ĐỊNH ANOVA
✓ Độ tự do nội bộ nhóm (df within-group)
✓ Độ tự do giữa các nhóm (df between groups)
▪ Kí hiệu: F(df between, df within)
91
Trang 93CÁC BƯỚC TÍNH TOÁN F
2
) 1
Trang 94Bước 3: Tổng bình phương toàn bộ SS
Total sum of square _ SS: df = N-1
CÁC BƯỚC TÍNH TOÁN F
Trang 95Bước 4: Trung bình bình phương nội bộ nhóm
Within_group mean squares_MSw
Between_group mean squares_MSb
k N
Trang 96Bước 6: Tính giá trị thống kê F
Ha: Trung bình giữa các nhóm khác nhau, MSb > MSw
Độ tự do của F
Trang 97PHÂN PHỐI CỦA F
Kiểm định dựa trên phân phối F > 1
97
Trang 98PHÂN PHỐI CỦA F
2 2
2
2 0
m n within
Trang 99VÍ DỤ
800 mg calcium vs 1500 mg calcium vs placebo
99
Trang 100Within group variability
Within group variability
Trang 102KIỂM ĐỊNH F
063
)1
3
)97.06.1()
97.94(
)97.92
(
(
*11
2 2
2 2
−
−+
−+
) 11 08
10
6 0095
Cỡ mẫu
Hiệu số giữa trung bình từng nhóm và trung bình chung
MSB
MSW
MSB
MSW
Trang 103BẢNG F
P < 0.05
103
Trang 104BẢNG F
Trang 107ANOVA TÓM TẮT
cụ thể những nhóm nào
số phân tích sâu hơn để hiệu chỉnh vấn đề so sánh đa
nhóm (Post Hoc Test)
107
Trang 108KIỂM ĐỊNH PHI THAM SỐ
Danh định Thứ tự Wilcoxon
Rank sum (Mann Whitney)
Kruskal Wallis
Hồi qui Logistic Thứ tự
Định lượng
(phân phối
chuẩn)
T 2 nhóm độc lập ANOVA Tương quan Pearson/
Hồi qui tuyến tính
Định lượng
(phân phối lệch)
Wilcoxon Rank sum/ Mann
Kruskal Wallis
Tương quan Spearman
Trang 109KIỂM ĐỊNH PHI THAM SỐ
Friedman test GEE/ GLMM
Trang 110PHÂN BIỆT THAM SỐ VÀ PHI THAM SỐ
Trang 1113/22/2022 111
Giả định chung của các phương pháp này
mẫu)
PHÂN BIỆT THAM SỐ VÀ PHI THAM SỐ
Trang 112PHƯƠNG PHÁP PHI THAM SỐ
(NON-PARAMETRIC METHODS)
Kĩ thuật thống kê
thường của số liệu
Trang 113PHƯƠNG PHÁP PHI THAM SỐ
(NON-PARAMETRIC METHODS)
❖ Hữu dụng khi:
chữa bằng phép biến đổi thích hợp
❖ Khuyết điểm
3/22/2022 113
Trang 114KIỂM ĐỊNH PHI THAM SỐ THAY THẾ
KIỂM ĐỊNH THAM SỐ
KIỂM ĐỊNH THAM SỐ PHI THAM SỐ
Signed-rank test
samples T test
Wilcoxon rank sum test
Trang 116Số giờ ngủ Bệnh nhân thuốc placebo hiệu số hạng (bỏ qua dấu)
Trang 117WILCOXON SIGNED-RANK TEST
1 Loại bỏ mọi hiệu số bằng zero Sắp xếp các hiệu số
3/22/2022 117
Số giờ ngủ Bệnh nhân thuốc placebo hiệu số hạng (bỏ qua dấu)
Trang 118WILCOXON SIGNED-RANK TEST
Trang 119WILCOXON SIGNED RANK TEST
3 Nếu không có sự khác biệt hiệu quả giữa thuốc ngủ
sự khác biệt thì một tổng sẽ lớn hơn và tổng kia sẽ
nhỏ hơn Kí hiệu tổng nhỏ hơn là T
Trang 121WILCOXON RANK SUM TEST
Không hút thuốc Hút thuốc lá nặng Trọng lượng lúc sinh Hạng Trọng lượng lúc sinh Hạng
Trang 122WILCOXON RANK SUM TEST
1 Sắp hạng các quan sát trong cả hai nhóm theo thứ tự độ lớn như trong bảng Nếu có các giá trị nào bằng nhau thì lấy trung bình của chúng
Trang 123WILCOXON RANK SUM TEST
Trang 124WILCOXON RANK SUM TEST
được sắp đặt hơi khác
Trang 125N1 = 15; N2 = 14; P=0,05
Khoảng giá trị tương ứng của T 164 - 256
T =163 => P<0,05
3/22/2022 125
Trang 126PHÉP KIỂM KRUSKAL WALLIS
Kiểm định cho biết có ít nhất 1 cặp so sánh có trung vị
khác nhau
Trang 127PHÉP KIỂM KRUSKAL WALLIS
≥3)
3/22/2022 127
Trang 128PHÉP KIỂM KRUSKAL WALLIS
Trang 129PHÉP KIỂM KRUSKAL WALLIS
Trang 130PHÉP KIỂM KRUSKAL WALLIS
Trang 131PHÉP KIỂM KRUSKAL WALLIS
trong bảng
hạn thì bác bỏ giả thuyết Ho
22/03/2022 131
Trang 132PHÉP KIỂM KRUSKAL WALLIS
Ví dụ: Kiểm định sự khác biệt về mức thu nhập giữa 3
nhóm
Trang 133PHÉP KIỂM KRUSKAL WALLIS
Trang 134PHÉP KIỂM KRUSKAL WALLIS
▪ H=6,72
Trang 135PHÉP KIỂM KRUSKAL WALLIS
22/03/2022 135
P=0,05 và df=2, Chi=5.99
Trang 136PHÉP KIỂM KRUSKAL WALLIS
Trang 138TÀI LIỆU THAM KHẢO
▪ Sách:
1 ARMITAGE, P., BERRY, G & MATTHEWS, J N S 2008
Statistical Methods in Medical Research, Chichester:, John
Wiley & Sons, Ltd
2 Ðỗ Văn Dũng Xác suất và sinh thống kê căn bản TP Hồ Chí
Minh, Khoa Y tế công cộng, Trường Ðại học Y Dược, 2001
▪ Web:
https://www.graphpad.com/support/faqid/1790/