Bài giảng Xác suất thống kê y học: Kiểm định chi bình phương cung cấp cho người học các kiến thức: Sự biến thiên mẫu của tỷ lệ, đại cương mẫu và phương pháp lấy mẫu, nguyên tắc kiểm định ý nghĩa,... Mời các bạn cùng tham khảo nội dung chi tiết.
Trang 1KIỂM ĐỊNH CHI BÌNH PHƯƠNG
TH.S BÙI THỊ KIỀU ANH TH.S LÊ HUỲNH THỊ CẨM HỒNG
Trang 2Nội dung
Sự biến thiên mẫu của tỷ lệ
Đại cương mẫu và phươn pháp lấy mẫu
Khoảng tin cậy 95%
Nguyên tắc kiểm định ý nghĩa
Các bước trong quy trình kiểm định thống kê
Lựa chọn kiểm định phù hợp
Kiểm định chi bình phương
Trang 3SỰ BIẾN THIÊN MẪU
CỦA TỈ LỆ
Trang 4Biến số nhị giá
Là biến số định tính có 2 giá trị
Trình bày phân phối của biến nhị giá chỉ cần mô tả bằng một con số tỷ lệ (%)
Trang 5Ví dụ:
Cuộc điều tra dinh dưỡng tiến hành trên
1503 trẻ em dưới 5 tuổi tại TPHCM năm
1994 Trong số trẻ được điều tra có 494 trẻ bị suy dinh dưỡng nhẹ cân.
Tỷ lệ trẻ bị suy dinh dưỡng nhẹ cân =
494/1503 = 0,329 = 32,9%
Trang 6Đại cương
về mẫu và phương pháp lấy mẫu
Trong nghiên cứu, chúng ta chỉ
có thể thu thập số liệu trên một
tập hợp nhất định các đối tượng
Nhưng chúng ta lại muốn khái
quát hóa kết quả của các số liệu
và áp dụng chúng cho một dân
số rộng lớn hơn
Trang 7Làm sao áp dụng kết quả nghiên cứu
(mẫu) lên dân số mục tiêu?
- Cỡ mẫu phải đủ lớn
- Phương pháp lấy mẫu phải có tính đại diện
Trang 8Các khái niệm
Mẫu (sample): Tập hợp các đối tượng
được thu thập số liệu
Dân số nghiên cứu (study population): tập
hợp các đối tượng có các đặc tính hay
đại lượng được thu thập trong quá trình
nghiên cứu.
Dân số mục tiêu (Target population): Tập
hợp các đối tượng mà chúng ta muốn các
thành quả nghiên cứu được áp dụng vào
8
MẪU
DÂN SỐ NGHIÊN CỨU
DÂN
SỐ MỤC TIÊU
Trang 10Ví dụ:
Cuộc điều tra tỷ lệ suy dinh dưỡng trên trẻ em dưới 5 tuổi ở
TPHCM
Tỷ lệ suy dinh dưỡng của dân số
tương ứng với các mẫu khác nhau
Nếu chúng ta rất may mắn, p =
Tuy nhiên, thường tỷ lệ mẫu sẽ dao động (phân tán) xung quanh giá trị
của dân số đích
Trang 11
Phương sai _ Sai số chuẩn
Phương sai của tỷ lệ:
Sai số chuẩn của tỷ lệ: căn bậc hai của phương sai Đo lường mức độ sai số trung bình của p
Trang 12Ví dụ:
Cuộc điều tra tỷ lệ suy dinh dưỡng trên trẻ em dưới 5 tuổi ở TPHCM Cỡ mẫu n = 1000, tỷ lệ suy dinh
dưỡng trong dân số đích
Như vậy, sai số chuẩn của tỷ lệ quan sát là:
S.E = = 0.0145 = 1.45%
Trong thực tế, ta ít khi biết tỷ lệ của dân số , do đó ta
sử dụng tỷ lệ của mẫu p đề ước lượng sai số chuẩn
Trang 13Khoảng tin cậy
Khi chúng ta quan sát một tỷ lệ trong một mẫu ngẫu nhiên, ta mong muốn có được một
khoảng các giá trị mà giá trị tỷ lệ (thực) của
dân số nằm trong đó Khoảng này được gọi là khoảng tin cậy
Khoảng tin cậy được xác định bằng cách giới hạn tin cậy mức trên và dưới
Trang 14Giả sử:
Có hai biến định tính
Tổng thể tuân theo phân phối nhị thức
Có thể sử dụng xấp xỉ chuẩn
Điều kiện áp dụng (nxp) > 5 & nx(1 - p) > 5
=> Ước lượng khoảng tin cậy 95%:
(p – 1,96 x S.E.) < p < (p - 1,96 x S.E )
Khoảng tin cậy cho ước lượng tỉ lệ
Trang 15Khoảng tin cậy 95%:
95% các trường hợp nghiên cứu giá trị nằm trong khoảng
Trang 16
Khoảng tin cậy 95%:
Nên nhớ rằng có xác suất 5% tỷ lệ của dân số đích nằm ngoài khoảng tin cậy 95%, do đó có thể có khoảng tin cậy sẽ không chứa tỷ lệ thực
Khoảng tin cậy sẽ hẹp nhất khi cỡ mẫu là lớn nhất và khoảng tin cậy sẽ rộng nhất khi cỡ mẫu nhỏ
Trang 17Trình bày khoảng tin cậy
Trang 18Nguyên tắc của kiểm định ý nghĩa
Trang 19 Phương pháp phản chứng/phản nghiệm
A làm B không xảy ra => B xảy ra suy ra A không xảy ra
Chúng ta thường sử dụng trong y khoa
Ví dụ: Bn nhập viện vì bị đau bụng dữ dội Chúng ta nghi ngờ
BN bị tắt ruột và khai thác bệnh sử BN nói rằng BN trung tiện bình thường, ta loại bỏ căn nguyên tắc ruột.
Nếu BN bị tắc ruột thì BN sẽ không trung tiện
Do BN trung tiện bình thường nên BN không bị tắt ruột.
Nguyên tắc của kiểm định ý nghĩa
Trang 20 Nếu giả thuyết Ho xảy ra => T hiếm xảy ra
T xảy ra => giả thuyết Ho hiếm xảy ra
Ký hiệu theo công thức tính xác suất của biến cố T
Trang 21Giả thuyết Ho (null hypothesis)
Trang 23Giả thuyết Ho
Chỉ có thể bác bỏ chứ không chứng minh được giả
thuyết Ho
Giả thuyết Ho là phủ định của giả thuyết nghiên cứu
Là bước đầu tiên của bất cứ kiểm định thống kê nào
Nguy cơ tương đối =1
Trang 24Giả thuyết phụ (alternative hypothesis)
Ha: Là một giả thuyết mà nhà nghiên cứu nghĩ là sự thật
Điều cần được “chứng minh” bằng dữ
kiện
Trang 25Một thử nghiệm lâm sàng điều trị ung thư vú đã di căn, BN được phân nhóm ngẫu nhiên để điều trị với L-Pam hay CMF (phối hợp 3 thuốc).
Giả thuyết Ho:
Hai phương pháp điều trị có hiệu quả tương đương
Giả thuyết phụ Ha:
Hai phương pháp điều trị có hiệu quả khác nhau
PP điều trị CMF hiệu quả hơn PP điều trị L-Pam
PP điều trị L-Pam hiệu quả hơn PP điều trị CMF
Trang 26Hay
Giả thuyết Ho:
Tỷ lệ đáp ứng với CMF = tỷ lệ đáp ứng với L-Pam
Giả thuyết phụ Ha:
Tỷ lệ đáp ứng với CMF > Tỷ lệ đáp ứng với L-Pam
Tỷ lệ đáp ứng với CMF < Tỷ lệ đáp ứng với L-Pam
Tỷ lệ đáp ứng với CMF khác Tỷ lệ đáp ứng với L-Pam
Trang 27Bài tập Đặt giả thuyết Ho và Ha
Một nghiên cứu tiến hành nhằm so sánh
chiều cao trung bình nam sinh và chiều
cao trung bình ở nữ sinh trường THCS A.
Trang 28 Một nghiên cứu tiến hành nhằm khảo sát
nguy cơ nhồi máu cơ tim ở 2 nhóm: nhóm
có cholesterol cao và nhóm có cholesterol
thấp.
Bài tập Đặt giả thuyết Ho và Ha
Trang 29Các bước của một kiểm định ý nghĩa
Xây dựng giả thuyết Ho
Trang 30Giá trị p
Trị số P là một con số xác suất, viết tắt chữ “probability value”
Trang 31Giá trị p
Trị số P là một con số xác suất, viết tắt chữ “probability value”
Giá trị p lớn hơn 0.05 được xem là không đủ bằng chứng
để bác bỏ giả thuyết Ho => chấp nhận giả thuyết Ho
Giá trị p < 0.05 là có đủ bằng chứng để bác bỏ giả thuyết
Ho, cho rằng giả thuyết Ho là không đúng.
=> kết luận: sự khác biệt có ý nghĩa thống kê ở mức 5%
Trang 32Các bước của một kiểm định ý nghĩa
Xây dựng giả thuyết Ho
Trang 33Whitney
Hồi quy logistic Hồi quy Poisson
Sống còn Wilcoxon
tổng quát Logrank
Wilcoxon tổng quát
Logrank
Hồi quy Cox
Trang 34Cả hai đều là biến
liên tục Scatter plot Hồi quy tuyến tính
Trang 35Kiểm định chi bình phương
Chi-square test
Trang 36Kiểm định chi bình phương ( 2 ) 36
Còn gọi là kiểm định chi square test.
Phép kiểm 2 dùng để đánh giá sự quan hệ giữa 2
Trang 37Các bước tiến hành
1.Xây dựng giả thuyết Ho
2 Tính toán tỷ lệ hay phần trăm thích hợp trong bảng 2x2;
3 Tính số kỳ vọng (E)
4 Tính 2 = (quan sát - kì vọng) 2 /kì vọng cho mỗi ô trong bảng dự trù
và cộng chúng lại
37
5 Đối chiếu bảng: điểm phần trăm của phân phối χ2
được trình bày trong bảng A5 Giá trị này phụ thuộc
vào độ tự do và trong bảng 2 × 2 độ tự do bằng 1.
6 Kết luận: bác bỏ hay không bác bỏ Ho
1)-
t oco(s1)
- hàngo
s(
.,
Trang 38Kết quả thử nghiệm vac xin cúm
Cúm Vacxin Giả dược Tổng
Số quan
sát
Trang 39Bước 1: Hình thành giả thuyết Ho
Ho: P(Cúm | tiêm vaccine) = P(cúm | giả dược) =
P(cúm | chung)
39
Trang 40trong toàn bộ
Trang 42Bước 4: Tính giá trị chi bình phương
Có 52,2 47,8 100 Không 187,8 172,2 360 Tổng 240 220 460
Trang 43Bước 5: Đối chiếu với bảng chi bình phương
43
Trang 44Bước 6: Kết luận
53,09 lớn hơn 10,83, điểm 0,001 của phân phối χ2 một độ tự do
Do đó xác suất của sự khác biệt quan sát được về bệnh cúm do
tình cờ nhỏ hơn 0,001, nếu không có sự khác biệt thực sự giữa
vaccine và placebo
Tức là p< 0,001
Bác bỏ Ho: Tỷ lệ cúm/vac xin không tương đương tỷ lệ cúm/giả
dược tỷ lệ cúm/vac xin khác biệt tỷ lệ cúm/giả dược
Do đó có thể kết luận rằng vaccin có hiệu quả.
44
Trang 46Good study!!!