Biến số định tính biến số định lượng biến số sống còn Nếu biến số thể hiện ... Trong phân tích thống kê, để tiện việc nhập số liệu hay lí giải kết quả, ... Thông thường, nhà nghiên cứu bắt đầu với một quan điểm tương đối ...
Trang 1THỐNG KÊ PHÂN TÍCH VỚI
BIẾN SỐ ĐỊNH TÍNH
Trang 2NỘI DUNG CẦN THẢO LUẬN
2 Nghiên cứu cắt ngang
3 Nghiên cứu bệnh chứng
4 Nghiên cứu đoàn hệ
5 Nghiên cứu can thiệp
6 Biến số gây nhiễu và cách kiểm soát
1 Các phép kiểm so sánh các tỉ lệ
Trang 4Wilcoxon tổng quát
Logrank
Hồi quy Cox
Trang 5KIỂM ĐỊNH CHI BÌNH PHƯƠNG
5
Bước 1: lập bảng n x m và kiểm tra vọng trị của
Bước 2: chọn lựa kiểm định
* Nếu có trên 20% số ô có giá trị vọng trị < 5 thì
Trang 7hàng của
Tổng cột
Trang 102 Nếu số liệu từ bộ dữ kiện
tab factor devar [if] [in],expect
Trang 11Mẹ uống rượu Cân nặng sơ sinh Tổng
Trang 13CÁC CÂU LỆNH CHI BÌNH PHƯƠNG – FISHER CHÍNH XÁC
là bao nhiêu? Sự khác biệt này có ý nghĩa thống
kê hay không?
Phép kiểm chi bình phương hay phép kiểm
Fisher chính xác?
Dựa vào vọng trị tab factor devar [if] [in],[ro] [co] [chi] [exact]
Trang 14CÁC CÂU LỆNH CHI BÌNH PHƯƠNG – FISHER CHÍNH XÁC
Trang 153 Tỉ lệ bà mẹ uống rượu ở nhóm trẻ nhẹ cân và
tỉ lệ bà mẹ uống rượu ở trẻ bình thường là bao
nhiêu? Sự khác biệt này có ý nghĩa thống kê hay
Trang 16CÁC CÂU LỆNH CHI BÌNH PHƯƠNG – FISHER CHÍNH XÁC
Trang 17Tỉ lệ bệnh nhân có kết quả điều trị tốt hơn ở
phương pháp X có cao hơn phương pháp Y hay
không? Sự khác biệt này có ý nghĩa thống kê hay
không?
CÁC CÂU LỆNH CHI BÌNH PHƯƠNG – FISHER CHÍNH XÁC
Trang 19tabi 8 2\4 6,ro exact
1-sided Fisher's exact = 0.085
CÁC CÂU LỆNH CHI BÌNH PHƯƠNG – FISHER CHÍNH XÁC
Trang 20CÁC CÂU LỆNH CHI BÌNH PHƯƠNG – FISHER CHÍNH XÁC
Mở file biendoisolieu_edit.dta
Tỉ lệ THA ở nam và ở nữ là bao nhiêu và sự
khác biết này có ý nghĩa thống kê hay không?
Anh chị cho biết có vọng trị của các ô là bao nhiêu?Phép kiểm nào được sử dụng
Tỉ lệ THA ở từng nhóm tuổi là bao nhiêu và sự
khác biết này có ý nghĩa thống kê hay không?
Trang 21tab gioi THA, expect
Trang 22tab gioi THA, ro chi
Trang 23tab nhomtuoi THA, expect
Tuoi duoc | Tang huyet ap
phan nhom | khong co | Total
Trang 24tab nhomtuoi THA, ro chi
Tuoi duoc | Tang huyet ap
phan nhom | khong co | Total
Trang 25B –
B –
NGHIÊN CỨU CẮT NGANG
Trang 26NGHIÊN CỨU CẮT NGANG
Đo lường tỉ lệ hiện mắc của bệnh
Các số đo về phơi nhiễm và hậu quả được ghi nhận ở cùng thời điểm khảo sát (dữ kiện trên từng cá thể
điểm dân số hoặc trong điều tra dịch
Có thể được phân tích để tìm sự kết hợp giữa yếu tố tiếp xúc và bệnh
Trang 28NGHIÊN CỨU CẮT NGANG
Số đo được dùng cho nghiên cứu cắt ngang
1 Tỉ lệ hiện mắc (P)
Đo lường mức độ kết hợp của biến số độc lập và
biến số phụ thuộc
Tỉ lệ hiện mắc của biến số quan tâm
Tỉ lệ hiện mắc của biến số quan tâm ở nhóm
phơi nhiễm và nhóm không phơi nhiễm
2 Tỉ số tỉ lệ hiện mắc (PR)
Trang 29Tỉ lệ B+ / PN+ =
(1+2) (1+2+3+4)
Trang 30Tỉ số tỉ lệ hiện mắc (PR) = P1: P2 = a:(a+b)/c:(c+d)
Trang 31PN-NGHIÊN CỨU BỆNH CHỨNG
Trang 32mức độ kết hợp giữa yếu tố phơi nhiễm và bệnh
Trang 33Dễ có sai số khi thu thập dữ kiện
Đặc điểm
xuất phát bằng có bệnh, chiều nghiên cứu đi ngược chiều thời gian
Trang 35NGHIÊN CỨU ĐOÀN HỆ
Từ một dân số, xác định
Nhóm Phơi Nhiễm, và Nhóm không phơi nhiễm Theo dõi để phát hiện Bệnh.
Nguy cơ/Tỉ suất mắc bệnh ở nhóm phơi nhiễm so
với nhóm không phơi nhiễm
dụng để đo lường mức độ kết hợp giữa yếu tố phơi nhiễm và bệnh
Trang 36NGHIÊN CỨU ĐOÀN HỆ
Nguy cơ quy trách (AR), phần trăm nguy cơ quy trách (AR%) được sử dụng để đo lường tác
động gây bệnh thật sự của yếu tố phơi nhiễm trên người có phơi nhiễm
Nguy cơ quy trách dân số (PAR), phần trăm nguy cơ quy trách dân số phần trăm (PAR%)
được sử dụng để đo lường tác động gây bệnh thật
sự của yếu tố phơi nhiễm trong dân số
Trang 37Tốn kém, kéo dài thời gian
Đối tượng bỏ tham gia
Đặc điểm
Xuất phát bằng sự tiếp xúc
Chiều nghiên cứu đi cùng chiều thời gian
NGHIÊN CỨU ĐOÀN HỆ
Trang 38Lí giải giá trị của RR hay OR
1.7 – 2.5 Gây hại trung bình
> 2.6 Gây hại nhiều (strong hazard)
Greenberg RS , Ibrahim MA The case-control study In: Oxford
Textbook of Public Health Oxford, Oxford University Press, 1990, p131.
Trang 39 NC cắt ngang: PR (prevalence ratio)
NC bệnh chứng: OR (Odds Ratio)
NC đoàn hệ: RR (Risk Ratio)
Nếu PR/OR/RR có giá trị <1 gợi ý về yếu tố bảo vệ
Nếu PR/OR/RR có giá trị >1 gợi ý về yếu tố nguy cơ
Nếu PR/OR/RR = 1 gợi ý không có mối liên quan giữa các biến số
Nếu khoảng tin cậy 95% của PR/OR/RR chứa số 1 gợi ý không có mối liên quan giữa các biến số
TÓM TẮT VẤN ĐỀ
Trang 41Odds ratio | 3.27871 | 1.79919 6.113519 (exact)
Attr frac ex | 695002 | .4441945 .8364281 (exact) Attr frac pop | 4708078 |
chi2(1) = 18.03 Pr>chi2 = 0.0000
OR =3,28; KTC 95 %(1,80-6,11) -> Nam giới có số chênh THA cao gấp 3,28 lần nữ giới và sự khác biệt này có ý nghĩa thống kê với p<0,001
Trang 42Nếu mối liên quan có tính chất khuynh hướng
2 glm depvar indevars, family(binomial1)
link(logit) eform
Trang 44CÁC CÂU LỆNH TÍNH OR
Để kiểm tra mối liên quan có tính chất khuynh hướng hay không
tabodds biến phụ thuộc biến độc lập,graph
p trend > 0.05 không có tính chất khuynh hướng
ptrend < 0.05 có tính chất khuynh hướng
Trang 45CÁC CÂU LỆNH TÍNH OR
Tỉ lệ THA có tăng dần theo nhóm tuổi hay không?
tab nhomtuoi1 THA,ro chi
Tuoi duoc |
pham 3 | Tang huyet ap
nhom | khong co | Total
Trang 46CÁC CÂU LỆNH TÍNH OR
Tỉ lệ THA có tăng dần theo nhóm tuổi hay không?
tabodds THA nhomtuoi1,graph
nhomtuoi1 | cases controls odds [95% Conf Interval] -+ - 24-44 | 15 233 0.06438 0.03819 0.10851
45-54 | 34 142 0.23944 0.16469 0.34810
55-69 | 13 22 0.59091 0.29768 1.17298
Test of homogeneity (equal odds): chi2(2) = 33.56
Trang 48CÁC CÂU LỆNH TÍNH OR
logistic THA nhomtuoi1
Logistic regression Number of obs = 459
LR chi2(1) = 30.78 Prob > chi2 = 0.0000 Log likelihood = -166.33731 Pseudo R2 = 0.0847
THA | Odds Ratio Std Err z P>|z| [95% Conf Interval] -+ - nhomtuoi1 | 3.126343 .6564323 5.43 0.000 2.071626 4.718042 -
-Tuổi tăng thêm 1 nhóm thì số chênh THA sẽ tăng lên 3,13 lần với OR = 3,13; KTC 95% (2,07-4,72); p<0,001
Mô hình biến số khuynh hướng
Trang 49CÁC CÂU LỆNH TÍNH OR
logistic THA i.nhomtuoi1
Logistic regression Number of obs = 459
LR chi2(2) = 31.28 Prob > chi2 = 0.0000 Log likelihood = -166.08901 Pseudo R2 = 0.0861
THA | Odds Ratio Std Err z P>|z| [95% Conf Interval] -+ - nhomtuoi1 |
2 | 3.719249 1.218941 4.01 0.000 1.956517 7.070119
3 | 9.178788 4.035913 5.04 0.000 3.877144 21.72995 -
Số chênh THA trong nhóm tuổi 45-54 cao gấp 3,72 lần so với nhóm tuổi 24-44, với OR = 3,72; KTC 95% (1,96-7,07); p<0,001
Mô hình biến số yếu tố
Trang 51Attr frac ex | 6419484 | .4100421 .7826947
Attr frac pop | 4348683 |
chi2(1) = 18.03 Pr>chi2 = 0.0000
Trang 53Nếu mối liên quan có tính chất khuynh hướng
poisson depvar indepvar, irr robust
Trang 54Nếu mối liên quan có không tính chất khuynh hướng
poisson depvar i indepvar, irr robust
Trang 55CÁC CÂU LỆNH TÍNH RR/PR
Mô hình biến số khuynh hướng
poisson THA nhomtuoi1,irr robust
| Robust
THA | IRR Std Err z P>|z| [95% Conf Interval]
nhomtuoi1 | 2.5 .3691105 6.21 0.000 1.871824 3.338989 -
Trang 56CÁC CÂU LỆNH TÍNH RR/PR
poisson THA i nhomtuoi1, irr robust
Mô hình biến số yếu tố
| Robust
THA | IRR Std Err z P>|z| [95% Conf Interval]
nhomtuoi1 |
2 | 3.193938 .9396523 3.95 0.000 1.794338 5.685241
3 | 6.14095 2.048063 5.44 0.000 3.194127 11.80644 -
Trang 58poisson tdc i.q5, irr robust
| Robust
tdc | IRR Std Err z P>|z| [95% Conf Interval] -+ - q5 |
2 | .9550562 .0109943 -3.99 0.000 9337491 .9768495
3 | .9354839 .0441788 -1.41 0.158 8527816 1.026207 -
LƯU Ý
poisson tdc i.q5,irr
| OIM
tdc | IRR Std Err z P>|z| [95% Conf Interval] -+ - q5 |
2 | .9550562 .2604516 -0.17 0.866 5596278 1.629891
3 | .9354839 .3044441 -0.20 0.838 4943347 1.770319 -
Trang 59BIẾN THỨ TỰ HAY DANH ĐỊNH
Khi phơi nhiễm tăng N
đơn vị thì nguy cơ
thay đổi OR N
Biến danh định
Có nhiều OR/RR/PR khác nhau
Không có mối quan
hệ liều lượng đáp ứng
Trang 60 poissom bpt bđl, irr robust
poisson bpt i bđl, irr robust
* Đặt i vào biến độc lập nếu biến độc lập là biến danh định hoặc không có tính khuynh hướng
Trang 61PHÂN TÍCH PHÂN TẦNG
GÂY NHIỄU
Trang 62Nhắc lại khái niệm gây nhiễu
Trong một nghiên cứu, luôn luôn có các biến số chính mà chúng ta quan tâm
Các biến số khác (biến số thứ 3) có thể làm sai lệch mối liên quan giữa biến số chính
Trang 63C
Liên quan phơi nhiễm, phân bố không
đều giữa các giá trị của biến số độc lập
Liên quan bệnh, là yếu tố nguy cơ của bệnh
Không nằm trong cơ chế tác động của biến độc lập lên biến phụ thuộc
Giô ùi
Huùt thuoác
NMCT
Đặc tính của biến số gây nhiễu
Trang 64Kiểm soát nhiễu
Hạn chế
Phân tầng
Bắt cặp Phân bổ ngẫu nhiên
Phân tích đa biến
Trang 65Kiểm soát gây nhiễu – phân tầng
PHÂN TÍCH BẢNG 2x2 PHÂN
TẦNG
KIỂM ĐỊNH TÍNH ĐỒNG NHẤT
CỦA OR/RR THEO TẦNG
CÓ TƯƠNG TÁC – BÁO CÁO OR/RR TỪNG TẦNG
CÓ
Trang 67Khô
suyển ở nhóm HA bình thường
suyển ở nhóm THA
Suyển / THA và bệnh Giãn Nỡ Cơ Tim Tự Phát
Tương Tác, Thay Đổi Tác Dụng ( Interaction , Effect Modification )
Trang 68Biến số Giá trị biến số tầng Số
Nữ Hút
thuốc giờ Không bao 3
Đã có hút
Đang hút
Số tổ hợp = 2 x 3 = 6
Hạn chế của phân tầng
Trang 69CÂU LỆNH PHÂN TÍCH
PHÂN TẦNG
cc depvar indepvar, by(biến phân tầng)
cs depvar indepvar, by(biến phân tầng)
Phân tích phân tầng cho OR
Phân tích phân tầng cho RR/PR
Trang 70Có bao nhiêu đối tượng nghiên cứu?
Có bao nhiêu biến số nghiên cứu?
Trang 71variable name type format label variable label
-anman byte %8.0g An man 1:co 0:khong
tha byte %8.0g Tang huyet ap 1:co 0:khong
gioi byte %8.0g Gioi tinh 1:nam 0: nu
tuoi byte %8.0g tuoi 1:>=50 tuoi 0: <50 tuoi htl byte %8.0g HTL 1: co 0: khong
CÂU LỆNH PHÂN TÍCH
PHÂN TẦNG
Trang 721 Ăn mặn có tăng nguy cơ THA hay không?
2 Giới tính có phải là biến số gây nhiễu trong mối liên quan giữa ăn mặn và THA hay không?
CÂU LỆNH PHÂN TÍCH
PHÂN TẦNG
Trang 731 Ăn mặn có liên quan đến THA hay không?
tab anman tha,ro chi
An man | Tang huyet ap 1:co 0:khong
Trang 741 Ăn mặn có liên quan đến THA hay không?
cs tha anman
| An man 1:co 0:khong |
| Exposed Unexposed | Total
Prev frac ex | 3333333 | .1103848 .5004082
Prev frac pop | 1666667 |
chi2(1) = 8.00 Pr>chi2 = 0.0047
Nguy cơ THA ở nhóm ăn mặn thấp hơn 33% so với nhóm không ăn mặn
Trang 752 Giới là biến số gây nhiễu trong mối liên quan trên hay không?
-Test of homogeneity (M-H) chi2(1) = 0.002 Pr>chi2 = 0.9659
Sau khi kiểm soát biến số giới tính, người ăn mặn
có nguy cơ THA gấp 1,34 lần so với người không
ăn mặn, với RR =1,34; KTC 95%(1,07-1,70)
Trang 76Kiểm soát gây nhiễu- Phân tầng
KHÔNG NHIỄU VÀ KHÔNG TƯƠNG TÁC –
BÁO CÁO OR/RR THÔ
Trang 77Wilcoxon tổng quát
Logrank
Hồi quy Cox
Trang 78Hồi quy logistic là một loại hồi quy tuyến tính tổng quát (generalized linear model) với phép biến đổi logit (hàm link là hàm logit) được sử dụng để tính
OR cho biến số kết cục là biến nhị giá
KIỂM SOÁT NHIỀU BIẾN SỐ
GÂY NHIỄU –HỒI QUY ĐA BIẾN
logistic depvar indepvars [if] [in] [,options]
logistic depvar i.indepvars [if] [in] [,options]
Hồi quy logistic
Trang 79CHỌN BIẾN SỐ ĐƯA VÀO MÔ
HÌNH ĐA BIẾN
Trang 80Mở file tha.dta
logistic tha anman gioi
Logistic regression Number of obs = 200
-Sau khi kiểm soát biến số, người ăn mặn có nguy
cơ THA gấp 2,94 lần so với người không ăn mặn, với OR =2,94; p=0,04; KTC 95%(1,07-8,06)
KIỂM SOÁT NHIỀU BIẾN SỐ
GÂY NHIỄU –HỒI QUY ĐA BIẾN
Trang 81Hồi quy Poisson được sử dụng cho những nghiên cứu đòan hệ với biến số đầu ra là số đếm Tuy nhiên, hồi quy Poisson cũng có thể được sử dụng
để tính PR/RR cho biến số nhị giá
poisson depvar indepvars, irr robust
poisson depvar i.indepvars, irr robust
KIỂM SOÁT NHIỀU BIẾN SỐ
GÂY NHIỄU –HỒI QUY ĐA BIẾN
Hồi quy Poisson
Trang 82poisson tha anman gioi, irr robust
| Robust
tha | IRR Std Err z P>|z| [95% Conf Interval] -+ - anman | 1.345463 .1528978 2.61 0.009 1.076816 1.681132 gioi | 4.03859 .8967494 6.29 0.000 2.613512 6.240724 -
Sau khi giới tính được kiểm soát, người ăn mặn có nguy cơ THA gấp 1,34 lần so với người không ăn mặn, với RR =1,35; p=0,009; KTC 95%(1,08-1,68)
KIỂM SOÁT NHIỀU BIẾN SỐ
GÂY NHIỄU –HỒI QUY ĐA BIẾN