Nội dung• Ước tính tỉ lệ và khoảng tin cậy 95% • Phân tích khác biệt giữa hai tỉ lệ – Kiểm định z – Odds ratio và relative risk... Ước tính tỉ lệ mang tính thời gian• Ví dụ 2: công trình
Trang 1Phân tích mô tả biến không liên tục
Nguyễn Văn Tuấn Viện nghiên cứu Y khoa Garvan
Sydney, Australia
Trang 2Nội dung
• Ước tính tỉ lệ và khoảng tin cậy 95%
• Phân tích khác biệt giữa hai tỉ lệ
– Kiểm định z
– Odds ratio và relative risk
Trang 3Phân tích một tỉ lệ
Trang 4Ước tính tỉ lệ từ nghiên cứu một thời điểm
• Ví dụ 1: Một nghiên cứu cắt ngang gồm 700 phụ nữ người Việt tuổi 60+,
có 148 phụ nữ được chẩn đoán loãng xương
• Phân tích: Ở đây chúng ta muốn ước tính prevalence (tỉ lệ hiện hành)
Gọi tỉ lệ loãng xương trong quần thể là , và trong mẫu nghiên cứu là p
Chúng ta không biết , nhưng biết rằng p = 148/700 = 0.211 Chúng ta muốn biết khoảng tin cậy 95% của
• Lí thuyết: Theo luật phân phối chuẩn (normal distribution), khoảng tin
cậy 95% của p là: p + 1.96xSE
1 0.211 1 0.211
0.015 700
Trang 5Trình bày kết quả prevalence
• Tỉ lệ loãng xương được ghi nhận là 21.1% với khoảng tin cậy 95% từ 18% đến 24%
Trang 6Ước tính tỉ lệ mang tính thời gian
• Ví dụ 2: công trình Women’s Health Initiative nghiên cứu nguy cơ
ung thư vú ở những phụ nữ sử dụng thay thế hormone (hormone replacement therapy, HRT) Có 8506 phụ nữ tham gia, họ được
theo dõi trung bình 62.2 tháng Trong thời gian này có 166 người bị ung thư vú
• Phân tích: Ở đây chúng ta muốn ước tính incidence ( tỉ lệ phát sinh )
Gọi tỉ lệ này là I (ước số của ) Vấn đề là thời gian!
Trung bình mỗi người được theo dõi 5.18 năm (tức 62.2 / 12) Như vậy tổng số năm-người (person-years) là: 5.18 x 8506 = 44089.
Tỉ lệ ung thư trên mỗi năm-người là :
I = 166 / 44089 = 0.00376
Tỉ lệ ung thư trên mỗi 1000 năm-người là:
I = 166 / 44089 x 1000 = 3.76
Trang 7Ước tính khoảng tin cậy 95% cho tỉ lệ phát sinh
• Sai số chuẩn (standard error) của I: tùy thuộc vào số trường hợp
(x) và số năm-người (N)
166
0.000292 44089
x SE
Trang 8Trình bày kết quả incidence
• Tỉ lệ phát sinh ung thư vú trong nhóm được điều trị bằng HRT là 3.8 trên 1000 năm-người với khoảng tin cậy 95% dao động từ 3.2 % đến 4.3
Trang 9Phân tích hai tỉ lệ
Trang 10So sánh 2 tỉ lệ hiện hành (prevalence) với kiểm định z
• Ví dụ 3: so sánh tỉ lệ loãng xương giữa Úc và Việt Nam ở phụ nữ trên 60
tuổi 700 phụ nữ Việt Nam, có 148 loãng xương Trong nhóm 1287 phụ
nữ Úc, có 345 người loãng xương Hai tỉ lệ này khác nhau?
• Phân tích: Trong trường hợp này, chúng ta muốn tìm hiểu độ khác biệt giữa
hai nhóm Gọi tỉ lệ trong quần thể (mà chúng ta không biết) của hai nhóm là:
Trang 11Khoảng tin cậy 95% 0.18 – 0.24 0.24 – 0.29
• Phân tích: Ước số (estimate) của độ khác biệt do đó:
Trang 13Ước tính khoảng tin cậy 95% của 2 tỉ lệ
• Phân tích: Ước số (estimate) của độ khác biệt do đó:
Trang 14Trình bày kết quả kiểm định 2 tỉ lệ
Tỉ lệ loãng
xương (0.18 – 0.24)0.211 (0.24 – 0.29)0.268 (0.018 - 0.095)0.057
xxx
Tỉ lệ hiện hành loãng xương ở phụ nữ Việt Nam là 21.1% (với
khoảng tin cậy 95% 18% đến 24%); tỉ lệ này thấp hơn so với phụ nữ
Úc cùng độ tuổi 6% (KTC95%: 2% đền 10%)
Trang 15Phân tích hai tỉ lệ phát sinh (incidence)
• Ví dụ 4: công trình nghiên cứu Women’s Health Initiative nghiên
cứu nguy cơ ung thư vú ở những phụ nữ sử dụng thay thế
hormone (hormone replacement therapy, HRT) và placebo (giả
dược) Số liệui của hai nhóm có thể tóm lược như sau:
• Phân tích: Trong trường hợp này, chúng ta muốn tìm hiểu độ khác biệt giữa
hai tỉ lệ phát sinh Gọi tỉ lệ của hai nhóm HRT và placebo lần lược là I1 và I2
Chúng ta có thể ước tính độ khác biệt qua:
D = I1 – I2
Trang 16Phân tích hai tỉ lệ phát sinh (incidence)
Trang 17Phân tích hai tỉ lệ phát sinh (incidence)
Trang 18Ước tính khoảng tin cậy 95% cho hai tỉ lệ phát sinh
Trang 19Phân tích hai tỉ lệ Giới thiệu odds và odds ratio
Trang 20Nghiên cứu bệnh chứng
• Ví dụ 5: Hút thuốc lá và ung thư phổi (Doll et al 1950) Một nghiên cứu bệnh
chứng (case-control study) gồm 2 nhóm đối tượng: nhóm 1 gồm 60 bệnh nhân ung thư phổi và nhóm 2 gồm 60 đối tượng không ung thư Số liệu tóm lược như sau:
Ung thư phổi (K) Control (C)
• Trong nhóm K, có 68% (41/60) người hút thuốc lá; trong nhóm C tỉ lệ này là 47% (28/60)
• Câu hỏi: Số liệu này có đủ bằng chứng để phát biểu rằng có mối liên hệ giữa cắt
ống tinh và ung thư tiền liệt tuyến
Trang 21Giới thiệu odd
• Odd = một danh từ không có trong tiếng Việt và Latin!
• Odd phản ảnh khả năng của hai sự kiện Nếu p là xác suất ung thư, thì 1 – p là xác suất không bị ung thư
Trang 23Giới thiệu odds ratio
• Odds ratio (OR) là tỉ số của hai odds
Ung thư phổi (K) Control (C)
Trang 24Tính khoảng tin cậy 95% của OR
• Rất khó tính sai số chuẩn (SE) của một tỉ lệ hay tỉ số
• Do đó, chúng ta phải sử dụng một thuật toán gián tiếp (mẹo!)
– Thay vì tính SE cho OR, chúng ta tính SE cho logarithmic OR.
ad OR
Trang 25Tính khoảng tin cậy 95% của OR
Trang 26Trình bày kết quả odds ratio
Odd mắc bệnh ung thư phổi trong nhóm hút thuốc lá cao gấp 2.5 lần
so với odd trong nhóm không hút thuốc lá, và độ khác biệt này có ý nghĩa thống kê vì khoảng tin cậy 95% không hàm chứa 1 (KTC95%: 1.2 đến 5.2)
Trang 27Tỉ số nguy cơ Relative risk)
Trang 28Tỉ lệ phát sinh tính trên năm-người 0.00377 0.00300
• Tỉ lệ phát sinh (incidence) là một “đo lường” về nguy cơ
• Nguy cơ ung thư ở nhóm HRT là 0.00377 và nhóm giả dược 0.003
• RR – relative risk – chỉ đơn giản là tỉ số của hai nguy cơ
0.00377
1.254 0.00300
Nguy cơ ung thư vú ở nhóm HRT cao hơn nhóm giả dược 25.4%
Trang 29Ước tính khoảng tin cậy 95% cho RR
• Không thể trực tiếp ước tính sai số chuẩn (SE) cho RR
• Phải tính gián tiếp:
– Hoán chuyển RR sang L = log(RR)
– Tính sai số chuẩn cho L
– Tính KTC95% cho L
– Hoán chuyển ngược lại KTC95% cho RR
Trang 30Ước tính khoảng tin cậy 95% cho RR
Trang 31Trình bày kết quả relative risk
Nguy cơ mắc bệnh ung thư vú trong nhóm HRT tăng 25% so với nguy
cơ trong nhóm chứng, và độ khác biệt này có thể ý nghĩa thống kê (KTC95%: 1.0 đến 1.58)
Trang 32So sánh odds ratio và relative risk
Trang 33KTC95% của OR: 1.01 đến 1.60
Phân tích bằng OR Phân tích bằng RR (không tính đến thời gian)
Trang 34Cẩn thận:
khác biệt giữa OR và RR
Trang 35Vài khác biệt giữa OR và RR
• OR là tỉ số giữa hai odds (không
phải nguy cơ)
Trang 36Tác giả cho rằng tỉ lệ thông tim ở bệnh
nhân da trắng cao hơn bệnh nhân da
Trang 37– Odds ratio và relative risk
– RR chỉ sử dụng cho các nghiên cứu xuôi thời gian; OR sử dụng cho bất cứ mô hình nghiên cứu nào
• Cẩn thận về khác biệt (ý nghĩa) giữa OR và RR!