Hồi quy logistics trong SPSSBiến độc lập là biến nhị giá... Tính tỷ số số chênh OR• Đo lường mức độ tác động giữa chủng ngừa BCG và bệnh phong • Đơn biến: 1 biến độc lập • Kết quả phần B
Trang 1Dịch tễ Thống kê Nâng cao
Hồi quy logistics
Trang 2Mục tiêu
• Trình bày được nguyên lý của hồi quy
logistic
• Trình bày được các bước xây dựng mô
hình hồi quy logistic
• Kiểm soát được các vấn đề khi thực
hiện
hồi quy logistic
• Thực hiện được phân tích trên SPSS
và
Trang 3Nguyên lý của hồi quy logistics
Trang 4Ví dụ 1
Trang 5Ví dụ 1 (tt)
Tuyến tính?
Trang 6Ví dụ 2
Tuyến tính?
Trang 7Vấn đề
• Giá trị trục tung – y: đi từ 0 đến 1
• Giá trị ước lượng theo hồi quy tuyến tính
có thể nằm ra ngoài giá trị ý nghĩa
• Sai số không có phân phối chuẩn
Trang 8Hồi quy logistics
là biến nhị giá
– Được đo lường bằng:
• Nguy cơ (risk), hoặc
• Số chênh (odds), hoặc
• Tỷ số số chênh (odds ratio)
– Các đo lường này có miền xác định: risk(0,1),
Odds(0,+α)α))
– với miền xác định của y là (-α; +α) α); +α)α)) không
thích hợp để sử
Trang 9Hồi quy logistics (tt)
• Vấn đề: biến đổi đo lường biến phụ thuộc để
Trang 11Hồi quy logistics (tt)
• Sử dụng thuật toán logit
– Logit = ln(θ/1-θ/1- θ)
• Như vậy:
– Logit = ln(θ/1-Odds) = ln[p/(θ/1-1 - p)] = a + bx
Tính toán được OR
Trang 12Hồi quy logistics (tt)
• Odds của x = 0 là:
• Odds của x = 1 là:
• Vậy OR được tính:
Trang 13Như vậy
• Hồi quy logistics:
• Số chênh
• Tỷ số số chênh
• Tỷ lệ đã hiệu chỉnh
Trang 14Hồi quy logistics trong SPSS
Biến độc lập là biến nhị giá
Trang 15Tính tỷ số số chênh OR
• Đo lường mức độ tác động giữa chủng
ngừa BCG và bệnh phong
• Đơn biến: 1 biến độc lập
• Kết quả phần Block 1
Trang 16Kết quả hồi quy logistics
– Giả thuyết Ho: việc đưa biến độc lập vào mô hình là không có ý nghĩa
– Đối thuyết Ha: việc đưa biến độc lập vào mô hình là
có ý nghĩa
Omnibus Tests of Model
Trang 17Kết quả hồi quy logistics (tt)
Variables in the Equation
a Variable(s) entered on step 1: bcg.
ln(Odds) = 0.933 – 1.49 x 0 = -α; +α) 0.933 Odds=0.393
ln(Odds) = 0.933 – 1.49 x 1 = -α; +α) 2.423 Odds=0.089
Hiểu như thế nào?
B S.E Wald df Sig Exp(B)
95.0% C.I.for EXP(B) Lower Upper
Satep bcg
1 Constant
-α; +α) 1.490 -α; +α) 933
.180 081
68.221 131.286
1 1
.000 000
.225 393
.158 321
Trang 18Phiên giải thế nào?
• OR=0.089/0.393 = 0.225
• Người được tiêm chủng BCG có nguy cơ mắc bệnh phong chỉ vào khoảng 22,5% so với người không tiêm BCG
Trang 20Hồi quy logistics trong SPSS
Biến độc lập là biến thứ bậc
Trang 21Tính tỷ số số chênh (1)
các lớp tuổi kế cận nhau là giống nhau:
Trang 23Phiên giải kết quả
Variables in the Equation
a Variable(s) entered on step 1: nhtuoi.
bên sẽ bị nguy cơ bị bệnh phong tăng gấp 1.463 lần
95.0% C.I.for EXP(B) Lower Upper
Satep nhtuoi
1 Constant
.380 -α; +α) 2.669
.049 194
59.253 189.407
1 1
.000 000
1.463 069
1.328 1.612
Trang 24Phiên giải kết quả (tt)
Trang 25• Biến giả (dummy variables): chọn indicator
để define categorical covariates
Trang 26Kết quả
Variables in the Equation
a Variable(s) entered on step 1: nhtuoi.
không có ý nghĩa thống kê (hay hệ số hồi quy B trong 2 nhóm này không có ý nghĩa)
95.0% C.I.for EXP(B) Lower Upper
nhtuoi(3) 1.002 251 15.877 1 000 2.723 1.664 4.458 nhtuoi(4) 1.404 217 41.971 1 000 4.073 2.663 6.230 Constant -α; +α) 2.122 187 128.612 1 000 120
Trang 27Hồi quy logistics trong SPSS
Biến độc lập là biến danh định
Trang 28Tương tự biến thứ bậc
Không có giả định tính khuynh hướng
Trang 29Hồi quy logistics trong SPSS
Biến độc lập là biến định lượng
Trang 30Kết quả
Variables in the Equation
a Variable(s) entered on step 1: cholesterol.
• Với mỗi 1 mg% cholesterol cao hơn, nguy cơ của bệnh
Satep cholesterol
1 Constant
.007 -α; +α) 3.538
.003 687
5.225 26.531
1 1
.022 000
1.007 029
1.001 1.013
Trang 31Hồi quy logistics đa biến Nhiều biến độc lập trong mô hình
Trang 32Mô hình
• Biến phụ thuộc: bệnh phong
• Biến độc lập: chủng ngừa BCG
Trang 34Xem xét
• Thay đổi của hệ số hồi quy
• Thay đổi của OR hiệu chỉnh và OR thô
• Thay đổi của -α; +α) 2loglikelihood
• Giá trị p của biến thứ 3
• Kết quả của kiểm định Hosmer-α; +α) Lemeshow
Trang 35Xem xét (tt)
• Thay đổi của hệ số hồi quy (B)
– B mô hình 1: -α; +α) 1.49
– B mô hình 2: -α; +α) 1.194
(thay đổi nhiều)
Trang 38Xem xét (tt)
• Giá trị p của biến thứ 3:
– p=0.000 (p<0.001)
– Rất nhỏ
Trang 40Sử dụng thông tin nào?
• Biến thứ 3 là biến nhị giá hay không?
• Mô hình tiên đoán hay mô hình giải thích?
Trang 41Giới có phải là nhiễu/tương tác?
• Nếu không là biến nhiễu, có phải là tương tác không?
Trang 42Đưa biến tương tác vào mô hình
• Lưu ý:
– Phải có biến gốc
Trang 43Kết quả
• Xem xét giá trị p của tương tác
Trang 44Học vấn là nhiễu/tương tác?
Trang 45Học vấn là nhiễu/tương tác?
Trang 46Tiếp xúc phong u, phong củ
Trang 47Đưa nhiều biến vào mô hình
Trang 48Mô hình đa biến
logit = ln(p/1-α; +α) p) = α) +α) βx +1x1 +α) βx +2x2 +α) βx +3x3 +α) … +α) ε
Variables in the Equation
a Variable(s) entered on step 1: bcg, nhtuoi.
logit = ln(Odds) = -α; +α) 1.849 – 1.194 x chủng ngừa
BCG +α) 0.245 x nhóm tuổi
95.0% C.I.for EXP(B) Lower Upper
Satep bcg -α; +α) 1.194 .191 38.913 1 .000 .303 .208 .441
Constant -α; +α) 1.849 214 74.487 1 000 157
Trang 49Đưa biến số vào mô hình
• Enter: Kết quả cho một mô hình duy nhất
bao gồm tất cả các biến đã được lựa chọn
• Forward: lần lượt đưa dần từng biến độc
lập vào mô hình và sẽ giữ chúng lại nếu như biến đó có ý nghĩa thống kê.
Trang 50Đưa biến số vào mô hình (tt)
mô hình sau đó bỏ dần từng biến không có ý
nghĩa thống kê
• Stepwise: kết hợp 2 phương pháp forward và
backward, tại mỗi một bước phương pháp này sẽ tính toán để đưa vào hoặc loại ra các biến độc lập
Trang 51Mô hình: tuổi, học vấn, tiếp xúc phong u, phong củ
Trang 52Kết quả
Trang 53Mô hình: tuổi, học vấn, tiếp xúc phong u, phong củ
Trang 54Kết quả
Trang 55Có nên đưa biến giới vào không?
Trang 56Vấn đề đưa biến số vào mô hình
• Mô hình giải thích hay mô hình tiên đoán?
• Mô hình giải thích:
lượt bổ sung các biến khác
cho
bậc tự do của mô hình <10% số đối tượng
nhóm chọn 1-α; +α) 2 biến nhiều thông tin nhất
Trang 57Vấn đề đưa biến số vào mô hình (tt)
• Thực hiện backward selection
nhiễu/tương tác vào mô hình
p<0.2
Cần lưu ý ý nghĩa y sinh học của biến số!
Trang 58So sánh mô hình
• Sử dụng likelihood ratio test:
models)
– Sử dụng giá trị -α; +α) 2log likelihood
lệch 2
giá trị -α; +α) 2log likelihood
Trang 59Ví dụ
• Mô hình không có biến số “giới”
• Mô hình có biến số “giới”
Trang 60Tóm tắt
• Hồi quy logistics sử dụng khi đo lường
mức độ tác động OR
• Lưu ý các loại biến số độc lập khác nhau
• Việc đưa các biến số vào mô hình đòi hỏi nhiều thời gian, cân nhắc ý nghĩa y sinh học, ý nghĩa thống kê của biến số.