1. Trang chủ
  2. » Giáo án - Bài giảng

Bài giảng hồi quy logistic đơn và đa biến

60 1,2K 3

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 60
Dung lượng 384,59 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Hồi quy logistics trong SPSSBiến độc lập là biến nhị giá... Tính tỷ số số chênh OR• Đo lường mức độ tác động giữa chủng ngừa BCG và bệnh phong • Đơn biến: 1 biến độc lập • Kết quả phần B

Trang 1

Dịch tễ Thống kê Nâng cao

Hồi quy logistics

Trang 2

Mục tiêu

• Trình bày được nguyên lý của hồi quy

logistic

• Trình bày được các bước xây dựng mô

hình hồi quy logistic

• Kiểm soát được các vấn đề khi thực

hiện

hồi quy logistic

• Thực hiện được phân tích trên SPSS

Trang 3

Nguyên lý của hồi quy logistics

Trang 4

Ví dụ 1

Trang 5

Ví dụ 1 (tt)

Tuyến tính?

Trang 6

Ví dụ 2

Tuyến tính?

Trang 7

Vấn đề

• Giá trị trục tung – y: đi từ 0 đến 1

• Giá trị ước lượng theo hồi quy tuyến tính

có thể nằm ra ngoài giá trị ý nghĩa

• Sai số không có phân phối chuẩn

Trang 8

Hồi quy logistics

là biến nhị giá

– Được đo lường bằng:

• Nguy cơ (risk), hoặc

• Số chênh (odds), hoặc

• Tỷ số số chênh (odds ratio)

– Các đo lường này có miền xác định: risk(0,1),

Odds(0,+α)α))

– với miền xác định của y là (-α; +α) α); +α)α)) không

thích hợp để sử

Trang 9

Hồi quy logistics (tt)

• Vấn đề: biến đổi đo lường biến phụ thuộc để

Trang 11

Hồi quy logistics (tt)

Sử dụng thuật toán logit

– Logit = ln(θ/1-θ/1- θ)

• Như vậy:

– Logit = ln(θ/1-Odds) = ln[p/(θ/1-1 - p)] = a + bx

 Tính toán được OR

Trang 12

Hồi quy logistics (tt)

• Odds của x = 0 là:

• Odds của x = 1 là:

• Vậy OR được tính:

Trang 13

Như vậy

• Hồi quy logistics:

• Số chênh

• Tỷ số số chênh

• Tỷ lệ đã hiệu chỉnh

Trang 14

Hồi quy logistics trong SPSS

Biến độc lập là biến nhị giá

Trang 15

Tính tỷ số số chênh OR

• Đo lường mức độ tác động giữa chủng

ngừa BCG và bệnh phong

• Đơn biến: 1 biến độc lập

• Kết quả phần Block 1

Trang 16

Kết quả hồi quy logistics

– Giả thuyết Ho: việc đưa biến độc lập vào mô hình là không có ý nghĩa

– Đối thuyết Ha: việc đưa biến độc lập vào mô hình là

có ý nghĩa

Omnibus Tests of Model

Trang 17

Kết quả hồi quy logistics (tt)

Variables in the Equation

a Variable(s) entered on step 1: bcg.

ln(Odds) = 0.933 – 1.49 x 0 = -α; +α) 0.933  Odds=0.393

ln(Odds) = 0.933 – 1.49 x 1 = -α; +α) 2.423  Odds=0.089

Hiểu như thế nào?

B S.E Wald df Sig Exp(B)

95.0% C.I.for EXP(B) Lower Upper

Satep bcg

1 Constant

-α; +α) 1.490 -α; +α) 933

.180 081

68.221 131.286

1 1

.000 000

.225 393

.158 321

Trang 18

Phiên giải thế nào?

• OR=0.089/0.393 = 0.225

• Người được tiêm chủng BCG có nguy cơ mắc bệnh phong chỉ vào khoảng 22,5% so với người không tiêm BCG

Trang 20

Hồi quy logistics trong SPSS

Biến độc lập là biến thứ bậc

Trang 21

Tính tỷ số số chênh (1)

các lớp tuổi kế cận nhau là giống nhau:

Trang 23

Phiên giải kết quả

Variables in the Equation

a Variable(s) entered on step 1: nhtuoi.

bên sẽ bị nguy cơ bị bệnh phong tăng gấp 1.463 lần

95.0% C.I.for EXP(B) Lower Upper

Satep nhtuoi

1 Constant

.380 -α; +α) 2.669

.049 194

59.253 189.407

1 1

.000 000

1.463 069

1.328 1.612

Trang 24

Phiên giải kết quả (tt)

Trang 25

• Biến giả (dummy variables): chọn indicator

để define categorical covariates

Trang 26

Kết quả

Variables in the Equation

a Variable(s) entered on step 1: nhtuoi.

không có ý nghĩa thống kê (hay hệ số hồi quy B trong 2 nhóm này không có ý nghĩa)

95.0% C.I.for EXP(B) Lower Upper

nhtuoi(3) 1.002 251 15.877 1 000 2.723 1.664 4.458 nhtuoi(4) 1.404 217 41.971 1 000 4.073 2.663 6.230 Constant -α; +α) 2.122 187 128.612 1 000 120

Trang 27

Hồi quy logistics trong SPSS

Biến độc lập là biến danh định

Trang 28

Tương tự biến thứ bậc

Không có giả định tính khuynh hướng

Trang 29

Hồi quy logistics trong SPSS

Biến độc lập là biến định lượng

Trang 30

Kết quả

Variables in the Equation

a Variable(s) entered on step 1: cholesterol.

• Với mỗi 1 mg% cholesterol cao hơn, nguy cơ của bệnh

Satep cholesterol

1 Constant

.007 -α; +α) 3.538

.003 687

5.225 26.531

1 1

.022 000

1.007 029

1.001 1.013

Trang 31

Hồi quy logistics đa biến Nhiều biến độc lập trong mô hình

Trang 32

Mô hình

• Biến phụ thuộc: bệnh phong

• Biến độc lập: chủng ngừa BCG

Trang 34

Xem xét

• Thay đổi của hệ số hồi quy

• Thay đổi của OR hiệu chỉnh và OR thô

• Thay đổi của -α; +α) 2loglikelihood

• Giá trị p của biến thứ 3

• Kết quả của kiểm định Hosmer-α; +α) Lemeshow

Trang 35

Xem xét (tt)

• Thay đổi của hệ số hồi quy (B)

– B mô hình 1: -α; +α) 1.49

– B mô hình 2: -α; +α) 1.194

(thay đổi nhiều)

Trang 38

Xem xét (tt)

• Giá trị p của biến thứ 3:

– p=0.000 (p<0.001)

– Rất nhỏ

Trang 40

Sử dụng thông tin nào?

• Biến thứ 3 là biến nhị giá hay không?

• Mô hình tiên đoán hay mô hình giải thích?

Trang 41

Giới có phải là nhiễu/tương tác?

• Nếu không là biến nhiễu, có phải là tương tác không?

Trang 42

Đưa biến tương tác vào mô hình

• Lưu ý:

– Phải có biến gốc

Trang 43

Kết quả

• Xem xét giá trị p của tương tác

Trang 44

Học vấn là nhiễu/tương tác?

Trang 45

Học vấn là nhiễu/tương tác?

Trang 46

Tiếp xúc phong u, phong củ

Trang 47

Đưa nhiều biến vào mô hình

Trang 48

Mô hình đa biến

logit = ln(p/1-α; +α) p) = α) +α) βx +1x1 +α) βx +2x2 +α) βx +3x3 +α) … +α) ε

Variables in the Equation

a Variable(s) entered on step 1: bcg, nhtuoi.

logit = ln(Odds) = -α; +α) 1.849 – 1.194 x chủng ngừa

BCG +α) 0.245 x nhóm tuổi

95.0% C.I.for EXP(B) Lower Upper

Satep bcg -α; +α) 1.194 .191 38.913 1 .000 .303 .208 .441

Constant -α; +α) 1.849 214 74.487 1 000 157

Trang 49

Đưa biến số vào mô hình

• Enter: Kết quả cho một mô hình duy nhất

bao gồm tất cả các biến đã được lựa chọn

• Forward: lần lượt đưa dần từng biến độc

lập vào mô hình và sẽ giữ chúng lại nếu như biến đó có ý nghĩa thống kê.

Trang 50

Đưa biến số vào mô hình (tt)

mô hình sau đó bỏ dần từng biến không có ý

nghĩa thống kê

• Stepwise: kết hợp 2 phương pháp forward và

backward, tại mỗi một bước phương pháp này sẽ tính toán để đưa vào hoặc loại ra các biến độc lập

Trang 51

Mô hình: tuổi, học vấn, tiếp xúc phong u, phong củ

Trang 52

Kết quả

Trang 53

Mô hình: tuổi, học vấn, tiếp xúc phong u, phong củ

Trang 54

Kết quả

Trang 55

Có nên đưa biến giới vào không?

Trang 56

Vấn đề đưa biến số vào mô hình

• Mô hình giải thích hay mô hình tiên đoán?

• Mô hình giải thích:

lượt bổ sung các biến khác

cho

bậc tự do của mô hình <10% số đối tượng

nhóm chọn 1-α; +α) 2 biến nhiều thông tin nhất

Trang 57

Vấn đề đưa biến số vào mô hình (tt)

• Thực hiện backward selection

nhiễu/tương tác vào mô hình

p<0.2

Cần lưu ý ý nghĩa y sinh học của biến số!

Trang 58

So sánh mô hình

• Sử dụng likelihood ratio test:

models)

– Sử dụng giá trị -α; +α) 2log likelihood

lệch 2

giá trị -α; +α) 2log likelihood

Trang 59

Ví dụ

• Mô hình không có biến số “giới”

• Mô hình có biến số “giới”

Trang 60

Tóm tắt

• Hồi quy logistics sử dụng khi đo lường

mức độ tác động OR

• Lưu ý các loại biến số độc lập khác nhau

• Việc đưa các biến số vào mô hình đòi hỏi nhiều thời gian, cân nhắc ý nghĩa y sinh học, ý nghĩa thống kê của biến số.

Ngày đăng: 16/11/2016, 15:41

TỪ KHÓA LIÊN QUAN