1. Trang chủ
  2. » Luận Văn - Báo Cáo

BAI 6 TUONG QUAN VA HOI QUY

29 4 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 29
Dung lượng 1,91 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

GIỚI THIỆU VÀ XÂY DỰNG FORM NHẬP DỮ LIỆU TRONG SPSS TƯƠNG QUAN VÀ HỒI QUY TIN HỌC ỨNG DỤNG TRƯỜNG ĐẠI HỌC Y DƯỢC HUẾ BỘ MÔN THỐNG KÊ – DÂN SỐ SỨC KHỎE SINH SẢN 1 Mục tiêu 1 Xác định được ý nghĩa và cách sử dụng phân tích tương quan, mô hình hồi quy thích hợp. 2 Thực hiện được cách lệnh phân tích tương quan, mô hình hồi quy trong SPSS. 3 Đọc phiên giãi ý nghĩa và trình bày kết quả phân tích.

Trang 1

TƯƠNG QUAN VÀ HỒI QUY

TIN HỌC ỨNG DỤNG

TRƯỜNG ĐẠI HỌC Y DƯỢC HUẾ

BỘ MÔN THỐNG KÊ – DÂN SỐ - SỨC KHỎE SINH SẢN

TRƯỜNG ĐẠI HỌC Y DƯỢC HUẾ

BỘ MÔN THỐNG KÊ – DÂN SỐ - SỨC KHỎE SINH SẢN

1

Trang 3

PHÂN TÍCH TƯƠNG QUAN

Thường xét đến khi 2 biến NC là biến định lượng

Chú ý đến tính phân bố của số liệu định lượng

Xác định ngưỡng ý nghĩa của hệ số tương quan (r )

r<0,3: tương quan yếu

0,3 ≤ r ≤ 0,5 : tương quan TB

0,5 < r ≤ 0,7 : tương quan chặc chẽ

r>0,7 : tương quan rất chặt chẽ

3

Trang 4

Ví dụ: tính hệ số tương quan giữa tuổi và chiều cao

Thực hiện: Analyze/ Correlate/Bivariate

Biến số

Trang 6

Thể hiện mối tương quan trên biểu đồ scatter plot: graph/legacy Dialogs/Scatter plot

Trang 7

Biến phụ thuộc

Biến độc lập

7

Trang 8

Chú ý :

• Lựa chọn hệ tương quan pearson khi số liệu có phân bố chuẩn

• Hệ số tương quan Spearman khi số liệu có phân bố không chuẩn

Trang 9

MÔ HÌNH HỒI QUY

Phân loại: (dựa vào kiểu biến số phụ thuộc )

• Thông thường chúng ta có nhiều mô hình hồi quy khác nhau tùy thuộc vào kiểu biến số của biến phụ thuộc

• Một số mô hình chính hay gặp trong các phân tích thống kê: Hồi quy tuyến tính, hồi quy logistic, và hồi quy Cox ( sự kiện theo thời gian)

9

Trang 10

• Chương trình này chúng tôi chỉ đề cập đến 2 mô hình là hồi quy tuyến tính (linear regression) và

mô hình logistic với biến phụ thuộc là nhị phân (Binary logistic)

• Dựa vào số lượng biến độc lập đưa vào mô hình

hồi quy đơn biến ( 1 biến độc lập)

Hồi quy đa biến ( ≥ 2 biến độc lập)

MÔ HÌNH HỒI QUY

Trang 11

Hồi quy tuyến tính đơn biến có dạng:

Biến phụ thuộc (y): là biến định lượng

Biến độc lập (x): thường là biến định lượng hoặc thứ bậc.

• : là điểm cắt y khi x = 0 ( hằng số constant)

• : là độ dốc là sự thay đổi của mỗi đơn vị y khi x thay đổi

Sử dụng phương pháp ước tính bình phương tối thiểu để lựa chọn mô hình tối ưu

Mô hình hồi quy tuyến tính đơn biến

11

Trang 12

Mô hình hồi quy tuyến tính

Thực hiện:

Analyza/ Regression/ Linear

Lưu ý: Các giả định số liệu phải có phân bố chuẩn, các quan sát độc lấp

Trang 14

+ Một số phương pháp phân tích:

- Enter : tất cả các biến đưa vào đều góp mặt trong mô hình (1 mô hình duy nhất)

- Backward: Loại bỏ dần các biến không đóng góp cho mô hình (số biến độc lập giảm dần theo các mô hình)

- Forward: Tăng dần các biến trong mô hình

- Stepwise: Kết hợp

Trang 15

Ví dụ: Hồi quy tuyến tính đơn biến

Viết phương trình tuyến tính giữa t score cổ xương đùi với tuổi nghiên cứu

15

Trang 16

Phương pháp đưa biến độc lập vào mô hình

Tóm tắt mô hình ( lưu ý ý nghĩa hệ số R2)

Kiểm định sự tồn tại có ý nghĩa của mô hình

Trang 17

*Lưu ý hệ số B, sig ( giá trị p) và 95% của hệ số B

Phương trình :

Tscore cổ xương đùi = 1,1146 – 0,051*tuổi

Coefficientsa Model

Unstandardized Coefficients

Standardized Coefficients

95.0% Confidence Interval for B

a Dependent Variable: tscore_coxdui

17

Trang 18

Mô hình hồi quy binary logistic đơn biến

• Với biến phụ thuộc là nhị phân ( mã 0;1)

• Thường sử dụng để đo lường chỉ số nguy cơ (OR)

• Biến độc lập có thể định lượng hoặc định tính.

Phương pháp này về nguyên tắc tương tự như mô hình tuyến tính Sử dụng hàm

log

• Dạng :

Trang 19

Đo lường hệ số nguy cơ ( OR)

Theo lý thuyết odds được tính như sau :

Odd nhóm bệnh = tỷ lệ có phơi nhiễm nhóm bênh/ tỷ lệ không phơi nhiễm của nhóm bệnh

Trang 20

Trong mô hình hồi quy logistic thì

OR chính là ?

(SỬ DỤNG THUẬT TOÁN LOGIT thì OR chính là log cơ số e của hệ số hồi quy B)

Trang 21

Ví dụ: xây dựng mô hình logistic giữa tình trạng loãng xương (cổ xương đùi) với trình trạng giảm chiều cao (có; không )

Analyze/ Regression/Binary logistic

Trang 22

Lưu ý: Chọn nhóm reference tùy

thuộc vào mong muốn giải thích

kết qua

Biến định tính

Trang 23

Chọn khoảng 95% của OR

Test kiểm định mô hình

Ngưỡng ý nghĩa của biến số

đưa vào mô hình

23

Trang 24

Số trường hợp tham gia vào mô hình, số mising

Đọc từ dòng này

Trang 25

Mô hình khi chưa đưa biến độc lập

25

Trang 26

Phương pháp đưa biến độc lập vào mô

hình

Kiểm định mức ý nghĩa của mô hình p>0,05 mô hình tồn tại

Trang 27

Phương trình của mô hình:

Ln(Odds) = -0,421 +0,853 *giam chieu cao

Lưu ý :

Hệ số hồi quy B

Sig: giá trị p ý nghĩa của hệ số B

Exp(B) chính là tỷ suất chênh OR

95% CI (OR) : Khoảng tin cậy 95% của OR

27

Trang 28

Phiên giải kết quả có nhiều cách để phiên giải kết qua khác nhau :

Odds (x=0) = e(- 0.421+0,853*0) = e(-0.421)= 0.656  p=0,656/1.656= 0.396

Hay mô hình giúp tiên đoán 39,6% người không bị giảm chiều cao sẽ bị loãng xương

Odds(x=1) = e(-0.421 +0,853*1) = e(0,432)=1.54 p=1,54/2.54=0,606 hay mô hình giúp tiên đoán 60,6% người bị giảm chiều cao sẽ bị loãng xương

OR = Odds(x=1)/ Odds (x=0) = 1,54/0,656 = 2,347

Như vậy nhóm có giảm chiểu cao thì có khả năng loãng xương cao gấp 2,35 lần so với người không giảm chiều cao

Trang 29

BÀI TẬP

1 Tính hệ số tương quan và giải thích ý nghĩa mối tương giữa chiều cao, cân nặng,

tuổi và BMI của đối tượng nghiên cứu.

2 Viết phương trình tuyến tính giữa hb và chỉ số BMI và vẽ biểu đồ thích hợp.

3 Xây dựng mô hình thích hợp giữa nhóm thiếu máu và nhóm không thiếu máu

(hb>=11) với yếu tố gan to tình trạng lách và giới

29

Ngày đăng: 22/10/2022, 08:09