Phương trình hồi qui cho 2 chỉ số gồm: BMI, độ tuổi. Và nghiên cứu đề nghị: nam giới có PBF > 30 và nữ PBF > 40 thì được xem là béo phì. PBF (nữ) = 18.9 + 0.044tuổi + 3.473BMI 0.051BMIBMI PBF (nam) = 29.8 + 0.044tuổi + 3.473BMI 0.051BMIBMI http:journals.plos.orgplosonearticle?id=10.1371%2Fj ournal.pone.0127198 Mục tiêu 1 Xác định được ý nghĩa và cách sử dụng phân tích tương quang, mô hình hồi quy thích hợp. 2 Thực hiện được cách lệnh phân tích tương quan, mô hình hồi quy trong SPSS. 3 Đọc phiên giãi ý nghĩa và trình bày kết quả phân tích. Tin học ứng dụng NCKH Bộ môn: TKYT – DS SKSS PHÂN TÍCH TƯƠNG QUAN Thường xét đến khi 2 biến NC là biến định lượng. Chú ý đến tính phân bố của số liệu định lượng. Xác định ngưỡng ý nghĩa của hệ số tương quan (r ) r0,7 : tương quan rất chặt chẽ Ví dụ: tính hệ số tương quan giữa tuổi và chiều cao
Trang 1TƯƠNG QUAN VÀ HỒI QUY
TIN HỌC ỨNG DỤNG
TRƯỜNG ĐẠI HỌC Y DƯỢC HUẾ
BỘ MÔN THỐNG KÊ – DÂN SỐ - SỨC KHỎE SINH SẢN
TRƯỜNG ĐẠI HỌC Y DƯỢC HUẾ
BỘ MÔN THỐNG KÊ – DÂN SỐ - SỨC KHỎE SINH SẢN
1
Trang 5Phương trình hồi qui cho 2 chỉ số gồm: BMI, độ tuổi Và
nghiên cứu đề nghị: nam giới có PBF > 30 và nữ PBF > 40 thì được xem là béo phì
PBF (nữ) = -18.9 + 0.044*tuổi + 3.473*BMI - 0.051*BMI*BMIPBF (nam) = -29.8 + 0.044*tuổi + 3.473*BMI -
0.051*BMI*BMI
http://journals.plos.org/plosone/article?
id=10.1371%2Fjournal.pone.0127198
Trang 6Mục tiêu
1/ Xác định được ý nghĩa và cách sử dụng phân tích tương quang, mô hình hồi quy thích hợp 2/ Thực hiện được cách lệnh phân tích tương quan, mô hình hồi quy trong SPSS.
3/ Đọc phiên giãi ý nghĩa và trình bày kết quả phân tích
Trang 7PHÂN TÍCH TƯƠNG QUAN
Thường xét đến khi 2 biến NC là biến định
lượng
Chú ý đến tính phân bố của số liệu định lượng.
Xác định ngưỡng ý nghĩa của hệ số tương quan
Trang 8Ví dụ: tính hệ số tương quan giữa tuổi và chiều cao
Thực hiện: Analyze/ Correlate/Bivariate
Biến số
Trang 9Hệ số tương quan r
Ngưỡng ý nghĩa p value
Số trường hợp quan sát
Kết quả thực
hiện
9
Trang 10Thể hiện mối tương quan trên biểu đồ scatter plot: graph/legacy Dialogs/Scatter plot
Trang 11Biến phụ thuộc
Biến độc lập
11
Trang 13MÔ HÌNH HỒI QUY
Phân loại: (dựa vào kiểu biến số phụ
thuộc )
• Thông thường chúng ta có nhiều mô hình hồi quy khác nhau tùy thuộc vào kiểu biến
số của biến phụ thuộc
• Một số mô hình chính hay gặp trong các phân tích thống kê: Hồi quy tuyến tính, hồi quy logistic, và hồi quy Cox ( sự kiện theo thời gian)
13
Trang 14• Chương trình này chúng tôi chỉ đề cập đến 2 mô hình
là hồi quy tuyến tính (linear regression) và mô hình logistic với biến phụ thuộc là nhị phân (Binary logistic)
• Dựa vào số lượng biến độc lập đưa vào mô hình
hồi quy đơn biến ( 1 biến độc lập)
Hồi quy đa biến ( ≥ 2 biến độc lập)
MÔ HÌNH HỒI QUY
Trang 15Hồi quy tuyến tính đơn biến có dạng:
• Biến phụ thuộc (y): là biến định lượng
• Biến độc lập (x): thường là biến định lượng hoặc thứ bậc.
• : là điểm cắt y khi x = 0 ( hằng số constant)
• : là độ dốc là sự thay đổi của mỗi đơn vị y khi x thay đổi.
• Sử dụng phương pháp ước tính bình phương tối
thiểu để lựa chọn mô hình tối ưu
Mô hình hồi quy tuyến tính đơn biến
15
Trang 16Mô hình hồi quy tuyến tính
Thực hiện:
Analyza/ Regression/ Linear
Lưu ý: Các giả định số liệu phải có phân bố chuẩn, các quan sát độc lấp
Trang 17Biến phụ thuộc
Biến độc lập
Phương pháp
đưa phân tích
17
Trang 19Ví dụ: Hồi quy tuyến tính đơn biến
Viết phương trình tuyến tính giữa t score cổ xương đùi với tuổi nghiên cứu
19
Trang 20Phương pháp đưa biến độc lập vào mô
hình
Tóm tắt mô hình ( lưu ý
ý nghĩa hệ số R2)
Kiểm định sự tồn tại có ý nghĩa của mô hình
Trang 21*Lưu ý hệ số B, sig ( giá trị p) và 95% của hệ số B
Standardized Coefficients
95.0% Confidence Interval for B
B
Std
Error Beta
Lower Bound
Upper Bound
a Dependent Variable: tscore_coxdui
21
Trang 22Mô hình hồi quy binary logistic đơn biến
• Với biến phụ thuộc là nhị phân ( mã 0;1)
• Thường sử dụng để đo lường chỉ số nguy cơ
(OR)
• Biến độc lập có thể định lượng hoặc định tính.
• Phương pháp này về nguyên tắc tương tự như
mô hình tuyến tính Sử dụng hàm log
• Dạng :
Logit = ln(Odds) = ln[p/(1 - p)] = a + bx
Trang 23Đo lường hệ số nguy cơ ( OR)
Theo lý thuyết odds được tính như sau :
Odd nhóm bệnh = tỷ lệ có phơi nhiễm nhóm bênh/ tỷ
lệ không phơi nhiễm của nhóm bệnh = a/(a+c) / c/(a+c)
Trang 24Trong mô hình hồi quy logistic thì
OR chính là ?
(SỬ DỤNG THUẬT TOÁN LOGIT thì OR chính là log cơ số e của hệ số hồi quy B)
Trang 25Ví dụ: xây dựng mô hình logistic giữa tình trạng loãng xương (cổ xương đùi) với trình trạng giảm chiều cao (có; không )
thuộc
Biến độc lập
Phương pháp lựa chọn
Trang 26Lưu ý: Chọn
nhóm reference
tùy thuộc vào
mong muốn giải
Biến định tính
Biến định lượng
Trang 27Chọn khoảng 95% của OR
Trang 28Số trường hợp tham gia vào mô hình, số mising
Đọc từ dòng này
Mã code của biến phụ
thuộc
Trang 29Mô hình khi chưa đưa biến độc lập
29
Trang 30Phương pháp đưa biến
độc lập vào mô hình
Kiểm định mức ý nghĩa của mô hình p>0,05 mô hình tồn tại
Trang 31Phương trình của mô hình:
Ln(Odds) = -0,421 +0,853 *giam chieu cao
Lưu ý :
Hệ số hồi quy B
Sig: giá trị p ý nghĩa của hệ số B
Exp(B) chính là tỷ suất chênh OR
95% CI (OR) : Khoảng tin cậy 95% của OR
31
Trang 32Phiên giải kết quả có nhiều cách để phiên giải kết qua khác nhau :
Trong nhóm không giảm chiều cao:
Odds (x=0) = e(- 0.421+0,853*0) = e(-0.421)= 0.656
p=0,656/1.656= 0.396
Hay mô hình giúp tiên đoán 39,6% người không bị giảm chiều cao sẽ bị loãng xương.
Trong nhóm có giảm chiều cao:
Odds(x=1) = e(-0.421 +0,853*1) = e(0,432)=1.54
p=1,54/2.54=0,606 hay mô hình giúp tiên đoán 60,6% người bị giảm chiều cao sẽ bị loãng xương
OR = Odds(x=1)/ Odds (x=0) = 1,54/0,656 = 2,347
Như vậy nhóm có giảm chiểu cao thì có khả năng loãng
Trang 33BÀI TẬP
1 Tính hệ số tương quan và giải thích ý
nghĩa mối tương giữa chỉ số: tuổi, mạch, chiều cao, cân nặng, huyết áp tâm trương (hattr1) và BMI của đối tượng nghiên cứu.
2 Viết phương trình tuyến tính giữa BMI và
cân nặng và vẽ biểu đồ thích hợp.
3 Viết phương trình tuyến tính giữa BMI và
chiều cao và vẽ biểu đồ thích hợp.
33