1. Trang chủ
  2. » Giáo án - Bài giảng

Hồi quy tuyến tính nâng cao

25 386 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 25
Dung lượng 370,99 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

ỨNG DỤNG– Phân tích mối quan hệ giữa biến độc lập địnhlượng và biến phụ thuộc định lượng: Ví dụ: mối quan hệ giữa mức độ mỡ trong máu và tuổi – Dự đoán các giá trị của các biến phụ thuộc

Trang 1

TRƯỜNG ĐẠI HỌC Y TẾ CÔNG CỘNG

BỘ MÔN DỊCH TỄ- THỐNG KÊ

Hồi quy tuyến tính và

Tương quan

Trang 2

ỨNG DỤNG

– Phân tích mối quan hệ giữa biến độc lập (địnhlượng) và biến phụ thuộc (định lượng):

Ví dụ: mối quan hệ giữa mức độ mỡ trong máu và tuổi

– Dự đoán các giá trị của các biến phụ thuộc (y) dựa trên các giá trị của các độc lập (x1, x2,…xk)

Ví dụ: dự đoán huyết áp dựa trên tuổi, cân nặng,

Trang 3

TƯƠNG QUAN

Tương quan là một trong những phép thống kê

dùng để đo lường mối liên quan giữa hai biến

định lượng

Tương quan được sử dụng để xác định ĐỘ LỚN

của mối quan hệ giữa hai biến liên tục với giả

định mối quan hệ này là tuyến tính

Trang 5

TƯƠNG QUAN

• Hệ số tương quan đo lường mức độ liên quan

giữa hai biến x và y.

• Hệ số tương quan trong quần thể ký hiệu bằng ρ(rho) và có thể hiểu là trung bình nhân độ lệch

chuẩn của X vàY.

• Giá trị ước tính ký hiệu bằng r (giá trị trong

khoảng từ -1 đến 1)

Trang 6

TƯƠNG QUAN VÀ TUYẾN TÍNH

Nếu có một mối quan hệ tuyến tính giữa x và y, thì

các điểm được xác định qua x,y có xu hướng

nằm trên một đường thẳng

Æ Hệ số tương quan chỉ nói lên mối quan hệ

tuyến tính, không nói lên mối quan hệ nhân

quả giữa hai biến.

Trang 7

HẠN CHẾ CỦA TƯƠNG QUAN

1 Tương quan chỉ đánh giá mối quan hệ tuyến

tính giữa hai biến

2 Cần cân nhắc các số liệu bất thường (outliers)

Giá trị hệ số tương quan bị ảnh hưởng rất nhiềubởi các giá trị bất thường

Æ Tương quan Pearson vs tương quan phi tham

số (tương quan hạng Spearman)

Trang 8

HẠN CHẾ CỦA TƯƠNG QUAN

3 Không thể ngoại suy dựa vào khoảng giá trị củacác biến quan sát

4 Giá trị của hệ số tương quan lớn không đồng

nghĩa với việc mối quan hệ giữa hai biến này làquan hệ nhân quả

Trang 9

QUAN HỆ TUYẾN TÍNH

Chúng ta nói biến x và y có mối quan hệ tuyến tính

khi mối quan hệ quan sát được được thể hiện

trên một đường thẳng

Chúng ta đo lường sự liên quan tuyến tính của cácquan sát thông qua phép tính hệ số tương quan

Trang 10

HỒI QUI

Phân tích hồi quy giúp ước lượng mối quan hệ giữahai biến

- Hồi qui tuyến tính

- Hồi qui logistics

Mục tiêu của phép phân tích này là dự báo hoặc

ước lượng giá trị của một biến (biến phụ thuộc) khi biết giá trị của biến khác (biến độc lập)

Trang 11

HỒI QUI

Trong mô hình hồi quy tuyến tính đơn giản chỉ quan

tâm tới hai biến x và y

– Biến x được biết đến là biến ĐỘC LẬP.

– Biến còn lại y, gọi là biến BiẾN PHỤ THUỘC

Trang 12

GiẢ ĐỊNH

(1) Phân bố của giá trị y tại với mỗi giá trị x có phân

bố chuẩn

Trang 13

GiẢ ĐỊNH

(2) Mối quan hệ giữa hai biến y và x tuân theo

hàm số:

µy|x = β0 + β1x

Trang 14

GiẢ ĐỊNH

(3) Phương sai đồng nhất: phân bố phương sai của

y không thay đổi với giá trị x

Trang 15

GiẢ ĐỊNH

(4) Các quan sát yi độc lập (không được tính toánmột giá trị y của một đối tượng dựa vào một

hoặc nhiều đối tượng khác)

- Đo lường một đối tượng nhiều lần…

Đây là một giả định quan trong khi xây dựng

mô hình hồi qui.

Trang 16

HỒI QUI TUYẾN TÍNH ĐƠN

Hồi quy tuyến đơn là một kỹ thuật sử dụng mối

quan hệ “đường thẳng” (tuyến tính) để dự báo

giá trị của biến độc lập Y từ một biến độc lập x Nghĩa là, nếu x và y được thể hiện trên biểu đồ

chấm điểm (scatter plots) Æ có mối quan hệ

tuyến tính giữa các điểm

Trang 17

Biểu đồ scatter plots

Trang 18

ĐiỂM CẮT VÀ ĐỘ DỐC

Giá trị điểm cắt Y là giá trị của y khi x = 0, và ký

hiệu β 0

Giá trị độ dốc là sự thay đổi của mỗi đơn vị y khi x

thay đổi và được ký hiệu là β 1

– Giá trị độ dốc dương thể hiện y tăng khi x tăng.

– Giá trị độ dốc âm thể hiện khi x tăng thì y giảm.

Trang 19

PHƯƠNG TRÌNH HỒI QUI

Trang 20

KiỂM ĐỊNH GiẢ THUYẾT

• Liệu có mối quan hệ giữa x và y không

– Nếu không có mối quan hệ Æx thay đổi, y không

thay đổi: β 1=0 (giả thuyết gốc); tương đương ρ=0

– Có mối quan hệ Æ x thay đổi Æ y thay đổi (β 1≠0)

• Có thể tính khoảng tin cậy 95% cho β 1

Trang 21

PHÂN TÍCH VỚI SPSS

- Hệ số tương quan

- Analyze/ Correlate/ Bivariate…

- Analyze/ Regression/ Linear…

- Hồi qui tuyến tính

- Analyze/ Regression/ Linear…

Trang 22

KẾT QUẢ PHÂN TÍCH

1 Cho biết hệ số hồi quy

2 Cho biết khoảng tin cậy của hệ số hồi quy

3 Cho chúng ta giá trị kiểm định p

4 Cho chúng ta biết giá trị r (hệ số tương quan)

5 Cho chúng ta biết giá trị r 2 (hệ số xác định)

Trang 23

THỰC HÀNH

- Sử dụng bộ số liệu BMI.sav (elearning)

Thực hiện các phân tích thống kê phù hợp để kiểm

định các giả thuyết về mối quan hệ giữa BMI với:

Trang 24

HỒI QUI ĐA BiẾN

PurchaseBMI Gender Income AgeGiới Thu nhập Tuổi

BUỔI HỌC SAU

Trang 25

Tài liệu tham khảo

• Tài liệu bắt buộc:

– Trường đại học y tế Công cộng (2005), Thống

kê Y tế 1: Phần cơ bản, Nhà xuất bản y học, 2005

– Trường đại học y tế Công cộng (2005), Thống

kê Y tế 2: Phân tích số liệu định lượng, Nhàxuất bản y học, 2005

• Tài liệu tham khảo:

– Kirkwood B.R (2000) Essentials of Medical

Statistics Blackwell Science.

– Tài liệu phát tay của giảng viên khóa học

Ngày đăng: 16/11/2016, 15:41

TỪ KHÓA LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w