1. Trang chủ
  2. » Khoa Học Tự Nhiên

Chương 2: HỒI QUY 2 BIẾN pdf

37 380 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Chương 2: Hồi Quy 2 Biến
Trường học Trường Đại Học Khoa Học Tự Nhiên<br>https://www.hcmus.edu.vn
Chuyên ngành Khoa Học Máy Tính
Thể loại Chương
Định dạng
Số trang 37
Dung lượng 419 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Khái niệm về hồi quy Phân tích hồi qui là nghiên cứu sự phụ thuộc của 1 biến biến phụ thuộc vào 1 hay nhiều biến khác biến độc lập, nhằm mục đích ước lượng hay dự đoán giá trị trung bìn

Trang 1

Chương 2HỒI QUY 2 BIẾN

Trang 2

2.1 Giới thiệu

2.1.1 Khái niệm về hồi quy

Phân tích hồi qui là nghiên cứu sự phụ thuộc của 1 biến (biến phụ thuộc) vào 1 hay nhiều biến khác (biến độc lập), nhằm mục đích ước lượng (hay dự đoán) giá trị trung bình của biến phụ thuộc trên cơ sở các giá trị biết trước của các biến độc lập.

Trang 3

Đồ thị phân tán

40 60 80 100 120 140 160 180 200

Trang 4

2.1.2 Sự khác nhau giữa các dạng quan hệ

Quan hệ thống kê và quan hệ hàm số:

Y = aX + b

Năng suất lúa = f(nhiệt độ, lượng nắng, mưa, phân bón…)

Hồi quy và quan hệ nhân quả:

Phân tích hồi quy không đòi hỏi giữa biến phụ

thuộc và các biến độc lập phải có mối quan hệ nhân quả

Trang 5

Hồi quy và tương quan:

- Phân tích tương quan là đo mức độ tuyến tính giữa hai biến; không có sự phân biệt giữa các biến; các biến có tính chất đối xứng.

- Phân tích hồi quy ước lượng hoặc dự báo một biến trên cơ sở giá trị đã cho của các biến khác.

Trang 6

2.2.Mô hình hồi quy tổng thể và hồi quy mẫu

2.2.1 Mô hình hồi quy tổng thể (PRF)

Ví dụ 2.1 Hồi quy tiêu dùng Y theo thu nhập X Xét sự phụ thuộc chi tiêu của một gia đình vào thu nhập ở một địa phương có tổng cộng 40 hộ gia

đình Ta được số liệu cho ở bảng sau:

Trang 8

Mô hình hồi quy tổng thể:

E(Y/Xi) = f(Xi) = Xi

 : là hệ số chặn – tung độ gốc

2 : hệ số góc - hệ số đo độ dốc đường hồi quy

Ví dụ ở hộ gia đình có mức chi tiêu 130 ta có:

130 = 1 + 2.180 + 15

115

Mô hình hồi quy tổng thể ngẫu nhiên:

Yi = 1 + 2Xi + ui

ui:sai số ngẫu nhiên của tổng thể ứng với quan sát thứ i

ui: đại diện những nhân tố còn lại ảnh hưởng đến chi tiêu

Trang 9

Sai số ngẫu nhiên hình thành từ nhiều nguyên nhân:

- Bỏ sót biến giải thích

- Sai số khi đo lường biến phụ thuộc

- Dạng mô hình hồi quy không phù hợp

- Các tác động không tiên đoán được.

Trang 11

2.2.2 Mô hình hồi quy mẫu (SRF)

Mô hình hồi quy mẫu:

Trong đó

: ước lượng cho 1.: Ước lượng cho 2.: Ước lượng cho E(Y/Xi)

Mô hình hồi quy mẫu ngẫu nhiên

Y   ˆ1   ˆ2 

Trang 12

Hình 2.1 Mô hình hồi quy tổng thể và mẫu tuyến tính

Trang 13

2.2.3 Mô hình hồi quy tuyến tính (LRF)

Hồi quy tuyến tính chỉ yêu cầu tuyến tính trong các tham số, không yêu cầu tuyến tính trong biến số

Trang 14

2.3 Ước lượng các hệ số của mô hình hồi quy theo phương pháp bình phương tối thiểu-OLS

2.3.1.Các giả định của mô hình hồi quy tuyến tính

cổ điển

Giả thiết 1:Các biến giải thích là phi ngẫu nhiên tức là

các giá trị của chúng được cho trước hoặc được xác

Trang 15

Giả thiết 4: Không có tự tương quan giữa các ui:

Giả thiết 5: Không tự tương quan giữa ui với Xi:

Cov (ui,Xi) = 0

Định lý Gauss-Markov

Với các giả định của mô hình hồi quy tuyến tính

cổ điển, mô hình hồi quy tuyến tính theo phương pháp bình phương tối thiểu là ước lượng tuyến tính không thiên lệch tốt nhất

0 ]

cov[ ui, uj  i  j

Trang 16

2.3.2 Nội dung của phương pháp

Cho n quan sát của 2 đại lượng (Yi, Xi)

Mô hình hồi quy mẫu ngẫu nhiên

n

i  1 ,

i i

Y ˆ1  ˆ2 

i i

0 min

)

ˆ ˆ

(

ˆ

1 2

1 1

1 1

0 )

ˆ ˆ

(

ˆ

2 2

1 2

2 2

2  YYY   X

0 )

ˆ ˆ

(

ˆ

3 2

1 3

3 3

3  YYY   X

Trang 17

=> tìm ∑ei2 => 0: Phương pháp bình phương bé nhất

Điều kiện để phương trình trên đạt cực trị là:

1

2

1 1

i i

e

n

1 i

i

n

1 i

i 2

1 i

1 i

i i

i

n

1 i

i 2

1 i

Trang 18

Giải hệ phương trình trên được:

X n

X

Y X n X

Y

1

2 2

1 2

) (

.

ˆ

X X

xii

Y Y

2 i

n

1 i

i i

2

x

x

y ˆ

n

Y Y

n

X X

Trang 19

2.4 Phương sai, sai số chuẩn của các ước lượng, hệ số xác định R2, hệ số tương

quan r

2.4.1 Phương sai và sai số chuẩn của

các ước lượng

Trang 20

Trong đó : 2 = var (Ui) Do 2 chưa biết

nên dùng ước lượng của nó là

2 ˆ ˆ

2

2 2 i

2 ˆ 2

2 ˆ ˆ

1

2 2 i

2 i

2 ˆ 1

2 2

2

1 1

1

) ˆ (

se x

1 )

ˆ ( Var

) ˆ (

se x

n

X )

ˆ ( Var

β β

β

β β

β

σ σ

β σ

σ β

σ σ

β σ

σ β

e ˆ

2 i 2

 

σ

Trang 22

TSS (Total Sum of Squares): Tổng bình phương

tất cả các sai lệch giữa giá trị thực tế của Y với giá trị trung bình của nó

ESS (Explained Sum of Squares): Tổng bình

phương tất cả các sai lệch giữa giá trị của Y được tính theo mô hình với giá trị trung bình của nó

RSS (Residual Sum of Squares): Tổng bình

phương tất cả các sai lệch giữa giá trị thực tế với giá trị lý thuyết theo mô hình của Y

RSS TSS

ESS R

1

2 1 2

Trang 23

Trong mô hình 2 biến, người ta chứng minh được rằng

i

y

x R

1

2 1

2

2 2 2

ˆ

Trang 24

Hệ số tương quan r: Hệ số tương quan r đo lường

mức độ phụ thuộc tuyến tính giữa 2 đại lượng X và Y

i

n i

i

n i

i i

x y

x

y r

1

2 1

2 1

Trang 25

- Hệ số tương quan có tính chất đối xứng: rXY = rYX

- r độc lập với gốc toạ độ và các tỷ lệ Nghĩa là: với a,

c > 0, b, d là hằng số, và:

Thì : rXY = rX*Y*

d cY

Y

b aX

X

i i

i i

Trang 26

- Nếu X, Y độc lập theo quan điểm thống kê thì hệ số tương quan giữa chúng bằng 0.

- r chỉ là đại lượng đo sự kết hợp tuyến tính hay phụ

thuộc tuyến tính r không có ý nghĩa để mô tả quan

hệ phi tuyến

2 Y , X n

1 i

2 i

n

1 i

2 i

2 n

1 i

i

i

yx

Trang 27

2.5 Phân bố xác suất của các ước lượng

Giả thiết 6: ui có phân phối

) 1 , 0 (

~

ˆ )

, (

~ ˆ

) 1 , 0 (

~

ˆ )

, (

~ ˆ

2 2

1 1

ˆ

2 2

2 ˆ 2

2

ˆ

1 1

2 ˆ 1

1

N Z

N

N Z

- Chúng là các ước lượng không chệch

- Có phương sai cực tiểu

- Khi số quan sát đủ lớn thì các ước lượng này xấp xỉ với giá trị thực của phân phối

ˆ1, ˆ2, ˆ 2

Trang 28

2.6 Khoảng tin cậy của các tham số

Ước lượng khoảng cho hệ số hồi quy với mức ý

nghĩa a (độ tin cậy 1-a) như sau

Trang 29

2.7 Kiểm định giả thiết về hệ số hồi quy

Có 3 cách để kiểm định giả thiết:

1

* 2

)

ˆ(

ˆ

2

* 2 2

t n

t

) 2 / , 2 (  

t n t

Trang 31

Cách 2: Phương pháp khoảng tin cậy

Giả sử ta tìm được khoảng tin cậy của i là:

với mức ý nghĩa  trùng với mức ý nghĩa của gt H0

*

i i

i i

*

i i

i i

Trang 32

i

i i

T

P(  i ) 

Trang 33

2.8 Kiểm định sự phù hợp của mô hình – Dự báo 2.8.1 Kiểm định sự phù hợp của mô hình

Kiểm định giả thiết H0: R2 = 0 với mức ý nghĩa  hay

(

R

n

R F

Trang 34

Miền bác bỏ Miền chấp nhận

F =0,05

F(1,n-2 ) Thống kê F

Trang 35

2.8.2 Dự báo

Cho trước giá trị X = X0, hãy dự báo giá trị trung bình

và giá trị cá biệt của Y với mức ý nghĩa  hay độ tin cậy 1 - 

1

0 ˆ ˆ

Y   

Trang 36

* Dự báo giá trị trung bình của Y

)

ˆ

;

ˆ()

/(Y X 0  Y0   0 Y 00

E

) 2 / , 2 (

ˆ(Y0 Var Y0

Với:

)

) (

1 ( ˆ )

ˆ

2 0

2 0

Y

Trang 37

* Dự báo giá trị cá biệt của Y

Y

) 2 / , 2 (

0 0

)

ˆ ( Y0 Y0 Var Y0 Y0

)

) (

1 1

( ˆ

)

ˆ

2 0

2 0

Y Y

Ngày đăng: 15/03/2014, 09:20

HÌNH ẢNH LIÊN QUAN

Đồ thị phân tán - Chương 2: HỒI QUY 2 BIẾN pdf
th ị phân tán (Trang 3)
Hình 2.1. Mô hình hồi quy tổng thể và mẫu tuyến tính - Chương 2: HỒI QUY 2 BIẾN pdf
Hình 2.1. Mô hình hồi quy tổng thể và mẫu tuyến tính (Trang 12)

TỪ KHÓA LIÊN QUAN