1. Trang chủ
  2. » Luận Văn - Báo Cáo

Bài giảng Kinh tế lượng: Chương 6 - ThS. Trần Quang Cảnh

7 66 0

Đang tải... (xem toàn văn)

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 7
Dung lượng 444,92 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Bài giảng Kinh tế lượng - Chương 6: Hiện tượng đa cộng tuyến cung cấp cho người học các kiến thức: Bản chất, nguyên nhân của đa cộng tuyến; ước lượng các tham số, hậu quả, phát hiện đa cộng tuyến, khắc phục đa cộng tuyến. Mời các bạn cùng tham khảo.

Trang 1

CHƯƠNG 6

HIỆN TƯỢNG ĐA CỘNG TUYẾN

(MULTICOLLINEARITY)

2

1 Hiểu bản chất và hậu quả của

đa cộng tuyến

2 Biết cách phát hiện đa cộng tuyến và biện pháp khắc phục

MỤC

TIÊU

ĐA CỘNG TUYẾN

NỘI DUNG

3

Bản chất, nguyên nhân của đa cộng tuyến

1

Ước lượng các tham số

2

3

Phát hiện đa cộng tuyến

4

Khắc phục đa cộng tuyến

5

Hậu quả

4

Thu nhập Sự giàu có Chi tiêu

Nguồn: Ramu Ramanathan

5

6

1

2

3

4

5

6

Trang 2

8

Khi lập mô hình hồi quy bội

Có sự phụ thuộc tuyến tính cao giữa các biến

giải thích gọi là đa cộng tuyến

Tồn tại 2, 3,… kkhông đồng thời bằng 0

sao cho

2X2+ 3X3+ …+ kXk= 0

Nói cách khác là xảy ra trường hợp một biến

giải thích nào đó được biểu diễn dưới dạng một

tổ hợp tuyến tính của các biến còn lại

ki k i

i

6.1 Bản chất của đa cộng tuyến

9

b Đa cộng tuyến không hoàn hảo

2X2+ 3X3+ …+ kXk+ vi= 0

Với vilà sai số ngẫu nhiên thì ta có hiện tượng đa

cộng tuyến không hoàn hảo giữa các biến giải

thích

Nói cách khác là một biến giải thích nào đó có

tương quan với một số biến giải thích khác

6.1 Bản chất của đa cộng tuyến

10

X2và X3; r23= 1

nhưng hai biến này có tương quan chặt chẽ.

X* 3

V

52 2

75 0

97 7

129 9

152 2

6.1 Bản chất của đa cộng tuyến

VD

11

6.1 Bản chất của đa cộng tuyến

Hình 6.1 Biểu đồ Venn mô tả hiện tượng đa cộng tuyến

Hình 6.1 Biểu đồ Venn mô tả hiện tượng đa cộng tuyến

6.1 Bản chất của đa cộng tuyến

7

8

10

11

Trang 3

Một số nguyên nhân gây ra hiện tượng

đa cộng tuyến

- Khi chọn các biến độc lập mối quan có

quan hệ nhân quả hay có tương quan

cao vì đồng phụ thuộc vào một điều kiện

khác

- Khi số quan sát nhỏ hơn số biến độc lập.

- Cách thu thập mẫu: mẫu không đặc

trưng cho tổng thể

6.1 Nguyên nhân của đa cộng tuyến

6.2 Ước lượng khi có đa cộng tuyến

1 Trường hợp có đa cộng tuyến hoàn hảo

Xét mô hình hồi qui 3 biến dưới dạng sau:

Yi= 2X2i + 3X3i+ ei

giả sử X3i= X2i, mô hình được biến đổi thành:

Yi= (2+ 3)X2i+ ei= 0X2i+ ei

Phương pháp OLS

14

3

ˆ ˆ

i i i o

x y x

 Không thể tìm được lời giải duy nhất cho  ˆ2,  ˆ3

6.2 Ước lượng khi có đa cộng tuyến

là vô hạn

15

2 3 2 2

3 2 2

3 2 3 2

3 2 2

) (

ˆ

i i i

i

i i i i i i i

x x x

x

x x x y x

x

y

0

0 ˆ

2 3 2 3 2 2 3 2 3 2

3 3 3 2

3 3

 

i i i

i

i i i i i

i i

x x x

x

x x x y x

x y

6.2 Ước lượng các tham số khi có đa cộng tuyến

 Các hệ số ước lượng không xác định: chúng ta không tách rời tác động của từng biến Xilên Y do không thể giả định X 2 thay đổi trong khi X 3 không đổi.

16

2 3 2 2

3 2 2

3 2 3 2

3 2 2

) (

ˆ

i i i

i

i i i i i i i

x x x

x

x x x y x

x y

0

0 ˆ

2 3 2 3 2 2 3 2 3 2

3 3 3 2

3 3

 

i i i

i

i i i i i

i i

x x x

x

x x x y x

x y

6.2 Ước lượng các tham số khi có đa cộng tuyến

2 Trường hợp có đa cộng tuyến không hoàn hảo

• Đa cộng tuyến hoàn hảo thường không xảy ra trong thực tế

• Xét mô hình hồi qui 3 biến dưới dạng sau:

yi= 2x2i + 3x3i+ ei Giả định x3i=  x2i+ vi Với   0 và vilà sai số ngẫu nhiên

• Trong trường hợp này, các hệ số hồi qui 2 và

3có thể ước lượng được:

17

Ta có thể ước lượng được các này nhưng s.e

sẽ rất lớn

6.2 Ước lượng các tham số khi có đa cộng tuyến

18

ˆ

13

14

15

16

17

18

Trang 4

6.3 Hậu quả của đa cộng tuyến

Nếu có cộng tuyến gần hoàn hảo:

• Các ước lượng vẫn BLUE, nhưng:

1 Phương sai và hiệp phương sai của các ước

lượng OLS lớn

19

r23là hệ số tương quan giữa X2và

X3 Khi r23  1, các giá trị trên  

6.3 Hậu quả của đa cộng tuyến

Nếu có cộng tuyến gần hoàn hảo:

2 Khoảng tin cậy rộng hơn

• Khoảng tin cậy của 2và 3(với độ tin cậy 1 – )

là:

2=  t /2se ( );

3=  t /2se ( );

trong đó:

se ( ) = se ( ) =

20

^

2

^

^

^

^

2 2

23) 1

^

3 2

23) 1

21

Giá trị của r23 Khoảng tin cậy 95% của B2

0

0.5

0.95

0.995

0.999

A

* 96 1 ˆ

2 

A

* 33 1

* 96 1 ˆ

2 

A

* 26 10

* 96 1 ˆ

2 

A

* 100

* 96 1 ˆ

2 

A

* 500

* 96 1 ˆ

2 

2

i

x

6.3 Hậu quả của đa cộng tuyến

Nếu có cộng tuyến gần hoàn hảo:

3 Tỉ số t "không có ý nghĩa"

Khi kiểm định giả thuyết H0: 2= 0, chúng ta sử dụng tỷ số t

và so sánh giá trị ước lượng của t với giá trị tra bảng (tới hạn) của t

Trong trường hợp cộng tuyến cao thì sai số chuẩn

sẽ rất lớn và do đó làm cho giá trị t sẽ nhỏ đi, kết quả là sẽ làm tăng chấp nhận giả thuyết H0

22

) ˆ ˆ

2 2

se

t 

6.3 Hậu quả của đa cộng tuyến

Nếu có cộng tuyến gần hoàn hảo:

4 R2cao nhưng tỉ số t ít có ý nghĩa

• Đa cộng tuyến cao:

• - một hoặc một số tham số tương quan (hệ

số góc riêng) không có ý nghĩa về mặt thống

• - R2trong những trường hợp này lại rất cao (trên 0,9)

• - kiểm định F thì có thể bác bỏ giả thuyết cho rằng 2= 3= … = k= 0

23

6.3 Hậu quả của đa cộng tuyến

Nếu có cộng tuyến gần hoàn hảo:

5 Các ước lượng OLS và sai số chuẩn của chúng trở nên rất nhạy với những thay đổi nhỏ trong

dữ liệu

6 Dấu của các ước lượng của các hệ số hồi qui có thể sai

7 Thêm vào hay bớt đi các biến cộng tuyến với các biến khác, mô hình sẽ thay đổi về dấu hoặc thay đổi về độ lớn của các ước lượng

24

19

20

22

23

Trang 5

Ví dụ: Bảng 2 do nhập sai số liệu nên

xảy ra đa cộng tuyến

25

Bảng 1

Bảng 2

00868 0 ) , ˆ cov(

;

5523

.

0

;

81

.

0

003

.

0

446

.

0

193

.

1

ˆ

3 2 23

2

3 2

r

R

X X

Y i i i

Se (0.7736) (0.1848) (0.0850)

0282 0 ) , ˆ cov(

; 8285 0

; 81 0

027 0 401 0 210 1 ˆ

3 2 23 2

3 2

r R

X X

Y i i i

Se (0.7480) (0.2720) (0.1252)

26

Đa cộng tuyến là một hiện tượng theo

mẫu, nghĩa là cho dù các biến độc lập

Xikhông tương quan tuyến tính trong

tổng thể nhưng chúng có thể tương

quan tuyến tính trong một mẫu cụ thể

nào đó Do đó cỡ mẫu lớn thì hiện

tượng đa cộng tuyến ít nghiêm trọng

hơn cỡ mẫu nhỏ

27

1 Hệ số R2lớn nhưng tỷ số t nhỏ

2 Tương quan cặp giữa các biến giải thích cao

3 Sử dụng mô hình hồi qui phụ

4 Sử dụng yếu tố phóng đại phương sai (VIF)

6.4 Cách phát hiện đa cộng tuyến

28

1 R 2 lớn nhưng tỷ số t nhỏ

Nếu R2cao, chẳng hạn, >0,8 và F test bác bỏ giả thuyết 2= 3= … = k= 0, nhưng t test cho từng ilại chấp nhận H0

2 Tương quan cặp giữa các biến giải thích cao

Trong đó X, Z là 2 biến giải thích trong mô hình

2 2

) ( ) (

) )(

(

Z Z X X

Z Z X X r

i i

i i

XZ

6.4 Cách phát hiện đa cộng tuyến

29

3 Sử dụng mô hình hồi quy phụ

Hồi qui một biến giải thích X nào đó theo các biến còn lại

Tính R2và F cho mỗi mô hình theo công thức:

Lập giả thiết H0: R2= 0 ~ H0: không có đa cộng tuyến Nếu F > F(m-1,n-m): bác bỏ H0=> có đa cộng tuyến Nếu F < F(m-1,n-m): chấp nhận H0=> không có đa cộng tuyến

mi k i

X ˆ2   ˆ1  ˆ3 3    ˆ

) 1 )(

1 (

) (

2 2

m R m n R F

6.4 Cách phát hiện đa cộng tuyến

30

VD: Cho doanh số bán (Y), chi phí chào hàng (X2)

và chi phí quảng cáo (X3) trong năm 2001 ở 12 khu vực bán hàng của 1 công ty Có hiện tượng

đa cộng tuyến không?

Hồi quy biến chi phí chào hàng với chi phí quảng cáo, ta có kết quả

X 2 =42,012 + 0,387 *X 3

R 2 = 0,22922 F= 2,9738

Với mức ý nghĩa α=5%, tra bảng F0.05(1,10)=

4,96 Ta thấy F < F0.05(1,10) nên chấp nhận Ho hay không có đa cộng tuyến

6.4 Cách phát hiện đa cộng tuyến

25

26

27

28

29

30

Trang 6

4 Sử dụng nhân tử phóng đại phương sai (VIF)

Đối với hàm hồi quy 2 biến giải thích, VIF được định nghĩa

như sau:

Đối với trường hợp tổng quát, có (k-1) biến giải thích thì:

R 2

j : là giá trị R 2 trong hàm hồi quy của Xjtheo (k-1) biến giải

thích còn lại Thông thường khi VIF > 10, thì biến này được

coi là có cộng tuyến cao

) 1 (

1 2 23

r VIF

) 1 (

1 2

j

R VIF

6.4 Cách phát hiện đa cộng tuyến

VIF

x i.

) ˆ

2 2

 

32

Giá trị của r23 VIF

) ˆ (2

Var Cov ˆ2,ˆ3)

 

2 3 2 2

2 2

2

2

;

i i

x

1 Dùng thông tin tiên nghiệm

Ví dụ khi hồi quy mô hình sản xuất Cobb-Douglas

Ln(Yi)=1+ 2ln(Ki)+ 3ln(Li) + ui

Có thể gặp hiện tượng đa cộng tuyến do K và L

cùng tăng theo quy mô sản xuất Nếu ta biết là hiệu

suất không đổi theo quy mô tức là 2+3=1

Ln(Yi)=1+ 2ln(Ki)+ (1-2)ln(Li) + ui

Ln(Yi) – Ln(Li) = 1+ 2[ln(Ki) - ln(Li)] + ui

Ln(Yi/Li) = 1+ 2ln(Ki/Li) + ui

=> mất đa cộng tuyến (vì đây là mô hình hồi quy

đơn)

i

u i i

i AL K e

6.5 Cách khắc phục

34

1 Dùng thông tin tiên nghiệm

Ví dụ

Yi=1+ 2X2i+ 3X3i + ui Biết 3=0.12

Biến đổi Yi=1+ 2X2i+ 0.12X3i + ui

Yi=1+ 2Xi+ ui Với Xi=X2i+0.1X3i

6.5 Cách khắc phục

35

2 Loại trừ một biến giải thích ra khỏi mô hình

B1: Xem cặp biến giải thích nào có quan hệ chặt chẽ Giả sử X2, X3…Xklà các biến độc lập,

Y là biến phụ thuộc và X2, X3có tương quan chặt chẽ với nhau

B2: Tính R2đối với các hàm hồi quy: có mặt cả

2 biến; không có mặt một trong 2 biến B3: Loại biến mà giá trị R2tính được khi không

có mặt biến đó là lớn hơn

6.5 Cách khắc phục

36

6.5 Cách khắc phục

3 Bổ sung thêm dữ liệu hoặc chọn mẫu mới

31

32

34

35

Trang 7

4 Dùng sai phân cấp 1

Ví dụ từ hàm hồi qui:yt= 1+ 1x1t+ 2x2t+ ut

ta suy ra

Trừ hai vế cho nhau, ta được:

Hay:

yt= 1 x1,t+ 2 x2,t+ et,

Mặc dù, x1và x2có quan hệ tuyến tính, nhưng

không có nghĩa sai phân của chúng cũng như

vậy

6.5 Cách khắc phục

38

5 Đổi biến

Ví dụ :yt= 1+ 1x1t+ 2x2t+ ut

Với Y: tiêu dùng

X1: GDP

X2: dân số

Vì GDP và dân số theo thời gian có xu hướng

tăng nên có thể cộng tuyến

Biện pháp: chia các biến cho dân số

6.5 Cách khắc phục

t t t

t t

t

X

u X

X X

Y

2 2 2 1

2 1

2

   

39

Khảo sát chi tiêu tiêu dùng, thu nhập và sự giàu có,

ta có bảng số liệu sau

Gọi Y: chi tiêu tiêu dùng (USD) X2: thu nhập (USD)

X3: sự giàu có (USD)

Yêu cầu:

1 Ước lượng mô hình hồi quy Y= β1 + β2 X2 +

β3.X3 +U

2 Mô hình có xảy ra đa cộng tuyến không? Vì

sao?

3 Nếu xảy ra đa cộng tuyến, hãy tìm cách khắc

phục

Ví dụ 1

40

Nguồn: Ramu Ramanathan

41

1 Ước lượng mô hình hồi quy Y= β1 + β2

X2 + β3.X3 +U Nhận xét ban đầu: Theo lý thuyết kinh tế thì chi tiêu cho tiêu dùng (Y) có xu hướng tăng theo thu nhập (X2) và sự giàu có (X3) nên dấu của các hệ số hồi quy riêng

là dương

Kết quả hồi quy trên Eviews như sau:

42

37

38

39

40

41

42

Ngày đăng: 16/01/2020, 15:51

TỪ KHÓA LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm