Bài giảng Kinh tế lượng: Chương 6 do Th.S Phạm Văn Minh biên soạn cung cấp cho người học các kiến thức: Bản chất của đa cộng tuyến, nguồn gốc của đa cộng tuyến, ước lượng trong trường hợp có đa cộng tuyến, hậu quả của đa cộng tuyến, cách phát hiện đa cộng tuyến, biện pháp khắc phục đa cộng tuyến.
Trang 1Chương 6
ĐA CỘNG TUYẾN
1
Trang 31 B ả n ch ấ t c ủ a đ a c ộ ng tuy ế n
3
Một giả thiết trong mô hình hồi quy bội là giữacác biến giải thích không có hiện tượng cộngtuyến, nghĩa là các biến giải thích không cótương quan với nhau
Đa cộng tuyến là sự tồn tại mối quan hệ tuyếntính “hoàn hảo”/chính xác hay không hoàn hảogiữa một số hoặc tất cả các biến giải thíchtrong một mô hình hồi quy
ki k
i i
3 3
2 2
=
Trang 4Thực tế thường xảy ra hiện tượng đa cộng tuyếnkhông hoàn hảo.
Trang 5(d) đa cộng tuyến hoàn hảo
Trang 61 B ả n ch ấ t c ủ a đ a c ộ ng tuy ế n (tt)
6
Xem xét các mối quan hệ sau để “chẩn đoán”khả năng xảy ra hiện tượng đa cộng tuyến:
nh ậ p của người dùng café (X3) ở Brasil
b ậ c th ợ (X2), độ tu ổ i (X3) và thâm niên lao
độ ng (X4)
(X3)
(4) S ố gi ờ t ự h ọ c của SV (Y) với số giờ rảnh, số
giờ dành cho các hoạt động giải trí
Trang 8Montgomery và Peck cho rằng đa cộng tuyến là docác yếu tố sau:
Ph ươ ng pháp thu th ậ p d ữ li ệ u: việc lấy mẫu chỉgiới hạn trong 1 phạm vi hẹp các giá trị của các biếngiải thích trong tổng thể
Gi ớ i h ạ n v ề mô hình ho ặ c trong t ổ ng th ể đượ c
l ấ y m ẫ u: ví dụ khi hồi quy M ứ c tiêu th ụ đ i ệ n (Y) theo thu nh ậ p (X 2 ) và kích th ướ c nhà (X 3 ). Có một giớihạn trong tổng thể là gia đình có thu nhập caothường có nhà lớn hơn gia đình có TN thấp
2 Ngu ố n g ố c c ủ a đ a c ộ ng tuy ế n
8
Trang 9An overdetermined model: mô hình có số lượngcác biến giải thích nhiều hơn số lượng các quan sát.
Trong d ữ li ệ u chu ỗ i th ờ i gian (time series data),khi các biến giải thích có cùng xu hướng thì cũngthường xảy ra đa cộng tuyến
◦ Ví d ụ : Khi h ồ i quy tiêu dùng theo thu nh ậ p, s ự giàu có
và dân s ố , các bi ế n gi ả i thích thu nh ậ p, s ự giàu có và dân s ố có th ể đề u t ă ng trong kho ả ng th ờ i gian nghiên
c ứ u v ớ i t ỷ l ệ g ầ n gi ố ng nhau, đư a đế n hi ệ n t ượ ng c ộ ng tuy ế n gi ữ a các bi ế n này.
2 Ngu ố n g ố c c ủ a đ a c ộ ng tuy ế n
9
Trang 103 Ướ c l ượ ng khi có đ a c ộ ng tuy ế n
10
3.1 Tr ườ ng h ợ p có đ a c ộ ng tuy ế n hoàn h ả o:
Các hệ số hồi quy không xác định; phương sai vàcác sai số chuẩn của chúng là vô hạn
Không thể tách riêng ảnh hưởng của từng biếngiải thích lên biến phụ thuộc từ một mẫu chotrước
Không thể có lời giải duy nhất cho các hệ số hồiquy riêng, chỉ có thể có được lời giải duy nhất cho
tổ hợp tuyến tính của các hệ số này
Trang 113 Ướ c l ượ ng khi có đ a c ộ ng tuy ế n (tt)
3.1 Tr ườ ng h ợ p có đ a c ộ ng tuy ế n hoàn h ả o
2i
2 3i
2 2i
i 2i 3i
2i
2 2i i
3i
2 3i
2i
2 3i
2 2i
i 3i 3i
2i
2 3i i
2i
) x
x (
x x
y x
x x
x y
x
) x
x (
x x
y x
x x
x y
Trang 12Tuy nhiên nếu thay X3i = λX2i vào hàm hồi qui
) λ
(
) λ
)(
λ ( )
λ
(
ˆ
2 2
2 2i
2 2i
i 2i
2 2i
2 2i i
2i
) x (
x x
y x x
x y
3 Ướ c l ượ ng khi có đ a c ộ ng tuy ế n (tt)
3.1 Tr ườ ng h ợ p có đ a c ộ ng tuy ế n hoàn h ả o
3
2, ˆ
ˆ β β
Trang 13Tóm lại, khi có đa cộng tuyến hoàn hảo thìkhông thể ước lượng được các hệ số trong môhình mà chỉ có thể ước lượng được một tổhợp tuyến tính của các hệ số đó.
Hay có thể ước lượng được
nhưng không thể ước lượng với một lời
giải duy nhất
3 Ướ c l ượ ng khi có đ a c ộ ng tuy ế n (tt)
3.1 Tr ườ ng h ợ p có đ a c ộ ng tuy ế n hoàn h ả o
3 2
Trang 14Thực hiện tương tự như trong trường hợp có đacộng tuyến hoàn hảo nhưng với X 3i = λX 2i +V i
Vẫn có thể ước lượng được các hệ số trong môhình
Dữ liệu chuỗi thời gian thường xảy ra đa cộngtuyến không hoàn hảo
3 Ướ c l ượ ng khi có đ a c ộ ng tuy ế n (tt)3.1 Trường hợp có đa cộng tuyến không hoàn hảo
Trang 15V ề m ặ t lý thuy ế t, khi có đ a c ộ ng tuy ế n g ầ n hoàn h ả o ( đ a
c ộ ng tuy ế n cao), các ướ c l ượ ng OLS v ẫ n th ỏ a mãn tính ch ấ t BLUE, nh ư ng h ậ u qu ả th ự c t ế c ủ a nó g ồ m:
1 Phươ ng sai và hi ệ p ph ươ ng sai c ủ a các ướ c l ượ ng OLS
r ấ t cao (th ườ ng trên 0,9).
15
4 H ậ u qu ả c ủ a đ a c ộ ng tuy ế n
Trang 165 Các ướ c l ượ ng OLS và sai s ố chu ẩ n c ủ a chúng tr ở nên
r ấ t nh ạ y v ớ i nh ữ ng thay đổ i nh ỏ trong d ữ li ệ u.
6 Dấ u c ủ a các ướ c l ượ ng c ủ a các h ệ s ố h ồ i qui có th ể
sai.
Ví d ụ khi ướ c l ượ ng h ồ i quy c ầ u c ủ a hàng hóa thông
th ườ ng theo thu nh ậ p, n ế u x ả y ra hi ệ n t ượ ng đ a c ộ ng tuy ế n g ầ n hoàn h ả o, thì có th ể h ệ s ố c ủ a bi ế n thu nh ậ p mang d ấ u (-), đ i ề u này mâu thu ẫ n v ớ i lý thuy ế t kinh t ế
7 Thêm vào hay bớ t đ i các bi ế n c ộ ng tuy ế n v ớ i các bi ế n khác, mô hình s ẽ thay đổ i v ề d ấ u ho ặ c thay đổ i v ề độ l ớ n
c ủ a các ướ c l ượ ng.
Đ a c ộ ng tuy ế n làm t ă ng sai s ố chu ẩ n, sai s ố chu ẩ n l ớ n h ơ n
ph ả n ánh s ự bi ế n thiên c ủ a h ệ s ố h ồ i qui t ừ m ẫ u này đế n
4 H ậ u qu ả c ủ a đ a c ộ ng tuy ế n (tt)
Trang 174 H ậ u qu ả c ủ a đ a c ộ ng tuy ế n (tt)
Thí d ụ :
Trang 184 H ậ u qu ả c ủ a đ a c ộ ng tuy ế n (tt)
l ầ n l ượ t là:
Trang 195 Cách phát hi ệ n đ a c ộ ng tuy ế n
(1) Hệ số R 2 lớn (>0,8) nhưng rất ít tỷ số t có ý nghĩa
(hệ số tương quan > 0,8) Lưu ý là có trường hợptương quan cặp không cao nhưng vẫn xảy ra hiệntượng đa cộng tuyến, đặc biệt là khi mô hình cónhiều hơn 2 biến giải thích
giải thích X nào đó theo các biến còn lại
Tính R2 và F cho mô hình
Kiểm định H0: R2 = 0 bằng kiểm định F, tức kiểmđịnh giả thiết biến X không tương quan tuyến tínhvới các biến còn lại Nếu chấp nhận H0 thì không cóhiện tượng cộng tuyến
Trang 20Xét : Yi = β1+ β2X2i+ β3X3i+ β4X4i + Ui
Cách sử dụng mô hình hồi qui phụ như sau:
- Hồi qui mỗi biến độc lập theo các biến độc lập còn lại Tính R 2 cho mỗi hồi qui phụ:
2 2
R
2 3
R
2 4
R
4
2 j
Trang 21(4) S ử d ụ ng nhân t ử phóng đạ i ph ươ ng sai (VIF):
- Đối với mô hình có 2 biến giải thích X2 và X3:
VIF = 1/(1-r2 23)
Với r23 là hệ số tương quan giữa X2 và X3
Khi r23=1 thì VIF tiến đến vô hạn
Khi không có cộng tuyến giữa X2 và X3 thì VIF=1
- Trường hợp có (k-1) biến giải thích: VIF = 1/(1-R2
j)Với R2
j là giá trị R2 trong hàm hồi quy của Xj theo 2) biến giải thích còn lại Theo quy tắc kinh nghiệm,nếu VIF của 1 biến vượt quá 10 (khi R2
(k-j>0,9) thì biếnnày được coi là có cộng tuyến cao
21
5 Cách phát hi ệ n đ a c ộ ng tuy ế n (tt)
Trang 225 Cách phát hi ệ n đ a c ộ ng tuy ế n (tt)
Xét s ố li ệ u thí d ụ trang 143 Hãy ki ể m
đị nh hi ệ n t ượ ng đ a c ộ ng tuy ế n b ằ ng cách s ử d ụ ng mô hình h ồ i quy ph ụ
Trang 235 Cách phát hi ệ n đ a c ộ ng tuy ế n (tt)
V ớ i m ứ c ý ngh ĩ a 5%, tra b ả ng phân ph ố i F: F 0,05 (1,10) = ?
Trang 24(1) S ử d ụ ng thông tin tiên nghi ệ m
Thông tin có thể có được từ công việc thực tế trướcđây hoặc từ các lý thuyết trong lĩnh vực nghiên cứu
Trang 25(1) S ử d ụ ng thông tin tiên nghi ệ m (tt)
Biến đổi mô hình hồi quy trên, ta được:
Trang 26(2) Lo ạ i tr ừ 1 bi ế n gi ả i thích ra kh ỏ i mô hình
chặt chẽ dựa vào ma trận tương quan (ví dụ X2
và X3)
cả hai biến; không có mặt 1 trong 2 biến
không có mặt biến đó là lớn hơn
6 Bi ệ n pháp kh ắ c ph ụ c đ a c ộ ng tuy ế n (tt)
Trang 27(3) Thu th ậ p thêm s ố li ệ u ho ặ c l ấ y m ẫ u m ớ i
Vì đa cộng tuyến là một đặc tính của mẫu nên đôikhi chỉ cần tăng cỡ mẫu cũng có thể làm giảm bớtvấn đề này
Trang 28Mô hình hồi quy (3) thường làm giảm tính nghiêmtrọng của đa cộng tuyến vì dù X2 và X3 có thểtương quan cao nhưng không có lý do tiênnghiệm nào cho rằng sai phân của chúng cũngtương quan cao.
Tuy nhiên sử dụng sai phân bậc nhất cũng làm nảysinh một số vấn đề như sai số Vt trong mô hình(3) có thể không thỏa mãn giả thiết của mô hìnhhồi quy tuyến tính cổ điển là các nhiễu khôngtương quan
Xem thí d ụ trang 143 v ề cách phát hi ệ n và kh ắ c
ph ụ c đ a c ộ ng tuy ế n. 28
6 Bi ệ n pháp kh ắ c ph ụ c đ a c ộ ng tuy ế n (tt)
Trang 29số thì đa cộng tuyến là vấn đề cần xem xét vì sai
số chuẩn của các ước lượng lớn
29
6 Bi ệ n pháp kh ắ c ph ụ c đ a c ộ ng tuy ế n (tt)