Các v ấ n ñề c ầ n xem xét• ðịnh nghĩa loại khuyết tật của mô hình Mô hình vi phạm giả thiết nào của phương pháp OLS • Hậu quả của khuyết tật ñối với các ước • Hậu quả của khuyết tật ñối
Trang 1CH ƯƠ NG 5
ð A C Ộ NG TUY Ế N
ð A C Ộ NG TUY Ế N
Trang 2Các v ấ n ñề c ầ n xem xét
• ðịnh nghĩa loại khuyết tật của mô hình
(Mô hình vi phạm giả thiết nào của
phương pháp OLS)
• Hậu quả của khuyết tật ñối với các ước
• Hậu quả của khuyết tật ñối với các ước
lượng OLS
• Nguyên nhân của khuyết tật
• Cách phát hiện
• Giải pháp khắc phục
Trang 3ðị nh ngh ĩ a
• ð a c ộ ng tuy ế n hoàn h ả o:
∃λI ≠ 0: λ2X2i + λ3X3i + + λk Xki = 0
1 2 2 3 3
Y = + β β X + β X + + β X + u
∃λI ≠ 0: λ2X2i + λ3X3i + + λk Xki = 0
• ð a c ộ ng tuy ế n không hoàn h ả o:
∃λI ≠ 0: λ2X2i + λ3X3i + + λk Xki + vi = 0
vi là yếu tố ngẫu nhiên
Trang 4ð a c ộ ng tuy ế n hoàn h ả o
• Tồn tại mối quan hệ tuyến tính giữa các
biến ñộc lập trong mô hình
• Vi phạm giả thiết 6 của phương pháp OLS
• Nguyên nhân: Do thừa biến (ví dụ: trong
• Nguyên nhân: Do thừa biến (ví dụ: trong
mô hình bao gồm cả 2 biến giả nam và
nữ)
Trang 5X3i = λX2i ⇒ x3i = λx2i
ð a c ộ ng tuy ế n hoàn h ả o
yi = β x i + β x i + ei
i i
2 3
i 2 2
H ậ u qu ả :
gi ả i duy nh ấ t
h ồ i qui ( ) β βˆ , ˆ
i i
2 3
i 2 2
i i
2 3
2 ˆ ) x e
ˆ ( β + λ β +
=
i i
x
α
=
∑
∑
= λ
β + β
=
3 2
x
y
x ˆ
ˆ ˆ
h ồ i qui ( )
mà ch ỉ có l ờ i
gi ả i duy nh ấ t cho t ổ h ợ p
c ủ a các h ệ s ố
h ồ i qui ( )
2 3
ˆ , ˆ
β β
ˆ
α
Trang 6• Cách phát hiện: Báo lỗi từ các phần mềm
• Khắc phục: Bỏ biến thừa
ð a c ộ ng tuy ế n hoàn h ả o
• Khắc phục: Bỏ biến thừa
Trang 7ð a c ộ ng tuy ế n không hoàn h ả o
• Tồn tại mối quan hệ tương quan chặt chẽ
giữa các biến ñộc lập trong mô hình
• Không giả thiết nào của phương pháp
OLS bị vi phạm
OLS bị vi phạm
• Nguyên nhân: Do bản chất mối quan hệ
giữa các biến số (ví dụ: tiêu dùng ñiện và qui mô hộ)
Trang 8ð a c ộ ng tuy ế n không hoàn h ả o
-H ậ u qu ả
PRF: E(Y|X2i ,X3i) = β1 + β2X2i + β3X3i
• Phương sai của các ước lượng OLS bị
phóng ñại
(1)
=
)
ˆ var(
2
σ
• ⇒ var ( ) lớn ⇒ se( ) lớn ⇒ khoảng tin
cậy lớn
=
) 1
(
)
ˆ
23
2 2
2
r
σ β
2
ˆ
β
2
ˆ
β
[ βˆi −1.96se(βˆi );βˆi +1.96se(βˆi )]
Trang 9• Thống kê t thấp ⇒ tăng khả năng chấp
nhận H0: βi = 0
• R2 có thể rất cao ⇒ tăng khả năng bác bỏ
H0: β2 = β3 = = βk = 0
ð a c ộ ng tuy ế n không hoàn h ả o
-H ậ u qu ả
H0: β2 = β3 = = βk = 0
• Dấu của các ước lượng của hệ số hồi qui
có thể sai
• Các ước lượng OLS và các sai số tiêu
chuẩn của chúng nhạy với những thay ñổi
của số liệu
Trang 10ð a c ộ ng tuy ế n không hoàn h ả o –
Cách phát hi ệ n
• R2 cao nhưng thống kê t có ý nghĩa thấp
• Hệ số tương quan cặp giữa 2 biến giải
thích cao
• Hồi qui phụ
• Hồi qui phụ
Mô hình : Yi = β1+β2X2i + β3X3i +… + ui
Hồi qui phụ:
Xi = α1+α2X2+ +αi-1Xi-1+αi+1Xi+1+… +v
Trang 11H0: Không có ña cộng tuyến
⇔ α2 = α3 = = αi-1 = αi+1 = = 0
H1: Có ña cộng tuyến ⇔ ∃αi ≠ 0
ð a c ộ ng tuy ế n không hoàn h ả o –
Cách phát hi ệ n
H1: Có ña cộng tuyến ⇔ ∃αi ≠ 0
F ∼ Fα(k-1,n-k)
( là h ệ s ố xác ñị nh thu ñượ c t ừ h ồ i qui ph ụ )
(k là s ố h ệ s ố trong mô hình h ồ i qui ph ụ )
2
2
1 1
i i
i
R n k F
R k
−
=
2
i
R
Trang 12• Tiêu chuẩn Theil
R2
-i: là R2 thu ñược từ mô hình hồi qui ban
ñầu sau khi ñã bỏ biến Xi
ð a c ộ ng tuy ế n không hoàn h ả o –
Cách phát hi ệ n
∑
= −
−
−
2 i
2 i
2 2
) R
R ( R
m
ñầu sau khi ñã bỏ biến Xi
ñược gọi là mức ñộ ñóng góp của
Xi ñối với R2
- Nếu có ña cộng tuyến :m ≠ 0
- Nếu không có ña cộng tuyến : m = 0
2 i
2
R
R − −
Trang 13• Hệ số phóng ñại phương sai (VIF
_variance-inflating factor)
ð a c ộ ng tuy ế n không hoàn h ả o –
Cách phát hi ệ n
2
1
1 )
( i
R
X
VIF
−
=
VIF > 10 là dấu hiệu của ña cộng tuyến
nhưng không nhất thiết ñúng
( là h ệ s ố xác ñị nh thu ñượ c t ừ h ồ i qui ph ụ )
2
1
)
(
i
i
R
X
VIF
−
=
2
i
R
Trang 14ð a c ộ ng tuy ế n không hoàn h ả o
1 2 2 3 3
Y = + β β X + β X + u
2
ˆ
ar( )
(1 )
v
x r
σ
−
∑
2
2 VI F
x
σ
=
∑
2i (1 23)
x − r
∑
2 3 2
i i
x x r
2
2i
x
∑
Trang 15ð a c ộ ng tuy ế n không hoàn h ả o –
Gi ả i pháp
• Không làm gì (Do nothing)
• Các phương pháp khắc phục
Dùng thông tin tiên nghiệm
Gộp số liệu chéo (cross-sectional data)
Gộp số liệu chéo (cross-sectional data)
và số liệu theo thời gian (time series)
Thu thập thêm số liệu hoặc lấy thêm
mẫu mới
Trang 16ð a c ộ ng tuy ế n không hoàn h ả o –
Gi ả i pháp
Bỏ bớt biến
Dựa vào giá trị của R2 và
2
R
hình b ị ch ệ ch.
Trang 17ð a c ộ ng tuy ế n không hoàn h ả o –
Gi ả i pháp
Thực hiện phép biến ñổi với các biến số
1 S ử d ụ ng sai phân c ấ p 1 (Áp d ụ ng v ớ i
chu ỗ i th ờ i gian)
Y = β + β X + β X + u
Yt = β1 + β2X2t + β3X3t + ut
Yt-1 = β1 + β2X2t-1 + β3X3t-1 + ut-1
Yt -Yt-1 = β2 (X2t - X2t-1)+β3 (X3t - X3t-1)+ ut- u
t-1 ∆Yt = β2∆X2t +β3∆X3t + vt
Trang 18ð a c ộ ng tuy ế n không hoàn h ả o –
Gi ả i pháp
• S d ng sai phân c p 1
X2 và X3 có thể tương quan cao nhưng không
có lý do tiên nghiệm nào chắc chắn rằng
sai phân của chúng cũng tương quan cao
Một số vấn ñề của phương trình sai phân cấp
Một số vấn ñề của phương trình sai phân cấp 1: (1) vt có thể có tự tương quan ⇒ nghiêm
trọng hơn; (2) mất ñi một quan sát do tiến
hành sai phân sẽ làm giảm môt bậc tự do
của mô hình ⇒ cân nhắc ñối với các mẫu
nhỏ (3) không thể áp dụng cho số liệu chéo
Trang 19ð a c ộ ng tuy ế n không hoàn h ả o –
Gi ả i pháp
2 Biến ñổi số liệu về dạng phân số (theo
ñầu người, trên một ñơn vị)
3 Hồi qui ña thức (Biến ñộc lập có thể ở
dạng bậc 2, bậc 3…)
dạng bậc 2, bậc 3…)