Giới thiệu Để có thể ước lượng tham số theo phương pháp OLS Ordinary Least Square chúng ta đặt ra rất nhiều giả định cho mô hình hồi quy.. Khi vi phạm những giả định này sẽ dẫn đến các t
Trang 1Chương IV: Đa cộng tuyến và phương pháp chọn mô hình tối ưu
Trang 2Giới thiệu
Để có thể ước lượng tham số theo phương pháp OLS (Ordinary Least Square) chúng ta đặt ra rất nhiều giả định cho mô hình hồi quy Khi vi phạm những giả định này sẽ dẫn đến các trường hợp như:
- Đa cộng tuyến
- Tự tương quan
- Phương sai thay đổi
Trong phạm vi bài giảng này chúng ta sẽ tìm hiểu về trường hợp Đa cộng tuyến
Trang 3Đa cộng tuyến là trường hợp tồn tại mối
quan hệ tuyến tính giữa một số hoặc tất cả các biến độc lập trong
mô hình.
Xét hàm hồi qui k biến :
Yi = β1+ β2X2i + …+ βkXki + Ui
I/ Bản chất của đa cộng tuyến
Trang 4II/ Bản chất đa cộng tuyến
Trang 5II/ Phân loại đa cộng tuyến
- Nếu tồn tại các số λ2 , λ3 ,…,λk không đồng thời bằng 0 sao cho:
λ2 X 2i + λ3 X 3i +…+ λk X ki = 0
thì giữa các biến độc lập xảy ra hiện tượng đa
cộng tuyến hoàn hảo.
- Nếu tồn tại các số λ2 , λ3 ,…,λk không đồng thời bằng 0 sao cho:
λ2 X 2i + λ3 X 3i +…+ λk X ki + V i = 0
(V i : sai số ngẫu nhiên)
thì giữa các biến độc lập xảy ra hiện tượng đa
cộng tuyến không hoàn hảo.
Trang 6Ví dụ 1
Công ty Thế giới di động – chi nhánh Nguyễn Thị Minh Khai cần biết đợt khuyến mãi sản phẩm Nokia Lumia 620 tạo tác động như thế nào đến lợi nhuận của chi nhánh Nhân viên phòng marketing đã xem xét số liệu của phòng kế toán và dự định lập mô hình như sau:
Yi = β1+ β2X2i+ β3X3i+ β4X4i + Ui
Trong đó:
Y: Lợi nhuận của chi nhánh
X2: Số khách hàng mua điện thoại Nokia
X3: Doanh thu điện thoại Nokia
X4: Doanh thu điện thoại và dịch vụ hậu mãi
Trang 7Ví dụ 1
Bảng số liệu:
Trang 8Ta có : X3i = 5.X2i có hiện tượng cộng
hiện tượng cộng tuyến không hoàn hảo giữa X3 và X4.
Với số liệu của các biến độc lập :
Trang 9III/ Ước lượng tham số trong trường hợp có đa cộng tuyến
1.Trường hợp có đa cộng tuyến hoàn hảo
Xét mô hình :Yi = β1+ β2X2i+ β3X3i+ Ui (1) Giả sử : X3i = λ X2i x3i = λ x2i Theo OLS:
−
−
=
−
−
=
2 3i
2i
2 3i
2 2i
i 2i 3i
2i
2 2i i
3i
2 3i
2i
2 3i
2 2i
i 3i 3i
2i
2 3i i
2i
) x
x (
x x
y x
x x
x y
x
) x
x (
x x
y x
x x
x y
x
3
2
ˆ
ˆ
β
β
Trang 10Tóm lại, khi có đa cộng tuyến hoàn hảo thì không thể ước lượng được các tham
số trong mô hình.
0
0 λ
) λ
(
) λ
)(
λ ( )
λ
(
ˆ
2 2
2
−
−
=
2
2 2i
2 2i
2 2i
i 2i
2 2i
2 2i i
2i
) x
( x
x
y x
x x
y
x
β
0
0
ˆ
3 =
β
Thay x3i = λ2x2i vào công thức :
Tương tự :
Trang 112 Trường hợp có đa cộng tuyến không hoàn hảo
Thực hiện tương tự như trong trường hợp có đa cộng tuyến hoàn hảo nhưng
lượng được các hệ số trong mô hình.
Trang 12IV/ Hệ quả của đa cộng tuyến
1 Phương sai và hiệp phương sai của các
ước lượng OLS lớn.
2 Khoảng tin cậy rộng hơn
3 Trị thống kê tstatic nhỏ nên tăng khả
năng các hệ số ước lượng không có ý nghĩa
4 Dấu của các ước lượng có thể sai.
5 R2 cao nhưng trị thống kê tstatic nhỏ.
Trang 13IV/ Hệ quả của đa cộng tuyến
6 Các ước lượng OLS và sai số chuẩn của chúng trở nên rất nhạy với những thay đổi nhỏ trong dữ liệu.
7 Thêm vào hay bớt đi các biến cộng tuyến với các biến khác, mô hình sẽ thay đổi về dấu hoặc độ lớn của các ước lượng.
Trang 14IV/ Cách phát hiện đa cộng tuyến
1 Hệ số R 2 lớn nhưng trị thống kê tstatic nhỏ.
2 Tương quan cặp giữa các biến giải thích (độc
lập) cao.
Ví dụ : Y i = β1 +β2 X 2i +β3 X 3i + β4 X 4i + U i
Nếu r 23 hoặc r 24 hoặc r 34 cao có ĐCT Tuy nhiên
điều ngược lại không đúng, nếu các r nhỏ thì chưa biết có đa cộng tuyến hay không.
3 Sử dụng mô hình hồi qui phụ.
Trang 15Xét : Y i = β1 +β2 X 2i +β3 X 3i + β4 X 4i + U i
Cách sử dụng mô hình hồi qui phụ như sau :
- Hồi qui mỗi biến độc lập theo các biến độc lập còn lại Tính R 2 cho mỗi hồi qui phụ :
2 2
R
2 3
R
2 4
R
4
2 j
0
Hồi qui X2i = α1+ α2X3i+ α3X4i+u2i
Hồi qui X3i = λ1+ λ2X2i+ λ3X4i+u3i
Hồi qui X4i = γ 1+ γ 2X2i+ γ 3X3i+u4i
- Kiểm định các giả thiết
H0 :
- Nếu chấp nhận các giả thiết trên thì không
có đa cộng tuyến giữa các biến độc lập.
Trang 16V/ Cách khắc phục hiện tượng đa cộng tuyến
Thu thập thêm số liệu hoặc lấy mẫu mới.
Loại bỏ một biến giải thích ra khỏi mô
hình…
Trang 17VI/ Chọn mô hình và kiểm định việc
chọn mô hình
1 Chọn mô hình
- Tiết kiệm
- Tính đồng nhất
- Tính thích hợp (R 2 )
- Tính bền vững về mặt lý thuyết
- Khả năng dự báo cao
2 Các sai lầm khi chọn mô hình
- Lựa chọn mô hình không chính xác
- Bỏ sót biến thích hợp
-Đưa vào mô hình những biến không phù hợp
Trang 18VI Chọn mô hình và kiểm định mô hình
3 Kiểm định việc chọn mô hình
a Kiểm định sai lầm bỏ sót biến:
Giả sử ta hồi quy mô hình:
Y = β1 + β2.X1 + Ui (1)
Nghi ngờ có bỏ sót biến và mô hình đúng phải là:
Y = β1 + β2.X1 +β3.X2 + Ui (2)
Vậy làm cách nào để phát hiện X2 có bị bỏ sót hay không?
Trang 19VI Chọn mô hình và kiểm định mô hình
3 Kiểm định việc chọn mô hình
a Kiểm định sai lầm bỏ sót biến:
Thực hiện hồi quy mô hình:
Y = β1 + β2.X1 +β3.X2 + Ui (2)
Sau đó tiến hành kiểm định 2 trường hợp 1 với tham
số β3.
Nếu:
- X2 có tác động đến Y và R 2 của mô hình (2) lớn hơn
R 2 của mô hình (1) thì kết luận X2 quan trọng Chọn hàm ba biến phù hợp hơn.
- X2 không tác động đến Y thì sử dụng hàm hai biến.
Trang 20VI Chọn mô hình và kiểm định mô hình
3 Kiểm định việc chọn mô hình
thiết vào mô hình
Xét mô hình:
Y i = β1 + β2X 2i + β3X 3i + β4X 4i + u i
Trường hợp kiểm định một biến độc lập: Ta dùng kiểm định 2 trường hợp 1.
Trường hợp kiểm định nhiều biến độc lập: Kiểm định giả thuyết: β3 = β4 = 0 Trường hợp này
ta dùng kiểm định Wald.