CHƯƠNG 5 KIỂM ĐỊNH VÀ LỰA CHỌN MÔ HÌNH 9/20/2013 1 CHƢƠNG 5 KIỂM ĐỊNH VÀ LỰA CHỌN MÔ HÌNH 1 Chương 1, 2, 3 cho thấy Khi giả thiết 1 → 4 thỏa mãn thì các ước lượng OLS là các ước lượng BLUE Khi giả[.]
Trang 1CHƯƠNG 5
KIỂM ĐỊNH VÀ LỰA CHỌN MÔ HÌNH
1
Chương 1, 2, 3 cho thấy:
Khi giả thiết 1 → 4 thỏa mãn thì các ước lượng OLS là các
ước lượng BLUE
Khi giả thiết 5 thỏa mãn thì các suy diễn thống kê là có giá trị
Vậy:
Nếu một trong các giả thiết không được thỏa mãn?
Khi đó thì làm thế nào để thu được ước lượng tốt nhất, và các
suy diến thống kê đáng tin cây?
CHƯƠNG 5: KIỂM ĐỊNH VÀ LỰA CHỌN MÔ HÌNH
Trang 2NỘI DUNG CHƯƠNG 5
I Kỳ vọng của sai số ngẫu nhiên khác không
II Phương sai sai số thay đổi
III Sai số ngẫu nhiên không tuân theo quy luật chuẩn
IV Vấn đề đa cộng tuyến
V Mô hình chứa biến không thích hợp
3
I KỲ VỌNG CỦA SAI SỐ NGẪU NHIÊN KHÁC KHÔNG
Giả thiết 2: Kỳ vọng của sai số ngẫu nhiên với điều kiện X
Trang 3I KỲ VỌNG CỦA SAI SỐ NGẪU NHIÊN KHÁC KHÔNG
Minh họa giả thiết 2:
Trung bình sai số ngẫu nhiên tại mỗi giá trị X i : E(u/X=X i )=0 5
I KỲ VỌNG CỦA SAI SỐ NGẪU NHIÊN KHÁC KHÔNG
1 Nguyên nhân của kỳ vọng sai số ngẫu nhiên khác
không
Mô hình thiếu biến quan trọng
Dạng hàm sai
Tính tác động đồng thời của số liệu
Sai số đo lường của các biến độc lập
Trang 4I KỲ VỌNG CỦA SAI SỐ NGẪU NHIÊN KHÁC KHÔNG
2 Hậu quả của kỳ vọng sai số ngẫu nhiên khác không
Ước lượng OLS sẽ là ước lượng chệch
Các suy diễn thống kê không còn đáng tin cậy
Lượng chệch của các ước lượng OLS:
I KỲ VỌNG CỦA SAI SỐ NGẪU NHIÊN KHÁC KHÔNG
Lượng chệch khi mô hình thiếu biến:
Trang 5I KỲ VỌNG CỦA SAI SỐ NGẪU NHIÊN KHÁC KHÔNG
3 Phát hiện về sự khác không của kỳ vọng sai số ngẫu nhiên
a) Mô hình bỏ sót biến quan trọng
Liệu mô hình (5.3) có bỏ sót biến Z hay không? (có số liệu về
biến Z)
=> Kiểm định cặp giả thuyết:
Tư tưởng của kiểm định Ramsey: sử dụng dạng mũ của
giá trị ước lượng của biến phụ thuộc, ,
để thay thế cho tổ hợp của các biến dạng mũ của các
biến độc lập
m i i
Yˆ2; ˆ3 & ˆ
Trang 6Các bước thực hiện kiểm định Ramsey:
B1: Ước lượng mô hình gốc =>
B2: Ước lượng mô hình hồi quy phụ:
Việc đưa thành phần dạng lũy thừa của vào mô hình hồi quy
mới không bị hạn chế, nhưng thông thường dừng ở lũy thừa
i i i
2
2 1 3 3 2 2
I KỲ VỌNG CỦA SAI SỐ NGẪU NHIÊN KHÁC KHÔNG
I KỲ VỌNG CỦA SAI SỐ NGẪU NHIÊN KHÁC KHÔNG
Hay:
H0: Mô hình gốc có dạng hàm đúng - không thiếu biến
H1: Mô hình gốc có dạng hàm sai - thiếu biến
=> Thực hiện bằng kiểm định F
12
0
:
0
:
2 2
2
2 1 1
2 1 0
Trang 7I KỲ VỌNG CỦA SAI SỐ NGẪU NHIÊN KHÁC KHÔNG
bình phương, lập phương của các biến độc lập đã có trong
mô hình
hoặc sử dụng phương pháp biến công cụ
Trang 8II PHƯƠNG SAI SAI SỐ THAY ĐỔI
tại mọi giá trị Xi 𝑉𝑎𝑟 𝑢 𝑋𝑖 = 𝜎2
Phân phối của u tại Xn
Phân phối của u tại X2
II PHƯƠNG SAI SAI SỐ THAY ĐỔI
Giả thiết 3 bị vi phạm, tức là sai số ngẫu nhiên u có phương
sai thay đổi: 𝑉𝑎𝑟 𝑢 𝑋𝑖 = 𝜎𝑖2
Phân phối của u tại XnPhân phối
của u tại X2
Trang 9II PHƯƠNG SAI SAI SỐ THAY ĐỔI
1 Nguyên nhân của phương sai sai số (PSSS) thay đổi
Do bản chất của số liệu
Do mô hình thiếu biến quan trọng hoặc dạng hàm sai
17
2 Hậu quả của phương sai sai số thay đổi
Các ước lượng OLS cho các hệ số vẫn là các ước lượng
không chệch:
Các ước lượng hệ số không còn là ước lượng tốt nhất nữa
bị ước lượng chệch, do đó các khoảng tin cậy và
kết luận kiểm định về các giả thuyết thống kê đối với hệ số
hồi quy là không còn giá trị (không chính xác)
)ˆ
( j
Var
j j
E( ˆ )
II PHƯƠNG SAI SAI SỐ THAY ĐỔI
Trang 103 Phát hiện PSSS thay đổi
(
)) , , /
( ( ) , , /
(
) , , /
(
2 2
2 2
2 2
2
ki i
ki i
ki i
ki i
X X
u E
X X
u E X
X u E
X X
u Var
II PHƯƠNG SAI SAI SỐ THAY ĐỔI
II PHƯƠNG SAI SAI SỐ THAY ĐỔI
Các biện pháp phát hiện PSSS thay đổi:
Sử dụng đồ thị phần dư
Kiểm định Breusch – Pagan (giáo trình)
Kiểm định White
Kiểm định dựa trên biến phụ thuộc
Một số kiểm định khác: Park, Glejer (giáo trình)
20
Trang 11II PHƯƠNG SAI SAI SỐ THAY ĐỔI
Kiểm định White
Với n đủ lớn thì phương sai của các hệ số ước lượng là tiệm cận
với phương sai đúng nếu giả thiết 3’ được thỏa mãn
Giả thiết 3': không tương quan với các biến độc lập, bình
phương của các biến độc lập, và tích chéo của các biến độc
lập
=> Xét xem liệu có tương quan với các biến độc lập và
tích các biến độc hay không nhằm đánh giá mô hình gốc có
Bước 1: Ước lượng mô hình hồi quy gốc => phần dư ei
Bước 2: Ước lượng mô hình hồi quy phụ:
Bước 3: Xét cặp giả thuyết:
hay H0 : Mô hình gốc có PSSS đồng đều
i i i i
i i
i i
v X X X
X X
X e
2 3 5
2 2 4 3 3 2 2 1 2
Trang 122 (**)
R
F qs
23
2 (**)
2 n R
qs
) 1 ( (**)
Kiểm định trên được gọi là kiểm định White có tích chéo do
trong mô hình (**) có chứa thành phần tích chéo giữa các biến
độc lập ( X2i * X3i )
Trong nhiều trường hợp có thể bỏ đi số hạng chứa tích chéo
=> Kiểm định White không tích chéo
Mô hình (**) nhất định phải có hệ số chặn
Dạng thu gọn của kiểm định White là có thể hồi quy theo
từng thành phần X2i ; X3i ; riêng biệt mà không cần kết
2
2i;X i X
II PHƯƠNG SAI SAI SỐ THAY ĐỔI
Trang 13II PHƯƠNG SAI SAI SỐ THAY ĐỔI
Kiểm định dựa trên biến phụ thuộc
Thay vì xét hàm hồi quy phụ (**) ta xét hàm hồi quy phụ sau:
II PHƯƠNG SAI SAI SỐ THAY ĐỔI
4 Khắc phục phương sai sai số thay đổi
PSSS thay đổi có thể do mô hình thiếu biến hoặc dạng
hàm sai => xem xét xem liệu mô hình có gặp phải hai
vấn đề này không?
Phương pháp bình phương bé nhất tổng quát (GLS –
generalized least squares)
Ước lượng sai số chuẩn vững (robut standard error)
Trang 14II PHƯƠNG SAI SAI SỐ THAY ĐỔI
a) Phương pháp bình phương bé nhất tổng quát
Các bước thực hiện:
Bước 1: Nhận biết được dạng thay đổi của phương sai sai số
Bước 2: Biến đổi tương đương để đưa mô hình gốc về một mô
hình mới mà sai số ngẫu nhiên trong mô hình mới này có phương
sai sai số không đổi
(Tổng quát: nếu thì chia cả hai vế của mô hình gốc cho K i )
Bước 3: Sử dụng phương pháp OLS để ước lượng mô hình mới
Bước 4: Từ các hệ số ước lượng của mô hình mới suy ra các hệ số
ước lượng của mô hình gốc
27
2 2
(5.8) với:
Phương sai sai số ngẫu nhiên của mô hình mới:
X u Var X X
u Var u
2 2
*
2
1 ) ( ) 1 ( ) ( )
*
*
* 3 3
* 2 2 1
Trang 15II PHƯƠNG SAI SAI SỐ THAY ĐỔI
b) Ước lượng sai số chuẩn
Tư tưởng: vẫn sử dụng các hệ số ước lượng từ phương pháp OLS, tuy
nhiên phương sai các hệ số ước lượng thì được tính toán lại mà không
sử dụng đến giả thiết phương sai sai số không đổi
Ví dụ: với mô hình hồi quy hai biến, ta có:
(5.9) => Thay công thức (5.9) bởi công thức sau:
(5.10) => Sai số chuẩn vững bằng căn bậc hai của (5.10) Khi n đủ lớn thì
(5.10) tiệm cận về giá trị đúng (5.9)
29
2 2 2 1
2 1
ˆ ar( )
n
i i i n i i
x v
2 1
ˆ ar( )
n
i i i n i i
x e v
III SAI SỐ NGẪU NHIÊN KHÔNG TUÂN THEO
QUY LUẬT CHUẨN (*)
1 Hậu quả khi sai số ngẫu nhiên không tuân theo quy luật
chuẩn
Các ước lượng OLS vẫn là các ước lượng BLUE
Các thống kê T và F không tuân theo quy luật Student và quy luật
Fisher tương ứng Khi đó:
Nếu kích thước mẫu nhỏ thì các suy diễn thống kê không
đáng tin cậy
Với mẫu kích thước lớn thì các suy diễn thống kê vẫn có giá
trị
Trang 16III SAI SỐ NGẪU NHIÊN KHÔNG TUÂN THEO
QUY LUẬT CHUẨN (*)
2 Phát hiện sai số ngẫu nhiên không tuân theo quy
luật chuẩn
(1) Xem xét đồ thị phần dư
(2) Kiểm định Jacque – Bera (JB)
31
III SAI SỐ NGẪU NHIÊN KHÔNG TUÂN THEO
QUY LUẬT CHUẨN (*)
Kiểm định Jacque – Bera (JB):
Kiểm định: H 0 : u tuân theo phân phối chuẩn
H 1 : u không tuân theo phân phối chuẩn
B1: Ước lượng mô hình gốc => ei
e n S
Trang 171 Khái niệm đa cộng tuyến trong mô hình hồi quy
tuyến hoàn hảo nhưng có mối liên hệ tuyến tính khá chặt,
ta nói rằng mô hình có hiện tượng đa cộng tuyến
(multicollinearity)
mối quan hệ tuyến tính giữa các biến độc lập trong mô
hình hồi quy chứ không quan tâm đến biến phụ thuộc
IV VẤN ĐỀ ĐA CỘNG TUYẾN
X
Y 12 23 3 k k
v X X
X X
Trang 18IV VẤN ĐỀ ĐA CỘNG TUYẾN
2 Nguyên nhân của đa cộng tuyến
Do bản chất mối quan hệ giữa các biến số
Do mô hình có dạng đa thức
Do mẫu không mang tính đại diện
35
3 Hậu quả của đa cộng tuyến
ĐCT hoàn hảo: không ước lượng được mô hình
ĐCT cao (ĐCT không hoàn hảo): không vi phạm giả thiết
nào của định lý Gauss – Markov nên không ảnh hưởng gì
đến tính “tốt nhất” của các ước lượng OLS
=> Như vậy mô hình có ĐCT cao thì các ước lượng thu
được vẫn là các ước lượng tuyến tính, không chệch và tốt
nhất (có phương sai nhỏ nhất) 36
IV VẤN ĐỀ ĐA CỘNG TUYẾN
Trang 19Hậu quả của ĐCT cao trong mô hình hồi quy:
Khoảng tin cậy của βj rộng, nghĩa là ước lượng trở nên
kém chính xác
Hệ số ước lượng dễ mất ý nghĩa thống kê
Dấu của hệ số ước lượng của Xj có thể ngược so với kỳ
vọng
Một sự thay đổi dù bé trong mẫu cũng có thể gây ra một sự
thay đổi khá lớn trong kết quả ước lượng (do Var( ˆj) lớn)
37
IV VẤN ĐỀ ĐA CỘNG TUYẾN
IV VẤN ĐỀ ĐA CỘNG TUYẾN
4 Phát hiện đa cộng tuyến
(1) Xem xét hệ số xác định của các mô hình hồi quy phụ
(j = 2,3, , k) là hệ số xác định của mô hình hồi quy
phụ Xj theo các biến độc lập còn lại
Nếu lớn thì có thể mô hình gốc có hiện tượng đa
Trang 20(2) Xem xét hệ số phóng đại phương sai (VIF- variance
IV VẤN ĐỀ ĐA CỘNG TUYẾN
Nếu hệ số tương quan cặp giữa hai biến độc lập nào đó
lớn (có trị tuyệt đối lớn hơn 0.8) thì có thể xem như mô
hình có ĐCT cao
Tuy nhiên, hệ số tương quan cặp giữa các biến độc lập
không cao không có nghĩa là không có ĐCT
40
IV VẤN ĐỀ ĐA CỘNG TUYẾN
Trang 215 Một số biện pháp khắc phục
Gia tăng kích thước mẫu (tăng n)
Sử dụng thông tin tiên nghiệm
Sử dụng kỹ thuật phân tích nhân tố để tách lọc thông tin
từ các biến độc lập
Bỏ bớt biến
Lưu ý: Trong mô hình hồi quy luôn luôn xảy ra ĐCT, điều đáng
quan tâm là ĐCT ở mức cao hay thấp Nếu hậu quả của ĐCT đối
với mô hình hồi quy là không quá nghiêm trọng thì ta chưa
cần quan tâm tới vấn đề khắc phục
41
IV VẤN ĐỀ ĐA CỘNG TUYẾN
V MÔ HÌNH CHỨA BIẾN KHÔNG THÍCH HỢP
1 Hậu quả của việc chứa biến không thích hợp
Các ước lượng OLS vẫn là các ước lượng không chệch
Phương sai các hệ số ước lượng sẽ lớn Do đó:
Khoảng tin cậy cho các hệ số hồi quy sẽ trở nên rộng hơn
Các tỷ số t trở nên bé hơn và dẫn đến làm mất ý nghĩa thống
kê của các hệ số ước lượng
Trang 22V MÔ HÌNH CHỨA BIẾN KHÔNG THÍCH HỢP
2 Phát hiện biến không thích hợp
Để phát hiện một biến là có thích hợp hay không: sử
dụng kiểm định t để kiểm định về sự bằng 0 của hệ số
của biến này
Để phát hiện hai hay nhiều biến là có thích hợp hay
không: sử dụng kiểm định F – kiểm định nhiều ràng
buộc
43