Bài giảng Kinh tế lượng - Chương 9: Chọn mô hình và kiểm định chọn mô hình Cung cấp cho người học các kiến thức: Chọn mô hình - Các sai lầm khi chọn mô hình, cách tiếp cận để lựa chọn mô hình, kiểm định việc chọn mô hình. Mời các bạn cùng tham khảo.
Trang 1CHƯƠNG 9
CHỌN MÔ HÌNH VÀ KIỂM ĐỊNH CHỌN
MÔ HÌNH
2
1 Biết cách tiếp cận để lựa chọn
mô hình
2 Biết cách kiểm định việc chọn
mô hình
MỤC
TIÊU
CHỌN MÔ HÌNH
NỘI DUNG
3
Chọn mô hình- Các sai lầm khi chọn mô hình
1
2
3
4
Kiểm định việc chọn mô hình
Cách tiếp cận để lựa chọn mô hình
4
1 Chọn mô hình
-Tiết kiệm: Mô hình đơn giản nhưng phải chứa các biến chủ yếu ảnh hưởng đến biến phụ thuộc nhằm giải thích bản chất của vấn đề nghiên cứu
-Tính đồng nhất: Với một tập dữ liệu đã cho, các tham số ước lượng phải duy nhất
-Tính thích hợp (R2): Mô hình có R2(hoặc càng gần 1 được coi càng thích hợp
-Tính bền vững về mặt lý thuyết: mô hình phải phù hợp với lý thuyết nền tảng
-Khả năng dự báo cao
2
R
5
quả như
i Các tham số ước lượng sẽ bị chệch và không vững.
ii Khoảng tin cậy và các kiểm định không chính xác.
iii Dự báo dựa trên mô hình sai sẽ không đáng tin cậy.
2 Các sai lầm khi chọn mô hình- Hậu quả
6
•Đưa vào mô hình những biến không phù hợp:
các ước lượng thu được từ mô hình thừa biến không hiệu quả, khoảng tin cậy rộng.
2 Các sai lầm khi chọn mô hình- Hậu quả
1
2
3
4
5
6
Trang 2i Ước lượng chệch các hệ số hồi quy,
thậm chí dấu của hệ số hồi quy có thể
sai.
ii Có ít hệ số hồi quy ước lượng được có
ý nghĩa thống kê
iii R 2 không cao
iv Phần dư các quan sát lớn và biểu thị
sự biến thiên có tính hệ thống.
Ví dụ
• Về hàm chi phí của doanh nghiệp, dạng hàm đúng
Yi= b1+ b2Xi+ b3Xi2 + b4Xi3 + u1i
• Bỏ sót biến quan trọng (Xi3):
Yi= a1+ a2Xi+ a3Xi2 + u2i
• Đưa biến không liên quan vào mô hình (Xi4):
Yi= l1+ l2Xi+ l3Xi2 + l4Xi3 + l5Xi4 + u3i
• Dạng hàm sai
lnY = g1+ g2Xi+ g3Xi2 + g4Xi3 + u4i
8
9
Cách tiếp cận để lưa chọn mô hình
1 Xác định số biến độc lập: có hai hướng tiếp cận:
Từ đơn giản đến tổng quát: bổ sung biến độc lập từ từ
vào mô hình
Từ tổng quát đến đơn giản: Xét mô hình hồi quy có đầy
đủ các biến độc lập đã được xác định, sau đó loại trừ
những biến không quan trọng ra khỏi mô hình
2 Kiểm định mô hình có vi phạm giả thiết như đa cộng
tuyến, phương sai thay đổi, tự tương quan Nếu mô
hình vi phạm thì cần có biện pháp khắc phục.
3 Chọn dạng hàm; dựa vào
Các lý thuyết kinh tế
Các kết quả nghiên cứu thực nghiệm
4 Sử dụng các tiêu chuẩn thông dụng để chọn mô
hình
10
Kiểm định việc chọn mô hình
a Kiểm định thừa biến (kiểm định Wald)
Xét hai mô hình:
U X X X
X Y
U : 12 2 m1 m1m mk k (
V X X
Y
R : 1 2 2 m1 m1
(U): mô hình không bị ràng buộc (Unrestricted model)
(R): mô hình bị ràng buộc (Restricted model)
Điều kiện ràng buộc là các hệ số hồi quy của các biến Xm ,Xm+1, Xkđồng thời bằng 0
11
a Kiểm định Wald Xây dựng giả thiết để kiểm định đk ràng buộc
0
: m k
H1:có ít nhất một khác 0 B1: Hồi quy mô hình (U) có k tham số, tính RSSU
có n-k bậc tự do B2: Hồi quy mô hình (R) có m tham số, tính RSSRcó n-m bậc tự do
B3: Tính F
j
) /(
) 1 (
) /(
) (
) /(
) /(
) (
2 2 2
k n R
m k R R k
n RSS
m k RSS RSS F
U R U U
U R
12
B4: Tra bảng F với mức ý nghĩa α có giá trị Fα (k-m, n-k)
Quy tắc quyết định:
Nếu F> Fα (k-m, n-k): bác bỏ Ho, tức mô hình (U) không thừa biến
Nếu dùng kết quả p-value thì quy tắc quyết định như sau:
a Kiểm định Wald
7
8
10
11
Trang 3Để kiểm định các biến giải thích bỏ sót, ta dùng
kiểm định Reset của Ramsey, gồm các bước:
Bước 1 : Dùng OLS để ước lượng mô hình
Yi = b1 + b2X2i + ui
Từ đó ta tính và R 2
old
Bước 2 : dùng OLS để ước lượng mô hình
Tính R 2
new
Kiểm định giả thiết H0: b3 = b4 =… = bk = 0
i
Yˆ
i i
Y ˆ ˆ3
4 2 3 2 2
14
Bước 3 : Tính
n: số quan sát, k: số tham số trong mô hình mới; m: số
biến đưa thêm vào.
Bước 4 : Nếu F > F(m,n-k): Bác bỏ H0, tức các hệ số
b3,b4,…bkkhông đồng thời bằng 0, mô hình cũ đã bỏ
sót biến
Nếu dùng kết quả p-value thì quy tắc quyết định như
sau: Nếu p ≤ : Bác bỏ H0
Nếu p > : Chấp nhận H0
) ( ) 1 (
) (
2
2 2
k n R
m R R F
new
old new
b Kiểm định bỏ sót biến giải thích
15
Để kiểm định phân phối chuẩn của Ui, ta dùng kiểm
định χ 2 , hay kiểm định Jarque-Bera:
Kiểm định giả thiết H0: uicó phân phối chuẩn
24
) 3 ( 6
2 2
K S n JB
3 3
) (
u
i
SE
n
u u
4
) (
u
i
SE n
u u
Nếu JB > χ 2 , Bác bỏ H0, ngược lại, chấp nhận H0
c Kiểm định giả thiết phân phối chuẩn của u i
Tiêu chuẩn lựa chọn mô hình
• R2,
• Giá trị của hàm hợp lý log-likelihood (L),
• Tiêu chuẩn thông tin Akaike (AIC),
• Tiêu chuẩn thông tin Schwarz (SIC)
16
Tiêu chuẩn R2
• R 2 đo lường % biến động của Y được giải thích bởi các Xi trong mô hình.
• R 2 càng gần 1, mô hình càng phù hợp.
• Lưu ý:
– Nó chỉ đo lường sự phù hợp “trong mẫu”
– Khi so sánh R 2 giữa các mô hình khác nhau, các biến phụ thuộc phải giống nhau.
– R 2 không giảm khi tăng thêm biến độc lập.
17
Tiêu chuẩn R2điều chỉnh
(R2)
• Ta thấyR2 £ R2.R2 chỉ tăng khi giá trị tuyệt đối của giá trị t của biến được thêm vào mô hình lớn hơn 1
• Do vậy,R2 là tiêu chuẩn tốt hơn R2
nhau
18
k n
n R n
TSS
k n RSS R
) 1 /(
) /(
2
13
14
15
16
17
18
Trang 4• Giá trị L càng lớn chứng tỏ mô hình càng phù
hợp
19
2
1 ) 2 ln(
2
ln
n n
Tiêu chuẩn thông tin Akaike (AIC)
hệ số tự do) và n là cỡ mẫu
hợp
20
hay
n
e n
RSS
n
RSS n
k
ln
Tiêu chuẩn thông tin Schwarz (SC)
21
hay
n
n n
RSS
n
RSS n n
k
ln
6 Các chỉ tiêu đánh giá mô hình dự báo
Mẫu khởi động: gồm các quan sát t=1,2,3 S-1 Mẫu kiểm tra: gồm các quan sát t=S, S+1,…S+h
22
t t
t Y Y
e ˆ
6.1 Trung bình sai số bình phương
Mean Squared Error
23
h S
S t t
e h
1 1
6.2 Căn bậc hai của trung bình sai số bình
phương
24
MSE RMSE
19
20
22
23
Trang 56.3 Trung bình sai số tuyệt đối
vị đo của biến dự báo
25
h S
S t t
e h
MAE
1 1
6.4 Trung bình của phần trăm sai số tuyệt đối
26
h S
S
t Y
e h MAPE
1 1
6.5 Hệ số bất đẳng thức Theil
27
h S
S t t
h S
S t
h
Y h
RMSE TIC
2 2
1
1 ˆ
1 1
6.6 Tỷ lệ độ chệch
khác so với trung bình giá trị thực tế
28
S t t
Y h
Y Y BP
2 2
) ˆ 1 1 ˆ
6.7 Tỷ lệ phương sai
thiên của giá trị dự báo khác mức độ biến thiên của giá trị thiực tế
29
S t
t t
Y Y
Y Y h
S S VP
2
2 ˆ
) ˆ 1
) (
h S
S t
t t
h
h S
S t
t t
h
6.8 Tỷ lệ hiệp phương sai
số của dự báo không mang tính hệ thống
30
S t
t t
Y Y Y
Y Y h
S S r CP
2 ˆ ˆ
) ˆ 1
) 1 ( 2
25
26
27
28
29
30
Trang 6Ví dụ 1
(kg/tháng)
nếu kv khảo sát ở thành phố
Sử dụng Eviews, hãy kiểm định Wald để phát
hiện thừa biến
31
32
X2 X3 Z Y
2 14 1 20
3 13 0 19
3 15 1 18
4 16 0 18
4 11 1 17
3 16 1 17
4 10 0 16
4 17 1 16
5 13 1 15
5 12 1 15
5 14 0 14
6 15 1 14
6 13 0 13
7 14 1 12
7 12 0 12
5 16 1 15
4 15 0 16
7 18 1 12
8 16 0 10
8 20 1 11
B1 Chạy mô hình U
33
B2 Chạy mô hình R
34
B3 Tính F
• B4 Tra bảng F (α, k-m, n-k) và quyết định bác bỏ hoặc chấp nhận Ho
Ho: Thừa biến H1: Không thừa biến
35
) /(
) 1 (
) /(
) (
) /(
) /(
) (
2 2 2
k n R
m k R R k
n RSS
m k RSS RSS F
U R U U
U R
Ví dụ 1
Giả sử mô hình hồi quy
B1: Chạy mô hình hồi quy mẫu B2: Xác định hệ số hồi quy không có ý nghĩa thống kê (có p>α) Lập giả thuyết Ho B3: Chạy kiểm định Wald, xem giá trị F và p của F
để quyết định bác bỏ hay chấp nhận Ho
36
i i i i
Y 12 2 3 3 4
31
32
34
35
Trang 7B1: Chạy hồi quy
37
và Z có p > α nên biến X3 và Z khác 0 không có
ý nghĩa
H0: β3=β4=0,ta có kết quả
38
39
nhận giả thuyết H0: β3=β4=0.Tức biến X3, Z không cần thiết đưa vào mô hình
mặt hàng A chỉ phụ thuộc vào giá bán của mặt hàng A, không phụ thuộc vào giá bán mặt hàng B và khu vực bán
40
37
38
39
40