Theo trường phái trọng tiền, sự thay đổi của GDP của nền kinh tế chịu ảnh hưởng bởi sự thay đổi của lượng cung tiền, trong khi đó, theo Keynes, sự thay đổi của lượng chi mua hàng hóa dịch vụ của chính phủ sẽ ảnh hưởng lớn đến GDP. khi có sự sai sót, kết quả của phép ước lượng sẽ không thỏa mãn các đặc điểm của “ước lượng không chệch tuyến tính tốt nhất” (BLUE). chúng tôi chỉ tập trung phát hiện hai loại sai sót đầu tiên.
Trang 1CHƯƠNG 6 KIỂM ĐỊNH VÀ LỰA CHỌN MÔ HÌNH
Các loại sai sót của dạng mô hình hồi qui
Hậu quả của sai sót mô hình
Phương pháp phát hiện các sai sót của dạng mô hình hồi qui
Tiêu chuẩn lựa chọn mô hình
Trang 2Các loại sai sót của dạng
mô hình hồi qui
Các dạng sai sót của dạng mô hình như sau:
Bỏ sót biến quan trọng,
Đưa biến không liên quan vào mô hình,
Sai số trong đo lường, và
Xác định dạng của phần sai số không
đúng
Trang 3 Ví dụ về hàm chi phí của doanh nghiệp,
Trang 4 Sai lệch về đo lường
Y i * = b 1 * + b 2 *X i * + b 3 *X i * 2 + b 4 *X i * 3 +
u i *
vậy, thay vì sử dụng các biến số đúng
phần sai số:
Trang 5 Theo trường phái trọng tiền, sự thay đổi của GDP của nền kinh tế chịu ảnh
hưởng bởi sự thay đổi của lượng cung
tiền, trong khi đó, theo Keynes, sự thay đổi của lượng chi mua hàng hóa dịch vụ của chính phủ sẽ ảnh hưởng lớn đến
GDP
lượng sẽ không thỏa mãn các đặc điểm của “ước lượng không chệch tuyến tính tốt nhất” (BLUE)
loại sai sót đầu tiên
Trang 6Hậu quả của sai sót mô hình
Để minh họa, ta dùng mô hình 3
biến và xem xét 2 loại sai sót đầu tiên:
1. Bỏ sót biến có liên quan:
Giả sử dạng đúng của mô hình là:
Yi = 1 + 2X2i + 3X3i + ui (1)
Nhưng ta lại sử dụng mô hình:
Yi = 1 + 2X2i + vi (2)
Trang 7Hậu quả của sai sót mô hình
chệch và không vững.
Trang 8Hậu quả của sai sót mô hình
Đưa vào mô hình biến không có liên quan
Giả sử mô hình đúng như sau:
Trang 9Hậu quả của sai sót mô hình
Phương sai sai số, 2, được ước
lượng đúng;
Khoảng tin cậy và các kiểm định
vẫn đáng tin cậy;
Tuy nhiên, các ước lượng không
hiệu quả, tức là, phương sai của chúng có thể lớn hơn phương sai của
Trang 10Phương pháp phát hiện các sai sót của dạng mô hình
ˆ
t k k
Trang 11khai thác dữ liệu (data
mining)
chúng ta lựa ra k biến (k ≤ c)
mức ý nghĩa thực sự ( *) từ mức ý nghĩa danh nghĩa ( ) có thể được tính theo
công thức sau:
* ≈ (c/k)
nếu c = 15, k = 5, và = 5%, ta có thể tính được mức ý nghĩa thực sự là (15/5) (5) = 15%
lưu ý rằng khi c = k thì sẽ không có hiện tượng khai thác dữ liệu
Trang 122 Kiểm định biến bị bỏ sót
và dạng hàm số không
đúng
2.1 Kiểm tra phần dư
hàm chi phí của doanh nghiệp:
Y i = b 1 + b 2 X i + b 3 X i 2 + b 4 X i 3 + u 1i (1)
Y i = a 1 + a 2 X i + a 3 X i 2 + u 2i (2)
Trang 142.2 Kiểm định Durbin-Watson d
H 0 : mô hình không có tự tương quan
H 0 : = 0; H 1 : 0 Nếu d < d U hoặc (4 - d) <
d U thì bác bỏ giả thuyết H 0 , chấp nhận H 1 , tức
có tự tương quan (dương hoặc âm).
Không có tự tương quan dương
Không có tự tương quan dương
Không có tự tương quan âm
Không có tự tương quan âm
Không có tự tương quan âm hoặc
dương
Bác bỏ Không qđ Bác bỏ Không qđ Chấp nhận
Trang 152.3 Kiểm định RESET của
Ramsey
tuyến tính theo sản lượng:
Trang 17Kiểm định RESET của
Ramsey
Chạy hồi quy mô hình (*), và tính
toán ước lượng của Yi, Yi
Chạy lại (*) và đưa thêm biến Yi
vào mô hình dưới dạng một biến nào đó, chẳng hạn, Yi2 và Yi3
Yi = 1 + 2Xi + 3Yi2 + 4Yi3 + ui (**)
Đặt R2 từ (**) là Rnew2 và từ (*) là
Rold2 Chúng ta dùng kiểm định F theo công thức:
Trang 18Kiểm định RESET của
Ramsey
Nếu F > F tra bảng ở một mức ý nghĩa nào đó, ta chấp nhận có việc bỏ sót biến.
Ví dụ:
Trang 19Kiểm định RESET của
Trang 20Ví dụ:
H0: mô hình không bỏ sót biến
Giá trị kiểm định F thu được trực tiếp
từ phần mềm Stata
fitted values of chiphi
Ho: model has no omitted variables F(3, 4) = 1.52
Prob > F = 0.3380
Trang 212.3 Kiểm định RESET của
Ramsey
là nó dễ áp dụng bởi vì nó không đòi
hỏi chúng ta phải biết rõ các dạng mô hình liên quan
phương pháp này bởi vì khi chúng ta
biết mô hình có sai sót, chúng ta không
có dạng mô hình tốt hơn để thay thế
Trang 222.4 Kiểm định hệ số Lagrange (LM) đối với biến thêm vào
Nếu chúng ta so sánh hàm chi phí
tuyến tính với hàm chi phí bậc ba thì hàm tuyến tính chính là một phiên
bản bị giới hạn của hàm bậc ba
H0: hệ số của biến sản lượng bình
phương và lập phương đều bằng
không
Các biến tiến hành:
Trang 23Kiểm định hệ số
Lagrange
Trang 24Kiểm định hệ số Lagrange
hay mô hình bỏ sót biến.
giống như kiểm định RESET.
Trang 253 Sai số của phép đo lường
dữ liệu có thể thiếu chính xác do một
số lý do như:
• sai số khi cung cấp thông tin,
• sai số khi báo cáo
• hay sai số tính toán
gây ra những mô hình sai lệch
Chúng ta có thể xem xét hậu quả
của việc này trong 2 trường hợp:
3.1 Sai số trong biến phụ thuộc Y:
Trang 263.1 Sai số trong biến phụ thuộc Y:
ước lượng OLS vẫn không chệch nhưng phương sai của ước lượng sẽ thay đổi
Trang 273.1 Sai số trong biến phụ thuộc Y:
Ta thấy phương sai, và do đó sai số chuẩn
sẽ tăng lên khi có sai số trong đo lường Yi.
Trang 283.2 Sai số trong đo lường biến độc
Trang 293.2 Sai số trong đo lường biến độc lập Xi:
0
Do v ậy, Xi và zi có tương quan và vi phạm các giả định của CLRM Các ước lượng OLS chẳng những bị chệch mà còn không
vững.
Hậu quả của loại sai sót nghiêm trọng
nhưng khó có thể khắc phục nó vì ta
không biết Xi được như thế nào cho đúng.
Ta có thể giả định w2 rất nhỏ nên xem như không có sai số này và dùng OLS bình
thường.
Trang 304 Xác định dạng của phần
sai số không đúng
Do chúng ta không thể quan sát trực tiếp phần sai số nên để định dạng
cho nó không phải là việc dễ dàng
Chúng ta xem lại phần sai số sau:
Yi = Xiui (*) và Yi = Xi + ui (**)
Nếu (*) đúng nhưng lại ước lượng
(**), thì ước lượng sẽ chệch.
Trang 31Tiêu chuẩn lựa chọn mô
hình
R 2,
R 2 điều chỉnh,
Tiêu chuẩn thông tin Akaike (AIC),
Tiêu chuẩn thông tin Schwarz
(SIC),
Tiêu chuẩn C p của Mallows,
và dự báo χ 2
Trang 32Martin Feldstein:
“Nhà kinh tế lượng ứng dụng, giống như các nhà lý thuyết, nhanh chóng phát hiện ra rằng một mô hình hữu ích
không phải là một mô hình “đúng” hay
“thực tế” mà là một mô hình tiết kiệm, đáng tin cậy và cung cấp nhiều thông tin”
Trang 33các biến phụ thuộc phải giống nhau.
Trang 34Tiêu chuẩn R2 điều chỉnh (R2)
Ta thấyR2 R2.R2 chỉ tăng khi giá trị tuyệt đối của giá trị t của biến
được thêm vào mô hình lớn hơn 1
Do vậy,R2 là tiêu chuẩn tốt hơn R2
Lưu ý, các biến phụ thuộc cũng phải giống nhau
Trang 35Tiêu chuẩn thông tin Akaike (AIC)
số tự do) và n là cở mẫu.
chuẩn trên khi tăng thêm số biến.
M ô hình nào AIC thấp hơn thì tốt hơn
Để tiện lợi cho
việc tính toán, ta
lấy log:
Trang 36Tiêu chuẩn thông tin Schwarz (SIC)
SIC còn khắt khe hơn AIC
SIC càng nhỏ, mô hình càng tốt
hay
Trang 37Tiêu chuẩn Cp của Mallows