Sai số dự báo là chênh lệch giữa giá trị dự báo và giá trị thực tế tương ứng:et = Yt – MH dự báo được đánh giá là tốt nếu sai số dự báo nhỏ và dao động của nó không theo một chiều hướng
Trang 2Các tiêu chuẩn của một
MH tốt (theo Harvy):
Tiết kiệm:
Tính đồng nhất:
MH càng đơn giản càng tốt
Trang 3Với một tập hợp các dữ liệu đã cho, các ước lượng phải là duy nhất
thì được coi là càng thích hợp
Trang 4 Tính bền vững về mặt lý thuyết:
Xây dựng MH phải dựa trên
cơ sở của lý thuyết nào đó.
Có khả năng dự báo tốt:
MH được chọn sao cho khi dùng nó để dự báo sẽ cho kết quả sát với thực tế
Trang 5Sai số dự báo là thước đo phản ánh giá trị dự báo gần với giá trị thực tế là bao nhiêu
Trang 6Sai số dự báo là chênh lệch giữa giá trị dự báo và giá trị thực tế tương ứng:
et = Yt –
MH dự báo được đánh giá là tốt nếu sai số dự báo nhỏ và dao động của nó không theo một chiều hướng nào
t
Yˆ
Trang 7Mẫu dự báo có t = S, S+1, , S+h Ký hiệu giá trị thực tế và giá trị dự báo tương ứng là Yt và Các chỉ tiêu đánh giá độ chính xác của mô hình bao gồm:
t
Yˆ
Trang 82- Căn bậc hai của sai số bình
Squared Error):
•1- Sai số bình phương trung
bình (Mean Squared Error) : :
S t
2 t
h S
S t
2 t
1 h
1 Yˆ
Y 1
h
1 MSE
MSE RMSE
Trang 93- Sai số trung bình tuyệt đối
S t
t
e 1
h
1 MAE
Trang 104- Số phần trăm sai số trung bình tuyệt đối
(Mean Absolute Percentage Error):
h
1 MAPE
Trang 11Việc lựa chọn công thức tính sai số dự báo phụ thuộc vào bản chất của dữ liệu:
Trang 12•ª Nếu trong chuỗi dữ liệu
chỉ có một vài sai số dự báo có giá trị tuyệt đối lớn thì ta không nên dùng MSE & RMSE.
•ª Khi giá trị của các sai số
dự báo xấp xỉ nhau thì nên dùng MSE.
Trang 13ª Khi có đồng thời
RMSE) thì việc lựa chọn sẽ căn cứ vào chỉ tiêu nào nhỏ nhất.
Trang 14* Khi so sánh độ chính xác của những MH dự báo, ta không nên áp dụng cho những chuỗi dữ liệu đã có những biến đổi từ dữ liệu gốc
* Chỉ có MAPE có thể dùng cho mọi trường hợp vì MAPE là số tương đối.
Trang 15* Hệ số Theil U là một thước
đo khác về độ chính xác của dự báo Hệ số này được tính như sau:
S t
2 t
h S
S t
2 t
h S
S t
2 t
t
Y 1
h
1 Yˆ
1 h
1
Yˆ
Y 1
h
1 U
Trang 16* Nếu giá trị của U càng gần 0 thì MH dự báo càng chính xác
Hệ số Theil U luôn luôn nằm giữa 0 và 1 (0 < U < 1)
Trang 17Một số tỷ lệ sau đây cũng được dùng để đánh giá độ chính xác của dự báo:
1- Tỷ lệ độ chệch
S t
2 t t
Trang 182- Tyû leä phöông sai
Yˆ
) s
s
(
2 t
t
2 y
yˆ
Trang 193- Tyû leä hieäp phöông sai
Yˆ
s s
) r 1
(
2
2 t
t
y yˆ
Trang 20 Tỷ lệ độ chệch cho biết phạm vi giá trị trung bình dự báo cách giá trị trung bình của chuỗi thực.
Tỷ lệ phương sai cho biết phạm vi phương sai của dự báo cách phương sai của chuỗi thực.
Trang 21 Tỷ lệ hiệp phương sai đo lường sai số dự báo không có hệ thống
Thí dụ:
Các số liệu về doanh số, chi phí bán hàng và chi phí quảng cáo của một siêu thị được cho
ở bảng sau:
Trang 22Naêm quùy D.soá C.P.B.H C.P.Q.C
2001 1 2
3 4
18,298 17,526 15,940 16,266
1,715 1,380 1,090 0,920
2,287 2,484 2,344 2,916
2002 1 2
3 4
25,414 24,685 21,836 22,910
2,057 1,808 1,546 1,912
4,230 3,943 2,373 2,802
2003 1 2
3 4
31,767 30,475 27,126 29,448
3,000 2,999 2,388 2,561
4,588 4,498 3,753 4,573
2004 1 2
3 4
45,382 43,898 37,832 42,068
4,320 4,286 3,330 3,659
6,554 6,479 5,234 6,533
Trang 23Định mẫu từ quý I năm 2001 đến quý IV năm 2003 và hồi qui doanh số theo chi phí bán hàng (dùng EViews) ta được kết quả:
DOANHSO = 8.12838
+7.877757*CHIPHIBANHANG
Trang 24Dùng mô hình trên để dự báo doanh số của các quý
1, 2, 3, 4 năm 2004 thì sai số dự báo như sau:
Trang 26Mô hình dự báo tốt nhất sẽ có sai số dự báo thấp nhất Tuy nhiên cũng có những tiêu thức khác để đánh giá một MH dự báo có tốt hay không Điều này phụ thuộc vào khả năng và chi phí thu thập dữ liệu, khả năng xử lý dữ liệu và loại dự báo
Trang 27* Chẳng hạn, với thí dụ cho ở bảng trên Nếu dùng MH hồi quy tuyến tính 3 biến sau đây để dự báo doanh số:
DOANHSO = 5.83674
+ 5.61133*CHIPHIBANHANG
+ 1.973*CHIPHIQUANGCAO
Trang 28* Các chỉ tiêu đánh giá độ chính xác của MH 3 biến:
Trang 30* Nhìn vào kết quả của bảng trên ta thấy: so với MH 2 biến, MH 3 biến có RMSE, MAE, MAPE và hệ số Theil U nhỏ hơn Vì vậy ta nên chọn MH 3 biến để dự báo doanh số.
Trang 31* Có thể dùng đồ thị để đánh giá độ chính xác của dự báo Nếu đưa các sai số lên đồ thị và quan sát thấy các sai số đó dao động một cách ngẫu nhiên theo thời gian thì ta có
MH dự báo tốt.
Trang 32* Nếu đưa các giá trị thực tế và giá trị dự báo lên cùng hệ trục tọa độ Nếu thấy khoảng cách giữa giá trị thực tế và giá trị dự báo càng gần nhau thì mô hình càng chính xác.
Trang 33Thí dụ: Đồ thị phản ánh giá trị thực tế và giá trị dự báo của MH thứ nhất
Trang 34Thí dụ: Đồ thị phản ánh giá trị thực tế và giá trị dự báo của MH thứ hai
Trang 35Đồ thị của sai số dự báo
Trang 36 Bỏ sót biến thích hợp:
Trang 37Hậu quả việc bỏ sót biến :
của các tham số trong mô hình đúng.
lượng vững.
hình sai (b) > trong mô hình đúng (a)
còn tin cậy nữa.
Trang 38 Đưa vào MH biến không thích
hợp (MH th a bi n) ừa biến) ến)
hợp (MH th a bi n) ừa biến) ến)
Giả sử mơ hình đúng là :
Yi = 1 + 2X2i + Ui (a) Nhưng ta lại chọn mơ hình (cĩ thêm X3X3i + Ui (a)):
Yi = 1 + 2X2i + 2X3X3i + Ui (a)i + Vi (b)
hậu quả :
Trang 39Hậu quả việc thừa biến :
lượng không chệch và vững của các tham số trong mô hình đúng.
mô hình thừa biến (b) lớn hơn trong
mô hình đúng (a)
không còn tin cậy nữa.
Trang 40 Chọn dạng hàm không đúng
Trang 41 Phát hiện sự có mặt của biến không cần thiết
Giả sử ta có MH sau:
Yi = 1 + 2X2i + 3X3i + 4X4i
+ 5X5i + Ui (10.14)
Trang 42Nếu lý thuyết cho rằng tất cả các biến X 2 , X 3 , X 4 , X 5 đều ảnh hưởng tới Y thì phải giữ chúng trong mô hình cho dù khi tiến hành kiểm định ta nhận thấy hệ số hồi qui của một biến nào đó khác 0 không có ý nghĩa.
Trang 43Giả sử X5 là biến mà ta không biết chắc có thực sự cần thiết phải đưa vào MH hay không thì ta tiến hành kiểm định giả thiết:
H0: 5 = 0
Trang 44Trường hợp không biết chắc chắn cả hai biến X4,
X5 có thực sự cần thiết ở
MH hay không thì tiến hành kiểm định giả thiết:
Trang 45Kiểm định Wald
Xét các MH sau:
Y i = 1 + 2 X 2i + + m X mi + + m+1 X m+1i + + k X ki + U i
Y i = 1 + 2 X 2i + + m X mi +V i
(U) (R)
Trang 46Mô hình U được gọi là MH không giới hạn và MH R được gọi là MH giới hạn
Mô hình R có được bằng cách bỏ bớt một số biến ở mô hình U, đó là:
k 2
m 1
Trang 47Ta cần biết k-m biến bị loại có ảnh hưởng liên kết đối với Y hay không.
Để trả lời câu hỏi này, ta cần kiểm định giả thiết:
H0: m+1= m+2 = = k= 0
Trang 48Để kiểm định giả thiết H0,
ta dùng kiểm định Wald
Các bước của kiểm định Wald như sau:
Bước 1:
Trang 49Ước lượng mô hình U và mô hình R từ đó tính được RSSU và RSSR sau đó tính:
) k n
/(
RSS
) m k
/(
) RSS
RSS
( F
U
U
R c
Trang 51 Kiểm định các biến bị bỏ sót Để đơn giản ta xét MH tuyến tính 2 biến:
Để kiểm định xem MH có bị chọn sai do thiếu biến Z hay không ta phải ước lượng MH:
Yt = 0 + 1Xt + Ut
(10.15)
Trang 53Trường hợp không có số liệu của Z thì có thể dùng kiểm định RESET của Ramsey
Trang 54Ramsey đã đề xuất sử dụng
Các bước của kiểm định RESET
3X3i + Ui (a) t
2
t , Yˆ Yˆ
Trang 55Bước 1: Hồi qui Y theo X ta tìm được các giá trị
(ta gọi MH này là MH cũ)
Bước 2: Hồi qui Y theo X,
các hệ số của bằng 0
t
Y ˆ
3X3i + Ui (a) t
2
t , Yˆ
Yˆ
3X3i + Ui (a) t
2
t , Yˆ Yˆ
Trang 56thêm vào mô hình.
Bước 4: Nếu F có ý nghĩa ở mức 5% thì bác bỏ gt H 0 , tức cho rằng MH (10.15) được xác định không đúng (do thiếu biến).
F =
Trang 57Thí dụ: Số liệu về tổng chi phí (Y) và sản lượng (X)
Sản lượng tổng chi phí sản lượng tổng chi phí
1 193 6 260
2 229 7 274
3 240 8 297
4 244 9 350
5 257 10 420
Trang 58Hoài qui Y theo X:
2
i ; Yˆ
Yˆ
3X3i + Ui (a) i
2 i i
Trang 59 MH (10.17) được xác định không đúng
Áp dụng kiểm định RESET
ta có:
403X3i + Ui (a)5 ,
284 )
4 10
/(
) 9983X3i + Ui (a) ,
0 1
(
2 / ) 8049 ,
0 9983X3i + Ui (a)
, 0
Trang 60Kết quả kiểm định bằng Eviews:
Trang 61Khi tiến hành các kiểm định trên để loại bỏ biến không cần thiết đòi hỏi người thực hành phải có kinh nghiệm để phán đoán MH đúng.
Trang 62Trong MH hồi qui ta giả thiết
U i có phân phối chuẩn Do không ng/c toàn bộ tổng thể nên U i chưa biết, vì vậy ta thường dùng e i để ước lượng cho U i
Trang 63Để KĐ ei có phân phối chuẩn hay không ta có thể dùng kiểm định 2
Nhưng đa số các các phần mềm KTL sử dụng kiểm định Jarqua-Bera (JB)
Trang 65Với n khá lớn JB có phân phối xấp xỉ 2(2)
H0: U có phân phối chuẩn
H0 sẽ bị bác bỏ nếu
JB > 2(2)
Trang 67Với số liệu của thí dụ 4.1
Trang 68Heát chöông 9