CHƯƠNG 5 CHƯƠNG 5 PHƯƠNG PHÁP PHÂN RÃ CHUỖI THỜI GIAN VÀ LỌC PHƯƠNG PHÁP PHÂN RÃ CHUỖI THỜI GIAN VÀ LỌC
A. PHƯƠNG PHÁP PHÂN RÃ
III. PHÂN RÃ NHÂN TÍNH
Phương pháp phân r nhân tính (còn ược gọi là tỷ lệ xu thế hoặc tỷ lệ trung bình trượt) tương tự như phương pháp phân r cộng tính. Với phương pháp phân r nhân tính, chúng ta giả sử rằng Yt là tích của nhiều thành phần, bao gồm sai số (Yt = Trt . Snt . Clt . εt); sai số là ngẫu nhiên, và yếu tố mùa vụ cho mỗi mùa vụ là như nhau cho các năm.
0 500 1,000 1,500 2,000 2,500 3,000 3,500 4,000 4,500
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Time (1984-1987)
Sales (millions of dollars)
actual forecast
Hình 5.3: Giá trị thực và giá trị dự báo: sử dụng phương pháp phân rã nhân tính ước lƣợng sản lƣợng bán lẻ của Mỹ (1984-1987)
3.1. Các bước tính toán của phương pháp phân rã nhân tính
Để phân tích các kỹ thuật sử dụng trong phương pháp phân r nhân tính , chúng ta sẽ sử dụng số liệu theo quý của ngành bán lẻ của Mỹ từ năm 1984 ến 1987. Như trong hình 5.3, yếu tố mùa vụ xuất hiện trong chuỗi số liệu. Có nhiều ỉnh xuất hiện rõ rệt trong suốt các quý 4 và các áy xuất hiện trong suốt các quý 1 của các năm. Ngoài ra, nhìn vào hình vẽ ta cũng có thể thấy xuất hiện rõ xu thế i lên của số liệu. Vì vậy, chúng ta tiếp tục tách các biến này bằng cách tiến hành các bước sau:
1. Đối với chuỗi thời gian thực, tính (như trong mô hình cộng tính) trung bình trượt L iểm trung tâm. Trung bình trượt và trung bình trượt trung tâm cho 3 quý ầu của sản lượng bán lẻ (bảng 5.3) ược tính theo cách sau:
2. Chia số liệu có cho CMAt (Trt * Clt), thương còn lại là (Snt * εt) Yt = Trt * Snt * Clt * εt
(Trt * Snt * Clt * εt) / (Trt * Clt) = Snt * εt Trong ví dụ của chúng ta:
Sn3 * ε3 = 3,180 / 3,221.125 = 0.987
Sn4 * ε4 = 3,505 / 3,263.5 = 1.074 Sn5 * ε5 = 3,020 / 3,325 = 0.908
Loại bỏ thành phần sai số (εt) ra khỏi (Snt * εt) bằng cách tính trung bình cho các quý:
Quý 1 Quý 2 Quý 3 Quý 4
0.908 1.018 0.987 1.074
0.907 1.004 1.011 1.070
0.892 1.020 1.014 1.077
2.707 3.042 3.012 3.221
3. Với mô hình nhân tính, tổng của những ước lượng trung bình mùa vụ này phải bằng L (số mùa vụ trong năm). Nếu không, chúng cần ược chuẩn hoá ể có tổng bằng L.
Ước lượng chuẩn hoá cuối cùng là tích của mỗi ước lượng ược với hằng số (L/Sn_t).
Sử dụng số liệu từ ví dụ của chúng ta:
L/Sn_t= 4/(0.9025 + 1.014+1.004+1.074) = 1.0015 Ước lượng mùa vụ cuối cùng là:
Sn1 = 0.902*1.0015 = 0.904 Sn2 = 1.014*1.0015 = 1.015 Sn3 = 1.004*1.0015 = 1.005 Sn4 = 1.074*1.0015 = 1.075 4. San bằng tính chất mùa vụ của chuỗi số liệu bằng cách chia nó cho ước lượng cuối cùng của thành phần mùa vụ:
dt = Yt / Snt
Ví dụ:
d1 = 2,881/0.904 = 3,186.947 d2 =3,249/1.015 = 3,200.985 d3 =3,180/1.005 = 3,164.79
…
d16 =4,159/1.075 = 3,868.84
5. Thực hiện hồi quy với số liệu ược san bằng tính chất mùa vụ ể có ược mô hình phù hợp (tuyến tính, toàn phương, dạng mũ, …) cho biến xu thế.
Mô hình phù hợp cho số liệu ược san bằng tính chất mùa vụ trong ví dụ của chúng ta là dạng mô hình tuyến tính. Kiểm ịnh F cho hệ số xác ịnh (0.979) và kiểm ịnh t cho hệ số dốc ều có ý nghĩa ở mức ý nghĩa 0.05 (xem bảng 5.3). Phương trình cho mô hình xu thế sẽ là:
Trt = 3,085.017 + 48.79 * t
Một ước lượng hoặc dự báo cho bất kỳ một giai oạn t nào sẽ là tích của các ước lượng các thành phần tại thời iểm t:
Yt = Trt *Snt * Clt
Như vậy, giá trị dự báo của sản lượng bán lẻ của Mỹ trong quý 4 của năm thứ 2 (t=8) sẽ là:
Y8 = Tr8 *Sn8 * Cl8
Tr8 = 3,085.017 + 48.79 * 8 = 3,475.34 Sn8 = Sn4 = 1.075
Cl7 = 1 (chúng ta giả ịnh rằng không có chu kỳ) Y8 = 3,475.34 * 1.075 * 1= 3,735.99
3.2. Đánh giá mô hình
Như những gì chúng ta làm với mô hình cộng tính, chúng ta có thể ánh giá tính phù hợp của mô hình nhân tính bằng cách phân tích các kết quả thống kê của phân tích hồi quy xu thế, vẽ ồ thị so sánh giá trị thực và giá trị ước lượng của Yt, và tính ộ o Theil’s U.
Kết quả của phân tích hồi quy ối với số liệu ược san bằng tính chất mùa vụ của sản lượng bán lẻ chỉ ra rằng chúng ta có mô hình tốt cho biến xu thế. Tất cả các kiểm ịnh thống kê (kiểm ịnh t cho các hệ số, kiểm ịnh F, và kiểm ịnh Durbin-Watson) ều lớn hơn giá trị tra bảng của chúng (α=0.050. Mô hình giải thích vào khoảng 0.997 (R2adj) phương sai biến xu thế của số liệu ược san bằng tính chất mùa vụ (Xem bảng 5.3).
Đồ thị của giá trị thực và giá trị dự báo của Yt ược biểu diễn trên ồ thị 5.3. Nó chỉ ra rằng mô hình rất thích hợp với số liệu trên, ngoại trừ một số ít ngoại lệ.
Một chỉ số khác về sự thích hợp của mô hình là ộ o Theil’s U. Như trong bảng 5.4, thống kê U cho mẫu của chúng ta là 0.0046. Kết quả này một lần nữa chỉ ra rằng mô hình là phù hợp ể ước lượng số liệu cho.
3.3. Dự báo và khoảng tin cậy
Giá trị ước lượng của biến xu thế, mùa vụ và chu kỳ có ược từ phương pháp phân r nhân tính ược sử dụng ể mô tả chuỗi thời gian hoặc ể dự báo các giá trị tương lai của chuỗi số liệu. Như trình bày ở phần trước, giá trị dự báo cho thời iểm t trong mô hình nhân tính sẽ là tích của các ước lượng thành phần ở thời iểm t.
^
^
^
Bảng 5.3. Giá trị tính toán của thống kê Theil’s U cho sản lƣợng bán lẻ của Mỹ từ năm 1984 đến 1987
T Yt
Yˆt et Yt2
ˆ2
Yt et2
1 2,881 2,832 -49 8,300,161 8,020,224 2,401
2 3,249 3,232 -17 10,556,001 10,445,824 289
3 3,180 3,249 69 10,112,400 10,556,001 4,761
4 3,505 3,528 23 12,285,025 12,446,784 529
5 3,020 3,009 -11 9,120,400 9,054,081 121
6 3,449 3,430 -19 11,895,601 11,764,900 361
7 3,472 3,445 -27 12,054,784 11,868,025 729
8 3,715 3,737 22 13,801,225 13,965,169 484
9 3,184 3,185 1 10,137,856 10,144,225 1
10 3,576 3,628 52 12,787,776 13,162,384 2,704
11 3,657 3,641 -16 13,373,649 13,156,881 256
12 3,941 3,947 6 15,531,481 15,578,809 36
13 3,319 3,361 42 11,015,761 11,296,321 1,764
14 3,850 3,826 -24 14,822,500 14,638,276 576
15 3,883 3,838 -45 15,077,689 14,730,244 2,015
16 4,159 4,157 -2 17,297,281 17,280,649 4
Σei2
= 17,041 ΣYi2
= 198,169,590 ΣYi2
= 198,208,797
0046 . 67 0 . 519 32 . 519
64 . 32 1
1 1
^ 2 2
2
t t
t
n Y n Y
n e U
Trong ví dụ về sản lượng bán lẻ ở Mỹ, chúng ta có thể có ước lượng iểm cho quý 2 năm 1988 bằng phương pháp sau:
Y18 = Tr18 *Sn18 * Cl18
Tr8 = 3,085.017 + 48.79 * 18 = 3,963.24 Sn18 = Sn2 = 1.015
Cl18 = 1 (chúng ta giả ịnh rằng không có chu kỳ)
^ ^
^
^
Y18 = 3,963.24* 1.015 * 1= 4,022.69
Giống như trong phương pháp phân r cộng tính, không có không có khoảng tin cậy ― chính xác về mặt thống kê‖ nào cho ước lượng iểm. Dù sao, chúng ta vẫn có thể tính xấp xỉ khoảng tin cậy nhờ vào phương pháp ược trình bày trong mục 5.2.3. Phương pháp này sử dụng khoảng sai số cho thành phần xu thế như là thước o của khoảng sai số cho Yt . Vì vậy, công thức tính khoảng tin cậy sẽ là:
Yt = tα/2 * se * ( yếu tố hiệu chỉnh)
Trong ó se là ộ lệch chuẩn của ước lượng MSEcó ược từ ước lượng cho thành phần xu thế, và
Yếu tố hiệu chỉnh =
n t t
t t n
p
2 2
2 _
) (
) 1 (
1 , thu ược từ kết quả phân tích hồi quy
ối với số liệu ược san bằng yếu tố mùa vụ.
Trong ví dụ của chúng ta, ộ lệch chuẩn của ước lượng thành phần xu thế ối với số liệu ược san bằng yếu tố mùa vụ bằng 35.56 và yếu tố hiệu chỉnh cho giai oạn thứ 18 là 1.129. Như vậy, một xấp xỉ khoảng tin cậy 95% của Y18 sẽ là:
4,022.69 ± 2.145 * 35.56 * 1.129 hoặc có thể viết là (3,936.57 ến 4,108.80) Chúng ta có thể nói với 95% ộ tin cậy rằng sản lượng bán lẻ của Mỹ cho quý 2 năm 1988 sẽ nằm trong khoảng từ 3,936.57 trăm triệu ô la ến 4,108.80 trăm triệu ô la.
Một iểm áng chú ý ở ây là, giá trị thực của sản lượng bán lẻ của quý 2 năm 1988 ược báo cáo bởi Phòng thương mại Mỹ là 4,089.80 trăm triệu ô la.
3.4. Kiểm định yếu tố mùa vụ
Trong những ví dụ trước, chúng ta ã khẳng ịnh sự xuất hiện của thành phần mùa vụ (trước khi tách thành phần này ra) bằng cách xem ồ thị biểu diễn số liệu và bằng cách nghiên cứu hành vi của chuỗi số liệu. Dù sao cũng có một số thời iểm mà sự xuất hiện rõ ràng của thành phần thời vụ vẫn chưa có câu trả lời rõ ràng. Trong những trường hợp cá biệt ó, chúng ta cần một kiểm ịnh rõ ràng hơn là chỉ nhìn vào ồ thị. Một phương pháp như vậy có thể áp dụng là kiểm ịnh phương sai Kruskal-Wallis một chiều (Kruskal and Wallis, 1952) nhằm kiểm ịnh kết quả thu ược bằng cách trừ hoặc chia số liệu quan sát ược cho CMA. Các kết quả này ược giả ịnh chứa thành phần mùa vụ và sai số. Nếu không có thành phần mùa vụ ặc biệt nào, kết quả sẽ không chứa thành phần nào khác ngoài sai số ngẫu nhiên và phân phối của chúng là không ổi cho tất cả các mùa vụ. Điều này có nghĩa rằng nếu các kết quả này ược xếp hạng và sau ó ược nhóm lại theo từng mùa vụ thì trung bình của những xếp hạng này phải bằng nhau về mặt thống kê.
^
^
^
Kiểm ịnh Kruskal-Wallis là một kiểm ịnh phi tham số tương tự như kiểm ịnh phương sai một chiều. Nó sẽ xác ịnh có hay không tổng của các xếp hạng này (và trung bình của chúng) khác nhau (hoặc như nhau) giữa các nhóm (mùa vụ). Kiểm ịnh này ược tiến hành thông qua tính thống kê H:
) 1 ( ) 3
1 (
12 2
N N Rn N
H
i
i (5.5) Trong ó N = tổng số các phần tử ược xếp hạng;
Ri = tổng của các hạng trong một mùa vụ;
ni = số các phần tử ược xếp hạng trong một mùa vụ.
Trong ví dụ về phân rã nhân tính, bốn yếu tố mùa vụ (0.904, 1.015, 1.005, và 1.075) ược tách biệt và sau ó ược sử dụng ể san bằng yếu tố mùa vụ của số liệu. Dù sao, nếu bốn yếu tố mùa vụ này bằng 1 về mặt thống kê, các thủ tục kiểm ịnh trên là không cần thiết. Bằng cách xếp hạng các giá trị (Snt * εt) và áp dụng kiểm ịnh Kruskal- Wallis cho tổng của các xếp hạng mùa vụ, sự hiện diện của yếu tố thời vụ có thể xác ịnh ược về mặt thống kê. Bảng 5.5 biểu diễn các giá trị tính toán của tổng của các xếp hạng của mỗi quý và thống kê H, như chúng ta có thể thấy, giá trị tính toán (9.67) lớn hơn giá trị tra bảng (tới hạn) (χ2 = 7.81, df = 3). Kết quả này cho chúng ta một kết luận là có yếu tố mùa vụ trong số liệu bán lẻ
Giá trị tới hạn 2 với bậc tự do là df= L-1: ở ây 2 =7.814 , với df=3.
Giá trị tính ược của thống kê H là:
67 . 9 ) 13 ( 3 3
33 3 17 3 22 3 6 ) 13 ( 12
12
) 1 ( ) 3
1 (
12
2 2 2 2
2
N N Rn N
H
i i
Quy tắc ra quyết ịnh là 9.67> 7.841 do ó ta bác bỏ giả thiết H0
Chú ý rằng thủ tục này cũng như thủ tục tính mùa vụ trong mô hình cộng tính , khi ó giả thiết H0 là:
H0: Sn1=Sn2=....=SnL=0.