5. Q UY TRÌNH PHÂN TÍCH HÔI Q UY TRONG EXC EL
6.2. D ự báo nhanh sử dụng các hàm của Excel
H ìn h 4.18 trìn h bày c á c h sử d ụ n g hàm T R E N D với c o n st = 1.
A B MÊÊÊÊm 0 : E I F ỉ G I. m m Ê m ầ
V X
Tháng
G i á trị sả n xuất (triệu USD)
Đ iện năng tiêu thụ
(triệu Kwh) I i
S I 1 4.51 2 .4 8
K I 2 3.58 2.26
3 4.31 2 .4 7 d ư b á o d ù n g fo r e c a s t 5 .4 6
* 4 5 .0 6 2 .7 7 d ư b á o d ù n g tre n d 5 .4 6
V 2 5 5 .6 4 2.99 c i n f l _ t h i i c
n 6 4 .9 9 3 .0 5 I i T 1
r i 7 5.29 3.18 I5=F0RECAST(3.2,B3:B14,C3:C14)
1 0 8 5.83 3.46 I6 = T R E N D (B 3 :B 1 4 .C 3 :C 1 4 ,3 .2 ,1 ) i
m 9 4.71 3 .0 3 i l '
m 1 0 5.61 3 .2 6
m 1 1 4.91 2 .6 7
m 1 2 4 .1 9 2 .5 3
m
H ìn h 4.18. Sử dụng hàm cùa Excel để dự báo.
D ự b áo n h a n h s ử d ụ n g hàm p h i tuyến
Trong Excel có hàm G R O W T H dùng để dự báo nhanh theo hàm y = bm* theo cú pháp sau:
=GROW TH(known_y’s; known x ’s; new x ; [const]) Trong đó:
Const nhận giá trị logic để quyết định m ô hình hồi quy.
Const = 1 (TRUE - mặc định) thì tính hệ số b. N ếu const = 0 (FALSE) thì gán cho b = l. Các tham số khác tương tự như hàm TREND.
Độc giả tự lấy ví dụ cho hàm G R O W T H .
6.3. Dự báo bàng các phương pháp ngoại suy thống kê Phương pháp trung bình động
Phương pháp trung bình động (M oving A verage) còn được gọi là phương pháp bình quân diễn tiến. Theo phương pháp này, số tính toán ở kỳ t+1 băng bình quân của các số quan sát ờ n kỳ trước đó. Cứ thêm vào m ột kỳ ỡ phía tương lai thì bỏ bớt đi m ột kỳ ở quá khứ
f _ A + A-I +••• + A-„
i /+] “
n
(4.18) Trong đó:
Ft: số tính toán ở kỳ t.
Dt: số quan sát ở kỳ t.
n: số kỳ tính bình quân.
T rong Excel có trình cài thêm Moving Average dùng để dự báo theo phương pháp trung bình động. Truy cập m enu Tools I Data Analysis I Moving Average. Hộp thoại Moving Average nhu hình 4.19 xuất hiện.
Trong H ình 4.19, mục Interval để nhập số kỳ tính bình quân.
Tùy chọn Chat Output để vẽ đồ thị của dãy dữ liệu quan sát và dữ liệu tính toán. Tùy chọn Standard Errors để hiển thị sai số giữa số quan sát và số tính toán.
M o v in g A v e ra g e X]
■Input--- Input Range:
r~ Labels in First Row Interval:
OK Cancel
Help
fO utput options--- Output Range:
N e w W o r k s h e e t p ly : N e w W o r k t o i j h
[~ c h a rt Output r~ Standard Errors
Hình 4.19. Hộp thoại Moving Average.
Ví dụ 4. 10
Có số liệu thống kê về doanh thu ở m ột cửa hàng trong m ột năm như bảng sau:
Tháng D o anh thu (triệu đ)
1 10
2 12
3 13
4 16
5 19
6 23
7 26
8 30
9 28
10 18
11 16
12 14
Với số kỳ tính bình quân n=3. Hãy tính toán và dự báo doanh thu cho tháng 1 năm tiếp sau.
Hình 4.20 trình bày kết quả dự báo và đồ thị của số liệu quan sát và số tính toán sử dụng trình M oving Average.
Phương pháp san bằng hàm mũ
Phương pháp san bằng hàm m ũ (Exponential Smoothing) còn có tên gọi là phương pháp điều hòa mũ. Phương pháp này đưa ra các dự báo cho giai đoạn trước và thêm vào đó một lượng điều chinh để có được lượng dự báo cho giai đoạn kế tiếp. Sự điều chỉnh này là một tỷ lệ nào đó cùa sai số dự báo ở giai đoạn trước và được tính bằng cách nhân số dự báo của giai đoạn trước với hệ số a nằm giữa 0 và 1.
Hệ số này gọi là hệ số điều hòa.
F ^ = F l+a ị D , - F , ) (4.19) Trong đó:
F t: số tín h to án ở kỳ t.
Dt: số quan sát ở kỳ t.
a : hệ số san bàng.
Trong Excel có trình cài thêm Exponential S m o o th in g dùng đê dự báo theo phương pháp san bằng hàm mũ. Hình 4.21 trình bày hộp thoại Exponential Smoothing.
Trong hình 4.21, mục nhập Damping Factor để nhập hệ số san bàng a .
V í dụ 4.11. Sử dụng số liệu cùa ví dụ 4.10. Hãy dự báo theo phương pháp san bằng hàm mũ với a = 0.3.
A B c I n Ị E I F G I H I I I J I K
1 2 3
4--- T h ản g D o a n h thuf triêu đ
1 1 0 #N/A I
5 6
2 1 2 #N/A
M oving Average
3 13 11.67
7 4 16 13 .6 7
8 5 19 16 ,0 0
• 3 0 - 1 2 0-
> 1 0 0
9 6 2 3 19 .3 3 I —ằ-A ciual
FurtLdil
1ũ 7 2 6 2 2 .6 7
1 1 8 3 0 2 6 .3 3
1 2 9 2 8 2 8 .0 0 1 3 5 7 9 11
Data Point
13 1 0 18 2 5 .3 3
14 15
1 1 16 20.67
1 2 14 16 ,0 0
16 I I -
Hình 4.20. Dự báo bằng Moving Average.
Input Input Range:
Damping factor:
r Labels
1 2 J
1
Output Range: 1 i J
I
r ơ i a r t Output f” a a n d a rd Errors
H ình 4.21. Hộp thoại Exponential Smoothing.
Hình 4.22 trình bày kết quà dự báo theo phương pháp san bàng hàm mũ với a =0.3.
H ìn h 4.22. Dự báo bằng Exponential Smoothing.
BÀ I T Ậ P
Bài 4.1. M ột công ty kỹ nghệ chính xác nghĩ rằng các dịch vụ kỹ nghệ của công ty được cung ứng cho các công ty xây dựng thì có quan hệ trực tiếp đến số hợp đồng xây dựng trong vùng theo mô hình tuyến tính. Hãy xây dựng một phương trình hồi quy cho dự báo mức độ nhu càu về dịch vụ của công ty và kiểm định sự phù hợp của mô hình đó.
1) Sử dụng phương trình hồi quy để dự báo mức độ nhu cầu trong 4 quý tới. Ư ớc tính trị giá hợp đồng 4 quý tới là 260, 290, 300 và 270 (Đ V T: 10 triệu đồng).
Năm Quý
Nhu cầu của công ty
(10 tr đ)
Trị giá họp đồng thực hiện (10 tr đ)
1 1 8 150
2 10 170
3 15 190
4 9 170
2 1 12 180
2 13 190
3 12 200
4 16 220
2) Ghi bài vào thư m ục đã tạo ờ chucmg 1 theo dạng C:\tenthumuc\tenfĩle.xỉs. Trong đó tenfile bao gồm “họ tên sinh viên, chương 4, bài số 1” .
B ài 4.2. Có thống kê về chiều cao và trọng lượng của 12 phụ nữ Mỹ tuổi từ 30 đến 39.
1) H ãy tìm tương quan giữa chiều cao (y) và trọng lượng (x).
Quan hệ này có m ờ rộng cho tổng thể được không?
2) H ãy xây dựng m ô hình hồi quy tuyến tính và kiểm định các hệ số của m ô hình hồi quy.
3) N ếu cho ràng giữa chiều cao và trọng lượng có quan hệ y = bm x thì m ô hình có phù hợp không?
C ao (m )
1,47 1,5 1,52 1,55 1,57 1,60 1,63 1,65 1,68 1,7 1,73 1,75
T L (k ô )
52,21 53,12 54,48 55,84 57,2 58,57 59,93 61,29 63,11 64,47 66,28 68,1
4) Ghi bài vào thư mục đã tạo ở chương 1 theo dạng C:\tenthumuc\tenfile.xls. Trong đó tenfile bao gồm “họ tên sinh viên, chương 4, bài số 2” .
B ài 4.3. Có thống kê về thu nhập quốc dân (Y), sàn lượng điện (X |), sản lượng than (X2), sản lượng lương thực (X3) sản lượng thép (X4).
1) Hãy ước lượng các tham số của hàm hồi quy m ẫu biết ràng Y và X có quan hệ tuyến tính.
2) K iểm định sự phù hợp của mô hình. D ự báo Y với X = (5,2;
65,1; 275,3; 37,8).
Y X, x2 x3 X4
733,300 3,089 76,200 283,500 15,844
750,900 3,503 79,400 274,500 19,835
747,600 3,817 77,000 268,000 21,797
727,600 3,870 74,000 265,700 24,759
694,400 3,706 64,400 259,600 28,093
702,600 3,851 63,100 256,800 31,121
714,000 4,170 66,300 259,300 32,759
717,630 4,378 62,900 263,400 34,556
750,000 5,000 66,700 273,100 36,788
3) Ghi bài vào thư mục đã tạo ở chương 1 theo dạng C:\tenthumuc\tenfile.xls. Trong đó tenfile bao gồm “họ tên sinh viên, chương 4, bài số 3” .
Bài 4.4. Có số liệu thí nghiệm về quan hệ giữa y, X | , X2, X3 theo hàm
ln y = ao + ailn X] + a2lnx2 + a3Ỉn X3 + a4(ln Xi)(ln X 2) + a5(ln x2)(ln X3) + a6(ln Xi)(ln X3) + a7(ln X| ) 2 + a8(ln X2 )2 + a9(ln X3)2
Xi *2 * 3 y
0,005 0,3 25,12 58
0,005 0,6 25,12 80
0,005 0,3 37,68 71
0 ,0050 0,6 37,68 104
0,0025 0,45 25,12 52
0,0075 0,45 25,12 88
0,0025 0,45 37,68 63
0,0075 0,45 37,68 108
Xi *2 Xj y
0,0025 0,3 31,4 44
0,0075 0,3 31,4 82
0,0025 0,6 31,4 68
0,0075 0,6 31,4 118
0,0050 0,45 31,4 84
1) Hãy uớc lượng các tham số của hàm hồi quy và kiểm định sự phù họp của mô hình và các tham số khi m ở rộng m ô hình cho tổng thể.
2) Trong các X j, giá trị nào ảnh hưởng nhiều nhất đến y. Tại sao?
3) Ghi bài vào thư mục đã tạo ở chương 1 theo dạng C:\tenthumuc\tenjile.xls. Trong đó tenfile bao gồm “họ tên sinh viên, chương 4, bài số 4 ”.
Bài 4.5. N ghiên cứu về chi phí chăm sóc (x) năng suất lúa (y) trên 10 thừa ruộng cho ta kết quả:
B iết y có quan hệ tuyến tính vói X . N ăn g su ấ t
(n g h ìn Ib/ha) 9,9 10,2 11 11,6 11,8 12,5 12,8 13,5 14,3 14,4
C h i p h í ch ăm sóc (U S D /ha)
10,7 10,8 12,1 12,5 12,2 12,8 12,4 11,8 11,8 12,6
1) Hãy sử dụng các hàm của Excel để dự báo nhanh năng suất ờ mức chăm sóc 13 USD/ha.
2) Ghi bài vào thư mục đã tạo ở chương 1 theo dạng C:\tenthumuc\tenfile.xls. Trong đó tenfile bao gồm “họ tên sinh viên, chương 4, bài số 5” .
Bài 4.6. Trong điều tra mức sống dân cư năm 2004 (VH LSS2004) người ta cho rằng tổng giá trị sản phẩm (y) là hàm
tuyến tính của các yếu tố sau: chi phí giống (xi), chi phí phân bón (X2), chi phí thuốc trù sâu (X3).
1) Sử dụng các số liệu sau đây hãy cho biết mô hình có phù hợp không và có thể suy rộng được ờ mức ý nghĩa 5% hay không ?
Y *1 *2 *3
2267 355 1245 112
1601 210 560 140
1465 165 570 150
2642 520 920 410
780 97 160 40
1345 173 420 65
1300 200 230 80
2080 192 950 110
3375 277 1360 224
2803 155 1280 224
2) Ghi bài vào thu mục đã tạo ở chương 1 theo dạng C:\tenthumuc\íenfiỉe.xls. Trong đó tenfile bao gồm “họ tên sinh viên, chương 4, bài số 6”