5. Q UY TRÌNH PHÂN TÍCH HÔI Q UY TRONG EXC EL
5.2. Phân tích hồi quy bội trong Excel
Ước lư ợ ng các th a m số củ a m ô hình hồi q u y bội
Trong Excel có hàm LINEST để ước lượng các tham số của mô hình hồi quy bội tương tự như chức năng của hàm S L O P E và hàm IN T E R C E P T . Cú pháp cùa hàm L IN E S T như sau:
-L IN E ST (know n_y ’s; [known x ’sỊ; [constj [statj) (CSE) Trong đó:
Known_y’s: vùng địa chì chứa biến phụ thuộc y.
K n o w n _ x ’s: v ù n g đ ịa chỉ ch ứ a các b iến đ ộ c lập X | , X | ( .
Const: hằng số để chọn mô hình hồi quy. N ếu const = 1 (TRUE- mặc định) thì Po có mặt trong mô hình hồi quy. N ếu const = 0 (FALSE) thì bò qua Po (Po =0).
Stat: tùy chọn để hiển thị các tham số thống kê. N ếu stat =1 (TRUE, mặc định) thì tính toán các tham số thống kê. N ếu stat = 0 (FALSE) thì không tính các tham số này.
Kiểm định các tham sổ hồi quy
Kết quả trả về là m ột m a trận có số cột tùy thuộc vào số biến độc lập của m ô hình hồi quy. Hình 4.13 minh họa ma trận kết quả của L inest với const =1 và stat = 1.
À B c 0 r Ư W ' T
1 mn mn-1 T T T m2 m<| b
2 s e n s e n-1 s e 2 se-Ị _ s e b
3 r 2 s e v I
4 F df
5 s s re g s sre s id L__________
H ìn h 4.13. Kết quả trả về từ hàm Linest.
Trong đó:
mn, m i, b: các hệ số Pk, Pk-1, ..,Pi, Po của m ô hình hồi quy.
sen, sen-i,~, sei, seb: sai số chuẩn cùa các hệ số tương ứng.
ĩj. hệ số tương quan bội R2.
sey: sai số của hàm hồi quy.
F: giá trị kiểm định F.
df: bậc tự do cùa hồi quy; d f = n-k nếu const = 0; d f = n-k-1 nếu const =1.
ssreg: tổng bình phương sai lệch do hồi quy (Sum o f Square Regression).
ssresid* tồng bình phương các sai lệch do ngẫu nhiên (Sum o f Square Residual).
Ví dụ 4.5
Có thống kê về số lượng ô tô bán được (y), giá xăng (X|), sự tăng dân so ( X2) , và số lượng đường giao thông được xây dựng trong 15 năm. Già thiết có quan hệ tuyến tính giữa y và Xj. Hãy ước lượng các hệ số của hàm hồi quy.
Năm
Số xe bán được (nghìn chiếc)
Giá xăng (Slgalon)
Sự tăng dân số (triệu
người)
Sổ con đường mới
1 159 1,62 55 12
2 160 1,667 56 13
3 163 1,69 58 14
4 166 1,7 60 15
5 167 1,72 63 17
6 167 1,73 65 18
7 168 1,736 66 18
8 167 1,74 66,7 18
9 167,9 1,75 66,9 19
10 168.9 1,755 67,4 19
11 169 1,756 67,9 19
12 169 1,77 68 20
13 170 1,767 68,5 18
14 171 1,756 68,8 17
15 172 1,77 68,9 18
Hình 4.14 "trình bày cách nhâp dữ liệu và kết quả ước lượng các tham số cùa hàm hồi quy mẫu.
Yl *1 x2
nâm
Số xe bán được (nghìn
giá xăng (í/galon)
sự tăng dân số (tr
Số con
đu-ờnq mới
beta3 beta 2 betal beta 0
159 1 62 55 12
160 1 667 56 13 _______ ____________________
44.11072 ---
163 1 69 58 14 -0.63072 0 53354 57.41194
166 1.7 60 15
p p 11 0.225274 25.49001 0.966743 #N/A
31.70179
miA
167 1 72 63 17
167 1 73 65 18______ .65.31787 11 #N/A #N/A ---
167 1 74 66.7 18 —- - 4 -!“-...— 4... -
167.9 1 75 66.9 19 Hàm hòi q1 ... .
1 1 169 1 756 67 9 19 ■■■ Ị""' ... ... -Ị— -■■■■
1 2 169 1 77 68 20Côngthứq
13 170 1.767 68.5 18 S G S& Ĩ^U N E S T íE B iB Ư .C aiE I/.l.l)
i 1 í
14 171 1.756 60.8 17
15 172 1 77 68 9 18 .
H ình 4.14. Kết quả ước lượng tham sổ cùa hồi quy bội bằng hàm Linest.
S ử d ụ n g tr ìn h R egression để p h ân tích hồi q u y bội
Quy trình sử dụng trình R egression để phân tích hồi quy bội trong Excel giống như quy trình phân tích hồi quy đơn. Hình 4.15 hiển thị kết quả hồi quy và các tham số thống kê để phân tích phương sai, kiểm định giả thuyết đối với số liệu trong ví dụ 4.5.
Như có thể thấy trong kết quà hồi quy phản ánh trong Hình 4.15, Significance F = 2,7E-07 < a =0,05 nên mô hình hồi quy chấp nhận được. Giá trị P -v a lu e của Po và P3 > a nên các hệ số này không có ý nghĩa khi m ở rộng hàm hồi quy. Kết quả hàm hồi quy là:
y = 57,41 X| + 0,53 X2
5.3. P h â n tíc h hồi q u y phi tuy ến tro n g Excel
N hư đã nêu trong mục 4, các hàm hồi quy phi tuyến nếu có thể tuyến tính hóa được thì sử dụng các kỹ thuật hồi quy tuyến tính đã nêu để ước lượng các tham số hồi quy và kiểm định mô hình hồi quy.
Trong Excel cung cấp hàm L O G E S T để uớc lượng các tham số của hàm hồi quy m ũ y = b m l’1|m 2xỉ...mnx" . Cú pháp và cách diễn giải kết quả cùa L ogest như cú pháp và cách diễn giải kết quả của L inest.
Người ta nghiên cứu mối tương quan giữa đại lượng Y và các nhân tố X |, X2, X3, X4 theo quan hệ Y= a .X |blX2b2X3b3X4b4. Hãy sử dụng các số liệu sau đây để xây dựng hàm số cần nghiên cứu với độ tin cậy 95%.
Ví dụ 4.6
Y 34 34 35 36 33 38 31 37 32 39 36
X , 12 12,5 12,5 12,8 11 14 13 12,7 12,6 14 13
x 2 8,1 8,1 8,2 8,3 7 8,8 7,5 8 7,4 8,9 8,1
x3 5 5 5 6 6 6 7 7 7 6,5 6,4
X4 4,3 4,3 4,5 4,6 4 4,6 4 4.8 4,1 4,9 4,5
SUMMARY OUTPUT Regression Statistics Multiple R 0.973061
R Square 0.946848
Adjusted R Square 0.932352 Standard Error 0.966743
Observations 15
ANOVA
df s s MS F •qniiicance F
Regression 3 183.1368 61.0456 65 31787 2.7E-07
Residual 11 10.28052 0 934593
Total 14 193.4173
CoefficientSandard Err Í Slat P-value Lower 95%Upper 95%J Intercept 44 11072 31.70179 1.391427 0.191595 -25 6644 113.8859 (X1) 57 41194 25.49001 2 252331 0 045703 1-308802 113.5151 (x2) 0.53354 0.225274 2 36841 0.037256 0.037716 1 029364 (*3) -0.63072 0.315223 -2 00087 0 0 7 0 6 9 8 -1 32452 0 063081
H ình 4.15. Kết quà hồi quy sử dụng Regression với số liệu trong ví dụ 4.5.
Logarit hóa hai vế như trong Hình 4.16 thu được hàm hồi quy mẫu theo dạng:
In Y = In a + b |ln X | + b2ln x 2 + b3ln X3 + b4 In X4
Sử dụng trình cài thêm Regression để ước lượng các tham số hồi quy, kết quả trả về như trong Hình 4.17. Độc giả có thể tự kiểm định sự phù hợp của mô hình và kiểm định mức ý nghĩa của các tham số của mô hình.
6. D ự BÁ O K IN H T Ế
Dự báo là phán đoán những sự kiện sẽ xảy ra trong tương lai trên cơ sở phân tích khoa học các dữ liệu của quá khứ và hiện tại nhờ một số mô hình toán học. D ự báo kinh tế là việc đưa ra các dự báo những sự kiện kinh tế sẽ xảy ra trong tương lai dựa trên cơ sở phân tích khoa học các số liệu kinh tế cùa quá khứ và hiện tại. Tùy theo tầm của dự báo người ta phân thành dự báo dài hạn, dự báo trung hạn, dự báo ngắn hạn. Theo kết quả dự báo phân chia thành dự báo định tính và dự báo định lượng.
Các phương pháp dự báo hay sử dụng phương pháp hồi quy tương quan, phương pháp ngoại suy thống kê.
f ĩ
■ M B ■ H . E F G H J MễắẼM
Y X i x 2 x 3 X4 InY lnX1 lnX2 lnX3 lnX4
__
34 12 8.1 5 4 3 3 .5 2 6 4 2 4 8 4 9 2.0SL19 1 .6 0 9 4 1 .4 5 8 6
F I 34 1 2 5 8 1 5 4 3 3 .5 2 6 4 2 5 2 5 7 2 .0 9 1 9 1 .6 0 9 4 1 .4 5 8 6
n 35 12.5 8.2 5 4 5 3 .5553 2 5 2 5 7 2 .1 0 4 1 1 .6 0 9 4 1 .5 0 4 1
36_____ 12.8 8.3 6 4 6 3 5 8 3 5 2 5 4 9 4 2 .1 1 6 3 1.7918 1 .5 2 6 1
v ì 33 11 7 6 4 3.4965 2 3 9 7 9 1 .9 4 5 9 1 .7 9 1 8 1 .3 8 6 3
38 14 8.8 6 4 6 3 6 3 7 6 2 6 3 9 1 2 1 7 4 8 1 .7 9 1 8 1 .5 2 6 1
31 13 7.5 7 4 3.434 2 5 6 4 9 2 .0149 1 .9 4 5 9 1 3 8 6 3
37 12.7 8 7 4 8 3 .6 1 0 9 2 5 4 1 6 2 .0 7 9 4 1 .9 4 5 9 1 5 6 8 6
0
32 12.6 7.4 7 4 1 3 .4 6 5 7 2 5 3 3 7 2.0015 1 .9 4 5 9 1 4 1 1
39 14 8.9 6.5 4 9 3 .6 6 3 6 2 6 3 9 1 2 .1 8 6 1 1 .8 7 1 8 1 5 8 9 2
B Ẻ36 13 8.1 6.4 4 5 3 5 8 3 5 2 5 6 4 9 20919 1 .8 5 6 3 1 .5 0 4 1
H ìn h 4.16. Logarit hóa để chuyển hàm CD thành hàm tuyến tính..
Regression Statistics ---
M ultiple R 0 .9 5 9 0 8 8 8 5 8 R S q u a re 0 .9 1 9 8 5 1 4 3 7 Adjusted R Square 0 .8 6 6 4 1 9 0 6 2 S ta n d a rd E rror 0.026098779
O b s e rv a tio n s 11
A N O V A
df s s MS F Significance F
R e g re s s io n 4 0.0469044 0 .0 1 1 7 2 6 1 7 .2 1 5 2 5 0 .0 0 1 9 3 5 6 3 6
R e s id u a l 6 0.004086878 0 .0 00 6 81
T o tal 1 0 D.050991277 I
CoefficientsStandard Error í S ia i P-value Lơ*er95% Upper 95%
In terce p t lnX1 lnX2
2 .0 3 9 7 3 8 1 4 6 0 .3 2 3 3 2 7 9 4 1 6 .3 0 8 5 7 4 0 .0 0 0 7 4 1.248583176 2.030093 -0.68929079
1.061019785
0 .5 5 8 6 4 9 9 5 1 0.798356798
-1.23395 1 3 2 9 0 0 5
0.263394 0.232149
-2.056257971 0.677676 -0 692488923 3.014528 -0.26078684 D.686215
lnX3 0 .2 1 2 7 1 3 9 4
0.454850848
0.193509538 1 .0 9 9 2 4 3 0 . 3 1 3 8 0 1
llnX4 Ũ.412545789 1 .1 0 2 5 4 6 0 .3 1 2 4 7 3 -0 .5 5 4 6 1 2 3 3 1 .4 6 4 3 1 4
H ìn h 4.17. Kết quả hồi quy với dữ liệu trong hình 4.16.
6.1. D ự báo b ằn g p h ư ơ n g p h á p hồi q u y tư o n g q u a n
Sau khi kiểm định và đánh giá m ô hình hồi quy, người ta thay các giá trị của các biến độc lập vào phương trình hồi quy để dự báo.
V í d ụ 4.7
Sử dụng các số liệu của Ví dụ 4.3
Tháng 1 2 3 4 5 6 7 8 9 10 11 12
G iá trị s ả n x u ất (triệu USD)
4,51 3,58 4,31 5,06 5,64 4,99 5,29 5,83 4,71 5,61 4,91 4,19
Điện n ăn g tiêu
thụ (triệu KWh)
4,28 2,26 2,47 2,77 2,99 3,05 3,18 3,46 3,03 3,26 2,67 2,53
Hãy dự báo giá trị sản xuất nếu chi phí điện năng là 3,2 triệu Kwh.
Từ kết quả hồi quy trong mục 5.1, phương trình hồi quy là y = l,61x. Thay X = 3,2 vào phưcmg trình tính được y = 5,15 (triệu USD).
Ví dụ 4.8
Sử dụng số liệu trong Ví dụ 4.5. Hãy dự báo số xe bán được khi giá xăng là $2/gallon và dân số tăng 70 nghìn.
Năm S ố xe bán (nghìn ch iếc)
G iá xăng ($/galon)
S ự tăng dân s ổ (nghìn ngirời)
S ố c o n đ irò n g m ớ i
1 159,0 1,620 55,0 12
2 160,0 1,667 56,0 13
3 163,0 1,690 58,0 14
4 166,0 1,700 60,0 15
5 167,0 1,720 63,0 17
6 167,0 1,730 65,0 18
7 168,0 1,736 66,0 18
8 167,0 1,740 66,7 18
9 167,9 1,750 66,9 19
10 168,9 1,755 67,4 19
11 169,0 1,756 67,9 19
12 169,0 1,770 68,0 20
13 170,0 1,767 68,5 18
14 171,0 1,756 68,8 17
15 172,0 1,770 68,9 18
Phương trình hồi quy sau khi đã kiểm định (mục 5.2) là y = 57,41xi + 0,53x2.. Thay các giá trị Xi = 2, X2 = 70 vào phương trình, được y = 152,17 (nghìn chiếc).
Trong Excel có m ột số hàm giúp có thể dự báo nhanh không cân phải ước lượng các tham số cùa hàm hồi quy và không cần phải kiếm định mức độ phù hợp của phương trình hồi quy cũng như giả thuyết về sự tồn tại của các tham số hồi quy. Các hàm đó bao gồm F o recast, Trend, Growth.
D ự báo n h a n h s ử d ụ n g các h àm tuyến tín h H àm F O R E C A S T
Hàm FORECA ST dự báo theo phương pháp hồi quy tuyến tính đơn theo cú pháp sau:
Ị =FORECAST(x; know n_y’s; know n_x’s) Trong đó:
x: giá trị của biến độc lập X dùng để dự báo.
known_y: các giá trị quan sát của biến phụ thuộc y.
known_x: các giá trị quan sát của biến độc lập X .
Ví dụ 4.9
Sử dụng số liệu của Ví dụ 4.3. Dùng F O R E C A S T để dự bá giá trị sản xuất khi m ức tiêu thụ điện năng là 3.2 triệu Kwh.
Hình 4.1 trình bày cách nhập dữ liệu và sử dụng hàm FO R E C A ST . Hàm TREND
Hàm T R E N D dự báo theo phương pháp hồi quy tuyến tính với cú pháp sau:
=TREN F(known_y’s; knoyvn x ’s; new_x; [const]) Trong đó:
Const: tùy chọn mô hình hồi quy. Nếu const = 1 (TR U E - mặc định) thì hồi quy có tính cả hệ số Po- N ếu const = 0 (FA LSE) thì bỏ qua hệ số Po- Các tham số khác tương tự như hàm FORECA ST.