tiểu luận kinh tế lượng và dự báo: PHẦN I: THỰC HIỆN TRÊN EXCEL 1.1. THIẾT LẬP MÔ HÌNH HỒI QUI MẨU – MÔ TẢ DỮ LIỆU Ta có mô hình hồi qui mẩu có dạng: Yi = 1 + 2X2i + 3X3i + 4X4i + ei Yi = SUB: Số người thuê bao của mỗi hệ thống (nghìn người) X2i= HOME: Số nhà mà mỗi hệ thống cáp TV đi ngang qua (nghìn nhà) X3i = AIR: Số kênh truyền hính thu được X4i = AGE: Số tuổi của mỗi hệ thống (năm) 1.2. Phân tích kết quả thực nghiệm 1.2.1. Kết quả chạy mô hình từ Excel
Trang 1TL SỐ 9
Phần I : trên Excel
Sử dụng dữ liệu Data BT 2 trên Excel, dùng Regression trên Data Analysis để ước
lượng hàm hồi quy mẫu có dạng sau :
SUB = B1 + B2 * HOME + B3* AIR +B4* AGE
SUB số người thuê bao của mỗi hệ thống (nghìn người)
HOM
E Số nhà mà mỗi hệ thống cáp TV đi ngang qua (nghìn nhà)
AIR Số kênh truyền hính thu được
AGE Số tuổi của mỗi hệ thống (năm)
- Lập ma trận Correlation Matrix gồm cả biến phụ thuộc và tất cả các biền độc lập
- Ước lượng phương trình hồi quy dưới dạng như ở câu phần I
b/ Hãy kiểm định Wald ( biến thừa ) cho 3 biến độc lập nêu trên
c/ Từ mô hinh câu a phần II hãy kiểm định White và BG cho mô hình này
d/ Hãy dự báo giá trị trung bình và giá trị cá biệt số người thuê bao của hệ thống theo
mô hình sau:
SUB = C(1) + C(2)*AGE + C(3)*AIR + C(4)*HOME
Cho biết AGE = 25; AIR = 18; HOME = 360 (nghìn hộ )
Và độ tin cậy 1- = 95%
Biểu diễn trực quan đồ thị dự báo bằng cách vẽ đồ thị khoảng dự báo trung bình, dự báo
cá biệt, tương ứng với các cận trên và cận dưới theo số quan sát làm biến trên trục hoànhchung cho các đại lượng khác
BẢNG DỮ LIỆU ĐỂ LÀM BÀI TIỂU LUẬN (DATA BT2)
Trang 3ST
Trang 4PHẦN I: THỰC HIỆN TRÊN EXCEL 1.1 THIẾT LẬP MÔ HÌNH HỒI QUI MẨU – MÔ TẢ DỮ LIỆU
Ta có mô hình hồi qui mẩu có dạng: Yi = β 1 + β 2X2i + β 3X3i + β 4X4i + ei
Yi = SUB: Số người thuê bao của mỗi hệ thống (nghìn người)
X2i= HOME: Số nhà mà mỗi hệ thống cáp TV đi ngang qua (nghìn nhà)
X3i = AIR: Số kênh truyền hính thu được
X4i = AGE: Số tuổi của mỗi hệ thống (năm)
1.2 Phân tích kết quả thực nghiệm
1.2.1 Kết quả chạy mô hình từ Excel
Bước 1: Vào Data/Data Analysis/Regtesion/Ok (sẽ xuất hiện hộp thoại như hình bên
dưới)
Bước 2: (Các thao tác của bước này thể hiện cụ thể ở hình bên dưới)
- Tại mục Input Y Range: ta chọn tất cả các ô trong cột biến phụ thuộc (kể cả tênbiến)
- Tại mục Input Y Range: Ta chọn tất các các ô trong các cột của các biến giải thích(kể cả tên biến)
- Check vào mục Label
- Tại mục Output options: chọn Output Range và chọn vùng để xuất ước lượng hồi qui
Trang 5Bước 3: Bấm Ok (sẽ xuất hiện bảng như hình bên dưới)
Square
0.8618051
8 Standard
Intercept 12.869285 6.410971823 2.007384 0.052261 -0.13277 25.87134 -0.13277 25.87133841
HOME 0.4115021 0.030962654 13.29027 1.88E-15 0.348707 0.474297 0.348707 0.474297276
AIR
3.4618266
Trang 6Dựa vào bảng kết quả trên ta viết mô hình hồi quy mẫu số người thuê bao của mỗi
hệ thống có dạng:
SUB = 12,86928501 + 0,411502104* HOME - 3,46182666* AIR +
1,139738517*AGE + ei
Trong đó:
B1 = 12,86928501: Khi các biến HOME, AIR, AGE đồng thời bằng 0 thì số
người thuê bao trung bình của mỗi hệ thống SUB là 12,86928501 (nghìn người)
B2 = 0,411502104: Trong điều kiện các yếu tố khác không đổi khi số nhà của
mỗi hệ thống cáp tivi đi ngang qua tăng lên 1 nghìn người sẽ làm cho số ngườithuê bao trung bình của mỗi hệ thống tăng lên 0,411502104 (nghìn người)
B3 = - 3,46182666: Trong điều kiện các yếu tố khác không đổi khi số kênh
truyền hình thu được tăng lên 1 kênh thì số người thuê bao trung bình của mỗi hệthống giảm 3,46182666 (nghìn người)
B4 = 1,139738517: Trong điều kiện các yếu tố khác không đổi khi số tuổi của
mỗi hệ thống tăng lên 1 năm sẽ làm cho số người thuê bao trung bình của mỗi hệthống tăng lên 1,139738517 (nghìn người)
1.2.2 Giải thích một số ký hiệu
Bảng SUMMARY OUTPUT:
Regression Statistics: Hồi quy các số liệu thống kê
Multiple R = 0,934043: Hệ số tương quan R giữa biến phụ thuộc SUB và các
biến độc lập HOME, AIR, AGE
R Square = 0,872436 Hệ số xác định Trong 100% sự biến động của biến phụ
thuộc Y thì có 87,2436 % sự biến động là do các biến độc lập X ảnh hưởng, cònlại là do sai số hoặc các yếu tố khác ngoài mô hình
Adjusted R Square = 0,861805 : Hệ số R2 điều chỉnh Là hệ số xác định có tínhđến độ lớn hay nhỏ của bậc tự do
Standard Error= 12,46731: Sai số chuẩn của Y do hồi quy.
Observation= 40: Số quan sát hay dung lượng mẫu.
Trang 7Bảng phân tích phương sai ANOVA:
Regression: Do hồi quy, lượng biến thiên ESS
Residual: Do ngẫu nhiên, lượng biến thiên RSS
Total: Tổng cộng, lượng biến thiên TSS
D (Degree of freedom): Số bậc tự do ESS (3), RSS(36), TSS(39)
SS (Sum of Square): Tổng bình phương của mức động (sai lệch) giữa các giá trị
quan sát của Y (ký hiệu là Yi) và giá trị bình quân của chúng
MS (Mean of Square): Phương sai hay số bình quân của tổng bình phương sai
lệch kể trên
TSS ( Total Sum of Square)= 43865: Tổng bình phương của tất cả các mức sai
lệch giữa các giá trị quan sát Yi và giá trị bình quân của chúng
Do hồi quy Regression ESS (Explained Sum of Square)= 38269,39 là tổng bình
phương các sai lệch giữa các giá trị của biến phụ thuộc Y nhận được từ hàm hồiquy mẫu (ký hiệu Y*
i) Độ lớn của ESS phản ánh mức độ giao động của các giátrị cá biệt của mô hình với giá trị trung bình mẫu hàm hồi quy
Do ngẫu nhiên Residual RSS (Residual Sum of Square) = 5595,615 là tổng bình
phương của tất cả các sai lệch giữa các giá trị quan sát của Y (Yi) và các giá trịnhận được từ hàm hồi quy Ta có thể kiểm tra chéo như sau:
TSS = ESS + RSS
R2 = ESS/ TSS
SD2 = Var = MSS of RSS
F= 82,07009 : Trị số F-Fisher dùng làm căn cứ để kiểm định độ tin cậy về mặt
khoa học (thống kê) của toàn bộ phương trình hồi quy
Residual (cột MS) =155,4337: Trị số sigma ước lượng bình phương.
t Stat: Tiêu chuẩn t dùng làm căn cứ để kiểm định độ tin cậy về mặt khoa học của
mối liên hệ giữa biến độc lập với biến phụ thuộc
• β1/SE(β1) = 2,00738443
• β2/SE(β2) = 13,2902723
• β3/SE(β3) = -3.33645122
• β4/SE(β4) = 2,78367645
P-value: Xác suất để tkd> t Stat, là các trị xác suất tiêu chuẩn tới hạn
Coefficients: Hệ số chặn và các hệ số hồi quy riêng.
Standar Error: độ lệch chuẩn của các hệ số hồi quy
Trang 8R Square = R 2 = 0,872436 ≈ 87,2436% Nghĩa là trong 100% sự biến động của biến
phụ thuộc SUB thì có 87,2436% sự biến động là do các biến độc lập ảnh hưởng, còn lại là
do sai số ngẫu nhiên hoặc các các yếu tố khác ngoài mô hình
F = Fkd = 82,07009469 > Fα(k-1,n-k) = F0,05(4-1,40-4) =2,866266
Ta đi tìm Fα(k-1,n-k) bằng hàm FINV với cú pháp: =FINV(probability, deg_freedom1,
deg_freedom2)
Trong đó: probability là mức ý nghĩa, deg_freedom1 và deg_freedom2 là các số bậc
tự do thứ nhất (k-1) và thứ hai (n-k) (với k là số biến độc lập và n là số quan sát của môhình)
Thực hiện hàm trong Excel: = FINV(0.05,3,36) cho F0,05(4-1,40-4)
- Bật phần mềm Eviews 8, Xuất hiện hộp thoại để chọn file dữ liệu cần chuyển đổi
- Ta chọn Open a Foreign file (Such as Excel) (như hình bên dưới).
Trang 9Tại đây, ta chọn đường dẫn chứa dữ liệu, và địa chỉ giới hạn dữ liệu cần lấy.
Tiếp tục Next -> Finish, sau đó lưu lại với tên DATA TL9 (ta được workfile
để làm như hình bên dưới)
Trang 102.2 Lập bảng tham số thống kê của các biến độc lập và vẽ đồ thị
2.2.1 Lập bảng tham số thống kê
Chọn các biến giải thích, Clik chuột phải vào vùng đã chọn và chọn Open/asGroup
Trang 11Sẽ xuất hiện bảng dữ liệu như hình bên dưới
Vào View > Descriptive Stats > Common Sample
Trang 12Ta có bảng thống kê như hình bên dưới:
là 350 và giá trị nhỏ nhất là 1,7 qua đó có thể kết luận được, biến HOME trongcác quan sát không có mức độ tương đồng cao mà rải rác ở nhiều giá trị khácnhau
Trang 13Thứ hai, độ lệch chuẩn của biến AIR = 2,238217 khá cao so với giá trị trung bìnhcủa biến AIR = 6,375 cho thấy trong các quan sát không có mức độ tương đồngcao mà rải rác ở nhiều giá trị khác nhau.
Tương tự, độ lệch chuẩn của biến AGE = 5,423340 cũng khá cao so với giá trịtrung bình của biến AGE = 8,56675 nên trong các quan sát không có mức độtương đồng cao mà rải rác ở nhiều giá trị khác nhau
Vẽ đồ thị các biến độc lập trên cùng một bảng
Vào View > Graph… (như hình bên dưới)
Xuất hiện hộp thoại Graph Options, tại đây ta chuyển đổi giữa các Tab để thiết lập các mục để có được biểu đồ theo ý muốn, sau đó nhấn OK.
Trang 14Ở đây chọn kiểu đồ thị là Distributationvà để xuất hiện tất cả trên cùng một bảng
ở mục Multiple series chọn Multiple graphs→ OK:
Trang 15Nhìn vào đồ thị trên ta thấy tần suất của biến phụ thuộc SUB và các biến độclập HOME, AIR, AGE không chênh lệch nhau nhiều trong đó biến AGE là tươngđối tuân theo phân phối chuẩn Ta lần lượt kiểm tra từng biến để xem xét quy luậtphân phốn chuẩn của chúng.
Vẽ đồ thị cho từng biến độc lập
Thực hiện thống kê mô tả cho biến HOME: Từ hộp lệnh của Eviews 8 ta gõ
Hist home và nhấn Enter trên bàn phím.
Nhận thấy Probability = 0.0000000< α = 0.05 nên ta kết luận, biến HOME không
có phân phối chuẩn
Trang 16Thực hiện thống kê mô tả cho biến AIR: Từ hộp lệnh của Eviews 8 ta gõ Hist AIR và nhấn Enter trên bàn phím.
Nhận thấy Probability = 0.001922< α = 0.05 nên ta kết luận, biến AIR không có
phân phối chuẩn
Thực hiện thống kê mô tả cho biến AGE: Từ hộp lệnh của Eviews 8 ta gõ Hist AGE và nhấn Enter trên bàn phím.
Nhận thấy Probability = 0.075598 > α = 0.05 nên ta kết luận, biến AGE có phân
phối chuẩn
Trang 172.2.3 Lập ma trận Correlation gồm cả biến phụ thuộc và tất cả các biến độc lập
Mở các biến ở chế độ as Group:
Vào View > Covariance Analysis…
Xuất hiện hộp thoại Covariance Analysis > Tại mục Statistics chọn Correlation.
Ta có ma trận Correlation Matrix:
Nhận xét:
Quan sát ta thấy biến độc lập HOME giải thích tốt nhất cho biến SUB với90.34%
Biến độc lập AGE giải thích tương đối tốt cho biến SUB với 48%
Biến AIR giải thích không tốt lắm cho biến SUB với 28.65%
Mức tương quan giữa biến HOME và biến AGE, AIR tương đối khá lớn lần lượt
là 39,99%; 48,16% Trong đó, đáng quan tâm nhất lá mức tương quan giữa biếnHOME và AIR với 48,16%, do đó mô hình có thể xảy ra hiện tượng cộng tuyếngiữa hai cặp biến HOME – AIR và HOME – AGE Để kiễm tra xem 2 cặp biếnnày có khả năng xảy ra hiện tượng công tuyến hay không ta cần chạy mô hình hồiqui phụ cho từng cặp
Trang 18Chạy mô hình hồi quy phụ cho biến HOME với biến AGE
Từ màn hình workfile ta chọn biến phụ thuộc HOME rồi biến AIR, xong ta Double
click chuột trái, chọn Open Equation→OK
Ta thấy Prob(F-statistic) = 0,001652 <α = 0,05 nên ta kết luận mô hình hồi quy
phụ này tồn tại Vậy, thực sự có hiện tượng cộng tuyến giữa 2 biến
R-squared = 0.231961 ≈ 23,1961% cho thấy sự thay đổi của biến này do biến kiagiải thích, sự cộng tuyến giữa 2 biến độc lập này là không cao nhưng không thực sựtốt cho mô hình
Trang 19Chạy mô hình hồi quy phụ cho biến HOME với biến AGE
Từ màn hình workfile ta chọn biến phụ thuộc HOME rồi biến AGE, ta nhấn Double
click chuột trái, chọn Open Equation→OK
Ta thấy Prob(F-statistic) = 0.010569 <α = 0,05 nên ta kết luận mô hình hồi quy
phụ này tồn tại Vậy có hiện tượng cộng tuyến giữa 2 biến
R-squared = 0.159917 ≈ 15,9917% cho thấy sự thay đổi của biến này do biến kiagiải thích, sự cộng tuyến giữa 2 biến độc lập này là không cao nhưng không thực sựtốt cho mô hình
Trang 202.2.4 Ước lượng phương trình hồi quy
Từ workfile có chứa các biến, ta đánh dấu để chọn các biến: biến phụ thuộcSUB, rồi biến HOME, AIR, AGE, ta nhấn Double click chuột trái, chọn OpenEquation→OK
Ta được kết quả ước lượng hồi qui các biến như hình bên dưới
Trang 21Mô hình hồi quy mẫu: Yi = β1 + β2*X2i + β3*X3i + β4*X4i + ei
Vậy ta suy ra mô hình hồi qui có dạng như sau:
Yi = 12,86929 + 0,411502*HOME – 3,461827*AIR + 1,139739*AGE+ ei
Kiễm định sự phù hợp của phương trình hàm hồi qui trên
Từ cửa sổ Eviews 8, ta gõ scalar f=@qfdist(0.95,3,36) để tìm Fα(k-1,n-k)
Nhận xét:
Hệ số xác định R 2 = 0,872436 nghĩa là mô hình giải thích tương đối tốt sự thay
đổi của biến phụ thuộc SUB
Giá trị kiểm định F-statistic = 82,07009 > Fα(k-1,n-k) = 4)=2,866266 nên mô hình kiểm định hợp lý.
F0,05(4-1,40- Giá trị P-value của các biến giải thích đều nhỏ hơn 0,05 nên độ phù hợp của các
biến độc lập là rất tốt, Ta có thể kết luận được rằng: mô hình này phù hợp ở
mức độ tốt
Trang 222.3 Kiểm định Wald
2.3.1 Kiểm định Wald đồng thời
Với một mô hình bất kỳ, khi chúng ta đưa các biến độc lập vào chúng ta cầnkiểm tra sự có mặt của biến đó nó có gây ảnh hưởng tốt hay xấu cho mô hình.Trước tiên ta tiến hành kiểm định đồng thời cho tất cả các biết
Tại cửa sổ Equation, ta vào View -> Coeficient Diagnostics -> Wald Test –
Trang 23Nhận xét:
Giả thiết: H0: β2=β3=β4=0
Giả thiết đối: có ít nhất một trong các hệ số: β2, β3, β4 ≠ 0
Dựa vào bảng kết quả trên, ta thấy giá trị Probability của F-statistic là
0,00000<0,05
Vậy: Bác bỏ giả thiết H 0: nghĩa là các biến giải thích HOME, AIR, AGE đồng
thời ảnh hưởng đến biến phụ thuộc SUB
Lưu ý: Để chắc chắn rằng các biến độc lập đưa vào có gây ảnh hưởng xấu cho mô hình không, chúng ta cần tiến hành kiểm định cho từng biến độc lập.
2.3.2 Kiểm định Wald cho từng phần riêng lẻ
2.3.2.1 Kiểm định Wald với biến HOME
Tại cửa sổ Equation, ta vào View -> Coeficient Diagnostics -> Wald Test –
Coeficient Restrictions…
Hộp thoại Wald Test xuất hiện, gõ C(1)=0 Nhấn OK
Trang 24Nhận xét:
Giả thiết: H0: β2=0
Giả thiết đối: β2 ≠ 0
Dựa vào bảng kết quả trên, ta thấy giá trị Probability của F-statistic là
0,00000<0,05
Vậy: Bác bỏ giả thiết H 0: nghĩa là các biến giải thích SQFT đưa vào mô hình là
hợp lý
2.3.2.2 Kiểm định Wald với biến AIR
Tại cửa sổ Equation, ta vào View -> Coeficient Diagnostics -> Wald Test –
Coeficient Restrictions…
Hộp thoại Wald Test xuất hiện, gõ C(2)=0 Nhấn OK
Nhận xét:
Giả thiết H0: β3=0
Giả thiết đối: β3 ≠ 0
Dựa vào bảng kết quả trên, ta thấy giá trị Probability của F-statistic là
0,0020<0,05
Vậy: Bác bỏ giả thiết H 0 : nghĩa là các biến giải thích AIR đưa vào mô hình là
hợp lý
Trang 252.3.2.3 Kiểm định Wald với biến AGE
Tại cửa sổ Equation, ta vào View -> Coeficient Diagnostics -> Wald Test –
Coeficient Restrictions…
Hộp thoại Wald Test xuất hiện, gõ C(3)=0 Nhấn OK
Nhận xét:
Giả thiết: H0: β4=0
Giả thiết đối: β4 ≠ 0
Dựa vào bảng kết quả trên, ta thấy giá trị Probability của F-statistic là
0,0085<0,05
Vậy: Bác bỏ giả thiết H 0 : nghĩa là các biến giải thích AIR đưa vào mô hình là
hợp lý
Kết luận chung: Qua việc thực hiện kiểm định Wald cho đồng thời 3 biến,
rồi lần lượt cho từng biến, ta nhận thấy cả 3 biến HOME, AIR, AGE đều cần thiếtcho mô hình
Trang 262.3.3 Kiểm định White và kiểm định BG cho mô hình
2.3.3.1 Kiểm định White
Mục đích của kiểm định White là để kiểm tra phương sai có thay đổi không
Từ cửa sổ kết quả ước lượng mô hình hồi quy, vào View -> Residual ->
Heteroskedasicity Test.
Xuất hiện hợp thoại Heteroskedasicity Test Tại mục Test type chọn White.
Check vào Incule White cross terms
Nhấn OK, ta được kết quả:
Từ cửa sổ Eviews 8 nhập Scalar cbp=@qchisq(0.95,9) đề tìm
Trang 27Mô hình phụ trên có dạng:
= α1 + α2HOME 2 + α3HOME*AIR + α4HOME*AGE+ α5 HOME + α6AIR 2 +
α7AGE*AIR+ α8AIR+ α9AIR*AIR + AGE 2 + α10AGE + Vi
Giả thiết: H0: α2= α3=α4 = α5 = α6 = α7 = α8 = α9= α10 = 0
Giả thiết đối: Có ít nhất một trong các hệ số αI ≠ 0
Từ bảng trên ta thấy:
Obs*R-Squared = nR 2 = 35.73754 >(9) = 16.91898
Ngoài ra, Prob Chi-Square (9) của Obs.R-Square có giá trị là 0,0000< 0,05,
ta bác bỏ giả thiết H 0, nghĩa là mô hình hồi quy xảy ra hiện tượng phương sai thayđổi
Lưu ý: Để khắc phục hiện tượng phương sai thay đổi, ta dùng phương pháp FGL để hồi quy lại phần dư sau đó kiểm định lại phương sai để giảm tối đa
phương sai thay đổi
2.3.3.2.Kiểm định BG
Mục đích của kiểm định BG đẻ kiểm định hiện tượng tự tương quan
Từ cửa sổ kết quả ước lượng mô hình hồi quy, vào View -> Residual
Diagnostics -> Serial Correlation LM Test.
Trong cửa sổ này, ở mục Lags to include – ta chọn giá trị 2→OK Ta được
bảng kết quả kiểm định như sau: