2/ Tuyển lọc lại từ tập hợp các biến giải thích để chọn biến phù hợp đưa vào mô hình hồi quy mới kiểm định Wald, kiểm định F-sự phù hợp mô hình, tính các hệ số hồi quy chuẩn hóa.. 3/ Tiế
Trang 1Trang 2
ĐỀ TIỂU LUẬN SỐ 05 MÔN HỌC : ỨNG DỤNG PHẦN MỀM EVIEWS TRONG NGHIÊN CỨU
Từ dữ liệu : DATA-01
Đề xuất lập mô hình hồi quy theo dạng sau:
SUB = C(1) + C(2)*HOME + C(3)*INST + C(4)* TV +C(5)*AGE + C(6)*AIR + C(7)*Y +ei
Trên đây là dạng mô hình chưa phù hợp và chưa hoàn chỉnh Bằng lý thuyết kinh
tế lượng và phần mềm EVIEWS ứng dụng đã học, anh chị hãy thực hiện các nôi dung sau đây:
1/ Lập ma trận tương quan và phân tích các mối quan hệ
2/ Tuyển lọc lại từ tập hợp các biến giải thích để chọn biến phù hợp đưa vào mô hình hồi quy mới (kiểm định Wald, kiểm định F-sự phù hợp mô hình, tính các hệ số hồi quy chuẩn hóa.)
3/ Tiến hành kiểm tra sự vi phạm các gỉa thiết hồi quy cổ điển (kiểm định Jarque bera về phân phối chuẩn cho phần dư, kiểm định tính chất đa cộng tuyến, kiểm định tính chất phương sai thay đổi,kiểm định Durbin-Watson hoặc BG)
4/ Hãy tiến hành dự báo khoảng giá trị trung bình và cá biệt của tổng thể theo mô hình hồi quy phù hợp vừa chọn như ở câu 2 với các gíá trị biến giải thích cho trước như sau:
Trang 3- SUB : số người thuê bao cho mỗi hệ thống (nghìn thuê bao): 1-170
- Home: số nhà mỗi hệ thống đi qua (nghìn): 1,7-350
- Inst: Phí lắp đặt tính bằng USD: 5,6-10
- Tv: Số kênh truyền hình được mỗi hệ thống tải đi: từ 6-22
- Age: Tuổi mỗi hệ thống tính bằng số năm: 0,17-26
- Air: số kênh truyền hình thu được: từ 4-13
Trang 4Trang 5
- Y: thu nhập bình quân đầu người của mỗ thị trường cáp TV tình USD: 7.686-11.741
- SVC: phí dịch vụ hàng tháng đối với hệ thống: 5,6-10
Trang 5Trang 6
THỰC HÀNH TRÊN EVIEW 9 PHẦN 1: Lập ma trận tương quan và phân tích các mối quan hệ
Tiến hành copy dữ liệu từ file excel sang Eview, chọn Past as new workfile, chọn finish ta được workfile như sau:
Chọn lần lượt các biến: sub, home, inst, age, air, y, svc và mở ở dạng group như sau:
Trang 6Trang 7
Ta được kết quả sau:
Trang 7Trang 8 Vào View => chọn Covariance Analysis… ta được kết quả sau:
Chọn mục Correlation => OK ta được:
Trang 8Trang 9
Phân tích các mối quan hệ :
- Biến Home giải thích tốt nhất cho biến phụ thuộc Sub Biến Age, biến
TV và biến SVC giải thích khá cho biến phụ thuộc Sub Các biến Inst, Air và Y giải thích yếu cho biến phụ thuộc Sub
- Ta thấy có sự tương quan khá cao giữa biến Home với các biến TV, biến Age, biến Air và biến SVC Giữa biến TV với các biến Air và SVC Giữa biến Age và biến Y Giữa biến Air, biến Y và biến SVC Có thể xảy ra hiện tượng
đa cộng tuyển giữa các biến này
Trang 9Trang 10
PHẦN 2 : Tuyển lọc lại từ tập hợp các biến giải thích để chọn biến phù hợp đưa vào mô hình hồi quy mới (kiểm định Wald, kiểm định F-sự phù hợp
mô hình, tính các hệ số hồi quy chuẩn hóa.)
2.1 Mô hình hồi quy
Mở các biến ở dạng Equation ta có được mô hình hồi quy như sau :
Mô hình hồi quy có dạng :
SUB = C(1) + C(2)*HOME + C(3)*INST+ C(4)*TV + C(5)*AGE + C(6)*AIR + C(7)*Y +ei
Vào View chọn Representations
Trang 10Trang 11
Ta viết lại được như sau:
SUB = 0.405549*HOME - 0.52642*INST + 0.7565078*TV + 1.193511*AGE - 5.111142*AIR + 0.001655*Y + 2.038732*SVC - 6.8077256
Trên cửa sổ làm việc của Eview ta gõ: scalar f=@qfdist(0.95,7,33) để tìm Fα = 1,n-k) Ta được kết quả là F(k-1,n-k) = 2.303
Trang 11Trang 12
- Độ lệch chuẩn SE of regression = 12.40453
- Giá trị P-value của các biến Home, Air, Age nhỏ hơn α=0,05 cho thấy các biến độc lập tham gia giải thích cho biến phụ thuộc SUB khá tốt P-value của các biến Inst,
Từ mô hình hồi quy : Vào View => Coefficient Diagnostic => Wald Test - Cofficient Restrictions…
Xuất hiện hộp thoại Wald Test dưới đây và nhập vào hộp thoại cú pháp : C(1)=C(2)=C(3)=C(4)=C(5)=C(6)=C(7)=0
Trang 12Trang 13 Bấm OK ta được kết quả sau:
Trang 13Trang 14
Nhận xét:
Trên bảng ta thấy Probability của F-statistic = 0,0000<0,05 (mức ý nghĩa α=5%), bác bỏ giả thiết H0 tức là các biến Home, Inst, Tv, Air, Age, Y, SVC đều ảnh hưởng đến biến phụ thuộc Sub
2.2.1 Kiểm định Wald với biến HOME
Nhập vào hộp thoại Wald Test: C(1)=0, ta có kết quả sau:
Trang 14Trang 15
Nhận xét: Ta thấy P-value (Probabiltity của F-statistics) = 0,0000<0,05 (mức ý
nghĩa 5%) > Bác bỏ giả thiết H0, tức là biến Home đưa vào mô hình là hợp lý
2.2.2 Kiểm định Wald với biến INST
Nhập vào hộp thoại Wald Test: C(2)=0, ta có kết quả sau:
Trang 15Trang 16
Nhận xét: Ta thấy P-value (Probabiltity của F-statistics) = 0,2771>0,05 (mức ý nghĩa 5%) => Chấp nhận giả thiết H0, tức là biến INST đưa vào mô hình là không hợp
lý
2.2.3 Kiểm định Wald với biến TV
Nhập vào hộp thoại Wald Test: C(3)=0, ta có kết quả sau:
Nhận xét: Ta thấy P-value (Probabiltity của F-statistics) = 0,2796>0,05 (mức ý nghĩa 5%) => Chấp nhận giả thiết H0, tức là biến TV đưa vào mô hình là không hợp
lý
2.2.4 Kiểm định Wald với biến Age
Nhập vào hộp thoại Wald Test: C(4)=0, ta có kết quả sau:
Trang 16Trang 17
Nhận xét: Ta thấy P-value (Probabiltity của F-statistics) = 0,0237<0,05 (mức ý nghĩa 5%) > Bác bỏ giả thiết H0, tức là biến Age đưa vào mô hình là hợp lý
2.2.5 Kiểm định Wald với biến Air
Nhập vào hộp thoại Wald Test: C(5)=0, ta có kết quả sau:
Trang 17Trang 18
Nhận xét: Ta thấy P-value (Probabiltity của F-statistics) = 0,0020<0,05 (mức ý nghĩa 5%) > Bác bỏ giả thiết H0, tức là biến Air đưa vào mô hình là hợp lý
2.2.6 Kiểm định Wald với biến Y
Nhập vào hộp thoại Wald Test: C(6)=0, ta có kết quả sau:
Nhận xét: Ta thấy P-value (Probabiltity của F-statistics) = 0,6365>0,05 (mức ý nghĩa 5%) => Chấp nhận giả thiết H0, tức là biến Y đưa vào mô hình là không hợp lý
2.2.7 Kiểm định Wald với biến SVC
Nhập vào hộp thoại Wald Test: C(7)=0, ta có kết quả sau:
Trang 18Trang 19
Nhận xét: Ta thấy P-value (Probabiltity của F-statistics) = 0,3450>0,05 (mức ý nghĩa 5%) => Chấp nhận giả thiết H0, tức là biến SVC đưa vào mô hình là không hợp
lý
Kết luận: Việc kiểm định Wald đồng thời và kiểm định Wald cho từng biến cho
thấy các biến Home, Age, Air đưa vào mô hình là đều cần thiết và có ý nghĩa giải thích cho mô hình Còn các biến Inst, TV, Y, SVC đưa vào mô hình là chưa hợp lý
2.3 Kiểm định sự phù hợp của mô hình
Sau khi loại bỏ các biến Inst, TV, Y, SVC Chạy mô hình hồi quy với biến phụ thuộc Sub và các biến độc lập Home, Air, Age Ta được như sau:
Trang 19Trang 20
Mô hình hồi quy được viết như sau:
SUB = 12.86928+ 0.411502*HOME - 3.461827*AIR + 1.139739*AGE
Nhận xét:
- Hệ số Adjusted R-squared = 0.8618, cho thấy mô hình giải thích tương đối tốt
sự thay đổi của biến SUB
- Ta thấy giá trị kiểm định F-Statistic = 82.07009>F(k-1,n-k) hay P-value<0,05 cho thấy mô hình trên là phù hợp
- Độ lệch chuẩn SE of regression = 12.46731
- Giá trị P-value của các biến Home, Air, Age nhỏ hơn α=0,05 cho thấy các biến độc lập tham gia giải thích cho biến phụ thuộc SUB khá tốt
=> Mô hình trên khá phù hợp
2.4 Các hệ số hồi quy chuẩn hóa
Để tính các hệ số hồi quy chuẩn hóa, ta cùng mô hình hồi quy gốc để tính
Trang 20là lớn nhất, tiếp đến là biến AGE, ảnh hưởng ít nhất lên biến phụ thuộc là biến TV có
hệ số hồi quy chuẩn hóa là 0.327192
Trang 21Trang 22
PHẦN 3: Tiến hành kiểm tra sự vi phạm các gỉa thiết hồi quy cổ điển (kiểm định Jarque bera về phân phối chuẩn cho phần dư, kiểm định tính chất đa cộng tuyến, kiểm định tính chất phương sai thay đổi,kiểm định Durbin-Watson hoặc BG)
3.1 Kiểm định Jarque bera về phân phối chuẩn cho phần dư
Giả thiết H0: ei có phân phối chuẩn
Từ bảng hồi quy mô hình 2 chọn: View/Residual Normality Test:
Diagnostics/Histogram-Ta thấy đại lượng Jarque-Bera = 32.91156, với P-value= 0.00000<0.05 nên bác bỏ giả thiết H0, tức là phần dư của mô hình không có phân phối chuẩn
3.2 Kiểm tra hiện tượng đa cộng tuyến
Từ mô hình 2 ta lập ma trận tương quan với biến độc lập Sub và biến phụ thuộc Home, Air, Age như sau:
Trang 22Trang 23
Phân tích các mối quan hệ:
- Biến Home giải thích tốt nhất cho biến phụ thuộc Sub Biến Age giải thích khá cho biến phụ thuộc Sub Biến Air giải thích yếu cho biến phụ thuộc Sub
- Ta thấy có sự tương quan khá cao giữa biến Home với các biến Age, biến Air Có thể xảy ra hiện tượng đa cộng tuyển giữa các biến này
Ta tiến hành kiểm tra tính chất đa cộng tuyến bằng tiêu chuẩn hệ số phương sai phóng đại VIF
Tiếp tục ở mô hình hồi quy 2: Vào View/Cofficient Diagnostics/Variance Inflation Factors, ta được:
Nhận xét: Các hệ số VIF<2.5 nên không xảy ra hiện tượng đa cộng tuyến
Trang 23Trang 24
3.3 Kiểm định tính chất phương sai thay đổi
Dùng kiểm định White để kiểm định tính chất phương sai thay đổi của mô hình
Từ bảng kết quả hồi quy mô hình 2 ta chọn View => Residual Diagnostics => Heteroskedasticity Test => Chọn kiểm định White, được kết quả sau:
Nhận xét: Ta thấy P-value (Prob Chi-Squared(9)= 0.0000<α=0.05 nên ta bác bỏ giả thiết H0 tức là mô hình xảy ra hiện tượng phương sai thay đổi
3.4 Kiểm định hiện tượng tự tương quan (Kiểm định BG)
Từ bảng kết quả hồi quy mô hình 2: Vào View/Residual Diagnostics/Serial Correlation LM Test, chọn độ trễ (lags to include) = 1
Trang 24Trang 25
Ta được kết quả sau:
Trang 25Trang 26
Từ bảng ta thấy (n-p)R2 = 1.848226 có xác suất P-value=0.1740>α=0.05 nên ta chấp nhận giả thiết H0 tức là không xảy ra hiện tượng tự tương quan bậc nhất
Trang 26Trang 27
PHẦN 4 : Hãy tiến hành dự báo khoảng giá trị trung bình và cá biệt của tổng thể theo mô hình hồi quy phù hợp vừa chọn như ở câu 2 với các gíá trị biến giải thích cho trước như sau:
Cho độ tin cậy 1-α = 95%
Bước 1: Chạy mô hình hồi quy đã lập ở câu 2 (luôn mở mô hình hồi quy trong suốt
quá trình làm dự báo)
Bước 2: Tạo thêm biến quan sát thứ n+1, điền các giá trị của các biến độc lập
Trang 27Trang 28
Tại cửa số Workfile, vào Proc > Structure /Resize Current Page… xuất hiện hộp thoại sau:
Tại ô Data range ta nhập tăng giá trị hiện có lên 1 đơn vị> Ok
Mở các biến Home, Air, Age ở dạng Group Chọn Edit +/- và nhập: Home = 250, Air = 10, Age= 15 vào ô thứ 41
Trang 28Trang 29
Bước 3: Tạo các biến và các giá trị vô hướng
Tại mô hình hồi quy ở bước 1, hộp thoại Forecast xuất hiện Trong khung Series name:
- Tại mục Forecast name: Đặt tên biến dự báo cho biến phụ thuộc là Subf (Eview mặc định)
- Tại mục S.E.(Optional), ta khai báo là “se_1dubao” =>Ok
Ta được :
Trang 29Trang 30
Mở đồng thời 2 biến Subf và se_1dubao ta sẽ thấy ở quan sát cuối cùng (quan sát thứ 41) giá trị của Subf là giá trị của Ŷ0 = 98.22262 và giá trị của se_1dubao chính là giá trị của SE(Ŷ0) = 13.60864
Trang 30Trang 31 Lập biến se_2dubao thông qua se_1dubao và S.E of regression (sigma ước lượng)
Nhập lệnh scalar sigma = @se để khởi tạo giá trị sigma
Trang 31Trang 32 Tại màn hình làm việc chính của Eview, ta nhập: genr se_2dubao=sqr(se_1dubao^2-sigma^2) để tính se_2dubao Kết quả như sau:
Trang 32Trang 33
Tính giá trị tα/2(n-k) với n-k=40-4=36, α/2=0.05/2=0,025
Tại cửa sổ chính của Eview, gõ scalar tinv=@qtdist(0.95,40) để tính giá trị tinv Kết quả như sau:
Trang 33Trang 34
Bước 4: Thiết lập cận trên và cận dưới cho các khoảng dự báo trung bình và cá
biệt
a Tiến hành dự báo:
Từ màn hình làm việc chính của Eview, nhập các câu lệnh sau:
genr upperTB=subf+tinv*se_2dubao => Enter
genr lowerTB=subf-tinv*se_2dubao => Enter
genr upperCB=subf+tinv*se_1dubao => Enter
genr lowerCB=subf-tinv*se_1dubao => Enter
Trang 34Trang 35
Ta được kết quả sau :
Mở các kết quả uppertb, lowertb, uppercb, lowercb ở dạng group Ta được kết quả sau:
Trang 35Trang 36
Từ bảng trên cho ta thấy:
Khoảng dự báo trung bình cho số người thuê bao của hệ thống tương ứng với: Home=250, Air=10, Age=15 với độ tin cậy 1-α = 5% là:
[89.03657;1074087]
Khoảng dự báo cá biệt là:
[75.30777;121.1375]
Biểu thị trên đồ thị:
- Vẽ đồ thị dự báo trung bình cho số người thuê bao của hệ thống
Mở các biến uppertb, lowertb, sub, subf ở dạng group
Trang 36Trang 37 Vào View chọn Graph:
Trang 37Trang 38
- Tương tự ta vẽ được đồ thị dự báo cá biệt cho số người thuê bao của hệ thống:
Trang 38Trang 39
KẾT LUẬN
Bài tiểu luận tiến hành phân tích, kiểm định và dự báo số người thuê bao của mỗi
hệ thống với biến phụ thuộc Sub và các biến giải thích Home - số nhà mà mỗi hệ thống cáp TV đi ngang qua, Age - số tuổi của mỗi hệ thống, Air - số kênh truyền hình thu được Trong các biến độc lập thì biến độc lập Home giải thích cho biến Sub tốt hơn so với biến độc lập khác Mô hình hồi quy như sau:
SUB = 12.86928+ 0.411502*HOME - 3.461827*AIR + 1.139739*AGE
Mô hình không còn hiện tượng đa cộng tuyến nhưng có hiện tượng phương sai sai
số thay đổi Phần dư của mô hình e1 không có phân phối chuẩn Tuy nhiên, các hệ số
và P-value của kiểm định F đã đạt yêu cầu Ngoài ra trong kiểm định BG cũng cho thấy mô hình không có sự tương quan bậc 1, như vậy mô hình có thể chấp nhận để thực hiện dự báo
Mô hình này khá tốt khi việc lựa chọn các biến đưa vào mô hình đều có ý nghĩa Việc dự báo khá sát với giá trị thực Cho thấy mô hình dự báo là khá tốt Có thể ứng dụng mô hình này để dự báo số người thuê bao của mỗi hệ thống cho các công ty trong lĩnh vực này và để tham khảo cho các lĩnh vực có liên quan