Nguyên nhân• Do bản chất của các mối liên hệ giữa các đại lượng kinh tế • Do kỹ thuật thu thập và xử lý số liệu được cải tiến • Con người rút được kinh nghiệm từ quá khứ • Có các quan sá
Trang 1BÀI THẢO LUẬNMÔN KINH TẾ LƯỢNG
NHÓM: 4
Đề tài:
Hiện tượng phương sai sai số thay đổi – cách khắc phục
Trang 32 Nguyên nhân
• Do bản chất của các mối liên hệ giữa các đại lượng kinh tế
• Do kỹ thuật thu thập và xử lý số liệu được cải tiến
• Con người rút được kinh nghiệm từ quá khứ
• Có các quan sát ngoại lai (quan sát khác biệt rất nhiều với các quan sát khác trongmẫu)
• Mô hình định dạng sai, bỏ sót biến thích hợp hoặc dạng giải tích của hàm là sai
3 Hậu quả
• Các ước lượng bình phương nhỏ nhất β^ là ước lượng tuyến tính không chệchnhưng không hiệu quả
• Các ước lượng của các phương sai là các ước lượng chệch
=> Làm giá trị của thông kê T& F mất ý nghĩa
• Các bài toán về ước lượng & kiểm định dự báo khi sử dụng thông kê T&F làkhông đáng tin cậy
Trang 4• Ta hồi quy mô hình hồi quy gốc
Yi=β1+ β2 X2i+β3X3u+….+βk Xki+Ui
Ta thu được phần dư ei
Vẽ đồ thị phần dư ei(ei2) đối với Xi(hoặc với Ŷi trong trường hợp hồi quy nhiềubiến)
Nếu độ rộng của biểu đồ phần dư tăng hay giảm khi X tăng thì giả thiết về phươngsai hằng số có thể không thỏa mãn
Sử dụng tiêu chuẩn kiểm định
• Hồi quy mô hình gốc để thu được phần dư ei
Trang 5Ước lượng mô hình hồi quy sau:
Lnei2 = βi+ β2lnXi +Vi
Trường hợp có nhiều biến giải thích thì ước lượng hồi quy này với từng biến giảithích hoặc với Ŷi
Kiểm định giả thiết Ho : β2 = 0 Nếu giả thiết Ho bị bác bỏ thì có thể kết luận về
sự tồn tại của hiện tượng phương sai sai số thay đổi
Kiểm định Glejser
• Đầu tiên, hồi quy mô hình gốc để thu phần dư ei
• Hồi quy một trong các mô hình sau
• Ước lượng bằng OLS Từ đó thu được các phần dư ei
• Ước lượng mô hình sau :
ei2=α1+α2X2+α3X3+α4X22+α5X32+α6X2X3+vi
• Với H0 : Phương sai của sai số không đổi , có thể chỉ rằng nR2 có phần xấp xỉ χ2(df) , df bằng số hệ số của mô hình không kể hệ số chặn
Trang 6• Nếu nR2 không vượt qua giá trị χ2 (df) ,thì giả thiết H0 không có cơ sở bị bác bỏ.Trong trường hợp ngược lại thì giả thiết Ho bị bác bỏ.
i var(ui) = 1/ δ2
i δ2
i = 1 = const
(1b) có phương sai sai số không đổi
Phương pháp bình phương nhỏ nhất tổng quát (GLS – General Least Square) là phương pháp OLS áp dụng cho các biến số đã được biến đổi để thỏa mãn các giả thiết của phương pháp OLS Phương pháp bình phương nhỏ nhất có trọng số (WLS) là một trường hợp của GLS
Trang 7Yi = β1
+ β2
Xi + UiGiả sử mô hình này thoả mãn các giả thiết của mô hình hồi quy tuyến tính
cổ điển trừ giả thiết phương sai của sai số không đổi Chúng ta xét 1 số giả thiếtsau về phương sai của sai số Những dạng này tuy chưa bao quát được tất cảnhưng phổ biến
Giả thiết 1: Phương sai của sai số tỉ lệ với bình phương của biến giải thích:
E(
2
i U
) =
2 2
i X
σ
(1)Nếu bằng phương pháp đồ thị hoặc cách tiếp cận Park hoặc Glejser… chỉcho chúng ta rằng có thể phương sai Ui tỉ lệ với bình phương của biến giải thích Xthì chúng ta có thể biến đổi mô hình gốc theo cách sau:
Chia 2 về của mô hình gốc cho Xi (Xi ≠ 0)
Trang 8i U
là số hạng nhiễu đã được biến đổi, và rõ ràng rằng E(vi)2=
2σ ,thực vậy:
i
i X
X
σ
=
2σ
Như vậy tất cả các giả thiết của mô hình hồi quy tuyến tính cổ điển đượcthoả mãn đối với (2) vậy ta có thể áp dụng phương pháp bình phương nhỏ nhất
i V X X X
X X
X
2 3 5
2 2 4 3 3 2 2
1
) Hồi quy i
i X Y
XiNếu sau khi ước lượng hồi quy bằng phương pháp bình phương nhỏ nhấtthông thường, chúng ta vẽ đồ thị của phần dư này đối với biến giải thích X vàquan sát thấy hiện tượng chỉ ra phương sai của sai số liên hệ tuyến tính với biếngiải thích thì mô hình gốc sẽ được biến đổi như sau:
Với mỗi i chia cả 2 vế của mô hình gốc cho
i X
(với Xi >0)
Trang 9i X
2
β
+ i
i X U
X
1
1β
+
i X
và có thế thấy ngay rằng E(vi) =
2σChú ý: Mô hình (3) là mô hình không có hệ số chặn cho nên ta sẽ sử dụng mô hìnhhồi quy qua gốc để ước lượng β1 và, sau khi ước lượng (3) chúng ta sẽ trở lại mô
hình gốc bằng cách nhân cả 2 vế (3) với Xi
Cách khắc phục β2
Bước 1: Ước lượng phương trình (1) Yi= β1+ β2 Xi + ui
Bước 2: Vẽ đồ thị phần dư ei theo Xi đánh giá xem phường sai nhiễu có hay không
tỷ lệ thuận với biến giải thích
Bước 3: Chia cả 2 vế của phương trình hồi quy (1) cho Xi
i
i X Y
= i
X
1β +
i X
2
β
+ i
i X U
X
1
1β
+
i X
và có thế thấy ngay rằng E(vi) =
2σChuyển thành phương trình không có hệ số cắt
Bước 4: So sánh mô hình (1) và (2) qua số liệu hồi quy R2, t-stat và P- value và đánh giá mô hình
nghĩa là E(
2
i U
) = 2( ( ) )2
i Y E
σ
Trang 10Khi đó thực hiện phép biến đổi biến số như sau:
1
i Y E
β +
i Y E U
=
)(
X Y
E( )
1
2β
Trong đó Vi =
)( i
i Y E U
, Var(Vi) =
2σ.Nghĩa là nhiễu Vi có phương sai không đổi Điều này chỉ ra rằng hồi quy (4) thoảmãn giả thiết phương sai không đổi của mô hình hồi quy tuyến tính cổ điển
Tuy nhiên phép biến đổi (4) vẫn chưa thực hiện được vì bản chất E(Yi) phụ thuộc
vào β1
vàβ2
trong đó β1
vàβ2 lại chưa biết
Lúc này ta làm theo 2 bước sau:
thông thường, thu được i
1
1β
Xi
2β
Trong đó Vi = i
i Y U
ˆ
Trang 11• Bước 2: Ước lượng hồi quy (5), dù i
Một ưu thế của phép biến đổi này là hệ số β2 sẽ đo lường hệ số co giãn của Y theo
X, nghĩa là, nó cho biết % thay đổi của Y khi X thay đổi 1%
Trang 131. Mô hình hồi quy mẫu
Dependent Variable: Y
Method: Least Squares
Date: 01/02/13 Time: 00:42
Sample(adjusted): 1 20
Included observations: 20 after adjusting endpoints
Variable Coefficient Std Error t-Statistic Prob
Log likelihood -31.41128 F-statistic 1451.230
2. Phát hiện hiện tượng phương sai sai số thay đổi:
a Phương pháp quan sát theo đồ thị phần dư: Quan sát sự thay đổi của ei theo X:Quan sát “graph_ei_x”, đồ thị satter, ta nhận thấy các điểm (x,ei) loe dần ra, giốngmột đồ thị đặc trưng của hiện tượng phương sai sai số thay đổi Từ đó bước đầu tanhận định có xảy ra hiện tượng phương sai sai số thay đổi
Trang 14b Kiểm định G-Q:
Trang 15Với mục đích kiểm tra xem phần dư ở hai mẫu từ mẫu ban đầu có tương đươngnhau không, ta sắp xếp biến X theo thứ tự tăng dần, sau đó bỏ đi 4 quan sát ở giữa(do n = 20) Từ đó, ta nhận được 2 mẫu mới, mỗi mẫu gồm 8 quan sát Sau đó, taước lượng để thu về tổng bình phương phần dư tương ứng của 2 mẫu, sử dụngkiểm định F nhận biết sự sai khác hai giá trị đó.
Giả thiết: H0: Phương sai Ui thuần nhất
H1: có hiện tượng phương sai sai số thay đổi
Xây dựng tiêu chuẩn kiểm định:
Phân phối Fα(df,df)
Đọc hai bảng kết quả cho hai mẫu, hai bảng kết quả “eq01” và “eq02”, có:
c Kiểm định White: Cho biết phần ei² có phụ thuộc vào biến giải thích và có biếnđổi theo biến giải thích hay không
Ước lượng mô hình: ei²= β1+β2.X+β3.X²+Ui
Sau khi ước lượng mô hình, sử dụng kiểm định ᵪ²(2) kiểm định giả thiết H0:
β2= β3=0 (giả thiết tương đương phương sai Ui thuần nhất)
Ta chạy kiểm định White cho bảng kết quả:
White Heteroskedasticity Test:
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Trang 16X -0.147350 0.107503 -1.370656 0.1883
Adjusted R-squared 0.586201 S.D dependent var 1.760790S.E of regression 1.132668 Akaike info criterion 3.224509Sum squared resid 21.80991 Schwarz criterion 3.373869
Durbin-Watson stat 1.532774 Prob(F-statistic) 0.000215
Bảng kết quả cho thấy p_value của 2 giá trị kiểm định đều rất nhỏ, với mức α = 0.5%=> Bác bỏ giả thiết H0 => Có hiện tượng phương sai sai số thay đổi xảy ra
d Kiểm định Park: Tương tự kiểm định White , kiểm định Park cho phép kiểm tra sựphụ thuộc của ei² vào biến giải thích Ta phải ước lượng mô hình:
Ln(ei²)= β1+β2*ln(X)+ Ui(Trường hợp mô hình có nhiều biến giải thích, ta có thể áp dụng cho từng biến hoặc cho Ŷ)
Dependent Variable: LOG(E2)
Method: Least Squares
Date: 01/02/13 Time: 01:01
Sample(adjusted): 3 22
Included observations: 20 after adjusting endpoints
Variable Coefficient Std Error t-Statistic Prob
R-squared 0.771686 Mean dependent var -0.553733Adjusted R-squared 0.759002 S.D dependent var 1.676648S.E of regression 0.823093 Akaike info criterion 2.543145Sum squared resid 12.19468 Schwarz criterion 2.642718
Durbin-Watson stat 1.669346 Prob(F-statistic) 0.000000
Sau đó sử dụng kiểm định T kiểm tra giả thiết H0:β2=0
Đọc bảng kết quả “kdpark”, ta có giá trị p_value rất nhỏ =0.0000, với mức α = 0.5% => Có hiện tượng phương sai sai số thay đổi
e Kiểm định Glejser: Xác định mối quan hệ giữa ei và biến giải thích X
Ta hồi quy mô hình:
Trang 17|ei| =β1+β2.X+Ui
Theo bảng KQ có: |ei|= -0.166276+0.045755X
Dependent Variable: ABS(EI)
Method: Least Squares
Date: 01/02/13 Time: 01:04
Sample(adjusted): 3 22
Included observations: 20 after adjusting endpoints
Variable Coefficient Std Error t-Statistic Prob
Adjusted R-squared 0.691951 S.D dependent var 0.640368S.E of regression 0.355419 Akaike info criterion 0.863598Sum squared resid 2.273802 Schwarz criterion 0.963171
Durbin-Watson stat 1.423006 Prob(F-statistic) 0.000003Với p_value bác bỏ giả thiết H0: β2 = 0 là rất nhỏ, p_value = 0.0000 => Bác bỏ giảthiết H0=> Chấp nhận giả thiết có hiện tượng phương sai sai số thay đổi
f Kiểm định dựa trên biến phụ thuộc Y: Ý tưởng phương pháp kiểmđịnh này cho rằng: phương sai của các yếu tố ngẫu nhiên phụ thuộc vào biến giảithích có hoặc không có trong mô hình, vấn đề ta không rõ đó là biến nào Trongtrường hợp này, ta sử dụng biến E(Yi)² để đại diện cho các biến giải thích khác.Tuy nhiên do không biết E(Yi)² nên ta dùng ước lượng điểm là Ŷi² Ta xét hàm hồiquy:
ei²=β1+β2×Ŷ²i+Vi
Đọc bảng kết quả , ta có mô hình hồi quy mẫu:
Dependent Variable: EI^2
Method: Least Squares
Date: 01/02/13 Time: 01:26
Sample(adjusted): 3 22
Included observations: 20 after adjusting endpoints
Variable Coefficient Std Error t-Statistic Prob
Trang 18YY^2 0.002606 0.000515 5.057558 0.0001
Adjusted R-squared 0.564009 S.D dependent var 1.760790S.E of regression 1.162643 Akaike info criterion 3.233908Sum squared resid 24.33129 Schwarz criterion 3.333481
Durbin-Watson stat 1.458340 Prob(F-statistic) 0.000082ei²=-0.375963+0.002606X
Ta thấy giá trị p_value rất nhỏ = 0.0001, với α = 0.5% =>bác bỏ H0 => Cóhiện tượng phương sai sai số thay đổi
Với 6 cách kiểm tra, ta thấy đều cho rằng mô hình hồi quy có xảy ra hiệntượng phương sai sai số thay đổi Ta chấp nhận giả thiết có hiện tượng phương saisai số thay đổi và đi tới tìm cách khắc phục hiện tượng này
3. Phương pháp khắc phục hiện tượng:
a Giả thiết 1: σ²i= σ²×Xi
Ta hồi quy Yi/Xi theo 1/Xi
Dependent Variable: Y/X
Method: Least Squares
Date: 01/02/13 Time: 01:32
Sample(adjusted): 3 22
Included observations: 20 after adjusting endpoints
Variable Coefficient Std Error t-Statistic Prob
Adjusted R-squared 0.154852 S.D dependent var 0.044274S.E of regression 0.040702 Akaike info criterion -3.470458Sum squared resid 0.029819 Schwarz criterion -3.370884
Durbin-Watson stat 2.278814 Prob(F-statistic) 0.048457Bảng kết quả “gt_1” cho: β1=0.917983, β2=0.535241
Mô hình hồi quy: Ŷ=0.917983+0.535241*X
Trang 19Kiểm định White mô hình được:
White Heteroskedasticity Test:
F-statistic 2.051338 Probability 0.159201
Obs*R-squared 3.888300 Probability 0.143109
Từ bảng có thể thấy p_value có giá trị lớn hơn hẳn so với mô hình ban đầu, chứng
tỏ hiện tượng phương sai sai số thay đổi đã được khắc phục
b Giả thiết 2: σ²i= σ²×Xi²
Ước lượng mô hình hồi quy biến
Dependent Variable: Y/SQR(X)
Method: Least Squares
Date: 01/02/13 Time: 04:29
Sample(adjusted): 3 22
Included observations: 20 after adjusting endpoints
Adjusted R-squared 0.890708 S.D dependent var 1.124158S.E of regression 0.371639 Akaike info criterion 0.952850Sum squared resid 2.486075 Schwarz criterion 1.052423
Durbin-Watson stat 0.847151 Prob(F-statistic) 0.000000Bảng kết qủa “hq_gt2” cho hệ số mô hình hồi quy mới: β1=7.963617, β2=-
15.23254
Mô hình hồi quy mới: Ŷ=7.963617-15.23254*X
Kiểm định mô hình ta được
White Heteroskedasticity Test:
F-statistic 0.899843 Probability 0.425144
Obs*R-squared 1.914591 Probability 0.383930
Trang 20Từ bảng có thể thấy giá trị p_value ta thu được từ hai kiểm định cao hơn rất nhiều
so với ban đầu, điều này cho thấy hiện tượng phương sai sai số thay đổi đã đượckhắc phục
c Gt 3: σi²=σ²*E(Yi)²
Ta ước lượng
Dependent Variable: Y/YY
Method: Least Squares
Date: 01/02/13 Time: 01:46
Sample(adjusted): 3 22
Included observations: 20 after adjusting endpoints
Variable Coefficient Std Error t-Statistic Prob
Adjusted R-squared -0.033944 S.D dependent var 0.042563S.E of regression 0.043279 Akaike info criterion -3.347643Sum squared resid 0.033716 Schwarz criterion -3.248070Log likelihood 35.47643 Durbin-Watson stat 2.287963Bảng kết quả “gt_3” cho hệ số của mô hình hồi quy mới là:
β1 =0.543429, β2 = 0.917544
Mô hình hồi quy mới: Ŷ=0.543429+0.917544*X
Kiểm định White mô hình ta có:
White Heteroskedasticity Test:
F-statistic 2.313856 Probability 0.129189
Obs*R-squared 4.279428 Probability 0.117688
Từ bảng có thể thấy giá trị p_value thu được lớn hơn rất nhiều so với mô hình hồiquy ban đầu, chính vì vậy ta thấy hiện tượng phương sai sai số thay đổi đã đượckhắc phục
Trang 21d GT 4: sử dụng dạng hàm sai:
Ta nhận thấy các GT X và Y quan sát không có giá trị nào âm nên sử dụng dạnghàm ln để nén sai số trong mô hình
Ta ước lượng mô hình sau: ln Y = β1 + β2 lnX +Ui
Dependent Variable: LOG(Y)
Method: Least Squares
Date: 01/02/13 Time: 01:53
Sample(adjusted): 3 22
Included observations: 20 after adjusting endpoints
Variable Coefficient Std Error t-Statistic Prob
Adjusted R-squared 0.993756 S.D dependent var 0.550836S.E of regression 0.043525 Akaike info criterion -3.336301Sum squared resid 0.034100 Schwarz criterion -3.236727
Durbin-Watson stat 2.270130 Prob(F-statistic) 0.000000
Đọc bảng kết quả “gt4” ta có mô hình hồi quy:
Ln Y = 0.059899 + 0.962615*lnX.
Kiểm định White cho mô hình:
White Heteroskedasticity Test: