Bản chất hiện tượng phương sai sai số thay đổi Hậu quả của phương sai sai số thay đổi Cách phát hiện phương sai sai số thay đổi Cách khắc phục phương sai sai số thay đổi
Trang 1Chương 3: Phương sai sai số thay đổi
• Bản chất hiện tượng phương sai sai số thay đổi
• Hậu quả của phương sai sai số thay đổi
• Cách phát hiện phương sai sai số thay đổi
• Cách khắc phục phương sai sai số thay đổi
Trang 2Bản chất hiện tượng phương sai sai
số thay đổi
• Xét ví dụ mô hình hồi qui 2 biến trong đó
biến phụ thuộc Y là tiết kiệm của hộ gia
đình và biến giải thích X là thu nhập khả
dụng của hộ gia đình
Trang 4Bản chất hiện tượng phương sai sai
số thay đổi
• Hình 3.1a chỉ ra rằng khi thu nhập khả
dụng tăng lên, giá trị trung bình của tiết
kiệm cũng tăng lên nhưng phương sai của tiết kiệm quanh giá trị trung bình của nó
không thay đổi tại mọi mức thu nhập khả dụng
• Đây là trường hợp của phương sai sai số không đổi, hay phương sai bằng nhau
Trang 6Giải thích
• Những người có thu nhập cao, nhìn chung, sẽ tiết kiệm nhiều hơn so với người có thu nhập thấp nhưng sự biến động của tiết kiệm sẽ cao hơn
• Đối với người có thu nhập thấp, họ chỉ còn để lại một ít thu nhập để tiết kiệm
• Phương sai sai số của những hộ gia đình
có thu nhập cao có thể lớn hơn của những hộ có thu nhập thấp
Trang 7Hậu quả của phương sai sai số thay
đổi
1 Ước lượng OLS vẫn tuyến tính
2 Chúng vẫn là ước lượng không chệch
3 Tuy nhiên, chúng sẽ không còn có
phương sai nhỏ nhất nữa, nghĩa là, chúng sẽ không còn hiệu quả nữa
4 Công thức thông thường để ước lượng
phương sai của ước lượng OLS, nhìn chung, sẽ chệch
Trang 8Hậu quả của phương sai sai số thay
đổi
5 Theo đó, các khoảng tin cậy và kiểm định
giả thuyết thông thường dựa trên phân
phối t và F sẽ không còn đáng tin cậy
nữa Do vậy, nếu chúng ta áp dụng các
kỹ thuật kiểm định giả thuyết thông thường sẽ cho ra kết quả sai
Trang 9Phương pháp phát hiện ra phương
sai sai số thay đổi
1 Xem xét đồ thị của phần dư
2 Kiểm định Park
3 Kiểm định Glejser
4 Kiểm định tương quan hạng của
Spearman
5 Kiểm định Goldfeld – Quandt
6 Kiểm định Breusch – Pagan
7 Kiểm định White
Trang 122 Kiểm định Park
• Park cho rằng σi 2 là một hàm số nào đó
của biến giải thích X
• Park đã đưa ra dạng hàm số giữa σi 2 và X
như sau:
σi 2 = B 1 + B 2 ln|X i |+ v i trong đó v i là phần sai số
• Park đã đề nghị chúng ta có thể sử dụng
ei thay cho ui và chạy mô hình hồi qui sau:
lnei2 = B 1 + B2 ln|Xi|+ v i (*)
Trang 142 Kiểm định Park
4) Kiểm định giả thuyết H0: B 2 = 0, nghĩa là, không có phương sai của sai số thay đổi Nếu giả thuyết H0 bị bác bỏ, mối quan hệ
giữa lne i 2 và lnX có ý nghĩa thống kê, có
phương sai của sai số thay đổi
5) Nếu giả thuyết H0 được chấp nhận, B 1
trong mô hình (*) có thể được xem là giá trị chung của phương sai của sai số không đổi, σ2
Trang 153 Kiểm định Glejser
• Tương tự như kiểm định Park: Sau khi thu thập được phần dư từ mô hình hồi qui gốc, Glejser
• Glejser đề xuất một số dạng hàm hồi qui sau:
i i
e = 1 + 2 +
i i
X
B B
e = 1 + 2 1 +
Trang 163 Kiểm định Glejser
• Giả thuyết H0 trong mỗi hàm số trên là phương sai của sai số không đổi, nghĩa là,
H0: B2 = 0 Nếu giả thuyết này bị bác bỏ thì
có thể có hiện tượng phương sai sai số không đồng đều
i i
X
B B
i i
e = 1 + 2 +
i i
Trang 173 Kiểm định Glejser
• Goldfeld và Quandt đã chỉ ra rằng sai số v i
trong các mô hình hồi qui của Glejser có một số vấn đề, như giá trị kỳ vọng của nó khác không, nó có tương quan chuỗi
– 4 mô hình đầu cho kết quả tốt khi sử dụng OLS
– 2 mô hình sau (phi tuyến tính tham số) không sử dụng OLS được
• Do vậy, kiểm định Glejser có thể được dùng để chẩn đoán đối với những mẫu lớn
Trang 184 Kiểm định tương quan hạng của
Spearman
• Hệ số tương quan hạng của Spearman,
r S, được xác định như sau:
trong đó di là hiệu của các hạng được gán cho 2 đặc trưng khác nhau của cùng một phần tử thứ i và n là số các phần tử được xếp hạng
( n
Trang 191 Ước lượng mô hình hồi qui trên dựa trên bộ
tính hệ số tương quan hạng Spearman
Trang 204 Kiểm định tương quan hạng (tt)
3 Giả sử hệ số tương quan hạng của tổng
thể là ρ = 0 và n > 8 thì ý nghĩa của hệ
số tương quan hạng mẫu rS có thể được kiểm định bằng tiêu chuẩn t sau:
2 S
S
r 1
2 n
r t
−
−
=
Nếu giá trị t tính được lớn hơn giá trị tra bảng t với mức
ý nghĩa đã cho thì chúng ta có thể chấp nhận giả thuyết phương sai sai số thay đổi; ngược lại chúng ta bác bỏ giả thuyết này.
với bậc tự do
df = n – 2
Trang 21Kiểm định tương quan hạng
Trang 22Kiểm định tương quan hạng
333
01
10010
1106
) (
0 1
8 333
mức 10% (P-value = 0,17) Ta chấp nhận giả
hiện tượng phương sai không đồng nhất.
Trang 235 Kiểm định Goldfeld - Quandt
cách sau:
Quandt như sau:
1 Sắp xếp các quan sát theo thứ tự tăng dần về
giá trị của biến X.
2 Bỏ qua quan sát ở giữa theo cách sau:
Trang 245 Kiểm định Goldfeld - Quandt
2 Bỏ qua quan sát ở giữa theo cách sau:
Đối với mô hình 2 biến:
c = 4 nếu cỡ mẫu khoảng n = 30;
c = 10 nếu cỡ mẫu khoảng n = 60
và chia số quan sát còn lại thành 2
nhóm, trong đó mỗi nhóm có (n – c)/2
quan sát
Trang 25Thu thập tổng bình phương của các phần dư
diện cho RSS từ hồi qui ứng với các giá trị của
hơn
Bậc tự do tương ứng là hoặc (n – c – 2k)/2 Trong đó, k là các tham số được ước lượng kể cả hệ số chặn (trường hợp 2 biến: k
= 2)
k 2
c n
−
−
Trang 265 Kiểm định Goldfeld - Quandt
4 Tính tỷ số
Nếu u i theo phân phối chuẩn và nếu giả
định về phương sai có điều kiện không đổi được thỏa mãn thì λ tuân theo phân
phối F với bậc tự do ở tử số và mẫu số
là
df RSS
df
RSS λ
/
/
=
1 2
2
2k
c
n − −
Nếu λ tính được lớn hơn giá trị tra bảng F ở mức ý nghĩa
mong muốn, thì chúng ta có thể bác bỏ giả thuyết H0, nghĩa là chúng ta có thể nói phương sai của sai số thay đổi
Trang 276 Kiểm định Breusch - Pagan
• Xét mô hình hồi qui k biến sau:
Yi = β1 + β2X2i + … + βkXki + ui (**)Giả sử σi2 được mô tả như là một hàm
số của các biến phi ngẫu nhiên Zi, Zi là các biến Xi (một số hoặc tất cả) có ảnh hưởng đến σi2, có dạng:
σi2 = f(z2i, z3i, …, zmi)Giả định f() có dạng tuyến tính:
σi2 = α1 + α2Z2i + … + αmZminếu α2 = α3 = … = αm = 0 thì σi2 = α1 là hằng số
Trang 286 Kiểm định Breusch - Pagan
thay đổi hay không, chúng ta có thể kiểm định
sau:
1 Ước lượng (**) bằng phương pháp OLS để
2 i
=
= σ
2
~
σ
Trang 296 Kiểm định Breusch - Pagan
4 Hồi qui pi theo các biến Zi dưới dạng:
pi = α1 + α2Z2i + … + αmZmi + vi (*)trong đó vi là số hạng ngẫu nhiên của
hồi qui này
5 Thu được ESS (tổng các bình phương
được giải thích) từ (*) và xác định:
ESS
θ
2 1
=
Trang 306 Kiểm định Breusch - Pagan
Giả thuyết rằng ui có phân phối chuẩn và khi
cỡ mẫu n tăng lên vô hạn thì θ ≈ χ2
(m – 1).Tức là θ sẽ xấp xỉ χ2 với m – 1 bậc tự do Như vậy, nếu trong áp dụng mà ta tính được
θ vượt giá trị tra bảng χ2 với m – 1 bậc tự
do với mức ý nghĩa đã chọn, thì chúng ta bác bỏ giả thuyết H0 về phương sai đồng đều
Ngược lại, chúng ta có thể chấp nhận nó
Trang 317 Kiểm định White
phân phối chuẩn, White đã đề nghị một phương
pháp không cần đòi hỏi u có phân phối chuẩn
Trang 32(1) và (2) có thể có số mũ cao hơn và nhất thiết
phải có hệ số chặn bất kể mô hình gốc có hay không
hình không có số hạng chéo hay (2) với mô hình có số hạng chéo
Trang 337 Kiểm định White
hiện tượng phương sai sai số thay đổi
Trang 34đã biết; nghĩa là phương sai sai số của mỗi quan sát đã biết Đơn giản, chúng ta chia hai vế của mô hình cho σi đã biết
i
i i
i 2
i
1 i
Y
σ σ
α σ
α
σ = + +
Trang 351 Trường hợp đã biết σi 2 (tt)
Xem phần chứng minh trong giáo trình, vi2 là hằng số Hay phần sai số “được chuyển đổi”, vi là đồng đều
Trong thực tế, chúng ta chia mỗi quan sát Yi
và Xi cho σi đã biết và chạy hồi qui OLS cho dữ liệu đã được chuyển đổi này
Ước lượng OLS của α1 và α2 được tính theo cách này được gọi là ước lượng bình phương bé nhất có trọng số (WLS); mỗi quan sát Y và X đều được chia cho trọng
số (độ lệch chuẩn) của riêng nó, σi
Trang 362 Trường hợp chưa biết σi 2
Trường hợp 1: Phương sai sai số tỷ lệ với
biến giải thích
Sau khi ước lượng hồi qui OLS thông thường, chúng ta vẽ đồ thị phần dư từ ước lượng này theo biến giải thích X và quan sát hình ảnh của nó Nếu hình ảnh của phần dư tương tự như hình sau:
Trang 372 Trường hợp chưa biết σi 2
Trang 382 Trường hợp chưa biết σi 2
Như vậy, phương sai sai số có quan hệ tuyến tính:
E(u i 2 ) = σ2 X i
Chúng ta chia hai vế của mô hình cho căn bậc hai của Xi Trong mô hình đa biến, chúng ta chia hai vế của mô hình cho căn bậc hai của , vớiX i
i
i i
i i
i
i
X
u X
X X
X
Y
+ +
= α1 1 α2
i i
Trang 392 Trường hợp chưa biết σi 2 (tt)
Trường hợp 2: Phương sai sai số tỷ lệ với
bình phương của biến giải thích
Tương tự trường hợp 1, nếu hình ảnh của phần dư tương tự như hình bên dưới, phương sai sai số có quan hệ tuyến tính
với bình phương của X: E(u i 2 ) = σ2 X i 2
Chúng ta chia hai vế của mô hình cho Xi
i
i i
i
i
X
u X
X
Y
+ +
Trang 40Phương sai sai số tỷ lệ với bình phương
của biến X
Trang 412 Trường hợp chưa biết σi 2 (tt)
Trường hợp 3: Phương sai sai số tỷ lệ với
bình phương của giá trị kỳ vọng của Y
E(u i 2 ) = σ2 [E(Y i )] 2.Tương tự chúng ta chia hai vế của mô hình cho E(Yi) = Yˆ i = αˆ1 + αˆ 2X i
Tiến hành theo 2 bước sau:
Bước 1: Ước lượng mô hình hồi qui:
Yi = α1 + α2Xi + uibằng phương pháp OLS thông thường, từ
đó ta thu được Yˆ i
Trang 422 Trường hợp chưa biết σi 2 (tt)
Trường hợp 3:(tt) biến đổi mô hình gốc về
dạng như sau:
Bước 2: Ước lượng hồi qui trên dù không
chính xác là E(Yi\X i), nhưng chúng là ước lượng vững, nghĩa là khi cỡ mẫu tăng lên
vô hạn thì chúng hội tụ về E(Yi|Xi) Do vậy, phép biến đổi trên có thể dùng được khi
cỡ mẫu tương đối lớn
i i
i 2
i
1 i
Yˆ
X Yˆ
1 Yˆ
Y
++
i Yˆ
Trang 432 Trường hợp chưa biết σi 2 (tt)
Trường hợp 4: Định dạng lại mô hình
Thay vì ước lượng mô hình hồi qui gốc, ta có thể ước lượng mô hình hồi qui:
lnYi = α1 + α2lnXi + uiTình trạng phương sai sai số không đồng nhất sẽ bớt nghiêm trọng hơn so với mô hình gốc bởi vì khi được logarit hóa, độ lớn các biến bị ‘nén lại’
Một ưu thế của phép biến đổi này là hệ số α2
sẽ đo lường hệ số co giãn của Y theo X, nghĩa là, nó cho biết % thay đổi của Y khi X thay đổi 1%
Trang 44• Khi nghiên cứu mô hình có nhiều biến giải thích thì việc chọn biến nào để biến đổi cần phải được xem xét cẩn thận
• Phép biến đổi logarit không dùng được khi các giá trị của các biến âm
• Khi σi 2 chưa biết, nó sẽ được ước lượng
từ một trong các cách biến đổi trên Các
kiểm định t, F mà chúng ta sử dụng chỉ
đáng tin cậy khi cỡ mẫu lớn, do đó chúng
ta phải cẩn thận khi giải thích các kết quả
dựa trên các phép biến đổi khác nhau
trong các mẫu nhỏ