kinh tế lượng (econometrics) là một bộ phận của kinh tế học, được hiểu theo nghĩa rộng là môn khoa học kinh tế giao thoa với thống kê học và toán kinh tế.
Trang 1CHƯƠNG 8
Phương Sai Của Sai Số Thay Đổi
Trong việc tính toán các giá trị ước lượng bình phương tối thiểu thông thường (OLS) cũng như các giá trị ước lượng thích hợp cực đại (MLE), chúng ta đã thiết lập giả thuyết cho rằng các số hạng sai số u i có phân phối giống nhau với trị trung bình bằng không và phương sai σ2 như nhau (Xem Giả Thuyết 3.5 của Chương 3 đã phát biểu rằng Var(u i |x t =
σ2 cho tất cả các t) Giả thuyết phương sai bằng nhau được hiểu là phương sai của sai số
không đổi (có nghĩa là phân tán như nhau) Phương sai σ2 là một đại lượng đo lường mức độ phân tán của các số hạng sai số t, xung quanh giá trị trung bình zero Một cách tương đương, đó là một đại lượng đo lường mức độ phân tán của giá trị biến phụ thuộc quan sát được (Y) xung quanh đường hồi qui β1 + β2 X 2 +… +βk X k Phương sai của sai số không đổi có nghĩa là mức độ phân tán như nhau cho tất cả các quan sát
Tuy nhiên, trong nhiều trường hợp thông thường có liên quan đến những dữ liệu chéo, giả thuyết này có thể sai Ví dụ, giả sử như chúng ta tiến hành điều tra một mẫu ngẫu nhiên các hộ gia đình và thu được thông tin về tổng chi phí tiêu dùng của từng hộ gia đình và thu nhập của họ trong một năm cho trước Những hộ gia đình với mức thu nhập thấp không có nhiều linh động trong chi tiêu Phần lớn thu nhập sẽ tập trung vào các nhu cầu căn bản chẳng hạn như thức ăn, chỗ ở, quần áo, và đi lại Do vậy, mẫu hình chi tiêu giữa những hộ gia đình có thu nhập thấp như thế sẽ không khác nhau nhiều lắm Mặt khác, những gia đình giàu có có sự linh động rất lớn trong chi tiêu Một vài gia đình là những người tiêu dùng lớn; những người khác có thể là những người tiết kiệm nhiều và đầu tư nhiều vào bất động sản, thị trường chứng khoán, … Điều này hàm ý rằng tiêu dùng thực có thể khác nhiều so với mức thu nhập trung bình Hay nói cách khác, rất có khả năng những hộ gia đình có thu nhập cao có mức độ phân tán xung quanh giá trị tiêu dùng trung bình lớn hơn những hộ gia đình có thu nhập thấp Trong trường hợp như thế, biểu đồ phân tán giữa tiêu dùng và thu nhập sẽ chỉ ra những điểm của mẫu gần với đường hồi qui hơn cho những hộ gia đình thu nhập thấp nhưng những điểm phân tán rộng hơn cho
những hộ gia đình thu nhập cao (xem Hình 8.1) Hiện tượng như vậy được gọi là phương
sai của sai số thay đổi (có nghĩa là phân tán không như nhau) Hình 3.A.2 trong Phụ lục
Chương 3 có một đồ thị về phương sai của sai số thay đổi trong tổng thể
Ví dụ thứ hai xét đến một mẫu ngẫu nhiên của những thành phố mà chúng ta sẽ liên hệ mức độ tội phạm thường gặp của những thành phố đó với số lượng nguồn lực sẵn có của từng thành phố trong việc chống tội phạm Chúng ta có thể kỳ vọng rằng sự phân tán của những điểm quan sát được có thể phân tán rộng hơn đối với những thành phố lớn hơn khi so sánh với những thành phố nhỏ hơn Ở đây một lần nữa giả thuyết về phương sai của sai số không đổi có thể bị vi phạm
Phương sai của sai số thay đổi cũng xuất hiện khi sử dụng dữ liệu nhóm thay vì sử dụng dữ liệu cá nhân Ví dụ, chúng ta có thể không có dữ liệu của từng công ty nhưng
Trang 2thay vào đó chúng ta có thể sử dụng dữ liệu trung bình của ngành Trong trường hợp này, mô hình có thể là Y = t α + β X + t u , với những thanh ngang biểu thị giá trị trung bình t cho ngành công nghiệp thứ t Phương sai của số hạng sai số giờ đây sẽ là Var( u ) = t
σ2 /n t , với n t là số lượng công ty trong ngành công nghiệp thứ t Bởi vì số lượng công ty có thể khác nhau, nên phương sai của các số hạng sai số cũng sẽ khác nhau, do đó dẫn đến hiện tượng phương sai của sai số thay đổi
} Hình 8.1 Một Ví Dụ Về Phương Sai Của Sai Số Thay Đổi
Trong chương này, chúng ta nới lỏng giả thuyết phương sai của sai số có giá trị không đổi và giả thuyết có phương sai của sai số thay đổi Chính thức hơn, chúng ta hiệu chỉnh Giả Thuyết 3.5 như sau:
GIẢ THUYẾT 3.5a
u t là một biến ngẫu nhiên với E(u t |X t ) = 0 và Var(u t | X t ) = E( 2
Thu nhậpTiêu dùng
Trang 3Phương sai của sai số thay đổi cũng có thể xuất hiện trong dữ liệu chuỗi thời gian Vấn đề này sẽ được thảo luận trong chương kế tiếp
} VÍ DỤ 8.1
DATA3-11 cho biết mức lương hàng năm và số năm có bằng tiến sĩ của 222 giáo sư từ bảy trường đại học Chúng ta thấy rằng mô hình lôgarít-wage là mô hình thích hợp đối với mô hình tiền công (wages) và tiền lương (salaries) Đồ thị trong Hình 8.2 biểu diễn lôgarít của tiền lương đối với số năm nhận được bằng tiến sĩ tương ứng Chúng ta lưu ý độ rộng xung quanh quan hệ đường thẳng trung bình là không đồng dạng, dẫn đến vi phạm giả thuyết thông thường về phương sai của sai số không đổi của các số hạng sai số Điều đáng chú ý ở đây là phương sai xung quanh quan hệ trung bình có điều kiện mới đầu tăng khi số năm tăng nhưng sau đó giảm dần Không có gì ngạc nhiên cả, bởi vì mức lương hiện thời của các tiến sĩ khá cạnh tranh trên thị trường việc làm và do vậy chúng ta không thể mong đợi những chênh lệch cao về mức lương Tuy nhiên, mức lương của những giáo sư trong biên chế có thể khác nhau nhiều phụ thuộc vào năng lực và uy tín của họ Sau một số năm, mức lương tăng theo chiều hướng ổn định và do đó phương sai có khả năng giảm bớt Chúng ta sẽ đi sâu vào ví dụ này một cách chi tiết hơn trong Phần 8.2 về việc kiểm định phương sai của sai số thay đổi
} Hình 8.2 Phương Sai Của Sai Số Thay Đổi Trong Lôgarít-Salary
Giả sử chúng ta bỏ qua phương sai của sai số thay đổi và sử dụng thủ tục OLS để ước lượng các tham số Tính chất của chúng là gì? Chúng có bị thiên lệch, không hiệu quả hay không nhất quán không? Những kiểm định thống kê có tiếp tục còn hiệu lực hay không? Có một thủ tục nào đó mà có lưu ý một cách rõ ràng đến phương sai của sai số
Lôgarít của tiền lương
Số năm có bằng Tiến Sĩ
Trang 4thay đổi và cho ra những giá trị ước lượng tốt hơn? Những vấn đề này lần lượt sẽ được đề cập ngay sau đây
} 8.1 Các Kết Quả Của Việc Bỏ Qua Phương Sai Của Sai Số Thay Đổi
Đầu tiên chúng ta nghiên cứu đến những quan hệ của việc sử dụng thủ tục OLS để ước lượng các hệ số hồi qui khi có sự hiện diện phương sai của sai số thay đổi Mô hình là
Tác Động Lên Tính Chất Của Các Ước Lượng
Những chứng minh của Tính Chất 3.1 và 3.2 (phát biểu rằng các ước lượng OLS là
không thiên lệch và nhất quán) chỉ phụ thuộc vào Giả Thuyết 3.3 và 3.4 (mà u t có giá trị
trung bình bằng không và không tương quan với X t) và không phụ thuộc vào Giả Thuyết 3.5 hay 3.5a Do vậy, các tính chất của sự không thiên lệch và sự nhất quán không bị vi phạm do việc bỏ qua hiện tượng phương sai của sai số thay đổi và sử dụng OLS để ước lượng α và β Tuy nhiên, trong khi chứng minh định lý Gauss-Markov, chúng ta đã sử
dụng giả thuyết cho rằng Var (u t |x t) = σ2 nhằm làm cực tiểu phương sai của một kết hợp
tuyến tính giữa các giá trị Y Bởi vì giả thuyết đó không còn đúng nữa, nên không thể
khẳng định rằng ước lượng OLS hiệu quả hơn Điều này có nghĩa là ước lượng OLS hiện giờ là không hiệu quả Có thể tìm một ước lượng tuyến tính không thiên lệch khác mà có giá trị phương sai thấp hơn ước lượng OLS Phần phụ lục của chương này minh họa điều này đối với mô hình hồi qui tuyến tính đơn
Tác Động Lên Các Kiểm Định Giả Thuyết
Có thể thấy rằng (xem Phụ Lục 8.A) các phương sai và đồng phương sai ước lượng của các ước lượng OLS cho các giá trị βi là thiên lệch và không nhất quán khi phương sai của sai số thay đổi hiện hữu nhưng bị bỏ qua (xem Kmenta, 1986, tr 276–279) Do đó, các kiểm định giả thuyết không còn giá trị nữa
Tác Động Lên Việc Dự Báo
Chúng ta vừa chứng tỏ rằng các ước lượng OLS vẫn không thiên lệch Từ đó dẫn đến các dự báo dựa trên những giá trị ước lượng này cũng sẽ không thiên lệch Nhưng vì lý
do các ước lượng là không hiệu quả, nên các dự báo cũng sẽ không hiệu quả Nói cách
Trang 5khác, độ tin cậy của những dự báo này (đo lường bằng phương sai của chúng) sẽ kém hơn một ước lượng thay thế khác có hiệu quả hơn
Kết quả nhận được trong phần này được tóm tắt trong Tính Chất 8.1
Tính Chất 8.1 Nếu ta bỏ qua phương sai của sai số thay đổi giữa những số hạng nhiễu ngẫu
nhiên trong một mô hình hồi qui và sử dụng thủ tục OLS để ước lượng các tham số, thì các tính chất sau có hiệu lực:
a Các ước lượng và dự báo dựa trên các ước lượng đó vẫn không thiên lệch và nhất quán
b Ước lượng OLS không còn là BLUE và sẽ không hiệu quả Các dự báo cũng sẽ không hiệu quả
c Phương sai và đồng phương sai ước lượng của các hệ số hồi qui sẽ thiên lệch
và không nhất quán, và do đó các kiểm định giả thuyết (tức là kiểm định t và F) không còn hiệu lực)
} 8.2 Kiểm Định Phương Sai Của Sai Số Thay Đổi
Bởi vì chúng ta biết rằng phương sai của sai số thay đổi làm mất hiệu lực của các kết quả kiểm định, nên ta sẽ mong muốn kiểm định một cách chính thức việc phương sai của sai số thay đổi có hiện hữu hay không Trong phần này, chúng ta giới thiệu các kiểm định được sử dụng phổ biến nhất đối với phương sai của sai số thay đổi
Tuy nhiên, trước khi đi vào thực hiện bất kỳ kiểm định chính thức nào, khá là hữu ích khi kiểm tra những phần dư của mô hình bằng cái nhìn bề ngoài để có được một cảm giác tự tìm xem phương sai của sai số thay đổi có hiện hữu hay không Thực hiện việc này bằng cách biểu diễn trên đồ thị bình phương của các phần dư có được từ việc áp dụng OLS vào mô hình đang xem xét Sử dụng bình phương các phần dư OLS bởi vì trong một mô hình hồi qui, phần dư u) là một giá trị ước lượng không thiên lệch của số t hạng sai số tổng thể u t, ngay cả đối với sự hiện diện của phương sai của sai số thay đổi
Do đó, một giá trị ước lượng dễ nhận thấy, mặc dù không hoàn hảo, của phương sai sai số 2
ˆt
u theo từng biến này hoặc tốt hơn là vẽ chúng
theo Y) , là giá trị thích hợp của biến phụ thuộc sử dụng giá trị ước lượng OLS Tuy t nhiên, ta nên thấy rằng kỹ thuật đồ thị này chỉ có tính gợi ý về phương sai của sai số
thay đổi và không thay thế được kiểm định chính thức
} VÍ DỤ 8.2
Trang 6Sử dụng bộ dữ liệu DATA3-11 đã được đề cập trong Ví Dụ 8.1, chúng ta thu được mô hình lôgarít bình phương sau đây (xem Phần Thực Hành Máy Tính 8.1 để kiểm tra lại kết quả trong phần này):
ln (SALARY) = 3,809365 + 0,043853 YEARS – 6,273475e-04 YEARS2
2
R = 0,532 d.f = 219
Giá trị trong ngoặc đơn là trị thống kê t, cho thấy có ý nghĩa rất cao Số hạng bình
phương cho phép có khả năng xảy ra lợi nhuận biên giảm dần theo kinh nghiệm Hệ số âm ý nghĩa mạnh của YEARS2 ủng hộ giả thuyết này Đối với việc kiểm tra bằng đồ thị khả năng phương sai của sai số thay đổi, chúng ta thu được bình phương các phần dư của phương trình và biểu diễn chúng theo kinh nghiệm Từ Hình 8.3 cho thấy các phần
dư bình phương có xu hướng tăng lên theo số năm rồi sau đó giảm dần, một dạng mẫu hình đã được giải thích trong Ví Dụ 8.1 Mặc dù không đưa ra ở đây (thực hiện Phần Thực Hành 8.1 cho điều này), đồ thị phần dư bình phương theo giá trị dự báo của ln(SALARY) cho thấy một sự tăng nhiều hơn rõ rệt của phương sai Do đó có một bằng chứng có tính gợi ý về phương sai của sai số thay đổi trong mô hình Trong phần kế tiếp, sẽ tiến hành một kiểm định chính thức đối với việc này
} Hình 8.3 Phương Sai Của Sai Số Thay Đổi Của Các Phần Dư Trong Ví Dụ 8.2
Phần dư bình phương
Số năm có bằng Tiến Sĩ
Trang 7Kiểm Định Nhân Tử Larrange (LM) Đối Với Phương Sai Của Sai Số Thay Đổi
Có một số kiểm định đối với phương sai của sai số thay đổi và chúng khác nhau về nguyên tắc và năng lực kiểm định Trong những kiểm định đó, phương pháp kiểm định
LM trở nên phổ biến trong những năm gần đây Bởi vì kiểm định thống kê này dễ tính toán và nó có thể bao quát được nhiều phương án Trong phần này, chúng ta thảo luận kiểm định LM đối với phương sai của sai số thay đổi theo ba phương án giả thuyết về nguyên nhân gây ra phương sai của sai số thay đổi Đặt mô hình là
u | x t) Nếu chúng ta không chỉ rõ dạng của αt, thì sẽ có
n, σ và k hệ số hồi qui để ước lượng, tức là, n + k tham số để ước lượng Chỉ với n quan sát, đây là nhiệm vụ không thực hiện được Do đó chúng ta cần thiết phải đơn giản hóa những giả thuyết về phương sai sai số Ba phương án sau đây bao quát hầu hết các trường hợp đã thảo luận trong lý thuyết:
Harvey-Godfrey (Harvey, 1976, và Godfrey, 1978) sử dụng biểu thức (8.2c) Kiểm
định cuối cùng được gọi là phương sai của sai số thay đổi bội bởi vì phương sai sai số được xác định như tích số của một số các số hạng Kiểm định Park (Park, 1966) là một
trường hợp đặc biệt của kiểm định Harvey-Godfrey và không được đề cập đến một cách
riêng rẽ ở đây Dễ thấy rằng giả thuyết không của phương sai của sai số thay đổi có p –
1 ràng buộc và được cho bởi α2 = α3 = … = αp = 0 Theo giả thuyết không phương sai sẽ
không đổi, có nghĩa là phương sai của sai số thay đổi không tồn tại Lưu ý rằng trong tất
cả các biểu thức trên, chúng ta giả định rằng các biến đã biết Z chịu trách nhiệm đối với
phương sai của sai số thay đổi
Bởi vì chúng ta không biết σt, nên chúng ta sử dụng giá trị ước lượng có được từ việc áp dụng OLS vào Phương Trình (8.1) Do đó, chúng ta sẽ sử dụng 2
ˆt
u cho 2
t
σ , uˆ t
Trang 8(giá trị tuyệt đối của u t) cho σt và ln(uˆt2) cho ln( 2
t
σ ) Các bước tiến hành kiểm định LM như sau:
Bước 1 Hồi qui Y theo một số hạng không đổi, X2, X3, … , và Xk, và nhận được giá trị
ước lượng OLS của các hệ số β
Bước 2 Tính toán phần dư uˆ = Y t t - βˆ1 - βˆ2 X t2 - βˆ3 X t3 - … - βˆk X tk
Bước 3a Bình phương các phần dư và hồi qui 2
ˆt
u theo một số hạng không đổi, Z t2 ,
Z t3 ,…, và Z tp, và nhận được giá trị ước lượng OLS cho các hệ số α Đây chính
là hồi qui phụ tương ứng với Phương Trình (8.2a)
Bước 3b Tính toán giá trị tuyệt đối và hồi qui uˆ t theo một số hạng không đổi, Z t2 ,
Z t3 ,…, và Z tp, và nhận được giá trị ước lượng OLS cho các hệ số α Đây chính
là hồi qui phụ tương ứng với Phương Trình (8.2b)
Bước 3c Lấy lôgarít của bình phương các phần dư và hồi qui ln(uˆt2) theo một số hạng
không đổi, Z t2 , Z t3 ,…, và Z tp, và nhận được giá trị ước lượng OLS cho các hệ số
α Đây chính là hồi qui phụ tương ứng với Phương Trình (8.2c)
Bước 4 Tính toán kiểm định thống kê LM = nR 2 , với n là số quan sát được sử dụng
trong việc ước lượng hồi qui phụ và R2 là R 2 chưa hiệu chỉnh từ hồi qui này
Bước 5 Tính giá trị p = Prob( 2
1
−
p
χ >LM), đó là phần diện tích ở phía bên phải của LM
trong phân phối Chi bình phương với bậc tự do df là p – 1
Bước 6 Bác bỏ H0: αi = 0 với (i = 2, 3, …, p) và kết luận rằng phương sai của sai số
thay đổi có ý nghĩa nếu giá trị p nhỏ hơn mức ý nghĩa Hoặc là, tra bảng Chi bình phương đối với bậc tự do df là p -1 cho giá trị tới hạn 2
Trị thống kê nR2 được đề cập đến ở đây không phải là trị thống kê kiểm định được
đưa ra bởi những tác giả đầu tiên của những kiểm định này Ví dụ, kiểm định Glesjer không phải là một kiểm định Wald Harvey đưa ra một kiểm định tỉ lệ thích hợp (xem Phụ Lục Chương 6 về kiểm định tỉ lệ thích hợp) Các kiểm định Breusch-Pagan và kiểm định Godfrey kiến nghị một nửa tổng bình phương hồi qui (định nghĩa trong Chương 3) về hồi qui phụ là một kiểm định thống kê, mà nó có phân phối giống như 2
1
−
p
χ Như Engle (1984) đã chỉ ra, bởi vì tất cả các kiểm định này là những kiểm định mẫu lớn, cho nên tất cả kiểm định đề xuất bởi nhiều tác giả khác nhau đều tương đương về mặt thao tác với kiểm định nhân tử Lagrange vừa được đề cập ở trên Bởi vì phân phối chính xác của những kiểm định thống kê này chưa được biết (đặc biệt là với cỡ mẫu nhỏ), do vậy chúng khác nhau về năng lực của kiểm định Kiểm định biết rõ nguyên nhân gây nên phương sai của sai số thay đổi càng chính xác, thì năng lực của kiểm định đó càng cao
Do kiểm định LM gần tương đương với những kiểm định khác (tức là, dành cho những
Trang 9cỡ mẫu lớn), trị thống kê nR 2 là thích hợp nhất và nó là kiểm định đề nghị được sử dụng Người đọc với những kiến thức về đại số ma trận được khuyến khích nghiên cứu chi tiết hơn những vấn đề về kiểm định và ước lượng đối với sự hiện diện của phương sai của sai số thay đổi trong những bài báo đầu tiên của các tác giả đã trích dẫn trong bài Cũng nên tham khảo Chương 12 quyển sách của Green (2000) có một tóm tắt xuất sắc về những vấn đề này
} VÍ DỤ 8.3
Trong Ví Dụ 8.1, chúng ta đã sử dụng mô hình bình phương-lôgarít về lương của những giáo sư với dữ liệu lấy từ DATA3-11 và minh họa bằng đồ thị sự hiện diện của phương sai của sai số thay đổi, với các phương sai sai số lúc đầu tăng theo số năm từ khi họ lấy được bằng Tiến sĩ và sau đó giảm dần Điều này gợi ý những mô hình bình phương cho cấu trúc sai số sau đây:
định LM đều lớn hơn giá trị này, và do vậy chúng ta bác bỏ giả thuyết không cho tất cả
các trường hợp và kết luận rằng có phương sai của sai số thay đổi Như Bảng 8.1 cho biết, dấu của giá trị α2 ước lượng là dấu dương và dấu của giá trị α3 ước lượng là dấu âm trong cả ba kiểm định, khẳng định rằng mẫu hình đồ thị của việc đầu tiên phương sai tăng dần và sau đó giảm dần
Kiểm Định Goldfeld-Quandt
Goldfeld và Quandt (1965) đưa ra một kiểm định khác dựa trên khái niệm cho rằng nếu phương sai của sai số là như nhau cho tất cả các quan sát (tức là, nếu chúng có tính chất phương sai của sai số không đổi), thì phương sai cho một phần của mẫu cũng sẽ tương tự như phương sai cho một phần khác cũng của mẫu đó Do vậy ta có thể kiểm định sự
bằng nhau giữa những phương sai của sai số bằng việc sử dụng một kiểm định F Kiểm
định trở thành một tỉ số của hai phương sai mẫu Chia mẫu của những quan sát thành ba phần, và loại bỏ những quan sát ở giữa Tiếp đến mô hình sẽ được ước lượng cho từng cặp quan sát và tính toán phương sai phần dư Những bước chính thức thực hiện kiểm
định Goldfeld-Quandt như sau:
Trang 10} Bảng 8.1 Kết Quả Riêng Phần Của Các Kiểm Định LM Trong Ví Dụ 8.3 Sử Dụng
DATA3-11
[Đầu tiên lấy hồi qui của ln(SALARY) theo một hằng số, YEARS, và YEARS2 Tiếp theo phát ra
các biến: usq = 2
YEARS và YEARS2 đều bằng không.]
Dependent variable: usq
Chi-square(2): area to the right of (LM =) 16.586551 = 0.000250
[Giá trị p thấp cho biết bởi vì khả năng bác bỏ một giả thuyết đúng là thấp, nên chúng ta có thể bác
bỏ một cách an toàn giả thuyết không về phương sai của sai số thay đổi và kết luận rằng có phương
sai của sai số thay đổi một cách ý nghĩa Tiếp đến là hồi qui phụ cho kiểm định Glesjer.]
Dependent variable: absuhat
Chi-square(2): area to the right of (LM =) 28.922794 = 0.000001
[Giá trị p thấp như vậy cho biết sự hiện hữu của phương sai của sai số thay đổi Tiếp theo là hồi qui
phụ đối với kiểm định Harvey-Godfrey cũng với giá trị p thấp, cho biết sự hiện hữu của phương sai
của sai số thay đổi]
Dependent variable: lnusq
Chi-square(2): area to the right of (LM =) 35.302998 = 0.000000
Trang 11Bước 1 Xác định một biến (VD là Z) mà phương sai của sai số 2
t
σ quan hệ với nó Ví dụ, giả định rằng 2
t
σ nghi ngờ quan hệ đồng biến với Z t Sắp đặt lại bộ dữ
liệu theo giá trị tăng dần của Z t (Z t có thể là một trong những giá trị X trong hồi qui, chẳng hạn như thu nhập hay dân số)
Bước 2 Chia mẫu có n quan sát thành n1 đầu tiên và n2 cuối cùng, do vậy loại bỏ tất
cả các quan sát ở phần giữa từ n1 + 1 đến n - n2 Số quan sát được loại bỏ là
tùy ý và thường thường là giữa một phần sáu hoặc một phần ba Lưu ý rằng
n1 và n2 phải lớn hơn số hệ số được ước lượng
Bước 3 Ước lượng những hồi qui riêng biệt cho các quan sát từ 1 đến n1 và từ n – n2
n
t t
uˆ và ESS2 = ∑
+
−
=
n n n
u
1 2
2ˆ
Từ Tính Chất 4.1c chúng ta biết rằng ESS/ 2
)/(
ˆ
ˆ
1 1
2 2
1
2 2
k n
k n
−
−
=ESS
ESS2σ
σ
với k là số hệ số hồi qui bao gồm luôn cả số hạng hằng số Theo giả thuyết
không về phương sai của sai số không đổi, giá trị F c tuân theo phân phối F với bậc tự do df là n2 – k và n1 – k Nếu F c > F * , điểm nằm trên phân phối F
mà diện tích về phía bên phải là 5 phần trăm, thì bác bỏ giả thuyết không về phương sai của sai số không đổi và kết luận rằng có phương sai của sai số
thay đổi [Lưu ý: Nếu F c < 1, thì sử dụng 1/F c Bởi vì giả thuyết thay thế thường là 2
Trang 12Theo giả thuyết không về phương sai của sai số không đổi, F c tuân theo phân phối F với bậc tự do df là 72 cho tử số và cùng bậc tự do như vậy cho mẫu số Giá trị F * tới hạn đối với mức 1 phần trăm nằm giữa 1,53 và 1,84 (xem Bảng A.4a) Do vậy, kiểm định thống kê rõ ràng có ý nghĩa, điều này gợi ý rằng chúng ta nên bác bỏ giả thuyết không và khẳng định lại những kết quả trước đây
Kiểm Định Của White
Kiểm định Goldfeld-Quandt không hữu ích như những kiểm định LM bởi vì nó không thể tương thích với những trường hợp mà có nhiều biến kết hợp gây nên phương sai của sai số thay đổi, như trong Phương Trình (8.2a), (8.2b), và (8.2c) Cũng bằng cách bỏ đi những quan sát ở giữa, chúng ta đã loại ra những thông tin có giá trị Ta thấy rằng kiểm định Breusch-Pagan là nhạy cảm với bất kỳ vi phạm nào lên giả thuyết tiêu chuẩn (Xem Koenker, 1981, về việc thay đổi kiểm định của họ đối với sự hiện hữu của tính không chuẩn tắc.) Tất cả những kiểm định trước kia đều yêu cầu một kiến thức trước đó về cái mà có thể gây nên phương sai của sai số thay đổi White (1980) đã đưa ra một kiểm định trực tiếp về phương sai của sai số thay đổi mà nó rất gần với kiểm định Breusch-Pagan nhưng lại không giả định bất kỳ kiến thức nào trước đó về phương sai
của sai số thay đổi Kiểm định của White cũng là một kiểm định LM mẫu lớn với lựa
chọn đặc biệt cho các giá trị Z, nhưng nó không phụ thuộc vào giả thuyết chuẩn tắc Vì
những lý do này, kiểm định này được đề nghị hơn tất cả các kiểm định trước Ta cũng có thể tiến hành tất cả các kiểm định và xem kết quả nào là vững chắc Các bước thực hiện kiểm định White về phương sai của sai số thay đổi được mô tả theo mô hình sau Việc mở rộng những mô hình tổng quát hơn thì không phức tạp lắm
Y t = β1 + β2X t2 + β3X t3 + u t (8.3)
3 2 6 2 3 5 2 2 4 3 3 2 2 1 2
t t t
t t
t
Bước 1 Ước lượng (8.3) bằng thủ tục OLS và nhận được βˆ1, βˆ2, và βˆ3
Bước 2 Tính toán phần dư uˆ = Y t t - βˆ1 - βˆ2X t2 - βˆ3X t3, và lấy bình phương phần dư
Bước 4 Tính toán trị thống kê nR 2 , với n là cỡ mẫu và R2 là R-bình phương chưa hiệu
chỉnh từ hồi qui phụ của Bước 3
Bước 5 Bác bỏ giả thuyết không cho rằng α2 = α3 = α4 = α5 = α6 = 0 nếu nR2 > 2
5
χ (α), điểm α phần trăm cao hơn trong phân phối chi-bình phương với bậc tự do df là 5
Trang 13Mặc dù kiểm định này là một kiểm định với cỡ mẫu lớn, nó khá hữu ích đối với cỡ mẫu từ 30 trở lên Nếu không bác bỏ giả thuyết không, Phương trình (8.4) trở thành 2
u Chúng ta hồi qui phần dư bình
phương theo tất cả các biến trong bước đầu tiên, cộng với bình phương của tất cả các biến độc lập, cộng với tích số chéo giữa các cặp hồi qui Cuối cùng, chúng ta tính toán
trị thống kê nR2 và bác bỏ hiện tượng phương sai của sai số không đổi nếu nR2 >χ (α) 2
với mức ý nghĩa là α và bậc tự do tương đương với số hệ số hồi qui trong hồi qui phụ với
2
ˆt
u là biến phụ thuộc, loại trừ hằng số Lưu ý rằng bậc tự do khác với bậc tự do nhận
được khi sử dụng kiểm định LM để kiểm định những biến bị loại bỏ
Cần phải cẩn trọng trong việc thực hiện Bước 3, đặc biệt là nếu một vài biến giải
thích là những biến giả Nếu X t2 là một biến giả, thì 2
2
t
X đồng nhất với X t2 và do vậy không nên tính đến một cách riêng biệt, nếu không chắc chắn sẽ xảy ra hiện tượng đa cộng tuyến và không thể chạy được hồi qui phụ Thứ hai, nếu Phương Trình (8.3) có nhiều biến giả, Bước 3 sẽ gồm rất nhiều biến (bởi vì những số hạng bình phương và những số hạng tích chéo nhau) Do vậy khả năng số biến trong hồi qui phụ vượt quá số quan sát, và làm cho Bước 3 không thể thực hiện được Trong trường hợp tổng quát, với
k biến giải thích, bao gồm cả số hạng hằng số, hồi qui phụ sẽ có k(k + 1)/2 số hạng Số quan sát phải lớn hơn số số hạng này và vì vậy n>k(k + 1)/2 là một điều kiện cần thiết
Nếu bậc tự do có thể là một vấn đề, thì một phương án đơn giản dùng để hồi qui 2
2
t
σ = α1 + σ2YEARS + σ3YEARS2 + α4YEARS3 + α5YEARS4
Hồi qui phần dư bình phương có được từ việc áp dụng OLS vào mô hình bình
phương-lôgarít theo một hằng số và theo số mũ của YEARS, R2 chưa hiệu chỉnh = 0,09 và n =
222 (xem Phần Thực Hành Máy Tính 8.4) Do đó, LM = nR2 = 19,98 Giả thuyết không
là αi = 0 với i = 1, 2, …, 5 Dưới giả thuyết này, LM có phân phối chi-bình phương với
Trang 14bậc tự do df là 4 và mức ý nghĩa 0,001 là 18,467, nhỏ hơn LM Do vậy, ở đây chúng ta cũng bác bỏ hiện tượng phương sai của sai số không đổi
} 8.3 Các Thủ Tục Ước Lượng
Nếu giả thuyết về phương sai của sai số không đổi bị bác bỏ, chúng ta gặp phải vấn đề trong việc cố gắng tìm ra những thủ tục ước lượng thay thế mà nó tốt hơn thủ tục bình phương tối thiểu thông thường Trong phần này, chúng ta thảo luận một số phương pháp ước lượng
Ước Lượng Ma Trận Đồng Phương Sai Nhất Quán Phương Sai Của Sai Số Thay Đổi (HCCM)
Trong Tính Chất 8.1, đã đề cập đến các phương sai ước lượng của giá trị ước lượng OLS
bị thiên lệch và không nhất quán, và do vậy những suy luận thống kê sẽ không còn hiệu lực nữa Tuy nhiên, nếu có thể thu được những giá trị ước lượng nhất quán đối với các
phương sai ước lượng, thì vẫn có thể có những suy luận còn hiệu lực đối với những cỡ mẫu lớn White (1980) đưa ra một phương pháp để có được những ước lượng nhất quán
của phương sai và đồng phương sai của ước lượng OLS, mà ông ta gọi là Ước Lượng Ma
Trận Đồng Phương Sai Nhất Quán Phương Sai Của Sai Số Thay Đổi (HCCM) Messer và White (1984) cho thấy có thể có được một ước lượng HCCM bằng cách sử dụng kết hợp các hồi qui thông thường Việc này đã được mở rộng bởi MacKinnon và White (1985), họ đã nghiên cứu ba phương pháp khác nhau để có được giá trị ước lượng HCCM Họ kết luận từ những mẫu thực nghiệm rằng ước lượng với tính chất cỡ mẫu nhỏ
tốt nhất thì dựa vào cái mà những nhà thống kê thường ví đến như Jackknife (con dao
xếp) (Effron, 1982) Trong những số hạng đơn giản, một ước lượng Jackknife trước hết
sẽ ước lượng một mô hình n lần, mỗi lần bỏ đi một quan sát Việc này sẽ phát sinh ra
một chuỗi các giá trị ước lượng mà tính chất thay đổi được của nó sẽ được tận dụng trong việc xây dựng ước lượng Jackknife như một giá trị trung bình của các phương sai và đồng phương sai riêng biệt
} VÍ DỤ 8.6
Đối với ví dụ tiền lương mà chúng ta đang sử dụng, cả hai giá trị ước lượng OLS và HCCM của các sai số chuẩn đều có được từ việc sử dụng chương trình GRETL và SHAZAM (xem Phần Thực Hành Máy Tính 8.5) Kết quả nằm ở phần kế tiếp với những sai số chuẩn OLS trong ngoặc đơn; những sai số chuẩn HCCM từ chương trình GRETL nằm trong ngoặc vuông, và những sai số chuẩn HCCM từ chương trình SHAZAM nằm trong ngoặc móc Những giá trị ước lượng HCCM của phương sai của ước lượng là nhất quán, trong khi những giá trị ước lượng OLS thì lại không, nhưng những giá trị ước lượng
của các hệ số hồi qui và R bình phương sẽ không thay đổi ( R = 0,532) 2