Nối tiếp nội dung phần 1, phần 2 Bài giảng Kinh tế lượng cung cấp cho người học các kiến thức: Phương sai của sai số cơ bản, tự tương quan, chọn một mô hình và kiểm định việc định dạng mô hình, mô hình hồi tự quy, mô hình có trễ phân phối và kiểm định quan hệ nhân quả. Mời các bạn cùng tham khảo.
Trang 1CHƯƠNG VI
PHU0NG SAI CÙA SA! s ố THAY BỔI
Một trong những giả thiết quan ưọng cùa mổ hỉnh hồi quy tuyến tính cổ điển
1& các nhiẻu ngẫu nhiên ụ trong hàm hồi quy tổng thể có phuơng sai khổng dổi Nhung liẹu trong thục tế giả thiết này cố thổ bị vi phạm không? Nếu g ii thiết này
bị vi phạm tlủ điều gì sẽ xảy ra? Làm thế nào để biết dược rằng giả thiết này bị vi phạm? Cách khấc phục như thế nào? Đó là một loạt các câụ hỏi mà chúng ta sẽ trả
6.1 NGUYÊN NHÂN CỦA PHUƠNG SAI CỦA SAI s ố THAY Đ ổ i
l ễ Phương sai của saỉ số thay đổi là gì?
Khi nghiên cứu mố hình hồi quy tuyến tính cổ điển, chúng ta đã dưa ra giả thiết rằng: phương sai của mỗi một nhiễu ngẫu nhiên ụ trong diều kiện giá trị dã cho của biến giải thích Xi là không đổi, nglũa là
Var(lí I Xi) = E tú - E (lí)]2 = E(Ụ)2 = ơ2 (6.1)
i = 1,2, nV6 mặt đồ thị thì mo hình hồi quy 2 biến có phưong sai khổng đổi được m in h
h ọ a ở h ìn h6ẳl
124
Trang 2Ngược với trưòmg hợp trên là trường hợp: phương sai có điều kiện của thay doi khi X, thay dổi, nghĩa là: E(Ụ)2 = CT| (trông đó các ơjJ khác nhau) Thí dụ k h i, nghiên cứu mối quan hệ giữa lỗi mắc phải do đánh máy trong một thời kỳ đã cho VỚI số giờ thực hành, thì người ta nhận thấy số giờ thực hành đánh máy càng tàng thì lỗi sai trung bình mác phải càng giảm Điều này mô tả bàng đồ thị hình 6.2.
2 Nguyên n h ân của phưong sai của sai số thay đổi
Phương sai thay đổi có thể do một trong các nguyên nhân sau:
- Do bản chất của các mối liên hê kinh tế: có nhiều mối quan hộ kinh tế đã chứa đựng hiện tượng này Chẳng hạn mối quan hệ giữa thu nhập và tiết kiệm thông thường thu nhập tăng thì mức độ biến động cùa tiết kiệm cũng tảng
- Dó kỹ thuật thu nhập số liộu được cải titíh, ơ2 dường như giảm Kỹ thuật thu thập số liệu càng dược cải tiến sai lầm phạm phải càng ít hơn
- Do con người học được hành vi trong quá khứ Chẳng hạn, lỗi cùa người đánh máy càng ít nếu thời gian thục hành càng tăng
- Phương sai của sai số thay đổi cũng xuất hiện khi có các quan sát ngoại lai Quan s it ngoại lãi là các quan sát khác biột rất nhiều (quá nhò hoặc quá ĩớii) với các quan sát khác trong mấu Việc đưa vào hay loại bò các quan sát này ảnh hường rất lớn đến phân tích hổi quy
- Một nguyên nhân khác là mô hình định dạng sai Có thể do bỏ sót biến thích hợp hoặc dạng giải Uch của hàm là sai
Trang 36.2 UỠC LUDNG B
s ố THAY ĐỔI
Trong mục này chúng ta hãy xem điều gl sẽ xảy ra đối với các ưóc lượng bình phương bé nhất và phucmg sai của chúng nếu phưtmg sai của sai số thay đổi nhung vẫn giữ nguyên các giả thiẾt khác của mô hình hồi quy tuyến tính cổ điển ? Để trả lời cho vấn d& đó ta xét mò hình hai biến sau:
Áp dụng công thức thống thường của phutmg pháp bình phưong nhỏ nhít đã
cho ờ chương truớc để tính p2 ta đuục:
= E (k Iỉư 1+ k22ư2+ + k níư „)
(do giả thiếc không tương quan)
Trang 4Như ta đã biết P2 là ước lượng tuyến tính không chệch tốt nhất của p2 nếu các giả thiết của mô hình hồi quy tuyến tính cổ điển được thòa mãn Nhưng liệu nó có còn là ước lượng tuyến tính khóng chệch tốt nhất trong trường hợp giả thiết phương sai của sai số không thay đổi không được thỏa mãn nữa không?
Dê chứng tỏ rằng p2 vẫn là ước lượng tuyến tính khồng chệch của P2 Nhưng liệu P2 có vẫn là ước lượng hiộu quả nữa không? Liệu phương sai tính được từ(6.4) có phải là phưcmg sai cực tiểu không? Nếu không thì cái gì là ước lượng tuyên tính không chệch tốt nhất trong trường hợp này? Để trả lời câu hòi đó ta xét mục sau:
6.3 PHUƠNG PHÁP BÌNH PHUƠNG NHỎ NHẤT TổNG QUÁT
Để giải đáp cho câu hỏi ở-mục trên ta cần phải xét phương pháp bình phương nhỏ nhất tổng quát Trước khi đi vào nội dung cụ thể, chúng ta trình bày “phương pháp bình phương nhò nhất có trọrig số”
1 Phương pháp bình phương nhỏ nhất có trọng số
XỂt mô hình 2 biến
Ỵ = p, + fcXi + l íNhư ta đã biết phương pháp bình phữơng nhò nhất không có trọng số: cực tiểu tổng bình phương các phần dư:
để thu được các ước lượng
Còn phương pháp bình phương nhỏ nhất có trọng số cục tiểu tổng bìnhphưcmg các phần dư có trọng số:
Var(Ụ I Xi) = Var(Yi I Xi) = ơ 2i
Vì phân cà 2 vế của phương trình (6.1) theo 3i* và p2’ ta được:
Trang 5Ẻ V ị Y ị - P Ĩ Ỉ V i + P Ỉ ẳ ^ X ị
Z W i X i Y ^ P t Z W i X i + p j Z W i X ? (6.9)
giải hệ này ta được:
Rõ rặng rằng khi Wi = w (Vi) thì trung bình có trọng số bằng trung bình thông thường
2 Phương pháp bình phương nhỏ n h át tổng quát
Bây giờ ta quay lại ước luợng bình phương nhò nhất cùa Pĩ đã cho ở trên lì
p 2 p2 vẫn là ước lượng tuyến tính khồng chệch nhung không phải là tốt nhất Vi sao? Nguyên nhân của hiện tuợng đó là do một giả thiết cùa mô hình cổ điển khống được thỏa mãn đố là giả thiết phương sai của sai số khổng đỏi bị vi phạm.Vậy làm thế nào dể khắc phục tình trạng đỗ? Đổ trả lời cụ thể cho câu hòi này chúng ta phải phân biẹt từng trường hợp đã biết hoặc chua biết phucng sai (xem ở
mục cuối ở chương này) Ở đây chúng ta chỉ trinh bày một phương pháp tổng quát
dể đưa một mô hình khống thỏa mãn giả thiết: phưcmg sai của sai số khỗng thay đổi, về mô hình thỏa mãn giả thiết đó, để làm cơ sở cho việc xem xét ảnh huờng của viộc vi phạm giả thiết này
128
Trang 6Xét mô hình 2 biến Yj = p m -t- p2X + u, , trong đó tất cả các giả thiết của mô hình h'ôi quy tuyến tính cổ điển được thỏa mãn trừ giả thiết phương sai của sai số không đổi Phương Irình này có thể viết lại dưới dạng
Vậy ư i có phương sai không đổi
Vì chúng ta vẫn giỉr lại tất cà các giả thiết khác cùa mô hlnh hồi quy tuyến tính cổ điểnỄ Thêm vào đó Ưi thỏa mân cả giả thiết phương sai khống đổi.Nên nếu chúng ta tiếp tục phương pháp binh phương nhỏ nhất cho mô hình biến đổi (6.14) thì các ước lượng sinh ra từ đó sẽ là các ước lượng tuyến tính không chộch tốt nhất.Thủ tục biến đổi các biến gốc theo cách dã trình bày ố trỗn trong đó các biến
đã được biến đổi thỏa mãn các giâ thiết cùa mô hình cổ điển và sau đó áp đụng
phuơng pháp bình phương nhỏ nhất vào chúng, được gọi là plĩưomg pháp bình phương nhỏ nhất tổng quát.
Thù tục uớc lượng Pi*
Trước hết ta viết hàm hồi quy mẫu cùa (6.14) dưới dạng:
Để thu được ước lượng bình phưcmg nhỏ nhất tổng quát, ta cục tiểu hàm:
È e f = i K - p ; x ; i - p ; x *)2i=I i;=l
Trang 7(ẳwi)(ỉw ixf)-(l:w ixi)í
? w‘i»l
V ar{/Í;) = — - ^ - - (6.18)
i<
6.4 HẬU QUẢ CỦA PHUONG s a i c ủ a s a i s ố THAY Đ ổ i
Mục này ta sẽ xét xem phương sai cùa sai số thay đổi ảnh hưởng như thế nào đốn cíc ước lượng thu đuợc
Trang 8Vì E(ư,) = 0 và X không phải là ngẫu nhiên nên E (32) = p2, vậy P2 là uớclượng không chệch cùa p2-
Ta tính được:
( È x ? ) ’1=1(cách làm tương tự nhu đã nói ở trên)
Bây giờ chúng ta thưc hiên đánh trọng sô' cho quan sát thứ i lầ — trong đó Zj
Zithỏa mãn điều kiên Zj2 = ơi2 / ơ2 (ơ2 là hằng số) (Luu ý ràng phép biến đổi ở đây tổng quát hơn ở trên một chút vì chĩ cần đặt ơ2 = 1 ta được ngay Zi = 1/Wj) Ta sử dụng p" để chì uớc lượng tham số cùa mô hình đã biến đổi Lúc đó (6.17) có thể viết lại là:
Trang 9t ó - H - (6.22)
È ( Y i/Z iXX,7Z1) Ẻ ( X ,/Z ,)V ! ã ! _ _ n ễ i-1 _
V
È « ? Ẻ b ? i ( Ẻ a i b ,i=l i*l M=1
và dấu bằng xảy ra khi và chi khi
Trang 10Var(p;> S Ị
Var(P2)Nghĩa là V ar(pj) < Var(p2), dấu bàng chì xảy ra khi và chì khi
ai X j Z j J
bĩm' W k ' ếZì=const
nghĩa là ơj2 không đổi, vậy ước lượng ậ2 không hiệu quả.Bây giờ ta quay lại với
ước lượng cùa phương sai cùa p2 như đã biết, nó được ước lượng bởi công thức RSS 1
sau: _ £ X 2 ■ Trong đó RSS là tổng bình phương các phần dư thu đươc từ mô hình ước lượng bình phương nhỏ nhất Ta tính kỳ vọng của RSS :
thì giá trị kỳ vọng của phương sai đã được ước lượng nhò hơn phương sai thực Như vậy chúng ta sẽ ước lượng quá thíp phưcmg sai thực của ước lượng bình phương nhỏ nhất và sẽ thu được khoảng tin cậy hẹp hơn khoảng tin cậy thực Điều này sẽ làm ảnh hưởng kiểm định giả thiết về p2 Hay nói cách khác là khoảng tin cậy và các kiểm định gia thiết dựa trên phân phối t và F không còn đáng tin cây nữa VI vậy nếu sử dụng thủ tục kiểm định già thiết thông thường có thể dẫn đến nhũng kết luận sai lầm Điều này sẽ dãn đến hậu quả khônp lường trước đuợc trong
Trang 11thục tiễn Đó chính là lý do vì sao chúng ta phải nghiên cứu vấn dè này Nhung làm thế nào để biết được rằng phương sai của sai số thay đổi hay không?
6.5 PHÁT HIỆN RA PHTJONG SAI CỦA SAI s ố THAY Đ ổ i
N hu chúng ta đ ã thấy VẾ m ặt lý thuyết thì dẻ dàng chì ra hậu quả của hiện tuợng phương sai của sai số thay dổi, nhung việc phát hiện ra hiện tượng nầy trong thục tế thì cOng không phải 1& vắn dề đơn giản Vì sao vậy? Bồi vì chúng ta biét đuợc ơi2 chi khi chúng ta có toàn bô tổng thể luơng úng với những giá trị X duợc chọn, nhung điều này hầu như hiếm xảy ra, nghĩa là chúng la ít khi có đuợc toàn
bộ tổng thể dể nghiên cứu Thông thuờng chúng ta chĩ có đuợc mảu rút ra đuợc từ tổng thé muốn nghiên cứu mà thoi Như vậy chúng ta chi có những giá trị dcm cùa
Y ứng với những giá tri đã cho cùa biến X và ta lại không có cách nào để xác định phương sai ơi2 từ giá trị đơn của Y Vậy thì làm thế nào để phát hiện ra phuơng sai của sai số thay đổi?
Cũng như trong truờng hợp “đa cộng tuyến”, chúng ta không có một phuung pháp chác chắn để phát hiện ra phương sai của sai số thay đổi Chúng ta chỉ có vài công cụ để chẩn đoán có thể giúp chúng ta phát hiện ra hiện tượng này Sau đìy chúng ta hãy xét một vài cách chẩn đoán
1 Bản chất của vấn đ'ê của nghiên cứu
Thông thuờng bản chất cùa vấn dề nghiên cứu gợi ý cho chúng ta ràng có thể xảy ra hiện tượng: Phương sai của sai số Ihay đổi hay khồng? Trên thực tế thì ở số liệu chéo liẻn quan đến các dcm vị khổng thuần nhất hay xảy ra hiện tượng phương sai cùa sai sđ thay dổi Chảng hạn trong nghiên cứu số liệu chéo của chi phí trung binh của sản xuất tùy theo số lượng sằn phẩm được săn xuất ra, trong mảu gồm những doanh nghiệp có quy mổ khác nhau, người ta thíy rằng dường như phương sai của sai số thay đổi
2 Xem xét đò thị của phần dư
ĐỒ thị cùa sai số cùa hồi quy (phần dư) đối với biến độc lập X hoặc giá trị dự đoán Ỹ sẽ cho ta biết liệu phucmg sai cùa sai số có thay đổi hay không Phuơng sai của phần dư đuợc chi ra bầjig độ rộng cùa biểu đ6 phân rải của phần dư khi X tảng Nếu độ rộng của biểu đồ rải của phần dư tảng hoặc giảm khi X tăng thì giả thiết về phương sai hàng số có thể khổng đuọc thỏa m ỉn É -
T h í dụ tf j.ể Thí dụ sau đây là biểu hiện quan hệ của chi tiêu cho tiêu dùng (Y)
và thu thập (X) hàng tháng của 20 hộ gia đình ở một vùng nông thôn I
134
Trang 12Bàng 6.1 Chi tiêu cho tiêu dùng(Y) và thu nhập (X)
Đ/v 10.000 đGia
đình
Chi tiêu
YThu nhập X
Giađình
Chi tiêu YThu nhập X
Các giá trị dự đoán và phần du được tính trong bảng 6.2
Bảng 6.2 sắp xếp theo thứ tự của giá trị cùa các quan sát tăng dần lừ nhỏ đến lớn và các phần dư tữcmg ứng
Trang 13Vói giá trị đã cho trong bảng: đỏ thị của phần du đối với Xđuọc cho ờ ỉủnh 6.3.
Biểu đồ phần dư đối với Xcho chúng ta thấy rằng độ rộng của biểu dò rải tàng lên khi X tăng, cho nên có chúng cớ dể cho ràng phương sai của sai sổ thay đổi khi Xtăng Chú ý rằng dối khi người ta vẽ dò thị của phần dư bình phương dối với XNhưng có m ột vấn đề thực hành m à ta cần bàn tới là nếu chúng ta xem xét h'ốỉ
quy bội có nhiều hơn một biến giải thích thl chúng ta phải làm thế nào? Liệu có thể
dùng dồ thị nữa không? Một trong các cách có thể làm là vẽ đồ thị của phần dư (hoặc phần dư bình phương) theo Ỳ Vì Ỹ| là tổ hợp tuyến tính của các giá ưị của
X nên <fô thị của phần dư bình phương đối với Ỳi có thể chi ra một mẫu gợi ý cho
ta có tồn tại hiện tượng phuơng sai cùa sai số thay dổi hay khổng?
3 K iểm định Park
P ark đã hình thức hổa phương pháp dò thị cho ràng ơi2 là hàm nào đó của biến giải thích X Dạng hàm mà ống dề nghị là:
lấy ln cùa 2 vế ta được
lnơj2 = lnơ2 + p2 lnXi + Vi
T rong đó Vi là sơ hạng nhiẻu ngẫu nhiên
Vì ơ|2 là chưa biết nên Park đã đề nghị sù dụng e*2 thay cho ơi2 và ước lượng hồi quy sau:
lnei2 = lnơ|J + p2lnX + V| = Pi + P2lnXi +Vi (6.25) trong đó Pi = lnơị2 , ej2 thu dược từ hồi quy gốc
Như vậy để thực hiện kiểm định Park ta sẽ tiến hành các bước sau:
1 u&c lượng hồi quy gốc, cho dù có hoặc không tồn tại hiện tucmg phuơng sai của sai số thay đổi
136
Trang 142 Từ h'ôi quy gốc thu được các phần dư e, sau đó bình phương chúng được C\
rồi đến lấy ln e ,\
3 Uơc lượng hồi quy (6.23) trong đó biến giải thích (X) là biến giải thích trọng hồi quy gốc, nếu có nhiều biến giải thích có thể uớc lượng hồi quy đối với môi biến giải thích, hoặc có thể ước lượng hồi quy đối với Ỹị làm biến giải thích, trong đó Yi là Ỵ| đã được ước lượng
4 Kiểm định giả Ihiết Ho: Pỉ = 0 nghĩa là không có hiện tượng phương sai cùa
sai số thay đổi Nếu có t'ôn tại mối liên hệ có ý nghĩa v'ê mặt thống kẻ giữa
Ln e và lnXj thì giả thiết Ho: p2 = 0 có thể bị bác bỏ, trong trường hợp này ta phải tìm cách khác phục
5 Nếu giả thiết Ho: p2 = 0 được chấp thuận thì Pi trong hồi quy 6.25 có thể dược giải thích như là giá trị cùa phương sai không đổi (Pi = ln a2)
Thí dụ: Cân cứ vào số liệu đã cho ỏ bảng 6.2
“Phần dư đối với hàm tiêu dùng được ước lượng từ tập số liệu đã cho ờ bảng 6.1” u&e lượng h‘ôi quy 6.23 kết quả là như sau:
4 Kiểm định G lejser
Kiểm định Glejser cũng tương tự như kiểm định Park Sau khi thu được phần dư e; từ hồi quy theo phương pháp bình phương nhò nhất, Glejser đề nghị hồi quy giá trị tuyột đối cùa ej , 1ejl đối với biến X nào mà cớ thể
có kết hợp chặt chẽ vối ơị2 Trong thực nghiệm Glejser sử dụng các dạng hàm sau:
\eé\ = fl, + 0 1 X , + v Ê (6.26)
ị e ^ / } , + 0 2 y p c 7 + v ẫ ,(6.27)
Trang 15T ro n g đó Vi là sai số.
Giả thiết Ho trong mỗi trường hợp đã nẽu trên là không có phương sai của sai
số thay dổi, ngMa là Ho: p2 = 0 Nếu giả thiết này bị bác bỏ thì có Ihể có hiện tượng phương sai của sai số thay đổi Cân lưu ý ràng kiểm dịnh Glejser cũng có vấn dê như kiểm định Park Goldfeld và Quandt đã chi ra rằng sai số Vị trong hồi quy của Gleifser có một số vấn dề, như giá trị kỳ vọng của nó khác không, nó có tương quan chuỗi Tuy nhiên Glejser dã cho rằng trong mẫủ lớn thì 4 mô hình đầu cho ta kết quả tốt trong việc vạch ra hiện tượng phuơng sai của sai số thay đổi (2
mô hình cuối cùng còn có vấn dề vì là phi tuyến theo tham số, do đó, khống thể ước lượng đuợc bằng thủ tục binh phương nhỏ nhất thòng thường)
Do vậy mà kiểm định Glejser dược sử dụng như là một công cụ để chẩn đoán trong mẫu lóm
Thị dụ: Sử dụng số liệu đã cho về chi liêu của tiêu đùng phụ thuộc vào thu
nhập ở bảng (6.1) và phần dư tách được ở bảng (6.2) chúng ta tiến hành kiểm định Glcjser kết quả như sau:
- Đối với dạng (6.26) ta thu dược kết quả sau
Trang 16Nhìn vào 4 bảng ta đều thấy có mối liên hệ có ý nghĩa |ê;| và biến giải thích
% cho nên chúng ta thấy rằng:
Cả 4 kết quả đều cho ta cùng một kết luận là giả thiết Ho: p2 = 0 bị bác bỏ với
mức ý nghĩa 5% nghĩa là có hiện tượng phương sai cùa sai số thay đổi Các kết
luận này cũng giống như kết luận thu được từ kiểm định Park
5ẵ Kiểm định tương quan hạng của Spearm an
Trước khi trình bày chương này chúng la hãy định nghĩa hộ số tương quan hạng cùa Spearman
Định nghĩa: Hệ số tương quan hạng Spearman rs được xác định như sau:
Y d ?
Trang 17trong đó d| = hiệu của các hạng duợe gán cho 2 đặc trong khác nhau cùng mội
p hin tử thứ i và n = số các phần tử đuợc xếp hạng Thí dụ cho xếp hạng cùa 10 sinh viên theo kết quả cùa kỳ thi giũa kỳ: yà kỳ thi cuổi nâm là như sau:
Thủ tục kiểm định nhu sau:
Bước 1: u&c lượng hồi quy ữên tập sổ liệu đối với Y và X thu duợe phần dư ej
Bước 2: Xếp hạng |ej|và Xi theo thứ tự giảm hoặc tang, tính d = hạng
|e i Ị - hạng X i, sau đó tính hộ số tương quan hạng Spearman
Bước 3: Giả sử hệ số tuong quan hạng cùa tổng thể là pi bàng 0 và n > 8 thì ý nglũa của hệ số tuong quan hạng mẫu u có thể đuọc kiểm định bàng tiêu chuẩn t sau:
6 Kiểm định G oldfeld-Q uandt
N íu ta giả thiết ràng phuơng sai của sai số thay đổi ơi2 có thể liên hệ duơng với một trong các biến giải thích trong mô hình hồi quy thì la có thể sử dụng kiểm định này Đ ể đơn giản ta hãy xét mô hình 2 biến:
Yi = p, + p2?í + ụGiả sử ơ|2 có liên hệ dương với biến X theo cách sau:
140
Trang 18Trong đó a 2 là hàng số Giả thiết này có nghĩa là ơi2 tỉ lệ với bình phuơng của biên X Nếu giả thiết (6.32) là thích hợp thì điều này có nghĩa là khi X tãng ơ,7
cũng tăng
Thủ tục kiểm định cùa Goldfeld-Quandt gồm các bước sau:
Bước 1: Sấp xếp các quan sát theo thứ tụ tãng dần về giá trị cùa biến X Bứớc 2: Bỏ c quan sát ở giữa theo cách sau:
Đ ối với m ô hình 2 biến, George G Judge đề nghị :
c = 4 nếu cỡ mẫu khoảng n = 30
c = 10 nếu cỡ mẫu khoảng n= 60
và chia số quan sát còn lại Ihành hai nhóm, trong đó mỗi rihóm có ——- quan sát
Bước 3: Sử dụng phương pháp bình phương bé nhất ước lượng tham sô' của các
n —chàm hồi quy đối với ——— quan sát đầu và cuối; thu được tổng bình phương cácphần dư của RSS|, RSSj tương ứng Trong đó RSS| đại diện cho RSS từ hồi quy ứng với các giá trị của Xi nhỏ hcm và RSSị - ứng với các giá trị X; nhỏ hơn Bậc tự do
n - c n - c -2k
tương ứng là —— - k h o ặ c - Trong đó k là số các tham số được ước
lượng kể cả hẹ số chặn (trường hợp 2 biến k = 2)
- c - 2k)/2, nghĩa là F có phân phối F(df, df)
Trong úng dụng nếu F tính được lớn hơn điểm tói hạn F ờ mức ý nghĩa mong
muđn, thì chúng ta có thể từ bò giả thiết Ho: phưcmg sai có điều kiện khống đổi, nghĩa là có thể nói có thể phương sai cùa sai số thay đổi
Chú ý rằng trong trường hợp các biến giải thích X nhiều hơn 1 thì việc sấp xếp các quan sát trong kiểm định ở bước 1 có thể làm đối với một biến bất kỳ trong các biến giải thích đó Chúng ta có thể tiến hành kiểm định Park đối với mỗi biến X Thí dụ sau đây là số liệu về chi tiêu (Y) cùa 30 gia đình và thu nhập (X) cùa họ Số liêu nay đã dược sắp xếp theo thứ tự tăng đan của X
T hí dụ: Bảng số liệu chi tiêu tiêu dùng Y và thu nhập X
Trang 19Báng 6.9. SỐ liệu được sáp xếp theo giá trị của X
Chúng ta giả thiết ctai tiêu về tiêu dùng liên hệ tuyến tính với thu nhẠp, nhung
có tồn tại hiện tượng phương sai của sai số thay đổi trong tập sổ liệu, và cũng giả thiết ràng bản chất của phuong sai của sai stf thay dổi được chỉ ra ở (6.32).Thủ tục kiểm định Goldefld-Quandt được tiến hành như sau:
Bước 1: Sáp xếp các quan s ít theo gía trị tăng dãn của X
Bước 2: Loại bỏ 4 quan sát ờ giữa đó là các quan sát từ thứ 14 -17.
Bước 3: Chia tập số liệu làm đôi u&c luọng 2 hồi quy Hồi quy thứ nhất trên tập số
liệu gồm 13 quan sát dầu Hối quy số 2 tiên tập số liệu cuổi Kết quả như sau:
- Hồi quy ưên 13 quan sát dầu ta làm được hàm:
- Hồi quy tiên 13 quan sát cuối ta thu được:
142
Trang 20RSS2 / d f 1536 f i / 11 _ 1Ừ? RSS ị / d f 3 7 7 J 7 / U
Ở mức ý nghĩa 5% thì FC11.11) = 2,82 và F = 4,07 > 2,82, vậy có phương sai
sai SỐ thay đổi.
Chú ỷ : Theo kinh nghiệm của các nhà kinh tế lượng thì số quan sát bị loại bò
khoảng 2 0% tổng số quan sát và không nhất thiết phải bò đi các quan sát ở giữa Trong trường hợp đó cẩn phải xác định số bậc tự do cho thích hợp Các thử nghiêm
theo phương pháp Monte Carlo thì c = 8 nếu n khoảng 30; c= 16 nếu n khoảng 60
7 K iểm định Breusch - Pagan - Godfrey(BPG)
Kết quả cùa kiểm định Goldfeld-Quandt khổng chi phụ thuộc vào sô' các giá trị bị bỏ đi mà còn phụ thuộc vào biến dộc lập nào được chọn ra để sắp xếp lại các giá tri cùa nó Kiểm định BPG sẽ khắc phục được nhược điểm này
XSt mô hình k biến sau:
Giả sừ phương sai cùa sai số ơi2 đuợe miêu tả nhu là hàm của các biến phi ngẫu nhiên Zi, Zi ở đây là các biến Xi (một số hoặc tất cả) có ảnh hường đến ơị2, có
f( ) là hàm tuyến tính hoặc dạng Ioga Đặc biệt ta giả thiết
ơi2 = (X, + a2 Z21+ •■+ otnZm (6.34)
Từ (6.34) ta thấy ràng nếu a2 = otj = = ctm = 0 thì ơ-,5 = a , (hằng số) Do vậy việc kiểm định xem liệu Ơ|J có phải thay đổi hay không, nguời ta có thể kiểm dịnh giả thiết Ho : Ci2 = = •••= Om = 0 Đó chính là tu tưởng cơ bản của kiểm định Breusch-Pagan-Godfrey Thủ tục kiểm định dược tiến hành như sau:
Bước 1: ubc lượng (6.33) bằng phuơng pháp bình phương bé nhất để thu được
các phần d ư ei, e2> e„
Từ các kết quả này ta thu được:
Trang 21Bước 5: Thu đuạc ESS (tổng các bành phương đuọc giải thích) từ (6.35) và xác định:
Giả thiết rằng Uj có phân phổi chuẩn và khi cỡ m iu n tang lên vổ hạn thì 6
« x2(m - 1) Tức là 0 sẽ xấp xi XJ với m-1 bậc tự do Nhu vậy nếu trong áp dụng
mầ ta tính được 0 vuựt điểm tới hạn X2 V<M m-1 bậc tợ do và ở mức ý nghĩa đã chọn, thỉ chúng ta bác bỏ giả thiết Ho về tính đồng phương sai Ngược lại có thể chấp nhận nó
8 K iểm định W hite
Kiểm định BPG đòi hỏi u có phân bô' chuẩri White đề nghị một thù tục không đòi hỏi u có phan bổ chuẩn Kiểm định này là một kiểm định tổng quát về sụ thuần nhất cùa phương sai Xét mố hình sau đây:
Yi= p 1 + p2x í + 0 , x 3+Ui (6.37)
Bước 1: Ước lưạng (6.37) bằng OLS Từ đó thu được các phần dư tuơng úng e-p Bước 2: Ước lượng mô hình sau đây:
e f = a , + Oj Xj + a3 Xj + a4 X,2 + a s Xj2 + 0 4X5X5 + V, (6.38).(6.38) có thể có số mũ cao hơn và nhất thiết phải có hệ số chặn bất kể mô hình gốc có hay không có hẹ sđ chăn
R2 là hẹ số xác định bội thu được từ (6.38)
Bước 3: Với Ho : phưcmg sai cùa sai số không đổi, có thể chỉ ra rằng: nR2 có phan xíp xì x3(df), df bằng số hẹ số của mò hình (3.78) không kể hệ số chản
Bước 4: Nếu nR- không vượt quá giá trị x2o(<ìf) thì giả thiết Ho không có cơ
sở bị bác bò Điều này nói rằng trong mô hình (6.38): a , = a 3= = 0(4= 0 Trong trường họp ngưọc lại giả thiết Ho bị bác bỏ
Ta có thể nhãn th íy rằng bậc tự do cùa nR2 tăng nhanh khi có thêm biến đốc lập Trong nhiều tnrờng hợp người ta có thể bỏ các số hạng chứa các tích chéo Xi
X j, i * j Ngoài ra trong trường hợp có sai lẩm định dạng (chương IX), kiểm định
White có thể dua ra nhận định sai lẩm là phương sai của sai số thay dổi trong trường hợp phưcmg sai cùa sai số là dóng đều
144
Trang 22Kiểm định này dựa trên ý tưởng cho rằng phương sai cùa yếu tố ngẫu nhiên phụ thuộc vào các biến độc lập có hay không có ưong mô hình, nhưng không biết
rõ chúng là những biến nào Vì vây thay Vi xem xét quan hệ đó người ta xét mô
hình sau đây:
Trong (3.79), ơ2; v à E (Y j) đều chưa biết đo đó sử dụng các ưóe lượng cùa nó
là e2i Và X2
Bước ỉ : Ước lượng mô hình ban đầu bằng OLS Từ đó thu được e, và Ỹr
Bước 2: Ưóc lượng mô hình sau đây bằng OLS:
eJi = a , +<X2 Y* + V;.
Từ kết quả này thu được R2 tương ứng Có thể sử dụng-hai kiểtn định sau đây
để kiểm định giả thiết:
Ho : phương sai của sai số đồng đều
H | : phương sai của sai số thay đổi
Nếu F > Fa( 1 ,n-2) thì hê 46 a 2 * 0, có nghĩa ìấ Ho bị bác bỏ.
Ví dạ: Bộ số liệu cỉiéo sail đâyrbao gồm: ,
x2 - kinh nghiệrti công tác (sốnăm cỗ việc làm đầy đù);
;<■- số năm được đào tạo và,
Ỹ ;-thu nhập trung bình/giò,
Bây giờ ta sẽ xeip xét mối quan^ệ giữa Ỷ vằ Xj,;X3.
9 Kiểm định dựa trên biến phụ thuộc
Trang 23Bây giờ chúng ta sẽ kiểm định :
Ho : phương sai của sai số đổng đều
H| : phương sai cùa sai số thay đổi
bằng các kiểm định đã trình bày trong phần này
a Kiểm định Goldfeld- Q uandt
Tnróc hết ta thấy rằng biến x 2 đã được sắp xếp theo thứ tự tăng tăng dần, ta
bỏ đi c = 10 quan sát ở giữa tír 21 - 30 Từ đó co hai mảu có kích thước bang nhau
(20 quan sát) Mẫu thứ nhất 'oao gổm các quan sát 1 -20 và mẫu thứ hai gổm các quan sát từ 31- 50 Ước luợng các mô hình tuong ứng với các mẫu này ta thủ được: Với mẫu thứ nhít:
Ỳj = 2,1528 + 0,30129 X, + 0,47597 x 3 , RSS, = 26,8224.
Vúi mâu thứ hai:
Ỷ j = - 7 , 7 8 4 9 + 0 , 4 7 9 6 8 x 2 + 3 , 1 4 1 4 x 3 , R S S z = 3 3 6 3 , 0
146
Trang 241 o ỉ đã bỉết
Khi ơi2 đã biết, chúng ta có thể dễ dàng khắc phục cãn bệnh dó bang cách sù
dung phương pháp bình phutmg nhò nhất có trọng số đã trình bày ờ trên.
Trang 25mồ hình đã được biến đổi này thòa mãn g ỉỉ thiết phương sai của sai số khổng đổi Phưong pháp bình nhỏ nhát sẽ dược áp dụng cho mô hình đã được biỂn đổi như dã chì ra trước day, phương pháp bình phucmg nhò nhít có trọng số ià phuơng pháp
bình phuơng nhỏ nhất áp dụng cho tập số liệu đ i đuợc biến đổi.
Chúng ta sẽ minh họa cho các phép biến dổi này qua việc sử dụng mổ bình hồi quy 2 biến mà ta gọi là mồ hình gốc:
Y, = p, + M i + ụ
Giả sử mô hình này thỏa mãn các giả thiết của mô hình hồi quy tuyến tính cổ điểo trừ giả thiốt phuong sai của sai số khống đổi Chứng ta xét 1 số giả thiết sau về phuong sai của sai số Nhũng dạng này tuy chua bao quát được tất cả nhung phổ biến
Giả thiết 1: Phương sai cửa sai sổ tỉ lệ với bình phuong của biến giải thích:
NỂU bằng phương pháp dồ thị hoặc cách tiếp cận Park hoặc Giejser chỉ cho chúng ta rằng cố thể phuong sai ụ ti lệ với bình phương của biến giải thích X thì chúng ta có thể biến đổi mỡ hình gốc theo cách sau:
Chia 2 vế của mô bình gốc cho Xi (Xr ■* 0)
mồ hình gốc chúng ta phải nhãn c ỉ 2 vế cùa (6.38) đẫ uớc lượng với X j.
G iả thiết 2: Phương sai của sai sổ tì lệ với biến giải thích X
E i n j W X iNếu sau khi ước luợng hồi quy bầng phương pháp bình phucmg nhủ nhất thông thường, chúng ta vẽ đồ thị cùa phần du n ìy đối với biến giải thích X v à quan sát thấy hiện tượng chỉ ra phuơng sai của sai số liên hệ tuyến tính với biến giải thích hoặc bằng cách nào đó cố thể tin tưởng như vậy thỉ mô hình gốc sẽ duọc biến dổi như sau: ‘
148
Trang 26Với mỗi i chia cả 2 v ế cùa mô hình gốc cho -JXj ( với Xi > 0)
' Ẩ " P , ' Ãtrong đó Vị = Ụ — và có thể thấy ngay rằng E(Vi) = ơ 2
- J ^ + P2-\/X ĨV - ỹ = = = P r "7^ = + P2- \ / ^ + v i ’ (6.43)
Chú ý; Mô hình (6.43) là mô hình không có hệ số chặn cho nên ta sẽ sù dụng
mô hình h'ôi quy qua gốc để uức lượng (3, và P2, sau l^hi ước lượng (Ồ.43) chúng ta
sẽ trở lại mô hình gốc bằng cách nhân cả hai vế (6.43) với yỊXị
Giả thiết 3: Phương s ã của sai số tì lệ với bình phương của giá trị kỳ vọng
của Y , nghĩa là E (Ư |) = ơ 2(E(Yi))2
Khi đó thục hiện phép biến đổi biến số nhu sau :
Bước /:• ưởc lưcmg hồi quy (6.31) bằng phương pháp bình phương bé nhất
thông thuỉmg, thu đuợc Ỹj Sau đó sủ dụng Ỹị để biến đổi mô hình gốc thành dạng như sau:
f l ' í x i ì
l í
U ị trong đó V ị = ~ Ỳ
i Bước 2: Uồc lượng hồi quy (6.45), dù Ỳj không chính xác 1*60©» chúng chi là
uức luợng vững nghĩa là khi cỡ mẫu tăng lên vô hạn thì chúng hội tụ đến E(Ỵ) vì vậy
Trang 27Đôi khi thay cho việc dự đoán về ơi2 người ta định dạng Lại mô hình Chẳng hạn thay cho việc uớc luợng hôi quy gốc có thể chúng ta sẽ uớc lũợng hồi quy:
lnYi = Pi + Pi lnX + Ui (6.46)Việc ước luợng hồi quy (6.46) có thể lìm giảm phương sai của sai số thay đổi
do tác động của phép biến đổi loga Mọt trong uu thế của phép biến đổi loga là hệ
số góc p21& hẹ số co dãn của Y đối với X
T hí dụ: Với số liộu đã cho ở bảng 6.1 chi tiêu cho tiêu dừng Y và thu nhập X
Như ta đ ỉ biết ước lượngbình phương nhỏ nh ít thông thường của hàm hồi quy:
Từ bảng này ta có thể nhận thấy rằng không xảy ra tình trạng khi X tăng phàn
dư tăng Không xuất hiện hiện tượng phương sai của sai số thay đổi ở đây Dĩ nhiên
ta có thể sử dụng bất kỳ kiểm định nào đã trình bày ờtrên
Trước khi kết thúc chuông này chúng toi xin lưu ý bạn dọc một số v in dề sau: Hiện tượng mà chúng ta đang bàn đín là tuơng đối phổ biến, cho nên biện pháp khác phục nó là rất quan trọng Nhung biện pháp khấc phục thục c h ít là toa thuốc cho con bệnh, bệnh có chữa được khổng khổng chỉ toa thuốc có hay hay khống, mà trước hết là chẩn đoán đúng bênh Vì vậy, cả hai vấn đề chẩn đoán và
Vì thế cần phải lưu ý một số vấn dề:
• Khi nghiên cứu mồ hình có nhiều biến giải thích thì việc chọn biến nào để biến đổi cần phải có xem xét cẩn thận
150
Trang 28Có thể xảy ra tinh trạng là bản thân biến gốc không tương quan nhưng
tì số của các biến lại có thể tương quan: chẳng hạn xét mồ hình:
R-Bar-Squared 98433 S.E of Regression 18.0237
Residual Sum o f Squares 7796.5 M ean of Dependent Variable 346.3929
S D of Dependent Variable 143.9890 Maximum of Log-likelihood -118.539
*****************************************************************
Diagnostic Tests
************************************** *********** ****************
Trang 29* Test Statistics * LM Version * F Version *
Diagnostic Tests: £ á c kiểm định chuẩn đcấn
Serial Correlation: TUtmg quan chuỏi;
Functional Form:-Dang hàm;,!
Normality: Tĩnh chuẩn;
Heteroscedasticịtỵ: Phương sại không đồng đều
A:Lagrange multiplier test of residual serial correlation
( Kiểm định éằng phương phép nhãn từ Lagrangẹ vế tương quan chuỗi cùa các phần dư)
B:Ramsey's RESET test using the square o f the fitted values
( Kiểm định Ramsey.1, Reset vẻ dạng hàm hồi quỵ sử dụng bình phương các giá trị
tương, bợp- t Ê)
C: Based on a test of skewness and kurtosis of residuals
( Kiểm địqỊ? tính chuẩạ củạ Ụdụạ^trênhệ sổ bái đối xứng và hê sốnhọncùaphần dư) D:Bascd, on the regressiorjiPf squared residuals on squai:e4 fitted Values
( Kiểm định vệ sụ đổng nhất của phuợng sai dựa trên hồi quy phần dư phụ thuộc vào tưcmg hợp bình phựcmg)
Trong truòng hợp này tad.ựa vào các kết quả kiểm định D - sự đổng nhát cùa phương sai
trong đớ ẹ, là; phân dự khi; hồi quy TCOST phụ A n te vào Qi Q?i 0?L Kết quà: ước lựợng trêncó X 1 = nR2 = 7 8896[0,005] và F = ( â2 / Se( ậ ; ))2 = 10,2182[0,004],
€ ả hai kiổm định, này đểu, cho cùng kết luận; Phupng sai của sai số;thay đổi vl
Trang 30Ordinary Least Squares Estimation
Dependent variable is AC
28 observations used for estimation from 1 to 28
Regressor Coefficient Standard Error T-Ratio[Prob]
R-Bar-Squared 95412 S.E of Regression 3.6936
Residual Sum o f Squares 327.4281 Mean of Dependent Variable 70.1098 S.D of Dependent Variable 17.2444 Maximum of Log-1 ikelihood -74.1572
Bằng phép biến đổi biến số như trên, dựa vào kiểm định X* và F cho biết khuyết tạt
đã được khắc phục Thực chất thay vì ước lượng hàm tổng chi phí ta đã ước lượng hàm chi phí trung bình
Trang 31BÀI TẬP
6.1 Hãy giải thích các khái niệm sau:
a Thế nào là hiện tượng phuong sai khống đổng đầu? Nguyên nhãn
b Tính chát của các ước lượng khi phưcmg sai của sai số khống đổi
6.2.Phuong pháp binh phvơng nhỏ nhất có trọng số( WLS) và phưcmg pháp bình phương nhỏ nhất tổng quát ( GLS)
6.3 Với Q là luạng bán gas (binh); PG là giá gas (nghìn đ/bình); PE là giá điện (trăm đ/kW); PC là giá bếp gas (nghìn d/bếp), D là biến giả, DPG = D*PG; L
là logarit cơ SỐ e của các biến tưcmg ứng a =5%
[1] Ordinary Least Squares Estimation
*****************************************************************Dependent variable is Q
27 observations used for estimation from 97M1 to 99M3
***************************************************************** Regressor Coefficient Standard Error T-Ratio[Prob]
***************************************************************** R-Squared 95195 F-statistic F( 1,25) 495.29[.000]
ế R-Bar-Squared 99163 S.E o f Regression 40.5088
Residual Sum o f Squares 255165 Mean of Dependent Variable 1831.42 S.D of Dependent Variable 451.937 Maximum of Log-likelihood -199.9393
* Test Statistics * LM Version * F Version *
*****************************************************************
* A:Serial Correlation *CHI-SQ( 1)= 5.04362[.029]*F( 1,24)= 4.94142[.026]*
* B:Functional Form *CHI-SQ( 1)= 4.38957[.036]*F( 1,24)= 478831 [.037]*
* CNormality *CHI-SQ( 2)= 35.6073[.000]* Not applicable *
* D:Heteroscedasticity *CHI-SQ( 1)= 6.0333[.014]*F( 1,25)= 7.3164[.013]*[2] Ordinary Least Squares Estimation
ft****************************************************************Dependent variable is Q
27 observations used for estimation from 97M1 to 99M3
*****************************************************************
154
Trang 32R-Bar-Squared 99330 S E o f Regression 37.0059
S.D o f Dependent Variable 451.9370 Maximum o f Log-likelihood -133.6458
a Giá trị CHI-SQ( 1) = 6.0333[.014] ttong mục D: Heteroscedasticity cùa
mô hình [1] được tính như thế nào? Giá trị đó dùng để làm gì, kết luận như thế nào?
b Giá trị F( 1, 25)= 7.3164[.013] cũng trong mục D cùa mô hình [1] được tính như thế nào? Kết luận có giống vói câu (1.) ồ trên không?
c NẾU độ tin cậy a giảm xuống còn 1% thì m ô hình [1] có được coi là có phương sai sai số đồng đều không?
d Kiểm định hiện tượng phương sai sai số thay đổi trong mô hình [2],
e Việc đổi dạng mô hình có khắc phục được hiện tượng phương sai sai số thay đổi chưa?
f Sau khi hồi quy mô hình [2] thu được phỉn dư e và giá trị ước lượng Q ,
bình phựcmg lên có giá trị e1 và Q 2 Khi hổi quy e2 theo Q2 có hệ số chăn
thu được hộ số xác định R2 Có thể cho biết giá trị cùa hẹ số này bằng bao
nhiêu không?
g N íu hổi quy ln(e5) theo ln(PG) có hệ số chăn thu được R - = 0.5391 Hãy
viết hàm xuất phát cùa hàm hồi quy đó Hàm dó dùng để làm gỉ, dựa trên giả thiết nào, có kết 'luận gì?
h Khi hổi quy eJ theo PG2 thu được hệ số góc bằng 0.325 và Se tương ứng bằng 0.0819 Kết quả trên dùng để làm gì, dựa trên giả thiết nào, có kêít luận gì?
i Nêu cách khắc phục.khuyết tạt của mô hình [2] được phát hiện bởi câu (h) Khi đó hệ sổ chặn trong mô hình mới có ý nghía như thế nào?
6 4 Với s là sản luạng, L là lao động, K là vốn, D là biến giả, LS, LL LK là
lo g a ritc ơ s ố e c ác biến tương ứng Cho a = 5%
Trang 33i l l Ordinary Least Squares Estimation
Dependent -variable is s
20 observations used for estimation fiom 1 to 20
Regressor Coefficient Standard Error -T-RatioOProb]
* A:Serial Correlation *CHI-SQ( 1>= 4.9762[.Q26]*F( 1,17)= 5.96I98[j025J*
* B:Functional Form *CHI-SQ£ i)= 3.9042[.040]*F< 1,17)= 3jQ5014[j0383*
* C: Normality *CHI-SQ( ^)= 5.3996[.067]* Not applicable *
* D:Heteroscedasticity *CHI-SQ( 1)= 63776[.012]*F( 1.18)= 8.2345[.010]*
*****************+♦**********♦*********+*************************[2] Ordinary Least Squares Estimation
*****************
Dependent variable is s
20 observations used for estimation from 1 to 20
Regressor Coefficient Standard Error T-RatioCProbJ
R-Squared F-statistic F( 2,17) 21.5343[.000’
R-Bar-Squared 68369’ S.E o f Regression 32.4-717
Residual Sum of Squares 17925.0 Mean o f Dependent Variable 109.4666S.D o f Dependent Variable 5T.736T Maximum o f Log-likelihood -96.3610
************************ *****************************************
Trang 34* A:Serial Correlation *CHI-SQ( 1)= 1.1270[ ]*F( 1,16)= 95545Ị ]*
* B:Functional Form *CHI-SQ( 1)= 4.1644[.038J*F( 1,16)= 6.1326[.032]*
* C:Normality *CHI-SQ( 2)= 1.0269[ ]* Not applicable *
* DrHeteroscedasticity *CHI-SQ( 1)= 5.3111 [ế ]*F( 1,18)= 6.5083[ ]*
[3] Ordinary Least Squares Estimation
Dependent variable is LS
20 observations used for estimation from 1 to 20
R-Squared 78117 F-statistic F( 2,17) 30.3438[.Q00]
R-Bar-Squared 75543 S.E o f Regression 28222
Residual Sum of Squares 1.3540 Mean of Dependent Variable 4.5516S.D o f Dependent Variable 57067 Maximum of Log-likelihood -1.4523
it****************************************************************
* A:Serial Correlation *CHI-SQ( 1)= ,0048875[.944]*F( 1, 1 6 ) - ,003910[.951]*
* B:Functional Form *CHI-SQ( 1)= ,14702[.701]*F( 1, 16)= ,11849[.735]*
* CNormality *CHI-SQ( 2)= ,41004[.815]* Not applicable *
* D Heteroscedasticity *CHI-SQ( 1)= ,0038904[.950]*F( 1,18)= ,00350[.953]*
*****************************************************************
a Trong mô hình 11 ] có hiên tượng phương sai sai số thay đổi không?
b Hãy cho biết giá tri CHI-SQ và F ữong mục D: Heteroscedasticity cùa bảng [1] được tính như thế nào, từ mô hình nào?
c Nếu mức ý nghĩa giảm xuống còn 1% thì có thể coi trong mô hình [1] có
hiện tượng phương sai sai số thay đổi không?
d Kiểm tra hiên tuợng phương sai sai số thay đổi trong các mô hình [2][3]
e Sau khi hồi quy mô hình [2] thu được các phần dứ e và giá trị ước lượng của s là S Bình phương lên được e2 và S 2 Khi hồi quy e2 theo S2 có hộ
số chăn thu được giá trị xác định R1 bằng bao nhiêu?
f Bằng kiểm định trong mục D cùa bảng [2] hãy nêu một cách khắc phục khuyết tật trong mô hĩnh
Trang 35g Với e2 trên, khi hổi quy ln(e2) theo ln(K) có hê sổ chân thu duợc hẹ sổ xác định bằng 0.7215 Mô hình dó dùng đổ làm gì, dưa trtn giả thiết nào, có kết luận gì vể m ô hình [2]?
h Khi hổi quy e2 theo K2 cò hẹ sổ chạn thu dược hê số góc bằng Đ.3219 và Se bằng 0.1093 Mô hình đó dùng để làm gi,’dụá trên giả thiết nào, có kết luận gì thu dược
i Hãy nêu một cách khắc phục khuyết tạt dược phát hiện trong câu (h)
j Khi hổi quy m ò hình S/L phụ thuộc vào 1/L; K/L có hệ số chăn có kết quả
1 Đổi mô hình kinh tế từ dạng tuyến tính như [2] về dạng hàm mũ như [3] đã khắc phục được khuyết tạt chuá?
m Các thống kê dùng dể kiểm định hiện tượng phương sai của sai số thay đổi trong mổ hình [3] được tính nha thế nào?
158
Trang 36CHƯƠNG VU
T ự TƯƠNG QUAN
Một trong các giả thiết của mò hình hồi quy tuyến tính cổ điển là không có tụ tương quan hay tương quan chuỗi giữa các nhiễu n trong hàm h'ôi quy tổng thể Nhung trong thực tế liêu hiện tượng đó có thể xảy ra hay không? Nguyên nhâh của hiện tượng đó là gì? Nếu có hiện tượng tự tương quan thì liệu có còn áp đụng đuợc phương pháp bình phutmg bé nhất nữa hay không? Làm thế nào để biết rằng hiện tượng tự tuơng quan xảy ra? Cách khắc phục nhữ thế nào? Đó là một loạt các câu hỏi mà chúng ta cần phải giải quyết trong chương này
7.1 NGUYÊN NHÂN CỦA HIỆN TUỌNG TựTUƠNG QUAN
1 T ự tương q u an là gì?
Thuật ngữ tự tương quan có thể hiểu là sự tương quan giữa các thành phần của chuỗi các quan sất được sắp xếp theo thứ tự thời gian (trong các số liệu chuỗi thời gian) hoặc không gian (trong số liệu chéo)
Trong phạm vi hồi quy, mồ hình tuyến tính cổ điển giả thiết rằng khổng có sự tương quan giữa các nhiễu Ư, nghĩa là:
Nói một cách khác, mô htah cổ điển giả thiết rằng thành phần nhiễu gắn với môt quan sát nào đó không bị ảnh hưởng bòi thành phần nhiễu gắn với một quan sát khác
Tuy nhiên trong thực tế có thể xảy ra hiện tượng mà thành phần nhiễu của các quan sát lại có thể phụ thuộc lẫn nhau nghĩa là:
Các đổ thị dưới đây trục tung là U (hoặc e,) trong đó Ư, chỉ nhiễu của tổng thể còn ei chỉ là phần du, trục hoành biểu thị thời gian
Trang 372ế Nguyên n h ân cùa tự tương quan
Đupng nhiên chúng ta cần phải đạt ra câu hỏi rằng: Vì sao cồ sự tự tướng quan, Ịiệu đtèu đó cộ xậý ra trpng thực Ịế‘hay không?
160
Trang 38a Nguyên nhân khách quan
• Quán tính:
N ét nổi bật của hầu hết các chuỗi thời gian trong kinh tế là quán tính Chúng
ta đêu biết các chuỗi thời gian nhu tổng sản phẩm, chì số giá, thất nghiệp mang
tính chu kỳ Chẳng hạn nếu chúng ta ò đầu cùa thời kỳ khôi phục kinh tế, tổng sản
phẩm có xu hướng đi lên Trong quá trình biến động này, giá trị cùa chuỗi ờ mỗi
thời điểm sau lại cao hơn giá trị cùa nó ở thời điểm trước Vi vậy trong hồi qui của
chuỗi thời gian, các quan sát k ế tiếp đó có nhiều khả nâng phụ thuộc lẫn nhau
■ • H i ệ n t ư ợ n g m ạ n g n h ệ n
Người ta thấy rằng việc cung nhiều mặt hàng nông sản biểu hiện hiện tượng
“mạng nhện” , trong đó cung về các hàng hóa phản ứng lại với giá có trễ một
k h o ả n g t h ờ i g i a n , b ở i v ì c á c q u y ế t đ ị n h c u n g p h ả i m ấ t m ộ i t h ờ i g i a n d ể t h ự c h iệ n ,
người ta gọi đó là thời kỳ thai nghén
Chẳng hạn vào đầu vụ trồng iạc năm nay, người nôhg dân bị ảnh tiưởng hưởng bời giá mua lạc năm ngoái của các công ty xuất khẩu Cho nên cung về lạc có biểu diẽn dưới dạng hàm:
Giả sử ở cúối thôi k ỳ t giá lạc Pt < p , I, do đó trong thời kỳ t+1 những người
nông dân có thể sẽ quyết định sản xuất lạc ít hơn thời kỳ t Rõ ràng trong trường hợp đó, ta không mong đợi các nhiễu u là ngẫu nhiên, có lẽ nông dân sẽ giảm sản xuất ở năm t+ 1 Đ iềũ này sẽ dẫn đến mô hình mạng nhện
• T rễ
Trong phân tích hồi qui chuỗi thời gian, chúng ta có thể có gặp hiên tượng biến phụ thuộc ở thôi kỳ t phụ thuộc vào chính biến đó ở thời kỳ t -1 và các biến khác Chẳng iiạn khi nghiên cứu mối quan hệ giữa tiêu dùng và thu nhập, chúng ta thấy rang tiêu dùng ở thời kỳ hiện tại chẳng những phụ thuộc vào thu nhập hiện tại
mà còn phụ thuộc vào tiêu đùng ở, thời kỳ trước đó, nghĩa là:
Y1 = p, + p2X ,+ p3Y1., + Ul (7.4)
Trong đó: Y ,: Tiêu đùng ò thời kỳ t.
Xi: Thu nhập ở thời kỳ t.
Y,.I: Tiẽu dùng ở thời kỳ t -1
u t: Nhiẽu;
Pii P2 P3 • các hệ số
Chúng ta có thể lý giải m ô hình (7.4) như sau: Người tiêu dùng thường không thay đổi thói quen tiêu đùng như vậy nỂu ta bỏ qua số hạng trê trong (7.4), số
Trang 39hạng sai số sẽ mang tính hệ thổng do ảnh huủng của tiêu dùng thòi kỳ trước lên tiêu dừng thời kỳ hiẹn tại.
Một kiểu xử lý khác là phép nội suy và ngoại suy số liệụ Chẳng hạn tổng điều
tra dan số được tiến hành 10 năm 1 lần, lần cuối cùng vào nam 1997 N£u cần số
liệu cho 1 năm, n&m giữa hai cuộc diều ưa, cách phổ biến là nội say, kỹ thuật này
có thể gây ra sai số hẹ thống mà khổng cố stf liệu gốc
♦ Sai lệch do lập mõ hình:
Đây là nguyên nhăn thuộc về lập mổ hình Có hai loại sai lầm cớ thể gây ra
hiện tượng tự tuung quan
Một là: Không đưa dù cấc biến vào trong mỗ hình Việc khổng đưa đủ các biến vào trong mô hình có thể sẽ gây ralũện tượng tự tương quan
Thí dụ: ta có mô hình về cầu thịt bò như sau:
Trang 40-Hai là : DạrỀg hàm sai Dạng hàm sai có thể gây ra hiện tượng tự tương quan
Thí dụ: Giả sử mô hình đúng của quan hệ chi phí biên và sàn lượng là:
M Q » f t + f tQ + P iQ ? + H (7.7)Trong đó: MC là chi phí biên
Trên hình vẽ ta thấy giữa các điểm A, B đường chi phí biên cho ước lượng quá
cao chi phí biên đúng, nhưng ở ngoài các điểm đó nó ước lượng thấp chi phí đúng
Vì sao vậy? Bởi vì số hạng nhiễu Vi trên thực tế nó có dạng V| = p 3Q f + u và đo đó
nó chứa đụng ảnh hưởng có tính hệ thống cùa sản lượng đối với chi phí biên Vậy V| phản ánh tự tương quan vì sử dụng dạng hàm không chính xác
7.2 UỚC LUỢNG BÌNH PHUƠNG NHỎ NHẤT KHI CÓ TựTUƠNG QUAN Giả sử tất cả các giả thiết cùa mô hình hồi quy tuyến tính cổ điển đuợc thỏa mãn trừ giả thiết không tương quan giữa các nhiễu ụ , nghĩa là
c o v ( U , Ụj) * 0 ( i * j ) t r o n g t r ư ờ n g h ợ p n à y đ iề u g ì s ẽ x ả y r a đ ố i v ớ i c á c ư ớ c
lượng bình phương nhỏ nhất thông thudng và các phương sai cùa chúng
Để đơn giản ta xét mô hình: