(Thảo luận Kinh tế lượng) Khắc phục hiện tượng tự tương quan (Thảo luận Kinh tế lượng) Khắc phục hiện tượng tự tương quan (Thảo luận Kinh tế lượng) Khắc phục hiện tượng tự tương quan (Thảo luận Kinh tế lượng) Khắc phục hiện tượng tự tương quan (Thảo luận Kinh tế lượng) Khắc phục hiện tượng tự tương quan (Thảo luận Kinh tế lượng) Khắc phục hiện tượng tự tương quan (Thảo luận Kinh tế lượng) Khắc phục hiện tượng tự tương quan
Trang 1MỤC LỤC
LỜI MỞ ĐẦU 2
PHẦN 1 - BẢN CHẤT HIỆN TƯỢNG TỰ TƯƠNG QUAN 3
1.1 Định nghĩa 3
1.2 Nguyên nhân của tự tương quan 3
1.2.1 Nguyên nhân khách quan 3
1.2.2 Nguyên nhân chủ quan 4
1.3 Ước lượng bình phương nhỏ nhất khi có tự tương quan 4
1.4 Ước lượng tuyến tính không chệch tốt nhất khi có tự tương quan 5
1.5 Hậu quả 5
PHẦN 2: PHÁT HIỆN CÓ TỰ TƯƠNG QUAN 7
2.1 Phương pháp đồ thị 7
2.2 một số phương pháp kiểm định 7
2.2.1 Kiểm định các đoạn mạch 7
2.2.2 kiểm định về tính độc lập của các phần dư 8
2.2.3 kiểm định d Durbin – Watson 9
2.2.4 kiểm định Breusch – Godfrey 9
2.2.5 Kiểm định Durbin h 10
2.2.6 Các phương pháp khác ước lượng 10
PHẦN 3 : KHẮC PHỤC HIỆN TƯỢNG TỰ TƯƠNG QUAN 12
3.1 Khi cấu trúc tự tương quan là đã biết 12
3.2 Khi ρ chưa biết 12
3.2.1 Phương pháp sai phân cấp 1 12
3.2.2 Ước lượng ρ dựa trên thống kê d – Durbin – Watson 13
3.2.3 Thủ tục lặp Cochrane – Orcutt để ước lượng ρ 13
3.2.4 Thủ tục Cochrane – Orcutt hai bước 14
3.2.5 Phương pháp Durbin – Watson 2 bước để ước lượng ρ 14
3.2.6 Các phương pháp khác ước lượng ρ 15
B.VẬN DỤNG : 16
I Lập hàm hồi quy mẫu, và xử lí số liệu cơ bản 18
2.2 Phát hiện hiện tượng tự tương quan bằng phương pháp Durbin - Waston 20
KẾT LUẬN 27
Trang 2LỜI MỞ ĐẦU
Một trong các giả thuyết của mô hình hôi quy tuyến tính cổ điển là không có tự tương quan hay tương quan chuỗi các nhiễu Ui trong hàm hồi quy tổng thể Nhưng trong thực tế liệu hiện tượng đó có xảy ra hay không? Nếu có thì phát hiện bằng cách nào? Nguyên nhân là do đâu? Những câu hỏi đó sẽ được nhóm 3 giải đáp trong đề tài
: “Khắc phục hiện tượng tự tương quan”
Trang 3PHẦN 1 - BẢN CHẤT HIỆN TƯỢNG TỰ TƯƠNG QUAN
1.1 Định nghĩa
Thuật ngữ tự tương quan có thể hiểu là sự tương quan giữa các thành phần của chuỗi các quan sát được sắp xếp theo thứ tự thời gian (trong các số liệu chuỗi thời gian) hoặc không gian (trong số liệu chéo) Trong phạm vi hồi quy, mô hình tuyến tính
cổ điển giả thiết rằng không có sự tương quan giữa các nhiễu Ui nghĩa là:
Cov(Ui , Uj ) = 0 (ij) (1)
Nói một cách khác, mô hình cổ điển giả thiết rằng thành phần nhiễu gắn với một quan sát nào đó không bị ảnh hưởng bởi thành phần nhiễu gắn với một quan sát khác Tuy nhiên trong thực tế có thể xảy ra hiện tượng mà thành phần nhiễu của các quan sát lại có thể phụ thuộc lẫn nhau nghĩa là:
Cov(Ui , Uj ) 0 (ij) (2)
1.2 Nguyên nhân của tự tương quan
1.2.1 Nguyên nhân khách quan
- Hiện tượng mạng nhện:
Chẳng hạn vào đầu vụ trồng lạc năm nay, người nông dân bị ảnh hưởng bởi giá mua lạc năm ngoái của các công ty xuất khẩu Cho nên cung về lạc có biểu hiện dưới dạng hàm:
Trang 4- Trễ:
Trong phân tích hồi qui chỗi thời gian , chung ta có thể gặp hiện tượng biến phụ thuộc ở thời kỳ t phụ thuộc vào chính biến đó ở thòi kỳ t-1 và các biến khác Chẳng hạn khi nghiên cứu mối quan hệ giữa tiêu dùng và thu nhập, chúng ta thấy rằng tiêu dùng ở thời kỳ hiện tại chẳng những phụ thuộc vào thu nhập hiện tại mà còn phụ thuộc vào tiêu dùng ở thời kỳ trước đó, nghĩa là:
Y¬t = beta1 + beta2Xt +beta3 Yt – 1 + Ut (4)
Trong đó: Yt: Tiêu dùng ở thời kỳ t
Xt: Thu nhập ở thời kỳ t
Yt – 1: Tiêu dùng ở thời kỳ t – 1
Ut: Nhiễu , ,
beta1 beta2 , beta3 : Các hệ số
Chúng ta có thể lý giải mô hình (4) như sau: Người tiêu dùng thường không thay đổi thói quen tiêu dùng…, như vậy nếu ta bỏ qua số hạng trễ trong (4), số hạng sai số sẽ mang tính hệ thống do ảnh hưởng của tiêu dùng thời kỳ trước lên tiêu dùng thời kỳ hiện tại
1.2.2 Nguyên nhân chủ quan
- Xử lý số liệu: Trong phân tích thực nghiệm, số liệu thô thường được xử lý Chẳng hạn trong hồi quy chuỗi thời gian gắn với các số liệu quý, các số liệu này thường được suy ra từ số liệu tháng bằng cách cộng đơn giản 3 quan sát theo tháng rồichia cho 3 Việc lấy trung bình này làm trơn các số liệu và làm giảm sự dao động trong số liệu tháng Chính sự làm trơn này gây ra tự tương quan
- Sai lệch do lập mô hình: Đây là nguyên nhân thuộc về lập mô hình Có hai loại sai lầm có thể gây ra hiện tượng tự tương quan: Một là: không đưa đủ các biến vào trong mô hình Hai là: dạng hàm sai có thể gây ra hiện tượng tự tương quan
1.3 Ước lượng bình phương nhỏ nhất khi có tự tương quan
Ta xét mô hình:
Yt = beta1+ beta2Xt + ut (5)
Trong đó: t ký hiệu quan sát ở thời điểm t (giả thiết ta đang nghiên cứu số liệu dạng chuỗi thời gian)
Trang 5Với giả thiết tổng quát : cov(Ut, Ut + s) I0 (s I0) Ta có thể giả thiết nhiễu sản sinh ra theo cách sau:
Nếu Ut có dạng: ut = ρ1ut – 1 + ρ2ut – 2 +et
Là lược đồ tự hồi quy bậc 2 và ký hiệu AR(2)
Bằng phương pháp bình phương nhỏ nhất ta tính được:
Nhưng phương sai của nó trong lược đồ AR(1),
Nếu không có tự tương quan thì: Ta thấy
cộng với một số hạng phụ thuộc vào ρ
Nếu ρ = 0 thì
Nếu tiếp tục dùng phương pháp OLS và điều chỉnh công thức phương sai thôngthường bằng việc sử dụng lược đồ AR(1) thì beta2 không còn là ước lượng không chệch tốt nhất nữa
1.4 Ước lượng tuyến tính không chệch tốt nhất khi có tự tương quan
Giả sử chúng ta tiếp tục xét mô hình 2 biến và có quá trình AR(1) bằng phương pháp bình phương nhỏ nhất tổng quát đã xét từ ở chương trước ta thu được:
(8) Trong đó C là hiệu số điều chỉnh có thể bỏ qua trong thực tế
Và phương sai của nó được cho bởi công thức:
Trong đó D cũng là hệ số điều chỉnh mà ta có thể bỏ qua trong thực hành
1.5 Hậu quả
- Ước lượng bình phương nhỏ nhất thông thường không phải là ước lượng tuyếntính không chệch tốt nhất nữa
Trang 6- Phương sai ước lượng được của các ước lượng bình phương nhỏ nhất thông thường là chệch và thông thường là thấp hơn giá trị thực của phương sai, do đó giá trị của thống kê T được phóng đại lên nhiều lần.
- Các kiểm định t và F nói chung không đáng tin cậy
- cho ước lượng chệch của omega bình thực, và trong một số trường hợp, nó dường như ước lượng thấp omega bình
- R2 có thể là độ đo không đáng tin cậy cho R2 thực
- Các phương sai và sai số tiêu chuẩn của dự đoán đã tính được cũng có thể không hiệu quả
Trang 7PHẦN 2: PHÁT HIỆN CÓ TỰ TƯƠNG QUAN
2.1 Phương pháp đồ thị
Giả thiết không có tự tương quan trong mô hình cổ điển gắn với các nhiễu tổng thể U1 không quan sát được Cái mà chúng ta có thể qua sát được là các phần dư e1 thuđược từ phương pháp bình phương nhỏ nhất thông thường
Dù e1 không hoàn toàn giống như U0, nhưng sự xem xét trực quan thường gợi cho ta manh mối nào đó về sự tương quan trong U Trên thực tế sự xem xét trực quan
2.2 một số phương pháp kiểm định
2.2.1 Kiểm định các đoạn mạch
Kiểm tra các đoạn mạch là một phép kiểm định thống kê giúp ta xác định xem cóthể một dạy các kí hiệu, các khoản mục hoặc các số liệu có phải là kết quả của một quá trình mang tính ngẫu nhiên hay không
Một đoạn mạch là một dãy các phần tử giống nhau mà ở sát trước và sát sau là các phần tử khác chúng hoặc không có phần tử nào Chiều dài của một đoạn mạch là
số các phần tử của nó Để xác định có bao nhiêu đoạn mạch có thể chấp nhận được quá trình là ngẫu nhiên, ta dùng một quy luật phân phối xác xuất, quy luật này đưa đếntiêu chuẩn kiểm định cho ở dưới đây
Ta đặt n: tổng số quan sát ( n = n1 + n2)
n1: số kí hiệu dương ( số phần dư dương)
n2: số kí hiệu âm ( số phần dư âm)
N: số đoạn mạch
Giả thiết kiểm định:
H0: các kết cục kế tiếp nhau ( các phần dư là độc lập)
Trang 8Vậy nguyên tắc quyết định như sau
Chấp nhận giả thiết H0 về tính độc lập của các phần dư với độ tin cậy 95% nếu N
và bác bỏ giả thiết H0, nếu n không thuộc khoảng này tức là N <E(N) - hoặc N > E(N)
Chú ý, khi n1 , n2 nhỏ hơn 10, có bảng chuyên dụng cho các giá trị tới hạn đối với
số đoạn mạch mà ta kỳ vọng trong một dãy ngẫu nhiên n quan sát
2.2.2 kiểm định về tính độc lập của các phần dư
Để kiểm định về tính độc lập của các phần dư ta sử dụng bẳng tiếp liên Bảng tiếp liên mà ta sử dụng ở đây gồm một số dòng và một số cột, cụ thể là bảng tiếp liên
2 dòng và 2 cột Các dòng ứng với các phần dư dương và âm tại t còn các cột ứng với các phần dư dương và âm tại t – 1
Giả thiết kiểm định về tính độc lập của các phần dư:
H0: các hàng và cột độc lập với nhau
H1: Hàng và cột không độc lập với nhau
Tiêu chuẩn kiểm định cho tập hợp các giả thiết này là:
= Nếu giả thiết H0là đúng tức là các phần dư có phân độc lập thì thống kê đã nói ởtrên sẽ có phân bố , với số bậc tự do là df = (2 – 1)(2 – 1) = 1,
Quy tắc ra quyết định là nếu giá trị của thống kê đã tính được vượt quá giá trị tới hạn với 1 bậc tự do ở một mức ý nghĩa cho trước thì ta có thể bác bỏ H0 về tính độclập của các phần dư, ngược lại ta sẽ thừa nhận bác nó
2.2.3 kiểm định d Durbin – Watson
Trang 9Phương pháp kiểm định có ý nghĩa nhất để phát hiện ra tương quan chuôi là kiểm định d.Durbin – Watson
Thông kê d Durbin – Watson
Vậy thống kê d là tỉ số của tổng bình phương các hiệu số của các phần dư kế tiếpnhau với RSS Lưu ý rằng trên tử số của thống kế d số quan sát là n-1 và 1 quan sát bị mất đi khi lấy hiệu các quan sát kế tiếp
Lợi thế của thông kê d là nó dựa trên các phần dư đã ước lượng được vì vậy ngàu nay nó rất thông dụng tuy nhiên cần phải lưu ý tới các giả thiết làm cơ sở cho thống kê d
2.2.4 kiểm định Breusch – Godfrey
Để đơn giản ta xét mô hình giản đơn:
Y1 = 1 + U1
Trong đó U1= Ut-1 + Ut-2 +….+ Ut-p +
thỏa mãn các giả thiết của OLS
Giả thiết H0: , có nghĩa là không tồn tại tự tương quan ở bất kì bậc nào, giả thiết này có thể được kiểm định bằng thủ tục BG như sau:
Bước 1: ước lượng mô hình ban đầu bằng phương pháp OLS Từ đó thu được các phần dư ei
Bước 2: ước lượng mô hình sau đây bằng phương pháp OLS:
Ta được ei = 1 +
Từ kết quả ước lượng mô hình này thu được R2
Bước 3: với n đủ lớn, (n – p) R2 có phân bố sấp xỉ (p)
Nếu (n – p)R2 > thì H0 bị bác bỏ, nghĩa là ít nhất tồn tại tự tương quan ở một bậcnào đó Trong trường hợp ngược lại không tồn tại tự tương quan
2.2.5 Kiểm định Durbin h
Phần trên đã nói rằng d Durbin – Watson không thể sử dụng để kiểm định tính
tự tương quan chuỗi trong mô hình có chứa biến phụ thuộc ở thời kì trễ là biến độc lập Nhưng trong mô hình này gọi là mô hình tự hồi quy Gía trị d tính được trong các
mô hình như vậy nói chúng sẽ gần 2, đó là giá trị của d mong đợi đối với một dãy
Trang 10ngẫu nhiên thực sự như vậy nếu áp dụng thống kê d thông thường ở đây không cho phép phát hiện ra tương quan chuỗi
Durbin đã đưa ra kiểm định với mẫu lớn đối với tương quan chuỗi bậc nhất của
mô hình tự hồi quy
Ta xét mô hình Yt =
Thống kê kiểm định này được gọi là thống kê h và được tính theo công thức sau:
trong đó n cỡ mẫu: là phương sai của hệ số biến trễ Yt-1
là ước lượng của tương quan chuỗi bậc nhất từ phương trình
Khi n lớn, Durbin đã chỉ ra rằng nếu thì thống kê h tuân theo phân phối chuẩn hóa
2.2.6 Các phương pháp khác ước lượng
Ngoài các phương pháp để ước lượng đã trình bày ở trên còn một số phương pháp khác nữa Chẳng hạn ta có thể dùng phương pháp hợp lí cực đại để ước lượng trực tiếp các tham số mà không cần dùng đến một số thủ tục lặp đã thảo luận Nhưng phương pháp ước lượng hợp lí cực đại liên quan tới thủ tục ước lượng phi tuyến và thủ tục tìm kiếm của Hildreth – Lu nhưng thủ tục này tốn nhiều thời gian và không hiệu quả so với phương pháp ước lượng hợp lí cực đại nên ngày càng không được dùng nhiều
Tóm lại các phương pháp đã trình bày ở trên về cơ bản là các thủ tục 2 bướcBước 1: để thu được ước lượng của chưa biết,
Bước 2: sử dụng ước lượng đó để đổi biến để ước lượng phương trình sai phân tổng quát mà về cơ bản đó là phương pháp bình phương bé nhất tổng quát Nhưng vì chúng ta sử dụng thay cho thực, nên tấc cả các phương pháp ước lượng này, được coi
là phương pháp bình phương nhỏ nhất tổng quát ước lượng được hoặc chấp nhận được
Trang 11PHẦN 3 : KHẮC PHỤC HIỆN TƯỢNG TỰ TƯƠNG QUAN
3.1 Khi cấu trúc tự tương quan là đã biết
Trong thực hành, người ta thường giả sử rằng Ut theo mô hình tự hồi quy bậcnhất, nghĩa là: (3.1)
Trong đó thoả mãn các giả thiết của phương pháp bình phương nhỏ nhất thôngthường Giả sử (3.1) là đúng thì vấn đề tương quan chuỗi có thể được giải quyết thoảđáng nếu hệ số tự tương quan ρ là đã biết
Ta quay lại mô hình hai biến: (3.2)
Nếu (3.2) đúng với t thì cũng đúng với t – 1 nên:
(3.3)Nhân hai vế (3.3) với ρ ta được:
(3.4)Trừ (3.3) cho (3.4) ta được:
(3.5)
Đặt
Thì phương trình (3.5) có thể viết lại dưới dạng: (3.6)
Phương trình hồi quy (3.5) được gọi là phương trình sai phân tổng quát
3.2 Khi ρ chưa biết
3.2.1 Phương pháp sai phân cấp 1
Như ta đã biết -1 nghĩa là ρ nằm giữa [-1,0] hoặc [0,1] cho nên người ta có thểbắt đầu từ các giá trị ở các đầu mút của các khoảng đó Nghĩa là ta có thể giả thiếtrằng ρ=0 tức là không có tương quan chuỗi, ρ nghĩa là có tương quan dương hoặc âmhoàn toàn
Tuy nhiên nếu ρ thì phương trình sai phân tổng quát (3.3) quy về phương trìnhsai phân cấp 1:
(3.7)
Để ước lượng hồi quy (21) thì cần phải lập các sai phân cấp 1 của biến phụ thuộc
và biến giải thích và sử dụng chúng làm những đầu vào trong phân tích hồi quy
Giả sử mô hình ban đầu là: (3.8)
Trong đó t là biến xu thế còn Ut theo sơ đồ tự hồi quy bậc nhất
Trang 12Thực hiện phép biến đổi sai phân cấp 1 đối với (3.8) ta đi đến
Trong đó Nếu ρ=-1 nghĩa là có tương quan chuỗi âm hoàn toàn, phương trình sai phân bâygiờ có dạng:
Hay
Mô hình này được gọi là mô hình hồi quy trung bình trượt (2 thời kỳ) vì chúng tahồi quy giá trị của một trung bình trượt đối với một trung bình trượt khác
3.2.2 Ước lượng ρ dựa trên thống kê d – Durbin – Watson
Trong phần kiểm định d chúng ta đã thiết lập được các công thức:
Hoặc (3.9)
Đẳng thức này gợi cho ta cách thức đơn giản để thu được ước lượng của ρ từthống kê d Do đó thống kê d cung cấp cho ta một phương pháp sẵn có để thu đượcước lượng của ρ
Nhưng lưu ý rằng quan hệ (3.9) chỉ là quan hệ xấp xỉ và có thể không đúng vớicác mẫu nhỏ Vì vậy trong các mẫu nhỏ ta phải cẩn thận trong khi giải thích các kếtquả ước lượng
3.2.3 Thủ tục lặp Cochrane – Orcutt để ước lượng ρ
Phương pháp này sử dụng các phần dư et đã được ước lượng để thu được thôngtin về ρ chưa biết
Ta xét phương pháp này thông qua mô hình hai biến sau:
Giả sử Ut được sinh ra từ lược đồ AR(1) cụ thể là
Các bước tiến hành như sau:
Bước 1: Ước lượng mô hình 2 biến bằng phương pháp bình phương nhỏ nhấtthông thường và thu được các phần dư et
Bước 2: Sử dụng các phần dư đã ước lượng để ước lượng hồi quy: (3.10)
Bước 3: Sử dụng thu được để ước lượng phương trình sai phân tổng quát:
(3.5)
Đặt
Trang 13Ta ước lượng hồi quy (3.11)
Bước 4: Vì chúng ta chưa biết trước rằng thu được từ trên có phải là ước lượngtốt nhất của ρ hay không, ta thế giá trị và thu được từ (3.11) vào hồi quy gốc ban đầu
và thu được các phần dư mới chẳng hạn e**
Ước lượng phương trình hồi quy tương tự với (3.10)
là ước lượng vòng 2 của ρ
Thủ tục này tiếp tục cho đến khi các ước lượng kế tiếp nhau của ρ khác nhau mộtlượng rất nhỏ chẳng hạn bé hơn 0,01 hoặc 0,005
3.2.4 Thủ tục Cochrane – Orcutt hai bước
Đây là một kiểu rút gọn quá trình lặp Trong bước 1 ta ước lượng ρ từ bước lặpđầu tiên nghĩa là từ phép hồi quy (5) và trong bước 2 ta sử dụng ước lượng của ρ đểước lượng phương trình sai phân tổng quát
3.2.5 Phương pháp Durbin – Watson 2 bước để ước lượng ρ
Để minh hoạ phương pháp này chúng ta viết lại phương trình sai phân tổng quátdưới dạng sau: (3.12)
Durbin đã đề xuất thủ tục 2 bước để ước lượng ρ:
Bước 1: Coi (3.12) như là một mô hình hồi quy bội, hồi quy Yt theo Xt, Xt-1 và
Yt-1 và coi giá trị ước lượng được của hệ số hồi quy của Yt-1 (=) là ước lượng của ρ.Mặc dù là ước lượng chệch nhưng ta có ước lượng vững của ρ
Bước 2: Sau khi thu được , hãy đổi biến và ước lượng hồi quy bằng phươngpháp bình phương nhỏ nhất thông thường trên các biến đã biến đổi đó
Như vậy theo phương pháp này thì bước 1 là ước lượng ρ còn bước 2 là để thuđược các ước lượng tham số
3.2.6 Các phương pháp khác ước lượng ρ
Ngoài các phương pháp để ước lượng ρ đã trình bày ở trên còn có một sốphương pháp khác nữa Chẳng hạn ta có thể dùng phương pháp hợp lý cực đại để ướclượng trực tiếp các tham số của (3.12) mà không cần dùng đến một số thủ tục lặp đãthảo luận Nhưng phương pháp này tốn nhiều thời gian và không hiệu quả nên ngàynay không được dùng nhiều