LỜI MỞ ĐẦUMột trong các giả thuyết của mô hình hôi quy tuyến tính cổ điển là không có tựtương quan hay tương quan chuỗi các nhiễu Ui trong hàm hồi quy tổng thể.. Để trả lời những câu hỏi
Trang 1LỜI MỞ ĐẦU
Một trong các giả thuyết của mô hình hôi quy tuyến tính cổ điển là không có tựtương quan hay tương quan chuỗi các nhiễu Ui trong hàm hồi quy tổng thể Nhưngtrong thực tế liệu hiện tượng đó có xảy ra hay không? Nếu có thì phát hiện bằngcách nào? Nguyên nhân là do đâu? Để trả lời những câu hỏi đó nhóm 8 đã lựa chọn
và nghiên cứu đề tài: “Hiện tượng tự tương quan, cách khắc phục hiện tượng tựtương quan”
Bài thảo luận gồm hai phần lí thuyết và bài tập ứng dụng sẽ cung cấp cho thầy giáo
và các bạn những thông tin liên quan đến hiện tượng tự tương quan, cách phát hiện
và khắc phục trên phần mềm Eviews …
Bài làm không thể tránh được những thiếu sót mong thầy giáo và các bạn đóng góp
ý kiến để hoàn chỉnh hơn!
Nhóm 6 xin chân thành cảm ơn!
Trang 2MỤC LỤC
Phần 1: Bản chất hiện tượng tự tương quan
1.1 Định nghĩa 3
1.2 Nguyên nhân của tự tương quan 3
1.2.1 Nguyên nhân khách quan 3
1.2.2 Nguyên nhân chủ quan 3
1.3 Ước lượng bình phương nhỏ nhất khi có tự tương quan 4
1.4 Ước lượng tuyến tính không chệch tốt nhất khi có tự tương quan 4
1.5 Hậu quả 5
Phần 2: Phát hiện có tự tương quan 2.1 Phương pháp đồ thị 5
2.2 Một số phương pháp kiểm định 6
2.2.1 Kiểm định các đoạn mạch 6
2.2.2 Kiểm định χ2 về tính độc lập của các phần dư 6
2.2.3 Kiểm định d (Durbin - Watson) 6
2.2.4 Kiểm định Breusch – Godfrey (BG) 7
2.2.5 Kiểm định Durbin h 7
2.2.6 Phương pháp khác: Kiểm định Correlogram 7
Phần 3: Biện pháp khắc phục tự tương quan 3.1 Khi cấu trúc tự tương quan là đã biết 8
3.2 Khi ρ chưa biết 8
3.2.1 Phương pháp sai phân cấp 1 8
3.2.2 Ước lượng ρ dựa trên thống kê d.Durbin – Watson 9
3.2.3 Thủ tục lặp Cochrane – Orcutt để ước lượng ρ .9
3.2.4 Thủ tục Cochrane – Orcutt hai bước 10
3.2.5 Phương pháp Durbin – Watson hai bước để ước lượng ρ .10
3.2.6 Các phương pháp khác để ước lượng ρ .10
B Bài tập ứng dụng
Trang 3Trong phạm vi hồi quy, mô hình tuyến tính cổ điển giả thuyết rằng không có sự tương quan giữa các nhiễu UI nghĩa là:
Cov(Ui,Uj) = 0 ( i≠j) (1)
Tuy nhiên trong thực tế có xảy ra hiện tượng mà thành phần nhiễu của các quan sát lại có thể phụ thuộc lẫn nhau nghĩa là:
Cov(Ui,Uj) ≠0 ( i ≠ j) (2)
1.2 Nguyên nhân của tự tương quan.
1.2.1 Nguyên nhân khách quan
• Quán tính:
Chúng ta đều biết các chuỗi thời gian như tổng sản phẩm, chỉ số giá, thất nghiệp mang tính chu kì Vì vậy trong hồi quy của chuỗi thời gian, các quan sát kế tiếp đó cónhiều khả năng phụ thuộc lẫn nhau
• Hiện tượng mạng nhện:
Chẳng hạn vào đầu vụ trồng lạc năm nay, người nông dân bị ảnh hưởng bởi giá mua lạc năm ngoái của các công ty xuất khẩu Cho nên cung về lạc có biểu hiện dưới dạnghàm :
Yt = β1 + β2Pt-1 + Ut (3)
Giả sử ở cuối kỳ t giá lạc Pt< Pt-1, do đó trong thời kỳ t+1 những người nông dân có thể sẽ quyết định sản xuất lạc ít hơn thời kỳ t Điều này sẽ dẫn đến mô hình mạng nhện
• Trễ:
Khi nghiên cứu mối quan hệ giữa tiêu dùng và thu nhập, chúng ta thấy rằng tiêu dùng ở thời kỳ hiện tại chẳng những phụ thuộc vào tiêu dùng ở thời kỳ trước đó, nghĩa là:
Trang 4Kỹ thuật thu thập và xử lý số liệu thô làm trơn số liệu và giảm sự dao động của dữ liệu Chính sự làm trơn này dẫn tới sai số hệ thống các nhiễu ngẫu nhiên và gây ra tự tương quan.
• Sai lệch do lập mô hình:
Sai lầm do bỏ sót, không đưa biến vào mô hình, dạng hàm sai…
1.3 Ước lượng bình phương nhỏ nhất khi có tự tương quan.
Để đơn giản ta xét mô hình:
(5)Trong đó:
t: ký hiệu quan sát ở thời điểm t (giả thiết ta đang nghiên cứu số liệu dạng chuỗi thời gian)
Với giả thiết tổng quát (là giả thiết quá chung theo thực hành) vì vậy chúng ta giả thiết có một cơ chế sản sinh ra như là một điểm xuất phát hoặc xấp xỉ ban đầu, ta có thể giả thiết nhiễu sản sinh ra theo cách sau:
(6)Trong đó ρ gọi là hệ số tương quan, là nhiễu ngẫu nhiên thỏa mãn các giả thiết thông thường của phương pháp bình phương nhỏ nhất
Lược đồ (6) gọi là lược đồ tự hồi quy bậc nhất Markov Chúng ta ký hiệu lược đồ đó
là AR(1) Nếu có dạng:
(7)
Là lược đồ tự hồi quy bậc 2 và ký hiệu AR(2)
Chú ý rằng hệ số ρ trong (6) có thể giả thích là hệ số tự tương quan bấc nhất hay đúng hơn là hệ số tự tương quan trễ một thời kỳ
Bằng phương pháp bình phương nhỏ nhất ta tính được:
(8)
Giả sử tiếp tục sử dụng phương pháp bình phương nhỏ nhất thông thường và điều chỉnh công thức phương sai thông thường bằng việc sử dụng lược đồ AR(1) thì dễ chứng minh rằng:
- vẫn là ước lượng tuyến tính không chệch;
- không còn là ước lượng tuyến tính không chệch tốt nhất nữa Vậy liệu chúng ta có thể tìm được ước lượng không chệch tốt nhất hay không?
1.4 Ước lượng tuyến tính tốt nhất không chệch khi có tự tương quan.
Ta tiếp tục xem xét mô hình 2 biến và có quá trình AR(1) bằng phương pháp OLS.Tađược :
(9)
Và phương sai của nó được cho bởi công thức :
(10)Trong đó C và D là các hệ số điều chỉnh và ta có thể bỏ qua trong thực hành
1.5 Hậu quả của việc sử dụng phương pháp bình phương nhỏ nhất thông thường khi có tự tương quan.
Trang 5• Ước lượng BPNN j là các ước lượng tuyến tính, không chệch nhưng chúng không phải
là hiệu quả nữa
• Các ước lượng của các phướng sai là chệch và thông thường là thấp hơn giá trị thực củaphương sai, do đó giá trị của thống kê T được phóng đại lên nhiều lần so với giá trị thực
• Các kiểm định T và F nói chung không đáng tin cậy
• Các dự báo trên các ước lượng BPNN không còn tin cậy nữa
Như vậy, hậu quả này cũng giống như đối với trường hợp phương sai thay đổi và cũng là vấn đề nghiêm trọng trong thực hành
2 Phát hiện có tự tương quan.
2.1.Phương pháp đồ thị.
Giả thiết không có tự tương quan trong mô hình hồi quy tuyến tính cổ điển gắn với các nhiễu Ut không quan sát được, ta chỉ có thể quan sát các phần dư et Mặc dù et không hoàn toàn giống như Ut nhưng quan sát các phần dư et có thể gợi ý cho ta những nhận xét về Ut
Nhìn vào đồ thị, ta thấy phần dư không biểu thị một kiểu mẫu nào khi thời gian tăng lên, nó phân bố một cách ngẫu nhiên xung quanh trung bình của chúng
Nếu đồ thị của phần dư như hình dưới: ta thấy có xu thế tuyến tính, tăng hoặc giảm trong các nhiễu → Nó ủng hộ cho giả thiết có sự tương quan trong mô hình hồi quy tuyến tính cổ điển
2.2 Phương pháp kiểm định số lượng
2.2.1 Kiểm định các đoạn mạch
Trang 6Kiểm định các đoạn mạch là một phép kiểm định thống kê giúp ta xác định xem có thể coi một dãy các ký hiệu, các khoản mục hoặc các số liệu có phải là kết quả của một quá trình mang tính ngẫu nhiên hay không.
Để kiểm định χ2 về tính độc lập của các phần dư ta sử dụng bảng tiếp liên Bảng tiếp
liên mà chúng ta sử dụng ở đây gồm một số dòng và một số cột, cụ thể là bảng tiếp liên 2 dòng và 2 cột
2.2.3 Kiểm định d.Durbin – Watson
Đây là kiểm định có ý nghĩa nhất để phát hiện ra tương quan chuỗi
Thống kê d được định nghĩa như sau:
n t
t t
e
e e
1 2 2
2
1 ) (
(11)
d ≈ 2(1 - ρ ˆ) (12)Trong đó:
e
e e
1 2 2
1 ˆ
ρ
(13)
Vì -1 ≤ ρ ≤ 1 nên 0 ≤d ≤ 4
Nếu ρ = -1 thì d =4: tự tương quan ngược chiều
Nếu ρ = 0 thì d = 2: không có tự tương quan
Nếu ρ = 1 thì d = 0: tồn tại tự tương quan thuận chiều
d ∈ (5): tồn tại tự tương quan ngược chiều
Kiểm định Durbin – Watson chỉ nhận dạng được hiện tượng tương quan chuỗi bậc 1 Đôi khi Kiểm định Durbin – Watson không cho kết luận
2.2.4 Kiểm định Breusch – Godfrey (BG)
Để đơn giản ta xét mô hình giản đơn: Y t = β1+ β2X t +U t
Trong đó: U t = ρ1U t−1+ ρ2U t−2 + + ρp U t−p + εt, εt thoả mãn các giả thiết của OLS.
Giả thiết: H 0 : ρ 1 = ρ 2 = = ρp =0
Trang 7Kiểm định như sau:
Bước 1: Ước lượng mô hình ban đầu bằng phương pháp OLS Từ đó thu được các
phần dư et
Bước 2: Ước lượng mô hình sau đây bằng phương pháp OLS:
e t = β1+ β2X t + ρ1e t−1+ ρ2e t−2 + + ρp e t−p +v t
Từ kết quả ước lượng mô hình này thu được R2
Bước 3: Với n đủ lớn, (n - p)R2 có phân bố xấp xỉ χ2(p).
Nếu (n - p)R2 > χ α2(p) thì H0 bị bác bỏ, nghĩa là ít nhất tồn tại tự tương quan một bậc
nào đó Trong trường hợp ngược lại không tồn tại tự tương quan
Quy tắc quyết đinh: Vì h ≈ N(0,1) nên P(-1,96 ≤h≤ 1,96) = 0,95
Nếu h>1.96 hoặc h<-1.96: bác bỏ giả thiết không có tự tương quan
Nếu -1.96<h<1.96: không bác bỏ giả thiết không có tự tương quan
2.2.6 Phương pháp khác: Kiểm định Correlogram (trong tập bài giảng kinh tế
lượng – biên soạn: ThS Hoàng Thị Hồng Vân)
Một phương pháp khác giúp nhận dạng AR là kiểm định Q Để thực hiện kiểm định này chúng ta cần xem xét một khái niệm “tự tương quan” (AutoCorrellation – AC)
Giả thuyết kiểm định:
Trị số thống kê kiểm định (Box-Lung):
3 Các biện pháp khắc phục hiện tượng tự tương quan.
3.1 Khi cấu trúc của tự tương quan là đã biết
Trang 8Trong thực hành, người ta thường giả sử rằng U t theo mô hình tự hồi quy bậc nhất nghĩa là:
t t
U = ρ −1+ ε (6)
Trong đó ρ <1 và εt thoả mãn các giả thiết của phương pháp bình phương nhỏ nhất
thông thường Giả sử (6) là đúng thì vấn đề tương quan chuỗi có thể được giải quyết thoả đáng nếu hệ số tự tương quan ρ là đã biết
Ta quay lại mô hình hai biến:
t t
Y = β1+ β2 + (5)
Nếu (5) đúng với t thì cũng đúng với t – 1 nên:
1 1 2 1
2 1
t t
t
X X
U U X
X Y
Y
ε ρ
β ρ β
ρ ρ
β ρ β ρ
+
− +
−
=
− +
− +
) 1 (
) (
) (
) 1 (
1 2
1
1 1
2 1
1
(19)Đặt β 1* = β 1(1− ρ) * 2
Y = β + β * * + ε
2
* 1
*
(20)Phương trình hồi quy (19) được gọi là phương trình sai phân tổng quát
3.2 Khi ρ chưa biết
3.2.1 Phương pháp sai phân cấp 1
Như ta đã biết −1≤ρ ≤1 nghĩa là ρ nằm giữa [-1,0] hoặc [0,1] cho nên người ta có
thể bắt đầu từ các giá trị ở các đầu mút của các khoảng đó Nghĩa là ta có thể giả thiếtrằng:
ρ =0 tức là không có tương quan chuỗi
ρ =±1 nghĩa là có tương quan dương hoặc âm hoàn toàn.
Tuy nhiên nếu ρ =±1 thì phương trình sai phân tổng quát (17) quy về phương trình
sai phân cấp 1:
t t t t
t t
t t
Y = β1 + β2 + β3 + (22)
Trang 9Trong đó t là biến xu thế còn U t theo sơ đồ tự hồi quy bậc nhất.
Thực hiện phép biến đổi sai phân cấp 1 đối với (22) ta đi đến
t t
Y + −1 = 2 β1 + β2( + −1) + ε
Hay 2 2 2
1 2
Trong phần kiểm định d chúng ta đã thiết lập được các công thức:
) 1 (
2 − ρ
≈
d (25)Hoặc ˆ 1 2
kê d Do đó thống kê d cung cấp cho ta một phương pháp sẵn có để thu được ước lượng của ρ.
Nhưng lưu ý rằng quan hệ (26) chỉ là quan hệ xấp xỉ và có thể không đúng với các mẫu nhỏ Vì vậy trong các mẫu nhỏ ta phải cẩn thận trong khi giải thích các kết quả ước lượng
Phương pháp này sử dụng các phần dư et đã được ước lượng để thu được thông tin về
ρ chưa biết.
Ta xét phương pháp này thông qua mô hình hai biến sau:
t t
Y = β1+ β2 + (5)
Giả sử Ut được sinh ra từ lược đồ AR(1) cụ thể là
t t
U = ρ −1+ ε (6)
Các bước tiến hành như sau:
Bước 1: Ước lượng mô hình 2 biến bằng phương pháp bình phương nhỏ nhất thông
thường và thu được các phần dư et
Bước 2: Sử dụng các phần dư đã ước lượng để ước lượng hồi quy:
e t = ρ ˆe t−1 +v t (27)
Bước 3: Sử dụng ρ ˆ thu được từ (26) để ước lượng phương trình sai phân tổng quát (19) cụ thể là phương trình:
Y t − ρˆY t− 1 = β 1(1− ρ)+ β 2(X t − ρˆX t− 1)+(U t − ρˆU t− 1)
Trang 10Hoặc đặt 2
* 2 1
* 1 1
*
t t
β thu được từ (28) vào hồi quy
gốc ban đầu (5) và thu được các phần dư mới chẳng hạn e**
e t Yt *X t
2
* 1
ρ ˆˆ là ước lượng vòng 2 của ρ.
Thủ tục này tiếp tục cho đến khi các ước lượng kế tiếp nhau của ρ khác nhau một
lượng rất nhỏ chẳng hạn bé hơn 0,01 hoặc 0,005
3.2.4 Thủ tục Cochrane – Orcutt hai bước
Đây là một kiểu rút gọn quá trình lặp Trong bước 1 ta ước lượng ρ từ bước lặp đầu
tiên nghĩa là từ phép hồi quy (5) và trong bước 2 ta sử dụng ước lượng của ρ để ước
lượng phương trình sai phân tổng quát
Để minh hoạ phương pháp này chúng ta viết lại phương trình sai phân tổng quát dướidạng sau: Y t = β1( 1 − ρ ) + β2X t − ρβ2X t−1+ ρY t−1 + εt (31)
Durbin đã đề xuất thủ tục 2 bước để ước lượng ρ:
Bước 1: Coi (31) như là một mô hình hồi quy bội, hồi quy Yt theo Xt, Xt-1 và Yt-1 và
coi giá trị ước lượng được của hệ số hồi quy của Yt-1 (=ρ ˆ ) là ước lượng của ρ Mặc
dù là ước lượng chệch nhưng ta có ước lượng vững của ρ.
Bước 2: Sau khi thu được ρ ˆ, hãy đổi biến 1
lượng hồi quy bằng phương pháp bình phương nhỏ nhất thông thường trên các biến
đã biến đổi đó như là ở (20)
Như vậy theo phương pháp này thì bước 1 là ước lượng ρ còn bước 2 là để thu được
các ước lượng tham số
Ngoài các phương pháp để ước lượng ρ đã trình bày ở trên còn có một số phương
pháp khác nữa Chẳng hạn ta có thể dùng phương pháp hợp lý cực đại để ước lượng trực tiếp các tham số của (31) mà không cần dùng đến một số thủ tục lặp đã thảo luận Nhưng phương pháp này tốn nhiều thời gian và không hiệu quả nên ngày nay không được dùng nhiều
B.PHẦN THỰC HÀNH.
Trang 11Nền kinh tế Việt Nam đang ngày càng phát triển với nhiều yếu tố tác động làm nên
sự phát triển ấy và một trong những sự đóng góp đó không thể không kể đến vốn đầu
tư trực tiếp nước ngoài FDI Từ khi Luật đầu tư nước ngoài được ban 1987), Việt Nam đã đạt được những kết quả khả quan trong thu hút dòng vốn FDI.Vậy giữa các yếu tố trên có tồn tại mối quan hệ độc lập hay tự tương quan không?Nếu có thì khắc phục hiện tượng đó như thế nào và bằng những mô hình toán họcnào? Nhóm 6 đã quyết định giải đáp những câu hỏi đó bằng việc nghiên cứu bộ sốliệu “FDI tại Việt Nam giai đoạn 1988-2009” nguồn từ Tổng Cục Thống Kê
Y: Biến phụ thuộc - số dự án
X: Biến giải thích - vốn đăng kí
Z: Biến giải thích - vốn thực hiện
Trang 12*Thực hành trên bộ số liệu
*Ước lượng mô hình hồi quy trên
Tiến hành hồi quy bộ số liệu trên eviews bằng phương pháp ước lượng bình phương nhỏ nhất ta được kết quả như sau:
1.1 Phát hiện hiện tượng tự tương quan
Trang 13- Từ cửa sổ Equation, chọn Proc/Make Residual Series
- Cửa sổ Make Residual hiện ra, nhập tên cho phần dư là “E”
- Ta được phần dư e
Trang 14- Từ menu chính chọn Quick/ Graph
- Cửa sổ Series List sẽ xuất hiện, yêu cầu nhập tên biến “E” cần vẽ đồ thị
- Sau khi nhập tên biến xong, chọn “OK” ta được đố thị phần dư dưới đây:
Trang 150 dL dU 2 4- dU 4- dL 4
Chấp nhận H0 Không có TQC bậc 1
KhôngXác định
KhôngXác định
Nhìn Vào đồ thị ta thấy tăng giảm trong các nhiễu Do đó có hiện tượng tự tương
quan trong mô hình
1.1.2 Kiểm định d.Durbin – Watson
Ta có kết quả của thống kê d: d = 0.610699 Tra bảng với n = 22, α= 5%,
k’ = 2→ dL = 1,147 ; dU = 1,54
Ta thấy 0 < d < dL → tồn tại hiện tượng tự tương quan thuận
1.1.3 Kiểm định Breusch-Godfrey (BG).
Từ cửa sổ Equation, chọn Views/Residual Test/ Serial Correlation LM Test, xuất
hiện cửa sổ lag specification Nhập 1 vào ô Lags to include (tức p=1) → OK
Ta được, cửa sổ hồi quy mô hình mà B-G đưa ra sẽ có dạng:
Trang 16Nhìn vào phần trên của bảng kết quả ta có: prob.chi-square(1) = 0.0002
Với α = 0,05 > 0,0002 → ta bác bỏ giả thiết cho rằng không có tự tương quan ở bậc
1, hay nói cách khác, ta kết luận tồn tại hiện tượng tự tương quan bậc 1
Tượng tự trên để kiểm định B-G ở bậc 2, ta nhập 2 vào ô Lags to include và cửa sổ hồi quy mô hình mà B-G đưa ra sẽ là:
Trang 17- Nhìn vào phần trên của bảng kết quả ta có: prob.chi-square(2) = 0.0010
Với α = 0,05 > 0,0010→ tồn tại hiện tượng tự tương quan bậc 2
1.1.4 Kiếm định Correlogram
- Từ cửa sổ Equation chọn View/Residual Tests/Correlogram-Q-statistics
- Ta được cửa sổ Lag Specification, nhập 22 vào ô Lags to include
Ta được: kiểm đinh LM để nhận dạng AR(1)