LỜI MỞ ĐẦUMột trong các giả thuyết của mô hình hồi quy tuyến tính cổ điển là không có tự tương quan hay tương quan chuỗi các nhiễu Ui trong hàm hồi quy tổng thể.Nhưng trong thực tế hiện
Trang 1LỜI MỞ ĐẦU
Một trong các giả thuyết của mô hình hồi quy tuyến tính cổ điển là không có
tự tương quan hay tương quan chuỗi các nhiễu Ui trong hàm hồi quy tổng thể.Nhưng trong thực tế hiện tượng đó có xảy ra hay không? Nguyên nhân của hiệntượng đó là gì? Nếu có hiện tượng tự tương quan thì liệu có áp dụng được phươngpháp bình phương nhỏ nhất nữa hay không? Làm thế nào để biết hiện tượng đó xảyra? Cách khắc phục như thế nào? Đó là một loạt các câu hỏi mà nhóm chúng tôi sẽgiải quyết trong đề tài này
Áp dụng vào thực tế, Việt Nam đang trên đà hội nhập và phát triển, con người ngày được quan tâm hơn Chỉ số HDI là một thước đo tổng quát về phát triển con người theo ba tiêu chí sau: sức khỏe, tri thức và thu nhập Chính vì thế,
với những tổng hợp cơ bản về số liệu chỉ số phát triển con người HDI, tuổi thọ trungbình, tỷ lệ biết chữ, thu nhập bình quân giai đoạn 1993-2005, nhóm chúng tôi đã thực hiện nghiên cứu sự phụ thuộc giữa các yếu tố này
Trang 2CHƯƠNG I: CƠ SỞ LÝ THUYẾT 1.1 Hiện tượng tự tương quan
* Tự tương quan là gì? Là sự tương quan giữa các thành phần của chuỗi các
quan sát được sắp xếp theo thứ tự thời gian (trong các số liệu chuỗi thời gian) hoặc không gian (trong số liệu chéo)
Trong phạm vi hồi quy, mô hình tuyến tính cổ điển giả thiết rằng không có sựtương quan giữa các nhiễu Ui, nghĩa là:
- Nguyên nhân khách quan:
+ Quán tính: Nét nổi bật của hầu hết các chuỗi thời gian trong kinh tế là quántính Chúng ta đều biết các chuỗi thời gian như tổng sản phẩm, chỉ số giá, thất nghiệp mang tính chu kỳ Chẳng hạn nếu chúng ta ở đầu thời kỳ khôi phục kinh tế, tổng sản phẩm có xu hướng đi lên Trong quá trình biến động này, giá tri của chuỗi
ở mỗi thời điểm sau lại cao hơn giá trị cả nó ở thời điểm trước Vì vậy trong hồi qui của chuỗi thời gian, các quan sát kế tiếp đó có nhiều khả năng phụ thuộc lẫn nhau
+ Hiện tượng mạng nhện:
Trang 3Ví dụ: Vào đầu vụ trồng lạc năm nay, người nông dân bị ảnh hưởng bởi giá mua lạc năm ngoái của các công ty xuất khẩu Cho nên cung về lạc có biểu diễn dưới dạng hàm:
Giả sử ở cuối thời kì t giá lạc
Giả sử ở cuối thời kì t giá lạc do đó trong thời kì t+1 những người nông dân
sẽ quyết định sản xuất lạc ít hơn thời kì t Rõ ràng trong trường hợp đó, ta không mong đợi các ngẫu nhiên là ngẫu nhiên, có lẽ nông dân sẽ giảm sản xuất ở năm t+1 Điều này sẽ dẫn đến mô hình mạng nhện
+ Trễ: Trong phân tích hồi quy chuỗi thời gian, chúng ta chúng ta có thể có gặp hiện tượng biến phụ thuộc ở thời kì t phụ thuộc vào chính biến đó ở thời kì t-1
và các biến khác
-Nguyên nhân chủ quan:
+ Phương pháp ( kỹ thuật) thu thập và xử lí số liệu
+ Sai lầm khi lập ô hình: Bỏ biến ( không đưa biến vào mô hình), dạng hàm sai,
*Phân loại tự tương quan:
Xét mô hình:
AR(1)
AR(p)
*Hậu quả:
Trang 4Nếu có hiện tượng tự tương quan xảy ra mà vẫn tiếp tục sử dụng phương phápbình phương nhỏ nhất thông thường thì sẽ gây ra một số hậu quả sau:
• Ước lượng bình phương nhỏ nhất thông thường vẫn là ước lượng tuyến tính khôngchệch nhưng nó sẽ không hiệu quả nữa.Tức là ước lượng bình phương nhỏ nhấtthông thường không phải là ước lượng tuyến tính không chệch tốt nhất nữa
• Phương sai ước lượng được của các ước lượng bình phương nhỏ nhất thôngthường là chệch Đôi khi công thức để tính phương sai và sai số tiêu chuẩn của cácước lượng bình phương nhỏ nhất thường đưa đến ước lượng quá thấp phương saithực và sai số tiêu chuẩn, do đó phóng đại tỷ số t Hậu quả sẽ ngộ nhận rằng một hệ
số nào đó khác không có ý nghĩa về mặt thống kê, nhưng thực tế lại không phải nhưvậy
• Các kiểm định T và F không còn đáng tin cậy
• cho ước lượng chệch của thực và trong một số trường hợp, nó dường như ướclượng thấp
• 2 có thể là độ đo không đáng tin cậy cho R2 thực
• Các phương sai và sai số tiêu chuẩn của dự đoán đã tính được cũng có thể khônghiệu quả
1.2 Các cách phát hiện hiện tượng tự tương quan
a Kiểm định Durbin-Watson
Ý tưởng chung: Để phát hiện hiện tượng tự tương quan tức là xem xét tác động trễ giữa các biến ngẫu nhiên người ta sử dụng là chất liệu nghiên cứu
Bước 1: Ước lượng mô hình hồi quy ban đầu →
Bước 2: Bài toán kiểm định:
↔ Tiêu chuẩn kiểm định: d =
Ta có: n= ; k’= k-1= ; α= ; = ; =
0 dL dU 4-dU 4-dL 4
Trang 51 (2) (3) (4) (5)+ d (1) → có tự tương quan (+)
+ d (2), (4) → không có kết luận
+ d (3) → không có tự tương quan
+ d (5) → có tự tương quan (-)
Bước 3: Kết luận
b. Kiểm định Breusch – Godfrey (BG)
Cách phát hiện hiện tượng tự tương quan trong kiểm định B-G
Bước 1: Ước lượng mô hình hồi quy ban đầu để thu được
= + + Trong đó :
= + + + + Bài toán kiểm định :
Bước 2: Ước lượng mô hình ta được :
= + + + + + + +
Từ kết quả ước lượng mô hình này ta thu được
Bước 3 : Tiêu chuẩn kiểm định :
Tiêu chuẩn kiểm định
= ( n-p ) đúng thì Miền bác bỏ :
Trang 6=
Bước 4:
= ( n –p) bác bỏ
không thuộc chấp nhận bác bỏ
1.3 Các biện pháp khác phục hiện tượng tự tương quan
1.3.1 Khi cấu trúc của tự tương quan là đã biết
Vì các nhiễu Ut không quan sát được nên tính chất của tương quan chuỗithường là vấn đề suy đoán hoặc là do những đòi hỏi cấp bách của thực tiễn Trongthực hành, người ta thường giả sử rằng Ut theo mô hình tự hồi quy bậc nhất nghĩalà:
Ut = ρ Ut-1 + ɛt (1)
Trong đó ǀρǀ˂1 và ɛt thoả mãn các giả thiết của phương pháp bình phương nhỏ nhấtthông thường nghĩa là: Trung bình bằng 0, phương sai không đổi và không tự tươngquan Giả sử Ut = ρ Ut-1 + ɛt là đúng thì vấn đề tương quan chuỗi có thể được giảiquyết thoả đáng nếu hệ số tự tương quan là đã biết Để làm sáng tỏ vấn đề đó taquay lại mô hình hai biến:
Trang 7Phương trình hồi quy Yt - ρYt-1 = β1( 1 –ρ) + β2(Xt – ρXt-1) + ɛt được gọi làphương trình sai phân tổng quát.
Việc ước lượng hồi quy Y* đối với X* có hay không có hệ số chặn phụ thuộcvào phương trình gốc có hệ số chặn hay không Trong phương pháp này ( ước lượnghồi quy ρYt-1 = ρβ1 + ρβ2Xt-1 + ρUt-1 chúng ta mất đi một quan sát bởi vì quan sát thứnhất không có quan sát đứng trước nó Thủ tục này không chính xác là thủ tục ướclượng bình phương nhỏ nhất tổng quát sử dụng tất cả các quan sát với:
Yt* = Yt
Xt* = Xt
Nhưng trong thực tế thì ρ chưa biết nên ta xét trường hợp sau đây:
1.3.2 Khi ρ chưa biết
a. Phương pháp sai phân cấp 1
Như ra biết -1 ≤ ρ ≤1 nghĩa là p nằm giữa [-1,0] hoặc [0,1] cho nên người ta cóthể bắt đầu từ các giá trị ở các dấu mút của các khoảng đo Nghĩa là ta có thể giảthiết rằng:
Trang 8ρ = 0 tức là không có tương quan chuỗi.
ρ = ±1 nghãi là có tương quan dương hoặc âm hoàn toàn
Trên thực tế khi ước lượng hồi quy người ta thường giả thiết rằng không có tựtương quan rồi sau đó tự tiến hành kiệm định Durbin-Watson hay các kiểm địnhkhác để xem giả thiết này có đúng không Tuy nhiên nếu ρ =±1 thì phương trình sauphân tổng quát quy về phương trình sai phân cấp 1
Y1 – Yt-1 = ß1 ( X1-Xt-1) + ( U1-Ut-1)= ß2(X1-Xt-1)+ ε1
Hay ∆Yt= ß2 ∆Xt + ε1
Trong đó là toán từ sai số cấp 1 Để ước lượng hồi quy 1 thì cần phải lập các saiphân cấp 1 của biến phụ thuộc và biến giải thích và sử dụng chúng làm những đầuvào trong phân tích hồi quy
Chú ý một nét quan trọng của mô hình sai phân cấp 1 của biến phụ thuộc làkhông có số hạng chặn trong mô hình Vì vậy để ước lượng hồi tquy 1 ta sẽ sử dụng
mô hình hồi quy qua gốc tọa độ.Giả sử mô hình ban đầu là:
Yt= ß1+ß2X1+ß3+ ε1
Trong đó t là biến xu thế còn Ut theo sơ đồ tự hồi quy bậc nhất
Thực hiện phép biến đổi sai phân cấp 1 đối với 2 ta đi đến
Trang 9Thí dụ nếu ß3 trong ∆Yt= ß2 ∆Xt+ß3+ ε1 là dương thì điều đó có nghĩa là có xuthế tăng trong Y sau khi đã tính đến ảnh hưởng của tất cả các biến khác.
Nếu ρ = -1 nghĩa là có tương quan chuỗi âm hoàn toàn ( đây không phải làtrường hợp điển hình của các chuỗi thời gian trong kinh tế), phương trình sai phântổng quát bây giờ có dạng :
b. Ước lượng ρ dựa trên thống kê d – Durbin – Watson
Trong phần kiểm định d chúng ta đã thiết lập được các công thức:
d 2 ( 1 -
Hoặc 1 -
Đẳng thức này gợi cho ta cách thức đơn giản để thu được ước lượng của từ
thống kê d Từ (Y1 +Yt-1 )/ 2 = ß1+ ß2 (X1+Xt-1)/2+ ε1/2 chỉ ra rằng giả thiết sai phân
cấp 1 với = chỉ đúng khi d =0 hoặc xấp xỉ bằng không Cũng vậy khi d = 2 thì và khi
d = 4 thì Do đó thống kê d cung cấp cho ta một phương pháp sẵn có để thu được
ước lượng của
Nhưng lưu ý rằng quan hệ 1 - chỉ là quan hệ xấp xỉ và có thể không đúngvới các mẫu nhỏ
Khi đã được ước lượng thì có thể biến đổi tập số liệu theo phương trình sai phântổng quát
Trang 10Và tiến hành ước lượng theo phương pháp bình phương nhỏ nhất thôngthường Khi ta sử dụng một ước lượng thay cho giá trị đúng, thì các hệ số ước lượngthu được từ phương pháp bình phương nhỏ nhất có thuộc tính tối ưu thông thườngchỉ tiệm cận có nghĩa là có thuộc tính đó trong các mẫu lớn Vì vậy trong các mẫunhỏ ta phải cẩn thận trong khi giải thích các kết quả ước lượng.
Trang 11CHƯƠNG II: BÀI TOÁN ÁP DỤNG
1. Bài toán áp dụng.
Sau khi thu thập số liệu, ta có bảng về chỉ số phát triển con người HDI (Y),
tuổi thọ trung bình (X), tỷ lệ biết chữ (Z) và thu nhập bình quân (T) của Việt Nam trong giai đoạn 1993-2005 Số liệu được cho ở bảng sau:
Năm HDI (Y)
Tuổi thọ trung bình (tuổi) X Tỷ lệ biết chữ (%) Z
Thu nhập bình quân (nghìn đô) T
Nguồn: Báo cáo phát triển con người các năm từ 1995 đến 2007 của UBND
Nhập bảng số liệu vào eview ta có được bảng sau:
Trang 12Sau khi tiến hành hồi quy mô hình bằng phương pháp bình phương nhỏ nhất vớimức ý nghĩa 5%, ta thu được kết quả như sau:
Mô hình hồi quy mẫu:
Trang 13Ý nghĩa của các hệ số hồi quy:
β2 = - 0.010657 Khi tỷ lệ biết chữ và thu nhập bình quân không đổi, tuổi thọ trungbình tăng lên 1 tuổi thì chỉ số HDI giảm 0.010657
β3 = 0.005780 Khi tuổi thọ trung bình và thu nhập bình quân không đổi, tỷ lệ biếtchữ tăng 1% thì chỉ số HDI tăng 0.005780
β4 =0.135720 Khi tuổi thọ trung bình và tỷ lệ biết chữ không đổi, thu nhập bình quân tăng 1 nghìn đô thì chỉ số HDI tăng 0.135720
2. Phát hiện hiện tượng tự tương quan bằng kiểm đinh d (Dubin-Watson)
Mô hình hồi quy mẫu:
• BTKĐ:
Trang 14• KL: Có hiện tượng tự tương quan dương
3. Phát hiên hiện tượng tự tương quan bằng kiểm định B-G
a. Kiểm định tự tương quan BG bậc 1.
Mô hình hồi quy mẫu:
Trang 15Ước lượng mô hình :
= ’ + ’ + ’ + ’ + +
= -0,960630 + 0,020329 - 0,003061 - 0,078702 + 0,881341 Bài toán kiểm định
Tiêu chuẩn kiểm định
= (n-1) đúng thì Miền bác bỏ :
Kết luận : Mô hình có hiện tượng tự tương quan bậc 1
b. Kiểm định tự tương quan BG bậc 2.
Trang 16Mô hình hồi quy mẫu:
Ước lượng mô hình :
= ’ + ’ + ’ + ’ + + +
= -1,151084 + 0,014167 +0.002873 - 0,043078 + 1,061623 - 0,488122 Bài toán kiểm định
Trang 17
Tiêu chuẩn kiểm định :
= ( n-2 ) đúng thì Miền bác bỏ :
Trang 184. Cách khắc phục hiện tượng tự tương quan
a Khắc phục hiện tượng tự tương quan dựa trên Durbin- Watson
Từ phương pháp bình phương nhỏ nhất mô hình hồi quy gốc
20.1655 9
28.2720 2
0.48024 8
0.17023 3
20.2157 1
28.6221 3
0.39068 8
0.21813
3 20.5358 26.4323
0.44509 4
0.23714 5
20.5159
5 27.5219
0.60331 2
0.20635 8
20.6360 4
27.8918 7
0.62536 2
Trang 194 4 2
0.21076 2
20.7561 4
28.2521 6
0.69444 3
0.20656 4
20.8762 3
27.3422 3
0.67327 5
0.20956 4
20.9963 3
25.4320 6
0.85149 3
0.22046 4
22.2164 2
27.1114 9
0.88054 7
0.21636 8
21.4667 8
27.1114 9
1.00259 3
0.23686 9
24.1568 5
27.1114 9
1.15015 3
Ước lượng mô hình trên với các biến Y1, X1, Z1, T1 ta có kết quả:
Trang 21↔
Ta có mô hình kiểm định BG như sau
Theo mô hình kiểm định ta có p-value=0,2351 > α(5%) nên chấp nhận H0 bác bỏ H1
→không còn hiện tượng tự tương quan bậc 1
Kiểm định tự tương quan BG bậc 2.
Trang 22với α=5% ta cần kiểm định
↔
Ta có mô hình kiểm định BG như sau
Theo mô hình kiểm định ta có p-value=0.2907 > α (5%) nên chấp nhận H0 bác bỏ
H1 →không còn hiện tượng tự tương quan bậc 2
Ta thấy rằng kiểm định BG đều cho biết mô hình sai phân tổng quát không có hiện tượng tự tương quan Nếu chấp nhận mô hình này thì ước lượng của mô hình banđầu là:
Ŷ= 0.251968/ (1- 0.699762) + 0.003390 X – 0.004902 Z + 0.030574 T
Trang 24TÀI LIỆU THAM KHẢO
http://www.vn.undp.org/