Đa cộng tuyến trong kinh tế lượng...Hậu quả của đa cộng tuyến. Làm thế nào để phát hiện và khắc phục đa cộng tuyến. Bài tập ví dụ về hiện tượng đa cộng tuyến. Thực hành phát hiện đa cộng tuyến bằng phần mềm eview.
Trang 1CHÀO M NG TH Y GIÁO VÀ CÁC B N ỪNG THẦY GIÁO VÀ CÁC BẠN ẦY GIÁO VÀ CÁC BẠN ẠN
Đ N V I BÀI TH O LU N C A NHÓM 1 ẾN VỚI BÀI THẢO LUẬN CỦA NHÓM 1 ỚI BÀI THẢO LUẬN CỦA NHÓM 1 ẢO LUẬN CỦA NHÓM 1 ẬN CỦA NHÓM 1 ỦA NHÓM 1
Đ TÀI Ề TÀI
ĐA CỘNG TUYẾN- CÁCH PHÁT HIỆN VÀ KHẮC PHỤC
ĐA CỘNG TUYẾN
Trang 2là các biến giải thích có tương quan thì chúng ta không thể tách biệt sự ảnh
hưởng riêng biệt của một biến nào đó
Hiện tượng trên được gọi là đa công tuyến.Vậy đa cộng tuyến là gì, hậu quả của hiện tượng này như thế nào, làm thế nào để phát hiện và biện pháp khắc phục nó
Để trả lời được những câu hỏi trên, sau đây chúng ta cùng đi thảo luận về đề tài “
Hiện tượng đa cộng tuyến”
Trang 3BẢN CHẤT CỦA ĐA CỘNG TUYẾN
Xét mô hình hồi quy tuyến tính cổ điển nhiều biến:
Đa cộng tuyến xảy ra khi một biến giải thích được biểu diễn dưới dạng tổ hợp tuyến tính của các biến giải thích còn lại đối với mọi điểm của tập số liệu Hay có thể nói nếu tồn tại các không đồng nhất bằng 0 sao cho:
; Trong đó là nhiễu (sai số ngẫu nhiên) ; E()=0;
Trong trường hợp này chúng ta có thể nói là có đa cộng tuyến.
Đa cộng tuyến toàn phần(đa cộng tuyến hoàn hảo) xảy ra khi một biến giải thích được biểu diễn dưới dạng tổ hợp tuyến tính của các biến giải thích còn lại đối với mọi điểm của tập số liệu
Hoặc có thể nói: Đa cộng tuyến toàn phần giữa các biến giải thích xảy ra nếu điều kiện sau được thỏa mãn:
Trong đó là các hằng số không đồng thời bằng không.
Trang 4H U QU C A ĐA C NG TUY N ẬU QUẢ CỦA ĐA CỘNG TUYẾN Ả CỦA ĐA CỘNG TUYẾN ỦA ĐA CỘNG TUYẾN ỘNG TUYẾN ẾN
1. Phương sai và hiệp phương sai của các ước lượng bình quân bé
nhất lớn
2. Khoảng tin cậy rộng hơn
3. Tỷ số t mất ý nghĩa
4. cao nhưng tỉ số t ít ý nghĩa
5. Các ước lượng bình phương bé nhất và các sai số tiêu chuẩn của
chúng trở lên rất nhạy đối với những thay đổi nhỏ trong số liệu Dấu của các ước lượng của các hệ số hồi quy có thể sai
6. Thêm vào hay bớt đi các biến cộng tuyến với các biến khác, mô
hình sẽ thay đổi về độ lớn trong các ước lượng hoặc dấu của
chúng
Trang 5PHÁT HIỆN SỰ TỒN TẠI CỦA ĐA CỘNG TUYẾN
1 cao nhưng tỉ số t thấp
2 Tương quan cặp giữa các biến giải thích cao
3 Xem xét tương quan riêng
4 Hồi quy phụ
5 Nhân tử phóng đại phương sai
6 Độ đo theil
Trang 6 Trong trường hợp cao mà tỷ số t thấp đó chính là dấu hiệu của hiện tượng đa cộng tuyến.
Trang 7T ương quan cặp giữa các biến giải thích cao ng quan c p gi a các bi n gi i thích cao ặp giữa các biến giải thích cao ữa các biến giải thích cao ến giải thích cao ải thích cao
Nếu hệ số tương quan cặp giữa các biến giải thích cao (>0,8) thì có khả năng có tồn tại đa cộng tuyến Tuy nhiên tiêu chuẩn này thường không chính xác.
Có những trường hợp tương quan cặp không cao nhưng vẫn có đa cộng tuyến.
Trang 8Xem xét t ương quan cặp giữa các biến giải thích cao ng quan riêng
Vì vấn đề được đề cập đến liên quan đến tương quan bậc không
Farrar và Glauber đã đề nghị sử dụng hệ số tương quan riêng Trong hồi quy của Y đối với các biến X2, X3, X4 Nếu ta nhận thấy răng
cao trong khi đó , , tương đối thấp thì điều đó có thể gợi ý rằng các biến X2, X3 và X4 có tương quan cao và ít nhất một trong các biến này là thừa.
Dù tương quan riêng rất có ích nhưng nó cũng không đảm bảo rằng sẽ cung cấp cho ta hướng dẫn chính xác trong việc phát hiện ra hiện
tượng đa cộng tuyến.
Trang 9H i quy ph ồi quy phụ ụ
Một cách có thể tin cậy được để đánh giá mức độ của đa cộng tuyến
là hồi quy phụ Hồi quy phụ là hồi quy mỗi một biến giải thích theo các biến giải thích còn lại được tính hồi quy này ta kí hiệu là
Mối liên hệ giữa và :
Một trở ngại của kỹ thuật hồi quy phụ là gánh nặng tính toán Nhưng ngày nay nhiều chương trình máy tính đã có thể đảm đương được
công việc tính toán này.
Trang 10Nhân t phóng đ i ph ử phóng đại phương sai ại phương sai ương quan cặp giữa các biến giải thích cao ng sai
Một thước đo khác của hiện tượng đa cộng tuyến là nhân tử phóng đại phương sai gắn với biến
Trang 11Đ đo Theil ộ đo Theil
Khía cạnh chủ yếu của VIF chỉ xem xét đến tương quan qua lại giữa các biến giải thích Một độ đo mà xem xét tương quan của biến giải thích với biến được giải thích là độ đo Theil Độ đo Theil được định nghĩa như sau:
m= - Trong đó là hệ số xác định bội trong mô hình hồi quy của Y với các biến trong mô hình hồi quy:
là hệ số xác định bội trong mô hình hồi quy của Y với các biến
Trang 12BI N PHÁP KH C PH C ỆN PHÁP KHẮC PHỤC ẮC PHỤC ỤC
Sử dụng thông tin
tiên nhiệm
Thu thập thêm số liệu hoặc lấy thêm
Trang 13S d ng thông tin tiên nhi m ử phóng đại phương sai ụ ệm
Một trong các cách tiếp cận để giải quyết vấn đề đa
cộng tuyến là phải tận dụng thông tin tiên nghiệm hoặc thông tin từ nguồn khác để ước lượng các hệ số riêng.
Trang 14Thu thập thêm số liệu hoặc lấy thêm mẫu mới
Vì đa cộng tuyến là đặc trưng của mẫu nên có thể có mẫu khác liên quan đến cùng các biến trong mẫu ban đầu mà đa cộng tuyến có thể không nghiêm trọng nữa Điều này có thể làm được khi chi phí cho việc lấy mẫu khác có thể chấp nhận được trong thực tế
Đôi khi chỉ cần thu thập thêm số liệu , tăng cỡ mẫu có thể làm giảm tính nghiêm trọng của đa cộng tuyến
Trang 15Bỏ biến
Khi có hiện tượng đa cộng tuyến nghiêm trọng thì cách “đơn giản nhất” là bỏ
biến cộng tuyến ra khỏi phương trình Khi phải sử dụng biện pháp này thì cách thức tiến hành như sau:
Giả sử trong mô hình hồi quy của ta có Y là biến được giải thích còn là các biến giải thích Chúng ta thấy rằng tương quan chặt chẽ với X3 Khi đó nhiều thông tin về Y chứa ở thì cũng chứa ở Vậy nếu ta bỏ 1 trong 2 biến hoặc khỏi mô hình hồi quy, ta sẽ giải quyết được vấn đề đa cộng tuyến nhưng sẽ mất đi 1 phần thông tin về Y
Bằng phép so sánh và trong các phép hồi quy khác nhau mà có và không có 1 trong 2 biến chúng ta có thể quyết định nên bỏ biến nào trong biến X2 và X3 khỏi
mô hình
Thí dụ đối với hồi quy của Y đối với tất cả các biến là 0.94; khi loại biến là 0.87
và khi loại biến là 0.92; như vậy trong trường hợp này ta loại X3
Trang 16(2)
Từ (1) và (2) ta được :
Trang 17S d ng sai phân c p m t ử phóng đại phương sai ụ ấp một ộ đo Theil
Đặt
Ta được : (*)
Mô hình hồi quy dạng (*) thường làm giảm tính nghiêm trọng của đa cộng
nghiệm nào chắc chắn rằng sai phân của chúng cũng tương quan cao.
Tuy nhiên biến đổi sai phân bậc nhất sinh ra 1 số vấn đề chẳng hạn như số
quy tuyến tính cổ điển là các nhiễu không tương quan Vậy thì biện pháp sửa chữa này có thể lại còn tồi tệ hơn.
Trang 18Giảm tương quan trong hồi quy đa thức.
Nét khác nhau của hồi quy đa thức là các biến giải thích xuất hiện với lũy thừa khác nhau trong mô hình hồi quy Trong thực hành để giảm tương quan trong hồi quy đa thức người ta thường sử dụng dạng độ lệch Nếu việc sử dụng dạng độ lệch mà vẫn không giảm đa cộng tuyến thì người ta có thể phải xem xét đến kỹ thuật “đa thức trực giao”.
Trang 19CHƯƠNG 2: BÀI TẬP MINH HỌA
Xét mô hình hồi quy tuyến tính thể hiện sự phụ thuộc của doanh thu ngành vật liệu xây dựng vào doanh thu ngành xây dựng, ngành bất động sản và ngành thép Với mức ý nghĩa phát hiện đa cộng tuyến và khắc phục
Với:
Y là doanh thu thuần ngành vật liệu xây dựng
X2 là doanh thu thuần ngành xây dựng
X3 là doanh thu thuần ngành bất động sản
X4 là doanh thu thuần ngành thép
Trang 20BẢNG SỐ LIỆU DOANH THU NGÀNH VẬT LIỆU XÂY DỰNG
Trang 21Lập mô hình hồi quy
Ta có mô hình hàm hồi quy tuyến tính thể hiện sự phụ thuộc của
doanh thu thuần ngành vật liệu xây dựng vào doanh thu thuần ngành xây dựng, ngành bất động sản và ngành thép:
Mô hình ước lượng của hàm hồi quy tuyến tính:
Từ bảng số liệu, sử dụng phần mềm eviews ta có kết quả sau:
Trang 23Phát hiện đa cộng tuyến
Ta thấy rằng hệ số xác định bội của mô hình là rất gần 1, điều này chứng tỏ mô hình
là rất phù hợp Trong khi đó thống kê lại có giá trị rất gần 0, kết quả là làm tăng
khả năng chấp nhận không có ý nghĩa về mặt thống kê Vậy có thể nghi ngờ rằng
có hiện tượng đa cộng tuyến xảy ra trong mô hình
Trang 24Phát hiện đa cộng tuyến
2 T ương quan cặp giữa các biến giải thích cao ng quan c p gi a các bi n gi i thích cao ặp giữa các biến giải thích cao ữa các biến giải thích cao ến giải thích cao ải thích cao.
Trang 25Phát hi n đa c ng tuy n ệm ộ đo Theil ến giải thích cao
Từ bảng trên ta thấy:
Hệ số tương quan giữa biến và 0,733562 < 0.8
Hệ số tương quan giữa biến và là 0,747489< 0.8
Hệ số tương quan giữa biến và là 0,636793 < 0.8
Chưa thể nghi ngờ có hiện tượng đa cộng tuyến xảy ra trong mô hình.
Trang 26Phát hiện đa cộng tuyến
3 Hồi quy phụ.
- Ta tiến hành hồi quy
Sử dụng phần mềm eviews ta có bảng 3:
Trang 27Phát hiện đa cộng tuyến
Ta ki m đ nh c p gi thuy t: ểm định cặp giả thuyết: ịnh cặp giả thuyết: ặp giữa các biến giải thích cao ải thích cao ến giải thích cao
Xây d ng tiêu chu n ki m đ nh F = ; F(k-2, n-k+1)ựng tiêu chuẩn kiểm định F = ; F(k-2, n-k+1) ẩn kiểm định F = ; F(k-2, n-k+1) ểm định cặp giả thuyết: ịnh cặp giả thuyết:
Ta có mi n bác b : Wền bác bỏ : W ỏ : W α = {; > }
T b ng eview ta có = 23.38350ừ bảng eview ta có = 23.38350 ải thích cao
V i n = 26, k= 4, α= 0.05 ta có = 3,42ới n = 26, k= 4, α= 0.05 ta có = 3,42
> 3,42 => Wα
Bác b gi thuy t Hỏ : W ải thích cao ến giải thích cao 0
V y v i m c ý nghĩa α = 0.05 thì có m i liên h tuy n tính v i ậy với mức ý nghĩa α = 0.05 thì có mối liên hệ tuyến tính với ới n = 26, k= 4, α= 0.05 ta có = 3,42 ức ý nghĩa α = 0.05 thì có mối liên hệ tuyến tính với ối liên hệ tuyến tính với ệm ến giải thích cao ới n = 26, k= 4, α= 0.05 ta có = 3,42
K t lu n: mô hình có x y ra hi n tến giải thích cao ậy với mức ý nghĩa α = 0.05 thì có mối liên hệ tuyến tính với ải thích cao ệm ượng đa cộng tuyến.ng đa c ng tuy n.ộ đo Theil ến giải thích cao
Trang 28Phát hiện đa cộng tuyến
4 Sử dụng phân tử phóng đại phương sai
Phân tử phóng đại phương sai gắn với biến:
Trang 29Phát hiện đa cộng tuyến
5 Độ đo theil
Xét mô hình hồi quy Y theo ta được kết quả bảng 6:
Trang 30Phát hiện đa cộng tuyến
Xét mô hình Y theo ta được kết quả bảng 7:
Trang 31Phát hiện đa cộng tuyến
Xét mô hình Y theo ta được kết quả bảng 8:
Trang 32Phát hiện đa cộng tuyến
Từ 3 bảng hồi quy trên ta thu đươc kết quả:
=0.328337
Vậy độ đo của Theil về mức độ đa cộng tuyến là 0.328337
Trang 34Khắc phục đa cộng tuyến
Khi b bi n ỏ : W ến giải thích cao ta có bảng10:
Trang 35Khắc phục đa cộng tuyến
Khi bỏ biến ta có bảng 11:
Trang 36Khắc phục đa cộng tuyến
Bằng phép so sánh R2 trong các phép hồi quy trên mà có một trong
ba biến , , mà chúng ta quyết định nên bỏ biến nào ra khỏi mô hình hồi quy:
R2 khi loại bỏ biến là 0,840194
R2 khi loại bỏ biến là 0,820554
R2 khi loại bỏ biến là 0,750756
Như vậy trong trường hợp này chúng ta nên bỏ biến bởi ngay cả khi chúng ta bỏ biến ra khỏi mô hình thì hàm hồi quy mẫu vẫn giải
thích được 84,0194%, tỷ lệ giải thích của mô hình khi đó cao hơn so với khi loại bỏ biến ,
Trang 37Khắc phục đa cộng tuyến
2 Sử dụng sai phân cấp 1
Chúng ta có số liệu chuỗi thời gian biểu thị liên hệ giữa biến Y và các biến phụ
thuộc X, Z, T theo mô hình sau:
(*)Trong đó t là thời gian Phương trình trên đúng với t thì cũng đúng với t-1 nghĩa là :
(**)Trừ (* ) cho (** ) ta được:
Đặt:
Ta được:
Trang 38Khắc phục đa cộng tuyến
Ta có bảng kết quả Eviews khi sử dụng sai phân cấp 1 bảng 12:
Trang 39Kết luận
Có nhiều cách phát hiện và khắc phục hiện tượng đa cộng tuyến khác nhau Mỗi phương pháp có những hạn chế nhất định Vì vậy, khi áp dụng một phương pháp nào ta cần cân nhắc kĩ lượng để mang lại kết quả tin cậy nhất.
Trong bài tập ví dụ ở trên ta chưa thể kết luận đã khắc phục được hoàn toàn hiện tượng đa cộng tuyến
Trang 40Cảm ơn thầy giáo và các bạn đã chú ý lắng nghe