Cơ sở thực tiễnnghìn ha Sản lượng Z nghìn tấn Khối lượng xuất khẩu Y nghìn tấn Số liệu về diện tích, sản lượng, khối lượng xuất khẩu gạo trong nước giai đoạn 1995-2010 Nguồn: TCTK 2009 v
Trang 1Đề tài: Hiện tượng đa cộng tuyến
Bài thảo luận nhóm
Trang 2II Cơ sở thực tiễn
(nghìn ha)
Sản lượng Z (nghìn tấn)
Khối lượng xuất khẩu Y (nghìn tấn)
Số liệu về diện tích, sản lượng, khối lượng xuất khẩu gạo trong nước giai đoạn 1995-2010
(Nguồn: TCTK (2009) và Hiệp hội lương thực Việt Nam (2006) Bộ Nông nghiệp và Phát triển nông thôn)
Trang 31 Xây dựng MHHQ tuyến tính
Từ bảng số liệu, sử dụng phần mềm eviews ta được kết quả sau:
-> Mô hình hồi quy: Y= -2621.061- 0.464818X + 0.617217Z
+ Ý nghĩa:
- = -0.464818 Khi sản lượng không đổi, diện tích tăng
thêm 1(nghìn ha) thì khối lượng xuất khẩu gạo trung bình
trong 1 năm giảm 0.464818 (nghìn tấn)
- =0.617217 Khi diện tích không đổi, sản lượng tăng thêm 1(nghìn tấn) thì khối lượng xuất khẩu gạo trung bình trong 1 năm tăng 0.617217(nghìn tấn)
Trang 42 Bài toán:
Kiểm định sự ảnh hưởng của sản lượng đến khối lượng xuất khẩu của gạo
Ta tiến hành kiểm định giả thiết:
=> bác bỏ giả thiết H0, chấp nhận giả thiết H1
Vậy với mức ý nghĩa , ta có thể nói rằng sản lượng có ảnh hưởng tới khối lượng xuất khẩu
Với mức ý nghĩa 5% kiểm định giả thiết diện
tích không ảnh hưởng đến khối lượng xuất
khẩu của gạo
Ta tiến hành kiểm định giả thiết:
Theo bảng eview trên ta có: p-value= 0.2952
>
Suy ra: chấp nhận H0, bác bỏ H1
Vậy: với mức ý nghĩa 5% ta có thể nói rằng
diện tích không ảnh hưởng tới khối lượng
xuất khẩu
H H
: 0 : 0
H H
Trang 52 Bài toán:
Ước lương khoảng tin cậy của hệ số hồi quy
Từ bảng 1, ta có:
n=16 ;
=>
Ta XDTK: T = ~
với mức ý nghĩa ta có khoảng tin cậy của
(< < )
Hay - 2.160* << - 2.160*
=> 0.5434< 0.691
=> vậy với mức ý nghĩa ta có khoảng tin cậy của là:
Với mức ý nghĩa 5% kiểm định giả thiết cả hai yếu tố diện tích
và sản lượng đều không ảnh hưởng đến khối lượng xuất khẩu
của gạo.
Ta tiến hành kiểm định giả thuyết:
Ta tiến hành kiểm định giả thuyết:
Theo bảng eview ta có: p-value= 0 <
Þbác bỏ giả thiết H 0 , chấp nhận giả thiết H 1
Kết luận: với mức ý nghĩa 5% ta có thể cho rằng có ít nhất
một trong 2 biến diện tích, sản lượng có ảnh hưởng tới khối
lượng xuất khẩu.
Ta có: R 2 = 0.970896 do đó ta có thể kết luận mô hình hồi quy
giải thích được 97.0896 sự biến thiên của khối lượng xuất
khẩu, hay các biến diện tích, sản lượng gạo giải thích được
97,0896 sự thay đổi của khối lượng xuất khẩu.
Trang 63 Phát hiện hiện tượng đa cộng tuyến
Hồi quy mô hình: Y= β 1 + β 2 X +β 3 Z + U i thu được kết quả ở bảng eview:
1 R 2 cao nhưng tỉ số t thấp
Cho α = 0.05
Từ kết quả bảng eview ta thấy: R 2 = 0.970896 > 0.8, cao
Và + t 1 = - 0.945889 < 2.160
+ t 2 = - 1.090632 < 2.160
=> t tn thấp.
Vậy có thể nghi ngờ rằng có hiện tượng đa cộng tuyến xảy ra trong mô hình này.
Trang 73 Phát hiện hiện tượng đa cộng tuyến
2 Xét mô hình hồi quy phụ
Ta tiến hành hồi quy Dientich theo Sanluong
Mô hình có dạng : Xi =β1 + β2Zi + ei
Với α = 0.05 ta đi KĐGT:
Ta kiểm định cặp giả thuyết
Từ kết quả bảng Eview ta thấy
P-value (F) = 0,030195 < α =0.05
=> Bác bỏ H0 , chấp nhận H1
Kết luân: Với mức ý nghĩa 5% ta có thể kết luận có hiện tượng đa cộng tuyến
2 2 2
: 0 : 0
o
H R
H R
Trang 83 Phát hiện hiện tượng đa cộng tuyến
Xét mô hình KhoiIluonguatkhautheo Sanluong ta
có kết quả :
3 Đo đọ Theil
Xét mô hình hồi quy Khoiluongxuatkhau theo Dientich
Trang 93 Phát hiện hiện tượng đa cộng tuyến
3 Đo đọ Theil
* Từ 2 bảng hồi quy ta thu được kết quả:
+ r122 = 0,239793
+ r132 = 0,968233
* Đo độ Theil:
m= R 2 – (R 2 – r122 ) –(R 2 – r132 )
= 0,970896-(0,970896 - 0.239793)-( 0,970896- 0.968233) = 0,23713 Vậy m # 0 và độ đo của Theil về mức độ đa cộng tuyến là :
0.23713
* Kết luận : có hiện tượng da cộng tuyến
Trang 103 Phát hiện hiện tượng đa cộng tuyến
4 Hệ số tương quan cặp cao
Sử dụng phầm mềm Eview ta có bảng :
Từ bảng ta thấy:r23 = r32 =0.541736 <0.8 thấp
=> vẫn có khả năng xảy ra đa cộng tuyến
Trang 113 Phát hiện hiện tượng đa cộng tuyến
5 Sử dụng nhân tử phóng đại phương sai
VIF = =
Theo lý thuyêt nếu VIF 10 thì có hiện tượng đa cộng tuyến giữa hai biến độc lập trong mô hình
Vậy mô hình có xảy ra hiện tượng đa cộng tuyến
2 2
1
1 0,970896
Trang 124 Dự đoán
Dự báo khối lượng xuất khẩu gạo năm 2011, biết diện tích (X) = 6100 và sản lượng (Z) = 43000
Từ eviews ta tìm được se ( Yo/ Xo )
=> Yo = 21083.86 và SE( Yo) = 1665.711
Trang 134 Dự đoán
Trang 14 Các khoảng cận trên và cận dưới của Yo :
Từ bảng dự báo giá trị cho thấy :
Khoảng dự báo giá trị trung bình của y khi
[ 188878.65 ; 23289.08 ]
Giá trị cá biệt là
[ 17485.31 ; 24682.41 ]
Trang 155 Khắc phục hiện tượng đa cộng tuyến
1 Thu thêm số liệu để tăng kích thước mẫu
(nghìn ha)
Sảnlượng Z (nghìntấn)
Khốilượngxuấtkhẩu Y (nghìntấn)
Trang 165 Khắc phục hiện tượng đa cộng tuyến
1 Thu thêm số liệu để tăng kích thước mẫu
Từ bảng số liệu, sử dụng phần mềm eviews ta được kết quả sau:
Từ bảng hồi quy máy tính, ta có mô hình hàm hồi quy mới:
= 1000,757- 1,12922X + 0,671133Z
t1 = 0,447969
t2 = -3,804539
t3 = 28,72848
R 2 = 0,980176
Mô hình sau khi đã tăng kích thước mẫu có R2 khá gần 1, các tỷ
số t cũng cao nên mô hình ước lượng là rất phù hợp.
ˆ
Y
Trang 175 Khắc phục hiện tượng đa cộng tuyến
*) Khi bỏ biến X ta có mô hình hồi quy:
Y = -5505,637+ 0.59037Z
r 132 = 0,968233 t1’ = -6,616607 t2’ = 20,65708
*) Khi bỏ biến Z ta có mô hình hồi quy:
Y = -16997,25+ 3,70753X
r122 = 0,239793
t1 = -1.30023
t2 = 2,101439
2 Loại bỏ biến đa cộng tuyến khỏi mô hình
Dựa vào kết quả ước lượng bằng phần mềm eviews trong bảng 4 và bảng 5 ta có mô hình hồi quy của biến phụ thuộc
Y với từng biến giải thích như sau:
Ta thấy: r122 < r132 nên mô hình khi bỏ biến X có sự phù hợp cao hơn mô hình khi bỏ biến Z Vậy bỏ biến X ra khỏi mô hình là hợp lý hơn.