Kiểm địnhQuy trình kiểm định •B1: Đặt hai giả thiết thống kê: H0 và H1 (quy tắt đặt giả thiết???) •B2: Tìm giá trị tới hạn •B3: Xác định miền bác bỏ H0 •B4: Ra quyết định (Nguyên tắt ra quyết định)
Trang 1PHÂN TÍCH DỮ LiỆU VỚI
PHẦN MỀM EVIEWS*
NGUYỄN DUY TÂM - IDR
Nguyen Duy Tam nguyenduytam@ueh.edu.vn 1
-Giới thiệu bài báo và phương pháp phân tích
Bài báo Phương pháp phân tích định lượng
Trang 2GIAO DIỆN EVIEWS
Nguyen Duy Tam nguyenduytam@ueh.edu.vn 3
Trang 3-Tạo biến cho workfile
Tạo biến
Các loại biến:
• Biến định lượng: Scale
• Biến phân loại:
Nhập liệu cho biến
Nguyen Duy Tam nguyenduytam@ueh.edu.vn 5
-Thao tác với dữ liệu
• Mở bằng lệnh Show
Trang 4Lọc dữ liệu và hiệu chỉnh mẫu
Trình bày dữ liệu: Series Trình bày dữ liệu: Group
Nguyen Duy Tam nguyenduytam@ueh.edu.vn 8
Trang 5-Trình bày dữ liệu
Phương pháp đồ thị: series Phương pháp đồ thị: group
Nguyen Duy Tam nguyenduytam@ueh.edu.vn 9
• Thống kê mẫu chung
• Thống kê mẫu riêng
Trang 6Kiểm định Quy trình kiểm định
• B1: Đặt hai giả thiết thống kê: H0 và H1
(quy tắt đặt giả thiết???)
Kiểm định trung bình: Series
• Kiểm định tính phân phối
chuẩn của biến
• Kiểm định trung bình 1 mẫu
• Kiểm định trung bình phân
loại
Kiểm định trung bình: Group
• Kiểm định trung bình nhiều biến scale
Nguyen Duy Tam nguyenduytam@ueh.edu.vn 12
Trang 7-Phân tích và kiểm định tương quan
• Kiểm định tương quan
Nguyen Duy Tam nguyenduytam@ueh.edu.vn 13
-TƯƠNG QUAN – HỒI QUY đơn biến
1 Giới thiệu hồi quy
2 Ý nghĩa hồi quy
3 Giới thiệu hồi quy đơn biến
4 Giả thiết của hồi quy đơn biến
5 Phương pháp ước lượng mô hình hồi quy
đơn biến
6 Kiểm định đơn biến
7 Dự báo
Trang 8Ý nghĩa và đặc điểm của hồi quy
• Ý nghĩa: Nghiên cứu tác độn của XiY
• Đặc điểm: hồi quy tuyến tính
Nguyen Duy Tam nguyenduytam@ueh.edu.vn 15
-HỒI QUY ĐƠN
Trang 9Các giả thuyết của mô hình hồi quy
1 Xi là biến độc lập, được xác định trước
Trang 10Phương pháp ước lượng
hàm hồi quy đơn
Đường hồi quy ước lượng Phương pháp ước lượng
Trang 11-Bảng kết quả của hàm hồi quy
Nguyen Duy Tam nguyenduytam@ueh.edu.vn 21
Trang 12Kiểm định Ý nghĩa của R 2
Nguyen Duy Tam nguyenduytam@ueh.edu.vn 23
-Lựa chọn dạng hàm hồi quy đơn
Dạng hàm tuyến tính Dạng hàm phi tuyến
Nguyen Duy Tam nguyenduytam@ueh.edu.vn
-40 50 60 70 80 90
Trang 130 4,000 8,000 12,000 16,000 20,000 24,000
X2
Trang 15-Hàm hồi quy chuổi thời gian
2 Các giả thiết của mô hình
3 Phương pháp ước lượng và kiểm định mô
hình
4 Quy trình xây dựng mô hình hồi quy đa biến
5 Trình bày kết quả nghiên cứu hồi quy
Trang 16Giới thiệu mô hình và các giả thiết
• Các giả thiết của hồi quy đơn và,
nguyenduytam@ueh.edu.vn
Trang 18Kiểm định i
1 Kiểm định hệ số I
2 Kiểm định biến thừa
3 Kiểm định biến thiếu
Trang 20Trình bày kết quả mô hình
Ra quyết định Không chọn??? Chọn ??? Không chọn ???
Nguyen Duy Tam nguyenduytam@ueh.edu.vn 39
Trang 21-Quy trình phân tích hồi quy
• B1: Phân tích tương quan
• B2: Lựa chọn mối quan hệ Xi và Y
• B3: Xây dựng và kiểm định mô hình
• B4: Xử l{ và lựa chọn mô hình
• B5: Ra quyết định hoặc dự báo
Nguyen Duy Tam nguyenduytam@ueh.edu.vn 41
-MÔ HÌNH HỒI QUY VỚI BIẾN GiẢ
DUMMY VARIABLE
• Giới thiệu mô hình
• Hồi quy với biến giả đơn giản
• Hồi quy với biến giả
Trang 22Giới thiệu mô hình
Trang 23-Các khả năng xảy ra
Di không ảnh hưởng Xi Di và Xi có liên quan nhau, Di không ảnh hưởng đến Y
Nguyen Duy Tam nguyenduytam@ueh.edu.vn
Trang 24Hồi quy với biến giả có k đặc điểm
Trang 25-Hồi quy đa biến với dữ liệu time series
• Đặc điểm của dãy số time series
– 1
– 2.
– 3
– 4
Trang 26NGUYỄN DUY TÂM - IDR
KIỂM ĐỊNH CÁC GiẢ THIẾT
MÔ HÌNH HỒI QUY
Nguyen Duy Tam nguyenduytam@ueh.edu.vn 51
Trang 27Các vấn đề liên quan đa cộng tuyến
1 Giới thiệu Đa Cộng tuyến
• Dựa trên dữ liệu thực của một trạm xe
Toyota, Data3-7 có 3 biến sau:
– E t : Cost - chi tiêu tích lũy tại thời điểm t cho
việc bảo trì (không tính xăng dầu) một chiếc xe
hơi cho trước.
– Miles: số dặm xe đã chạy (ngàn dặm)
– Age: tuổi của xe
Xem xét 3 mô hình sau, bạn kz vọng như thế nào
về dấu của các hệ số?
Trang 28Bạn có nhận xét gì từ kết quả trên?
Nguyen Duy Tam nguyenduytam@ueh.edu.vn
-Giới thiệu hiện tượng đa cộng tuyến
• Là hiện tượng giả thiết Cov(Xi, Xj)<>0 Vi phạm
giả thiết về hồi quy tuyến tính
Nguyen Duy Tam nguyenduytam@ueh.edu.vn 56
Trang 29Đa cộng tuyến chính xác hay hoàn hảo
Exact (or Perfect) Multicollinearity
• Nếu hai hoặc nhiều hơn hai biến độc lập có quan hệ tuyến
tính giữa hai biến, hoặc giữa nhiều biến (nói cách khác là khi
mô hình hồi quy bội có một số biến độc lập có thể được biểu
diễn bằng các tổ hợp tuyến tính của các biến độc lập khác) thì
mô hình bị đa cộng tuyến hoàn hảo.
• Ví dụ: Y=f(X 2 , X 3 , X 4 ) và X 3 =2X 2
hoặc X 2 +X3+X4=1 … hoặc 2X2+3X3+4X4=0 …
• Hệ quả là: các hệ số hồi quy tương ứng không thể ước lượng
được Máy tính thường báo “matrix singular” hay “exact
collinearity encountered”
• Khắc phục: Loại một hoặc nhiều biến ra khỏi mô hình (một số
phần mềm như SPSS,Stata … sẽ tự động loại biến)
Nguyen Duy Tam nguyenduytam@ueh.edu.vn
-Đa cộng tuyến không hoàn hảo
Near Multicollinearity
• Khi các biến giải thích có tương quan gần như
tuyến tính (như hai ví dụ mà ta đã xem xét).
Lúc này vẫn tìm được các ước lượng duy nhất.
• Tuy nhiên nếu ta cứ để đa cộng tuyến không
hoàn hảo xảy ra thì hậu quả sẽ là gì?
• Làm sao biết được mô hình có bị đa cộng
tuyến (không hoàn hảo) hay không?
• Các biện pháp sẵn có mà nhà nghiên cứu sử
dụng để tránh đa cộng tuyến là gì?
Trang 30Hậu quả của Đa Cộng tuyến
• Ảnh hưởng đến dự báo
– Mặc dù đa cộng tuyến ảnh hưởng đến các hệ số
hồi quy riêng lẻ, tác động của nó đến các dự báo
thường ít nghiêm trọng hơn và có thể lại là những
tác động có lợi (Ở phần ví dụ, khi cộng tuyến, ta
thấy MAPE, MSE không có sự thay đổi lớn, thậm
chí nó nhỏ hơn)
59Nguyen Duy Tam -
nguyenduytam@ueh.edu.vn
60
Hậu quả của Đa Cộng tuyến
• Ảnh hưởng đến sai số chuẩn
– Mặc dù các ước lượng là BLUE, nhưng SE(Betajhat) cao hơn, khiến
t-statistic thấp hơn, P-value cao hơn và có thể dẫn đến hệ số hồi quy là
không có ý nghĩa.
– Cov(Betajhat,Betashat) cao hơn, khi đó hệ số hồi quy không thể đại diện
cho tác động riêng rẽ của Xj lên Y Mỗi hệ số chỉ giải thích được phần nào
ảnh hưởng của X2 và X3 lên Y Không thể thể giữ X3 không đổi và chỉ
tăng X2 vì X2 có tương quan X3;
* r: Partial Correlation
Nguyen Duy Tam nguyenduytam@ueh.edu.vn
Trang 31Các hệ quả khác
• (2) Sai số chuẩn của các hệ số sẽ lớn
• (3) R2 rất cao dù thống kê ít ý nghĩa
đổi khác biệt giữa các biến độc lập
hình có giá trị thống kê
Nguyen Duy Tam nguyenduytam@ueh.edu.vn
-Các hệ quả khác
Trang 33Solutions (các giải pháp khắc phục)
• Beign neglect (bỏ qua nhẹ nhàng) hay Do nothing (Không làm
gì cả)
– Nếu nhà nghiên cứu ít quan tâm đến diễn dịch từng hệ số riêng lẻ
nhưng lại chú trọng vào việc dự báo thì tính đa cộng tuyến không phải
là vấn đề nghiêm trọng
– Khi các hệ số hồi quy đều có { nghĩa và dấu phù hợp thì không bận tâm
về đa cộng tuyến
– Nếu một biến cần ở trong mô hình vì những l{ do về mặt l{ thuyết thì
có thể an toàn hơn khi chúng ta giữ biến đó ở lại trong mô hình ngay
cả khi bị đa cộng tuyến.
Nguyen Duy Tam nguyenduytam@ueh.edu.vn
-Solutions (cont.)
• Loại bỏ biến dư thừa (có thể tham khảo PP Hendry/LSE, tuy
nhiên loại bỏ quá nhiều biến có thể dẫn đến thiên lệch trong
các ước lượng, người ta cũng có thể cân nhắc giữ lại những
Trang 34Nguyễn Duy Tâm - IDR
Nguyen Duy Tam nguyenduytam@ueh.edu.vn 68Bài giảng có tham khảo của Cao Hào Thi
Trang 354 Các thủ tục ước lượng
Nguyen Duy Tam nguyenduytam@ueh.edu.vn
-HET ?
Giả thiết :
Phương sai của sai số không đổi
Var( i ) = E[( i - ) 2 ] = E( i 2 ) = 2 =const
Vi phạm giả thiết:
Var( i ) = i 2 const Phương sai của sai số thay đổi
Trang 36HET ?
Phöông sai
Nguyen Duy Tam nguyenduytam@ueh.edu.vn
-72
HET ?
Phöông sai
Nguyen Duy Tam nguyenduytam@ueh.edu.vn
Trang 37-HẬU QUẢ BỎ QUA HET ?
1 Các ước lượng và dự báo dựa trên các ước
lượng đó vẫn không chệch và nhất quán.
2 Các ước lượng OLS không còn BLUE và sẽ
không hiệu quả Các dự báo cũng sẽ
không hiệu quả.
3 Phương sai và đồng phương sai ước lượng
của các hệ số sẽ chệch và không nhất
quán và do đó các kiểm định giả thuyết (t
& F) không còn hiệu lực
Trang 38 ( , ) ,
ar( )
Cov X u n
1 Phương pháp đồ thị:
Kỹ thuật này chỉ có tính gợi ý về HET
và không thay thế được kiểm định
chính thức
Nguyen Duy Tam nguyenduytam@ueh.edu.vn
Trang 39KIỂM ĐỊNH HET ?
1 Kiểm định nhân tử Larrange (LM):
Kiểm định Breusch – Pagan (1979)
Trang 40KIỂM ĐỊNH GIẢ THUYẾT
H 0 : 2 = 3 = … = p = 0
H 1 : Có ít nhất 1 số j 0 (j = 2,p)
Vì không biết i nên sử dụng e i thay thế
Nguyen Duy Tam nguyenduytam@ueh.edu.vn
-80
CÁC BƯỚC THỰC HIỆN
Bước 1: Thực hiện hồi quy Y i = f(C,X)
PRF: Y i = 1 + 2 X 2i + 3 X 3i + … k X ki + i
Tính phần dư e i (=resid)
Nguyen Duy Tam nguyenduytam@ueh.edu.vn
Trang 41CÁC BƯỚC THỰC HIỆN
Bước 2: Thực hiện hồi quy phụ
-CÁC BƯỚC THỰC HIỆN
Bước 3: Kiểm định giả thuyết:
Trang 42 Cách thực hiện trên EVIEW
Nguyen Duy Tam nguyenduytam@ueh.edu.vn
Trang 43CÁC THỦ TỤC ƯỚC LƯỢNG
1 Ước lượng ma trận Đồng phương sai
nhất quán của HET (HCCM)
(H eteroscedasticity C onsistent
C ovariance M atrix Estimator)
2 Bình phương tối thiểu tổng quát hay
bình phương tối thiểu có trọng số
(GLS – WSL)
( W eighted L east S quares)
Nguyen Duy Tam nguyenduytam@ueh.edu.vn
-CÁC THỦ TỤC ƯỚC LƯỢNG
3 Bình Phương Tối Thiểu Tổng Quát
Khả Thi (FGLS)
( F easible G eneralized L east S quares)
4 Phương sai của sai số thay đổi với tỷ
số biết trước
Trang 44HET VỚI TỶ SỐ BIẾT TRƯỚC
Nguyen Duy Tam nguyenduytam@ueh.edu.vn
Trang 45FGLS
Tìm nhiều cách ước lượng i
Bằng hồi quy phụ của:
• Breusch – Pagan
• Glesjer
• Harvey-Godfrey
• White
Thực hiện trên EVIEW
Nguyen Duy Tam nguyenduytam@ueh.edu.vn
-TƯƠNG QUAN CHUỔI
SC : SERIAL CORRELATION AC: AUTO CORRELATION AR: AUTO REGRESSION
NGUYỄN DUY TÂM - IDR
Trang 464 Các thủ tục ước lượng
Nguyen Duy Tam nguyenduytam@ueh.edu.vn
-92
Tương quan chuỗi ?
Tương quan chuỗi (hay tự tương quan) là
tương quan giữa các phần dư t
Trang 47Nguyen Duy Tam nguyenduytam@ueh.edu.vn
-Töông quan chuoãi ?
Các sai số t có tính nhiễu trắng khi:
Trang 48HẬU QUẢ BỎ QUA AR ?
1 Các ước lượng và dự báo dựa trên các ước
lượng đó vẫn không chệch và nhất quán
nhưng không hiệu quả.
Tính nhất quán sẽ không có nếu biến độc
lập bao gồm biến phụ thuộc có độ trễ
2 Phương sai và đồng phương sai ước lượng
của các hệ số sẽ chệch và không nhất
quán và do đó các kiểm định giả thuyết (t
& F) không còn hiệu lực
Nguyen Duy Tam nguyenduytam@ueh.edu.vn
Trang 49KIỂM ĐỊNH AR ?
1 Phương pháp đồ thị:
Kỹ thuật này chỉ có tính gợi ý về AR
và không thay thế được kiểm định
Trang 50ĐỒ THỊ KIỂM TRA AR ?
Nguyen Duy Tam nguyenduytam@ueh.edu.vn
-100
KIỂM ĐỊNH AR ?
Kiểm định Durbin Watson
Kiểm định Correlogram – Q Statistics
Kiểm định Serial Correlation LM
Nguyen Duy Tam nguyenduytam@ueh.edu.vn
Trang 510 d L d U 2 4 - d U 4 - d L 4
H 0 : = 0 H 1 : < 0
Tự tương quan âm
Tự tương quan dương
H 1 : > 0
Không kết luận
Trang 53KIỂM ĐỊNH CORRELOGRAM
Giả thuyết:
H 0 : AC 1 =AC 2 = …= AC p = 0 Không có AR(p)
H 1 : Có ít nhất 1 số AC j 0 (j = 2,p) Có AR(p)
Nghĩa là:
H 1 : AC 1 ≠ 0 hoặc ACNguyen Duy Tam - 2 ≠ 0 Có AR(2)
Q tt > Q* Bác bỏ H o
Trang 54KIỂM ĐỊNH CORRELOGRAM
Thực hiện trên EVIEW
View/Residual Test/Correlogram–Q Statistics
Nếu t khơng cĩ tự tương quan thì:
- AC và PAC của tất cả các độ trễ sẽ cĩ giá trị
gần bằng 0 các giá trị trong 2
H 0 : AC 1 =AC 2 = …= AC p = 0 Không có AR(p)
H 1 : Có ít nhất 1 số AC j 0 (j = 2,p) Có AR(p)
Nguyen Duy Tam nguyenduytam@ueh.edu.vn
Trang 55H 0 : AC 1 =AC 2 = …= AC p = 0 Không có AR(p)
H 1 : Có ít nhất 1 số AC j 0 (j = 2,p)
Nguyen Duy Tam nguyenduytam@ueh.edu.vn
-Bước 1: Thực hiện hồi quy:
Trang 56KIỂM ĐỊNH NHÂN TỬ LAGRANGE
Nguyen Duy Tam nguyenduytam@ueh.edu.vn
-112
CÁC GiẢI PHÁP KHẮC PHỤC AR
1 Thay Đổi Dạng Hàm Số
2 Lấy sai phân
3 Các thủ tục ước lượng
– Thủ tục Tính lặp Cochrane – Orcutt
(CORC) (Cochrane và Orcutt, 1949)
– Thủ tục tìm kiếm Hildrth – Lu (HILU)
(Hildreth – Lu, 1960).
Nguyen Duy Tam nguyenduytam@ueh.edu.vn
Trang 57THAY ĐỔI DẠNG HÀM SỐ
Tương quan chuỗi có thể là triệu chứng
của mô hình bị sai dạng hàm.
Không có thủ tục ước lượng nào có thể hiệu
chỉnh vấn đề AR mà nguyên nhân là do đặc
trưng sai trong phần xác định hơn là trong
số hạng sai số
Nguyen Duy Tam nguyenduytam@ueh.edu.vn
-LẤY SAI PHÂN
Tuy nhiên, giải pháp sử dụng sai phân bậc nhất
này không phải lúc nào cũng thích hợp
Trang 58Y * *
3 3
* 2 2
* 1
1 2 2
1
ˆ
ˆ ˆ ˆ
Trang 593 3
* 2 2
* 1
*
THỦ TỤC COCHRANE – ORCUTT
Bước 5: Sử dụng các k ^ trong bước 4 thay vào
(1) để tính lại các t ^
Bước 6: Tính lại ^ và so sánh với ^ ở bước 2
Phương pháp này chỉ tìm được ^ cục bộ
Trang 60THỦ TỤC HILDRTH – LU
Bước 1: Chọn một giá trị ( 1 ) Sử dụng giá trị
này, biến đổi các biến và ước lượng phương trình
(*) bằng thủ tục OLS.
Nguyen Duy Tam nguyenduytam@ueh.edu.vn
-t tk k t
t
3 3
* 2 2
* 1
*
k t tk
1 1
• Từ các giá trị ước lượng này của phương trình (*)
ta tính ra giá trị tổng bình phương sai số tương
ứng Gọi giá trị này là ESS( 1 ).
• Tiếp tục chọn một giá trị khác nữa cho (gọi là
2 ) và lặp lại bước 1 và 2.
Nguyen Duy Tam nguyenduytam@ueh.edu.vn
Trang 61THỦ TỤC HILDRTH – LU
Bước 3:
• Thay đổi giá trị của từ –1 đến + 1 theo với
bước nhảy có tính hệ thống nào đó Một chuỗi
các giá trị ESS( ).
• Chọn nào có giá trị ESS nhỏ nhất *
• Phương trình (*) ước lượng với giá trị * là kết
quả tối ưu.
Nguyen Duy Tam nguyenduytam@ueh.edu.vn