Microsoft PowerPoint Ch 05 Cao Chương 5 Nhập môn Kinh tế lượng * Jeffrey M Wooldridge 03 08 2021 https //sites google com/a/ueh edu vn/ph amtricao/ 1 © 2013 Cengage Learning All Rights Reserved May no[.]
Trang 1© 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Chương 5
Phân tích hồi quy bội:
Tính tiệm cận của OLS
Wooldridge: Introductory Econometrics:
A Modern Approach, 5e
© 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
5.1 Tính vững
Giải thích:
Tính vững có nghĩa là xác suấtmà ước lượng bất kỳ gần với giá trị thực của tổng thể có thể được thực hiện caomột cách tùy ý bằng cách gia tăng cỡ mẫu
Tính vững là một yêu cầu tối thiểuđối với một ước lượng hợp lý
Một ước lượng g gọi là vữngcho 1 tham số tổng thể nếu
Với mọi và
Ký hiệu thay thế:
Ước lượng hội tụ theo xác suất
tới giá trị đúng của tổng thể
Phân tích hồi quy bội:
Tính tiệm cận của OLS
P n
1
2
Trang 2PHÂN TÍCH HỒI QUY BỘI:
TÍNH TIỆM CẬN CỦA OLS
Giả thiết MLR.6 của mô hình tuyến tính cổ điển:
Sai số ngẫu nhiênu có phân phối chuẩnvà độc lập với các biến giải thích
Điều này cho phép ta rút ra được phân phối mẫu chính xác của các ước lượng OLS (có điều kiện theo các biến giải thích trong mẫu)
Định lý 4.1 đã chứng tỏ rằng các ước lượng OLS của mẫucó phân phối chuẩn, từ đó suy ra ngay phân phối cho các thống kêt vàF
Nếu sai sốu không có phân phối chuẩnthì thống kêtsẽkhông chính xáclà phân phốit, và thống kêFsẽkhông chính xáclà phân phối Fvới một cỡ mẫu bất kỳ
3
© 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Cho đến giờ chúng ta đã tập trung vào các tính chất của OLS đúng cho mẫu bất kỳ (hữu hạn)
Các tính chất của OLS đúng cho mẫu/cỡ mẫu bất kỳ Giá trị kỳ vọng/tính không chệch dưới giả thiết MLR.1 – MLR.4 Công thức phương sai của hệ số hồi quy mẫudưới giả thiết MLR.1 – MLR.5 Định lý Gauss-Markov dưới giả thiết MLR.1 – MLR.5
Phân phối mẫu chính xác / kiểm định và KTCdưới giả thiết MLR.1 – MLR.6 Các tính chất của OLS đúng với mẫu lớn (tính tiệm cận)
Tính vững dưới giả thiết MLR.1 – MLR.4 Tính tiệm cận chuẩn/kiểm định dưới giả thiết MLR.1 – MLR.5
Mặc dù giả định nhiễu không có tính chuẩn!
Phân tích hồi quy bội:
Tính tiệm cận của OLS
3
4
Trang 3PHÂN TÍCH HỒI QUY BỘI:
TÍNH TIỆM CẬN CỦA OLS
Tính không chệch của các ước lượng, mặc dù quan trọng, nhưng không phải lúc nào cũng đạt được
Các ước lượng OLS thì không chệch khi các giả thiết từ MLR.1 đến MLR.4 thỏa
Trong Phần 3 của quyển sách này, chúng ta sẽ gặp một vài trường hợp ước lượngbị chệchnhưng vẫnhữu dụng
Không phải tất cả các ước lượnghữu dụngđềukhông chệch
Gần như tất cả các nhà kinh tế học đều đồng ý rằngtính vữnglà yêu cầu tối thiểu cần có của một ước lượng
5
PHÂN TÍCH HỒI QUY BỘI:
TÍNH TIỆM CẬN CỦA OLS
6
Tổng thể có phân phối X với E(X) = µ và var(X) = 2
X1, X2, …, Xn là mẫu ngẫu nhiên với cỡ mẫu n lấy ra từ tổng thể X1, X2, …, Xn có cùng phân phối X với E(Xi) = µ và var(Xi) = 2
Trung bình mẫu X1 Xn
X
n
Xét ước lượng của µ:
Ước lượng không chệch (unbiased) và vững (consistent)
X
Ước lượng không chệch (unbiased) và không vững (inconsistent)
X1
Ước lượng chệch (biased) và vững (consistent) 1
X n
Ước lượng chệch (biased) và không vững (inconsistent)
X1+1
5
6
Trang 4PHÂN TÍCH HỒI QUY BỘI:
TÍNH TIỆM CẬN CỦA OLS
7
Tóm lại:
• Tính không chệch: phụ nữ có sắc đẹp (cái đẹp)
• Tính vững: phụ nữ có tính tình tốt (cái nết)
Kết luận:
• Một chàng trai đi lấy vợ: ưu tiên cái nào?
• Một người phụ nữ vừa không … vừa không … thì …?
• Giống loài “đẹp người & đẹp nết” thì đã tc!
PHÂN TÍCH HỒI QUY BỘI:
TÍNH TIỆM CẬN CỦA OLS
8
5.2
Tính vững của OLS:
Trường hợp đặc biệt của mô hình hồi quy đơn
7
8
Trang 5© 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Định lý 5.1 (Tính vững của OLS)
Trường hợp đặc biệt của mô hình hồi quy đơn
Giả định MLR.4‘ Ta có thể thấy rằng ước lượng hệ số góc là vững nếu biến giải thích là ngoại sinh, nghĩa là không
tương quan với sai số: Cov(x1,u) = 0 Tất cả các biến giải thích phải không tương quan với sai số
Giả định này thì yếu hơn so với giả định kỳ vọng có điều kiện bằng 0 trong MLR.4.
Phân tích hồi quy bội:
Tính tiệm cận của OLS
5.3
Giả thiết MLR.4 có thể suy ra giả thiết MLR.4’
E(u/x1,…,xk) = 0 E(u) = 0 và Cov(xj,u) = 0 , j
© 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Với tính vững của OLS, chỉ có giả thiết yếu hơn MLR.4‘ là cần thiết Tính tiệm cận tương tự sự chệch do biến bị bỏ sót
Mô hình đúng
Lỗi chỉ định mô hình (bỏ sót biến x2)
Không có sự chệch do bỏ sót biến nếu biến bỏ sót là không thích hợp hoặc không tương quan với biến được bao gồm
Chệch (phần không vững)
Phân tích hồi quy bội:
Tính tiệm cận của OLS
Giả thiết MLR.4 suy ra giả thiết MLR.4’
9
10
Trang 6© 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
5.2 Tính tiệm cận chuẩn và suy luận trên mẫu lớn Trong thực hành, giả định tính chuẩnMLR.6 thì thường có vấn đề Nếu MLR.6 không đúng, kết quả của kiểm định thoặc Fcó thể sai May thay, kiểm định Fvà tvẫn còn hiệu lực nếu cỡ mẫu đủ lớn Ngoài ra, ước lượng OLS có thể xấp xỉphân phối chuẩn với mẫu lớnngay cả nếu không cóMLR.6 (theo định lý giới hạn trung tâm)
Định lý 5.2 (Tính tiệm cận chuẩn của OLS) Dưới các giả định MLR.1 – MLR.5:
Ngoài ra
Với mẫu lớn, ước lượng chuẩn hóa có phân phối
xấp xỉ chuẩn tắc
Phân tích hồi quy bội:
Tính tiệm cận của OLS
5.7 a: asymptotic / approximation
© 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Hội tụ tới
Hội tụ tới
Hệ quả thực hành Với mẫu lớn, phân phối ttiến tới phân phối chuẩn tắc N(0,1) Như 1 hệ quả, kiểm định tcó hiệu lực với mẫu lớnmà không có MLR.6 Tương tự cho ước lượng khoảng tin cậyvà kiểm định F
Quan trọng: MLR.1 – MLR.5 thì vẫn cần thiết, đặc biệt là giả thiết phương sai không đổi
Phân tích tiệm cận của phương sai ước lượng OLS
Hội tụ tới một số cố định nằm giữa 0 và 1
Phân tích hồi quy bội:
Tính tiệm cận của OLS
5.9
11
12
Trang 7© 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích tiệm cận của phương sai ước lượng OLS (tt)
Đây là lý do tại sao mẫu lớn thì tốt hơn
Ví dụ 5.2: Sai số chuẩn trong phương trình cân nặng khi sinh
co lạivới tốc độ
co lạivới tốc độ
Chỉ sử dụng nửa đầu của các quan sát
Phân tích hồi quy bội:
Tính tiệm cận của OLS
5.10
PHÂN TÍCH HỒI QUY BỘI:
TÍNH TIỆM CẬN CỦA OLS
• Tập tin bwght.wf1
14
> summary(hoiquy1) Call:
lm(formula = log(bwght) ~ cigs + log(faminc), data = mydata) Coefficients:
Estimate Std Error t value Pr(>|t|) (Intercept) 4.7185937 0.0182445 258.631 < 2e-16 ***
cigs -0.0040816 0.0008582 -4.756 2.18e-06 ***
log(faminc) 0.0162657 0.0055833 2.913 0.00363 **
- Signif codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 0.1883 on 1385 degrees of freedom Multiple R-squared: 0.02576, Adjusted R-squared: 0.02435 F-statistic: 18.31 on 2 and 1385 DF, p-value: 1.417e-08
> nobs(hoiquy1) [1] 1388
13
14
Trang 8PHÂN TÍCH HỒI QUY BỘI:
TÍNH TIỆM CẬN CỦA OLS
15
> summary(hoiquy2)
Call:
lm(formula = log(bwght) ~ cigs + log(faminc), data = mydata2) Coefficients:
Estimate Std Error t value Pr(>|t|) (Intercept) 4.705583 0.027053 173.939 < 2e-16 ***
cigs -0.004637 0.001332 -3.481 0.000531 ***
log(faminc) 0.019404 0.008188 2.370 0.018074 * -
Signif codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 0.1961 on 691 degrees of freedom Multiple R-squared: 0.02955, Adjusted R-squared: 0.02674
> nobs(hoiquy2)
[1] 694
0.000858/0.001332 = 0.644144
694 /1388 0.707107
CÁC KIỂM ĐỊNH KHÁC VỚI MẪU LỚN:
THỐNG KÊ NHÂN TỬ LAGRANGE (LM)
• Thống kê này phù hợp với mẫu lớn mà không cần giả thiết phân phối chuẩn
• Ta dùng thống kê nhân tử Lagrange (LM)thực hiện kiểm định ràng buộc loại bỏ biến
16
Kiểm định xem liệu q biến cuối có các tham số tổng thể đồng thời bằng 0 hay không
5.11
5.12
H1: H0sai
15
16
Trang 9CÁC KIỂM ĐỊNH KHÁC VỚI MẪU LỚN:
THỐNG KÊ NHÂN TỬ LAGRANGE (LM)
• Thống kê LM chỉ yêu cầu ước lượng mô hình đã gán ràng buộc
• B1) Ta thực hiện hồi quy (k-qbiến độc lập)
17
5.13 B2) Chạy hồi quy phụ: theo u x1, x2,…, xk (tất cả biến độc lập) 5.14
2 u R
ta thu được
2 u
LM nR
B3) Tính
Nếu LM > : bác bỏ H0 Hoặc: p value P (2( )q LM) p-value < mức ý nghĩa (0,05) : bác bỏ H0
B4) Với mức ý nghĩa , tra giá trị tới hạn có phân phối Chi bình phươngvới qbậc tự do
2( ) q
2( ) q
CÁC KIỂM ĐỊNH KHÁC VỚI MẪU LỚN:
THỐNG KÊ NHÂN TỬ LAGRANGE (LM)
• VD 5.3: Mô hình kinh tế của tội phạm
18
H0: β2=0 , β3=0
H1: H0sai
17
18
Trang 10CÁC KIỂM ĐỊNH KHÁC VỚI MẪU LỚN:
THỐNG KÊ NHÂN TỬ LAGRANGE (LM)
• Tập tin crime1.wf1
19
> hoiquygh<-lm(narr86 ~ pcnv + ptime86 + qemp86, data=crime1)
> hoiquygh Call:
lm(formula = narr86 ~ pcnv + ptime86 + qemp86, data = crime1) Coefficients:
(Intercept) pcnv ptime86 qemp86 0.71177 -0.14993 -0.03442 -0.10411
> unga<-resid(hoiquygh)
CÁC KIỂM ĐỊNH KHÁC VỚI MẪU LỚN:
THỐNG KÊ NHÂN TỬ LAGRANGE (LM)
• hoiquyphu
20
> hoiquyphu<-lm(unga ~ pcnv + ptime86 + qemp86 + avgsen + tottime, data=crime1)
> r2LM<-summary(hoiquyphu)$r.squared
> r2LM [1] 0.001493846
> nobs(hoiquyphu) [1] 2725
> LM<-r2LM*nobs(hoiquyphu)
> LM [1] 4.070729
> print("chi binh phuong voi muc y nghia 10%, bac tu do 2") [1] "chi binh phuong voi muc y nghia 10%, bac tu do 2"
> qchisq(1-0.1, 2) [1] 4.60517
> print("p-value") [1] "p-value"
> 1-pchisq(LM,2) [1] 0.1306328
19
20
Trang 11THỐNG KÊ NHÂN TỬ LAGRANGE (LM)
21
LM = 2725*0,001494 = 4,071 Với mức ý nghĩa 10% và bật tự do q = 2 ta có 0,12 (2) = 4,61
Ta có LM= 4,071 < 4,61 = 0,12 (2) : chấp nhận H0 Hoặc:
p-value = P(2(2) > 4,071) = 0,1306
Ta có p-value = 0,1306 > 0,1 = : chấp nhận H0
• VD 5.3: Mô hình kinh tế của tội phạm
CÁC KIỂM ĐỊNH KHÁC VỚI MẪU LỚN:
THỐNG KÊ NHÂN TỬ LAGRANGE (LM)
• Dùng kiểm định F:
22
> #Load package car
> library(car)
> # Kiem dinh F
> hoiquyf <- lm(narr86 ~ pcnv + ptime86 + qemp86 + avgsen + tottime, data=crime1)
> linearHypothesis(hoiquyf, c("avgsen=0", "tottime=0"))
Linear hypothesis test Hypothesis:
avgsen = 0 tottime = 0 Model 1: restricted model Model 2: narr86 ~ pcnv + ptime86 + qemp86 + avgsen + tottime Res.Df RSS Df Sum of Sq F Pr(>F)
1 2721 1927.3
2 2719 1924.4 2 2.879 2.0339 0.131
p-value = 0,131 > 0,1 : chấp nhận H0
21
22
Trang 12CÁC KIỂM ĐỊNH KHÁC VỚI MẪU LỚN:
THỐNG KÊ NHÂN TỬ LAGRANGE (LM)
23
Trong EXCEL:
Xác định phân vị 2( ) df như sau:
=CHIINV(xác suất, bậc tự do) Thí dụ:
=CHIINV(0.05,8) cho ta 2
0,05(8)
Xác định p-value = P( 2 02) bằng công thức:
=CHIDIST( 02, bậc tự do) Thí dụ:
=CHIDIST(15.5073, 8) cho kết quả là p-value = P( 2>15.5073) = 0.05
DÙNG KIỂM ĐỊNH F HAY KIỂM ĐỊNH LM?
• Kiểm định F:
– Nếu nhiễu u có phân phối chuẩn:
Dùng được với cỡ mẫu nhỏ hay lớn
– Nếu nhiễu u không có phân phối chuẩn:
Chỉ dùng được khi cỡ mẫu lớn
• Kiểm định LM:
– Không quan tâm nhiễu u có phân phối chuẩn hay không
– Chỉ dùng được khi cỡ mẫu lớn
24 23
24
Trang 13LƯU Ý:
• Log(x) = ln(x)
• Exp(x) = e^x (e mũ x)
• 2.1E+05 = 2,1*105
• 4.5E-03 = 4,5*10-3
• Nếu câu hỏi kiểm định cho mức ý nghĩa khơng thơng dụng (3,5%, 7,1%,…) thì nên suy nghĩ dùng phương pháp kiểm định gì
25
Mời ghé thăm trang web:
26
https://sites.google.com/a/ueh.edu.vn/phamtricao/
https://sites.google.com/site/phamtricao/
25
26