1. Trang chủ
  2. » Luận Văn - Báo Cáo

Bài giảng Nhập môn Kinh tế lượng: Chương 9 - Phạm Trí Cao

12 165 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 12
Dung lượng 1,25 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Bài giảng Nhập môn Kinh tế lượng: Chương 9 do Phạm Trí Cao biên soạn trình bày các nội dung sau: Vấn đề xác định sai dạng hàm, sử dụng biến đại diện cho các biến giải thích không quan sát được, mô hình với hệ số góc ngẫu nhiên (= Mô hình có hệ số ngẫu nhiên),...

Trang 1

© 2012 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

Chương 9

MỘT SỐ VẤN ĐỀ MỞ RỘNG

VỀ DẠNG HÀM VÀ DỮ LIỆU

Wooldridge: Introductory Econometrics:

A Modern Approach, 5e

© 2012 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

9.1 Vấn đề xác định sai dạng hàm Chúng ta có thể kiểm định xem liệu mô hình đang xét có thiếu bình phương hay bậc cao hơn của một biến độc lập hay không bằng cách thêm các số hạng này vào mô hình và kiểm định xem thành phần thêm vào có ý nghĩa thống kê không

Ngoài ra, có thể sử dụng kiểm định chung về sai dạng hàm như RESET của Ramsey

Kiểm định sai dạng hàm (RESET)

Ý tưởng của RESET là thêm bình phương và bậc cao hơn của giá trị ước lượng của biến phụ thuộc vào hàm hồi quy (giống với kiểm định White rút gọn)

Kiểm định xem có nên loại bỏ thành phần này hay không Nếu ta không thể loại bỏ chúng, nghĩa là mô hình đã thiếu bậc cao của biến độc lập và biến tương tác, hay nói cách khác, mô hình sai dạng hàm

Phân tích hồi quy bội:

Vấn đề dạng hàm và dữ liệu

9.3

2 3

0 1 1 k k 1ˆ 2ˆ

y     x    x   y   y saiso 

y     x    x u  9.2

H0: 1=0, 2=0  H0: mô hình (9.2) có dạng hàm đúng

PHÂN TÍCH HỒI QUY BỘI:

VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU

•Ví dụ 9.1: Mô hình kinh tế về vấn đề tội phạm

•Tập tin crime1.wf1

3

Dependent Variable: NARR86 (MH1) Method: Least Squares

Included observations: 2725 Variable Coefficient Std Error t-Statistic Prob

PCNV -0.133234 0.040350 -3.301949 0.0010 AVGSEN -0.011318 0.012240 -0.924645 0.3552 TOTTIME 0.012022 0.009435 1.274210 0.2027 PTIME86 -0.040842 0.008812 -4.634769 0.0000 QEMP86 -0.050540 0.014440 -3.500045 0.0005

INC86 -0.001489 0.000341 -4.370173 0.0000 BLACK 0.326503 0.045416 7.189232 0.0000 HISPAN 0.193914 0.039711 4.883099 0.0000

C 0.568685 0.036046 15.77660 0.0000 R-squared 0.072321 Mean dependent var 0.404404 Adjusted R-squared 0.069588 S.D dependent var 0.859077

Biến QEMP86 là 1 biến rời rạc chỉ nhận 5 giá trị

PHÂN TÍCH HỒI QUY BỘI:

VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU

4

Dependent Variable: NARR86 (MH2) Method: Least Squares

Included observations: 2725 Variable Coefficient Std Error t-Statistic Prob

PCNV 0.552524 0.154237 3.582297 0.0003 PCNV^2 -0.730212 0.156118 -4.677317 0.0000 AVGSEN -0.017022 0.012054 -1.412124 0.1580 TOTTIME 0.011954 0.009282 1.287803 0.1979 PTIME86 0.287433 0.044258 6.494462 0.0000 PTIME86^2 -0.029608 0.003863 -7.663609 0.0000 QEMP86 -0.014094 0.017361 -0.811813 0.4170 INC86 -0.003415 0.000804 -4.249251 0.0000 INC86^2 7.19E-06 2.56E-06 2.811369 0.0050 BLACK 0.292296 0.044830 6.520096 0.0000 HISPAN 0.163617 0.039451 4.147388 0.0000

C 0.504607 0.036835 13.69898 0.0000 R-squared 0.103454 Mean dependent var 0.404404 Adjusted R-squared 0.099819 S.D dependent var 0.859077

Trang 2

PHÂN TÍCH HỒI QUY BỘI:

VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU

5

Wald Test: (MH2) Equation: EQ02 Test Statistic Value df Probability F-statistic 31.40381 (3, 2713) 0.0000 Chi-square 94.21144 3 0.0000 Null Hypothesis: C(2)=0,C(6)=0,C(9)=0

Null Hypothesis Summary:

Normalized Restriction (= 0) Value Std Err

Restrictions are linear in coefficients

p-value = 0.0000 < 0.05 : bác bỏ H0

Vậy nên chọn mô hình 2 © 2012 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

Ví dụ 9.2: Hàm hồi quy giá nhà

Thảo luận Chúng ta có thể thêm vào các bậc cao hơn của , hàm ý là thêm vào mô hình các biến tương tác phức tạp và bậc cao hơn của các biến độc lập

RESET cung cấp ít thông tin về nguyên nhânsai dạng hàm

Bằng chứng cho thấy

có sai dạng hàm

Ít bằng chứng cho thấy

có sai dạng hàm

Phân tích hồi quy bội:

Vấn đề dạng hàm và dữ liệu

ˆy

9.4

9.5

PHÂN TÍCH HỒI QUY BỘI:

VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU

•Tập tin hprice1.wf1

7

Dependent Variable: PRICE (MH 9.4) Method: Least Squares

Included observations: 88 Variable Coefficient Std Error t-Statistic Prob

C -21.77031 29.47504 -0.738601 0.4622 LOTSIZE 0.002068 0.000642 3.220096 0.0018 SQRFT 0.122778 0.013237 9.275093 0.0000 BDRMS 13.85252 9.010145 1.537436 0.1279 R-squared 0.672362 Mean dependent var 293.5460

PHÂN TÍCH HỒI QUY BỘI:

VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU

8

Ramsey RESET Test Equation: EQ01 Specification: PRICE C LOTSIZE SQRFT BDRMS Omitted Variables: Powers of fitted values from 2 to 3

Value df Probability F-statistic 4.668205 (2, 82) 0.0120 Likelihood ratio 9.489063 2 0.0087 Unrestricted Test Equation:

Dependent Variable: PRICE Method: Least Squares Included observations: 88 Variable Coefficient Std Error t-Statistic Prob

LOTSIZE 0.000154 0.005203 0.029545 0.9765

FITTED^2 0.000353 0.007099 0.049786 0.9604 FITTED^3 1.55E-06 6.55E-06 0.235810 0.8142 R-squared 0.705853 Mean dependent var 293.5460

H0: Mô hình (9.4) có dạng hàm đúng Với = 3%

p-value = 0.0120 < 0.03: bác bỏ H0

Trang 3

PHÂN TÍCH HỒI QUY BỘI:

VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU

9

Ramsey RESET Test Equation: EQ01 Specification: PRICE C LOTSIZE SQRFT BDRMS Omitted Variables: Powers of fitted values from 2 to 5

Value df Probability F-statistic 3.225850 (4, 80) 0.0166 Likelihood ratio 13.15896 4 0.0105 Unrestricted Test Equation:

Dependent Variable: PRICE Method: Least Squares Included observations: 88 Variable Coefficient Std Error t-Statistic Prob

C 340.2329 3320.583 0.102462 0.9186 LOTSIZE 0.002603 0.080979 0.032149 0.9744 SQRFT 0.157983 4.816594 0.032800 0.9739 BDRMS 19.32476 542.8438 0.035599 0.9717 FITTED^2 -0.034809 0.240737 -0.144595 0.8854 FITTED^3 0.000191 0.000714 0.267613 0.7897 FITTED^4 -3.93E-07 1.02E-06 -0.383490 0.7024 FITTED^5 2.83E-10 5.70E-10 0.495886 0.6213

PHÂN TÍCH HỒI QUY BỘI:

VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU

10

Dependent Variable: LOG(PRICE) (MH 9.5) Method: Least Squares

Included observations: 88 Variable Coefficient Std Error t-Statistic Prob

C -1.297042 0.651284 -1.991517 0.0497 LOG(LOTSIZE) 0.167967 0.038281 4.387714 0.0000 LOG(SQRFT) 0.700232 0.092865 7.540306 0.0000 BDRMS 0.036958 0.027531 1.342415 0.1831 R-squared 0.642965 Mean dependent var 5.633180

PHÂN TÍCH HỒI QUY BỘI:

VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU

11

Ramsey RESET Test Specification: LOG(PRICE) C LOG(LOTSIZE) LOG(SQRFT) BDRMS Omitted Variables: Powers of fitted values from 2 to 3

Value df Probability F-statistic 2.565041 (2, 82) 0.0831 Likelihood ratio 5.340099 2 0.0692 Unrestricted Test Equation:

Dependent Variable: LOG(PRICE) Included observations: 88 Variable Coefficient Std Error t-Statistic Prob

C 87.88576 240.9739 0.364711 0.7163 LOG(LOTSIZE) -4.181019 12.59521 -0.331953 0.7408 LOG(SQRFT) -17.34933 52.48991 -0.330527 0.7418 BDRMS -0.925342 2.769757 -0.334088 0.7392 FITTED^2 3.910284 13.01429 0.300461 0.7646 FITTED^3 -0.192766 0.752080 -0.256311 0.7984

H0: Mô hình (9.5) có dạng hàm đúng Với = 6%

p-value = 0.0831 > 0.06: chấp nhận H0 © 2012 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

Kiểm định đối với mô hình không lồng nhau

Thảo luận

Luôn có thể thực hiện; tuy nhiên, không có mô hình chiếm ưu thế rõ ràng

Không thể sử dụng nếu các mô hình có biến phụ thuộc có dạng hàm khác nhau

Mô hình 1:

Mô hình 2:

Xây dựng một mô hình hỗn hợp và mỗi mô hình ban đầu là trường hợp đặc biệt của mô hình hỗn hợp và kiểm định:

Dạng hàm nào sẽ phù hợp hơn?

Phân tích hồi quy bội:

Vấn đề dạng hàm và dữ liệu

9.7 9.6

9.8

H0: 1=0, 2=0 cho mô hình 9.7

H0: 3=0, 4=0 cho mô hình 9.6

0 1 1 2 2 3log( )1 4log( )2

y     x   x   x   x  u

Trang 4

PHÂN TÍCH HỒI QUY BỘI:

VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU

•Tập tin hprice1.wf1

13

Dependent Variable: PRICE (MH 9.8) Method: Least Squares

Included observations: 88 Variable Coefficient Std Error t-Statistic Prob

C 1403.700 970.6562 1.446135 0.1519 LOTSIZE -0.000493 0.001021 -0.483133 0.6303 SQRFT 0.247463 0.063686 3.885688 0.0002 LOG(LOTSIZE) 60.21552 20.04305 3.004309 0.0035 LOG(SQRFT) -282.6301 140.5320 -2.011144 0.0476 R-squared 0.713293 Mean dependent var 293.5460

PHÂN TÍCH HỒI QUY BỘI:

VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU

14

Wald Test:

Equation: EQ03 Test Statistic Value df Probability F-statistic 7.792740 (2, 83) 0.0008 Chi-square 15.58548 2 0.0004 Null Hypothesis: C(2)=0, C(3)=0

Null Hypothesis Summary:

Normalized Restriction (= 0) Value Std Err

Restrictions are linear in coefficients

p-value = 0.0008 < 0.05: bác bỏ H0: 1=0, 2=0

Mô hình (9.7) không chiếm ưu thế hơn (9.6)

PHÂN TÍCH HỒI QUY BỘI:

VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU

15

Wald Test:

Equation: EQ03 Test Statistic Value df Probability F-statistic 7.259057 (2, 83) 0.0012 Chi-square 14.51811 2 0.0007 Null Hypothesis: C(4)=0,C(5)=0

Null Hypothesis Summary:

Normalized Restriction (= 0) Value Std Err

Restrictions are linear in coefficients

p-value = 0.0012 < 0.05: bác bỏ H0: 3=0, 4=0

Mô hình (9.6) không chiếm ưu thế hơn (9.7)

PHÂN TÍCH HỒI QUY BỘI:

VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU

•Cách làm này chỉ cho ra kết quả tốt khi 1 giả thiết bị bác bỏ và 1 giả thiết được chấp nhận

•Có thể dùng kiểm định Davidson-MacKinnon, trang 350

16

Trang 5

© 2012 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

9.2 Sử dụng biến đại diện cho các biến giải thích không quan sát được

Ví dụ: Bỏ sót biến năng lực trong mô hình tiền lương

Cách sử dụng biến đại diện trong mô hình:

Thông thường, ước lượng của suất sinh lợi giáo dục và kinh nghiệm thường bị chệch bởi vì mô hình

có thể bỏ sót biến năng lực không quan sát được

Ý tưởng: tìm một biến đại diện cho năng lực, có thể kiểm soát và thể hiện được năng lực khác nhau giữa các cá nhân, khi đó hệ số hồi quy của các biến khác không còn chệch Một trong những biến đại diện cho năng lực là chỉ số IQ hoặc kết quả của các bài kiểm tra tương tự

Thay bằng biến đại diện

Biến bỏ sót, chẳng hạn: năng lực Hồi quy biến bỏ sót theo biến đại diện của nó (x 3 đại diện cho x 3 *)

Phân tích hồi quy bội:

Vấn đề dạng hàm và dữ liệu

9.9

9.10 9.11

© 2012 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

Giả thiết đối với biến đại diện

Biến đại diện “chỉ là đại diện“ cho biến bị bỏ sót, nó không thuộc vào hàm hồi quy tổng thể, nghĩa là, nó không tương quan với nhiễu

Biến đại diện phải đại diện “tốt“ cho biến bị bỏ sót, nghĩa là các biến khác thêm vào không giúp gì trong dự đoán biến bị bỏ sót

Nếu nhiễu và biến đại diện có tương quan, biến đại diện cần có mặt trong mô hình hồi quy tổng thể

Nếu điều này không thỏa, thì x 1 và x 2 cần được thêm vào mô hình hồi quy của biến bị bỏ sót.

Phân tích hồi quy bội:

Vấn đề dạng hàm và dữ liệu

9.13

© 2012 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

Khi thỏa các giả định trên, biến đại diện được sử dụng như sau:

Thảo luận về giả thiết biến đại diện trong hàm tiền lương

Giả thiết 1: Chỉ số IQ phải hoàn toàn không tác động trực tiếp đến tiền lương; quan trọng

là một cá nhân chứng minh năng lực trong công việc như thế nào

Giả thiết 2: Hầu hết sự biến động của biến năng lực có thể được giải thích bởi sự thay đổi trong chỉ số IQ, chỉ có một số ít được giải thích bởi học vấn và kinh nghiệm

Trong mô hình hồi quy này, sai số ngẫu nhiên e= u+β 3 v 3 không tương quan với tất cả biến giải thích Khi đó, hệ số hồi quy sẽ được ước lượng đúng bằng OLS Hệ số của biến x 1 và x 2 sẽ xác định đúng Hệ số của biến đại diện trong nhiều trường hợp cũng được quan tâm (nó là bội số của hệ số đứng trước biến bị bỏ sót).

Phân tích hồi quy bội:

Vấn đề dạng hàm và dữ liệu

© 2012 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

Giống với kỳ vọng, suất sinh lợi giáo hình để làm đại diện cho biến năng lực không quan sát được.

Hệ số hồi quy đứng trước biến IQ cho biết sự khác nhau trong năng lực giữa tiền lương (ví dụ, mức chênh lệnh 15 điểm phần trăm trong tiền lương).

Ngay cả khi chỉ số IQ không hoàn toàn thêm nó vào mô hình ít nhất làm giảm tính chệch của suất sinh lợi giáo dục.

Tương tác giữa năng lực và học vấn không có ý nghĩa.

Phân tích hồi quy bội:

Vấn đề dạng hàm và dữ liệu

Ví dụ 9.3:IQlà biến đại diện cho năng lực abil

Có thể có đa cộng tuyến cao giữa IQ và educ

Trang 6

PHÂN TÍCH HỒI QUY BỘI:

VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU

•Tập tin wage2.wf1

21

Dependent Variable: LOG(WAGE) (MH1) Method: Least Squares

Included observations: 935 Variable Coefficient Std Error t-Statistic Prob

EDUC 0.065431 0.006250 10.46826 0.0000 EXPER 0.014043 0.003185 4.408852 0.0000 TENURE 0.011747 0.002453 4.788998 0.0000 MARRIED 0.199417 0.039050 5.106691 0.0000 SOUTH -0.090904 0.026249 -3.463193 0.0006 URBAN 0.183912 0.026958 6.822087 0.0000 BLACK -0.188350 0.037667 -5.000444 0.0000

C 5.395497 0.113225 47.65286 0.0000 R-squared 0.252558 Mean dependent var 6.779004 Adjusted R-squared 0.246914 S.D dependent var 0.421144

PHÂN TÍCH HỒI QUY BỘI:

VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU

22

Dependent Variable: LOG(WAGE) (MH2) Method: Least Squares

Included observations: 935 Variable Coefficient Std Error t-Statistic Prob

EDUC 0.054411 0.006928 7.853173 0.0000 EXPER 0.014146 0.003165 4.469316 0.0000 TENURE 0.011395 0.002439 4.671302 0.0000 MARRIED 0.199764 0.038802 5.148237 0.0000 SOUTH -0.080169 0.026253 -3.053735 0.0023 URBAN 0.181946 0.026793 6.790848 0.0000 BLACK -0.143125 0.039492 -3.624118 0.0003

IQ 0.003559 0.000992 3.588501 0.0004

C 5.176439 0.128001 40.44074 0.0000 R-squared 0.262809 Mean dependent var 6.779004 Adjusted R-squared 0.256441 S.D dependent var 0.421144

PHÂN TÍCH HỒI QUY BỘI:

VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU

23

Dependent Variable: LOG(WAGE) (MH3) Method: Least Squares

Included observations: 935 Variable Coefficient Std Error t-Statistic Prob

EDUC 0.018456 0.041061 0.449479 0.6532 EXPER 0.013907 0.003177 4.377665 0.0000 TENURE 0.011393 0.002440 4.669853 0.0000 MARRIED 0.200866 0.038827 5.173393 0.0000 SOUTH -0.080235 0.026256 -3.055888 0.0023 URBAN 0.183576 0.026859 6.834892 0.0000 BLACK -0.146699 0.039701 -3.695069 0.0002

IQ -0.000942 0.005163 -0.182424 0.8553

EDUC*IQ 0.000340 0.000383 0.888386 0.3746

C 5.648248 0.546296 10.33916 0.0000 R-squared 0.263438 Mean dependent var 6.779004 Adjusted R-squared 0.256271 S.D dependent var 0.421144

Chọn MH2

© 2012 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

Sử dụng biến trễ của biến phụ thuộc làm biến đại diện

Trong nhiều trường hợp, yếu tố không quan sát được bị bỏ sót có thể được đại diện bởi giá trị của biến phụ thuộc ởcác thời điểm trước

Ví dụ 9.4: Tỷ lệ tội phạm trong thành phố

Việc đưa thêm tỷ lệ tội phạm thời điểm trước vào mô hình ít nhất kiểm soát được phần nào các yếu tố bị bỏ sót có tác động đến tỷ lệ tội phạm trong năm đang xét.

So sánh hai thành phố có cùng tỷ lệ tội phạm vào năm trước; nghĩa là, chúng ta đã tránh trường hợp so sánh hai thành phố có sự khác biệt rất lớn trong các yếu tố tác động đến tỷ lệ tội phạm không quan sát được.

Kỳ vọng dấu của β 3 >0.

Nếu 2 thành phố có cùng tỷ lệ tội phạm trước đây (crime -1 ) và tỷ lệ thất nghiệp hiện tại (unem), β 2

đo lường tác động của expend lên crime.

Phân tích hồi quy bội:

Vấn đề dạng hàm và dữ liệu

9.16

Trang 7

PHÂN TÍCH HỒI QUY BỘI:

VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU

•Tập tin crime2.wf1

•Ví dụ 9.4: Tỷ lệ tội phạm trong thành phố

25

Dependent Variable: LOG(CRMRTE87) (MH1) Method: Least Squares

Included observations: 46 after adjustments Variable Coefficient Std Error t-Statistic Prob

UNEM87 -0.029003 0.032339 -0.896856 0.3748 LOG(LAWEXPC87) 0.203365 0.172653 1.177881 0.2453

C 3.342899 1.250526 2.673194 0.0106 R-squared 0.057117 Mean dependent var 4.590739 Adjusted R-squared 0.013262 S.D dependent var 0.325302 Dấu của UNEM87 và LOG(LAWEXPC87) trái với kỳ vọng

PHÂN TÍCH HỒI QUY BỘI:

VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU

26

Dependent Variable: LOG(CRMRTE87) (MH2) Method: Least Squares

Included observations: 46 after adjustments Variable Coefficient Std Error t-Statistic Prob

UNEM87 0.008621 0.019517 0.441725 0.6610 LOG(LAWEXPC87) -0.139576 0.108641 -1.284745 0.2059

LOG(CRMRTE82) 1.193923 0.132098 9.038124 0.0000

C 0.076450 0.821143 0.093102 0.9263 R-squared 0.679830 Mean dependent var 4.590739 Adjusted R-squared 0.656961 S.D dependent var 0.325302 Dấu của UNEM87 và LOG(LAWEXPC87) đúng với kỳ vọng

PHÂN TÍCH HỒI QUY BỘI:

VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU

•Cách tạo ra biến CRMRTE82:

•Tạo ra biến CRMRTE82từ biến CRMRTE

•Thêm 1 quan sát NAvào dòng đầu tiên (Insert obs…)

27 © 2012 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

9.3 Mô hình với hệ số góc ngẫu nhiên (= Mô hình có hệ số ngẫu nhiên)(tự đọc)

Hệ số chặn trung bình Thành phần ngẫu nhiên Hệ số góc trung bình Thành phần ngẫu nhiên

Giả thiết:

Sai số Thành phần ngẫu nhiên của một cá nhân độc lập với biến giải thích

Mô hình có hệ số chặn ngẫu nhiên

và hệ số góc ngẫu nhiên

WLS hay OLS với sai số chuẩn cải thiện sẽ giúp ước lượng vững hệ số chặn trung bình và hệ số góc trung bình của tổng thể.

Phân tích hồi quy bội:

Vấn đề dạng hàm và dữ liệu

9.18

9.20

Trang 8

© 2012 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

9.4 Tính chất của OLS khi có sai số trong đo lường Sai số đo lường ở biến phụ thuộc

Hậu quả của sai số đo lường ở biến phụ thuộc Ước lượngkém hiệu quả hơn do phương sai sai số cao hơn

Tuy nhiên, ước lượng OLS vẫnkhông chệch và vững (với giả thiết sai số đo lường e0

không tương quan với các biến giải thíchxj) Ngoài ra, các thống kê t, F, LM vẫn hợp lệ

Giá trị sai = Giá trị đúng + Sai số đo lường

Hàm hồi quy tổng thể

Mô hình được ước lượng

Phân tích hồi quy bội:

Vấn đề dạng hàm và dữ liệu

9.24

9.25

Khi chúng ta sử dụng 1 thước đo không chính xác cho 1 biến kinh tế trong 1 mô hình hồi quy, thì có nghĩa là mô hình của chúng ta hàm chứa vấn đề sai số đo lường

PHÂN TÍCH HỒI QUY BỘI:

VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU

•Ví dụ 9.5: Hàm tiết kiệm với sai số đo lường

•sav* = β0+ β1inc + β2size + β3educ + β4age + u

•sav*: tiết kiệm thật sự, sav: tiết kiệm báo cáo

•e0= sav-sav*

•Khá hợp lý nếu giả thiết sai số đo lường không tương quan với inc, size, educ, age

•Chúng ta có thể không bao giờ biết được sai số đo lường có tương quan với inc, educ hay không, trừ khi chúng ta thu thập được dữ liệu về sav*

•Ví dụ 9.6: Sai số đo lường trong tỷ lệ phế phẩm

•log(scrap*)= β0+ β1grant + u

•scrap*: tỷ lệ phế phẩm thực tế, scrap: tỷ lệ phế phẩm công ty báo cáo

•e0= log(scrap) - log(scrap*)

30

© 2012 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

Sai số đo lường ở 1 biến giải thích

Giá trị sai = Giá trị đúng + Sai số đo lường

Hàm hồi quy tổng thể

Mô hình được ước lượng

Giả thiết sai số trong đo lường cổ điển:

Giá trị sai x 1 có tương quan với sai

số của mô hình

Sai số không tương quan với giá trị đúng

Phân tích hồi quy bội:

Vấn đề dạng hàm và dữ liệu

9.28

9.30

9.31 9.32

9.27

-© 2012 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

Hậu quả của sai số đo lường trong biến giải thích

Dưới giả thiết sai số trong đo lường cổ điển (CEV), OLS cho ước lượng chệchvà

không vững vì biến đo sai x1bị nội sinh

Có thể biểu diễn tính không vững của ước lượng như sau:

Tác động của biến đo sai bị chệch suy giảm, nghĩa là độ lớn tác động của biến đo sai luôn gần với giá trị 0 hơn so với tác động của biến đúng Ví dụ nếu β1>0 thì β1^

sẽ có xu hướng ước lượng thấp hơn β1 Ngoài ra, tác động của các biến giải thích khác cũng bị chệch

Nhân tử này (liên quan đến phương sai của nhiễu trong hàm hồi quy giá trị đúng của x 1 theo các biến giải thích khác) luôn nhận giá trị từ 0 đến nhỏ hơn 1

Phân tích hồi quy bội:

Vấn đề dạng hàm và dữ liệu

9.33

Trang 9

PHÂN TÍCH HỒI QUY BỘI:

VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU

•Ví dụ 9.7: Phương trình GPA với sai số đo lường

•colGPA = β0+ β1faminc* + β2hsGPA + β3SAT + u

•faminc*: thu nhập thực tế hàng năm của hộ gia đình

•faminc: thu nhập hàng năm của hộ gia đình do sinh viên kê khai

•e1= faminc - faminc*

•Nếu dùng faminc thay cho faminc* sẽ làm chệch ước lượng OLS của

β1về phía 0 Một hậu quả của sự chệch dưới là kiểm định giả thiết

H0: β1= 0 ; H1: β1> 0 sẽ thường cho kết quả chấp nhận H0(do |t|

nhỏ)

33 © 2012 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

9.5 Dữ liệu bị khuyết, mẫu phi ngẫu nhiên, các quan sát bất thường(tự đọc)

Dữ liệu bị khuyết do chọn mẫu

Dữ liệu khuyết là trường hợp đặc biệt của vấn đề chọn mẫu (mẫu phi ngẫu nhiên) khi quan sát bị thiếu thông tin không thể sử dụng được

Nếu mẫu được chọndựa trên các biến độc lậpthì hàm hồi quy không gặp bất kỳ vấn đề nàovìhàm hồi quy xét điều kiện dựa trên các biến dộc lập

Nói chung, việc chọn mẫu sẽ không có vấn đề gì trong trường hợp nó không liên quan tới sai số của mô hình (=chọn mẫu ngoại sinh)

Việc chọn mẫu sẽ có vấn đề nếu nódựa trên biến phụ thuộchoặc sai số (=chọn mẫu nội sinh)

Phân tích hồi quy bội:

Vấn đề dạng hàm và dữ liệu

© 2012 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

Ví dụ về chọn mẫu ngoại sinh

Ví dụ về chọn mẫu nội sinh

Nếu mẫu phi ngẫu nhiên được chọn theo nhóm thu nhập, nhóm tuổi, quy mô gia đình, thì hàm hồi quy không có bất kỳ vấn đề gì bởi vì nó nghiên cứu tiết kiệm cho một tập con của tổng thể được xác định bởi thu nhập, tuổi và quy mô gia đình.

Nếu mẫu phi ngẫu nhiên là do các cá nhân từ chối tham gia cuộc khảo sát vì giá trị tài sản của họ (wealth) quá cao hoặc thấp, kết quả ước lượng sẽ bị chệch vì những cá nhân này có sự khác biệt một cách hệ thống với những cá nhân không từ chối tham gia mẫu khảo sát.

Phân tích hồi quy bội:

Vấn đề dạng hàm và dữ liệu

9.37

9.38

© 2012 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

Quan sát bất thường và quan sát có ảnh hưởng lớn

Quan sát có giá trị cách xa hay bất thường là vấn đề đặc trưng của OLS vì phương pháp này dựa trênbình phương phần dư

Nếu quan sát bất thường do sai sót khi nhập liệu, ta chỉ cần bỏ đi các quan sát đó

Nếu quan sát bất thường nảy sinh do quá trình thu thập dữ liệu, việc quyết định giữ lại hay bỏ đi những quan sát này không phải dễ dàng

Ví dụ 9.8: Cường độ R&D và quy mô doanh nghiệp

Phân tích hồi quy bội:

Vấn đề dạng hàm và dữ liệu

9.40

Trang 10

© 2012 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

Ví dụ 9.8: Cường độ R&D và quy mô doanh nghiệp (tiếp tục)

Kết quả ước lượng khi không có quan sát bất thường thì có ý nghĩa hơn.

Giá trị bất thường này không phải là lỗi nhập liệu: Một trong các công ty trong dữ liệu có quy mô lớn hơn các công ty khác

Phân tích hồi quy bội:

38

Dependent Variable: RDINTENS Method: Least Squares Sample: 1 32 Included observations: 32 Variable Coefficient Std Error t-Statistic Prob

C 2.622954 0.585494 4.479896 0.0001 SALES 5.35E-05 4.41E-05 1.214138 0.2345

PROFMARG 0.044744 0.046179 0.968926 0.3406 R-squared 0.076490 Mean dependent var 3.265625 Adjusted R-squared 0.012800 S.D dependent var 1.874079

PHÂN TÍCH HỒI QUY BỘI:

VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU

39

Dependent Variable: RDINTENS Method: Least Squares Sample: 1 32 IF (SALES<>39709) Included observations: 31 Variable Coefficient Std Error t-Statistic Prob

C 2.294401 0.591756 3.877273 0.0006 SALES 0.000186 8.42E-05 2.206527 0.0357

PROFMARG 0.047974 0.044480 1.078555 0.2900 R-squared 0.173177 Mean dependent var 3.254839 Adjusted R-squared 0.114118 S.D dependent var 1.904048

© 2012 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

9.6 Phương pháp độ lệch tuyệt đối nhỏ nhất (LAD)

Phương pháp độ lệch tuyệt đối nhỏ nhất tìm cách cực tiểu hóa tổng trị tuyệt đối của các phần dư (thay vì tổng bình phương phần dư, OLS)

Ít nhạy cảm hơn với các giá trị bất thường vì không bình phương phần dư

Phương pháp độ lệch tuyệt đối nhỏ nhất ước lượng các tham số củatrung vị có điều kiện(thay vìtrung bình có điều kiệnnhư OLS)

Các ước lượng độ lệch tuyệt đối nhỏ nhất là trường hợp đặc biệt củahồi quy phân vị

(ước lượng các tham số của phân vị có điều kiện)

Phân tích hồi quy bội:

Vấn đề dạng hàm và dữ liệu

9.45

Ngày đăng: 05/02/2020, 01:48

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w