Bài giảng 7 HỒI QUI VỚI BIẾN GIẢ Mục tiêu học tập: Bản chất của biến giả Hồi qui với một biến định lượng và một biến giả có hai tính tính Hồi qui với một biến định lượng và một biến giả
Trang 1Bài giảng 7
HỒI QUI VỚI BIẾN GIẢ
Mục tiêu học tập:
Bản chất của biến giả
Hồi qui với một biến định lượng và một biến giả có hai tính tính
Hồi qui với một biến định lượng và một biến giả có hơn hai đặc tính
Hồi qui với một biến định lượng và hai biến giả
Mô hình tổng quát về hồi qui biến giả
Ý nghĩa hệ số hồi qui biến giả
Biến giả và phân tích ổn định cấu trúc
Biến giả mùa vụ
Tài liệu tham khảo:
Domodar Gujarati, 1999, Essentials of Econometrics, Chapter 9
Domodar Gujarati, 2003, Basic Econometrics, Chapter 9
Ramanathan, 2002, Introductory Econometrics with Applications, Chapter 7
Trang 27 1 BẢN CHẤT CỦA BIẾN GIẢ
Định nghĩa: Biến giả (dummy variables) ở đây được hiểu là các biến giải thích định tính (qualitative)
Trong phân tích hồi qui, biến phụ thuộc không chỉ phụ thuộc vào các biến định lượng mà còn các biến định tính như giới tính, chủng tộc, tôn giáo, dân tộc, chính trị, …)
Ví dụ
Q = f(P, Ps, Pc, Sex, Edu, …)
W = f(T, Exp, Prod, Edu, …)
Ý nghĩa biến giả: Các biến định tính trong mô hình chỉ ra “sự hiện diện” hay
“không hiện diện” của một thuộc tính (attribute) nào đó và thường được gán các giá trị bằng số như 1 và 0 lần lượt thể hiện có và không có thuộc tính đó
Ký hiệu: D (để phân biệt với các biến định lượng X)
Tạo biến giả bằng Eviews?
Nhập giá trị 1 và 0 cho các quan sát tương ứng (cách nhập từ bàn phím)
Ví dụ: Sử dụng file Table7-6ee.txt
Trước hết, tạo biến xu thế
T=@trend(1969)
Sau đó, tạo biến giả DUM=t>12
Nghĩa là D=0 nếu các quan sát trong giai đoạn 1970 - 1981 và D=1 nếu các quan sát trong giai đoạn 1982 - 1995
Các biến giả được sử dụng trong hồi qui tương tự như các biến định lượng Cho nên, cũng có thể ước lượng mô hình mà các biến giải thích chỉ là biến giả (gọi là mô hình phân tích phương sai (ANOVA))
Ví dụ 9.1: Lương khởi điểm của người có bằng đại học và chưa có bằng đại học (Y = lương khởi điểm, D = biến giả về trình độ giáo dục)
Yi = B1 + B2Di + ui (9.1)
Yi = lương khởi điểm
Di = 1 nếu tốt nghiệp đại học
= 0 nếu chưa tốt nghiệp đại học
Lương trung bình của người chưa tốt nghiệp đại học?
E(Y|D=0) = B1 + B2*(0)
Lương trung bình của người tốt nghiệp đại học?
Trang 3E(Y|D=1) = B1 + B2*(1)
B2 = differential intercept coefficient
Kiểm định và giải thích ý nghĩa?
Lưu ý: Chỉ thực sự khác biệt về lương khởi điểm giữa 2 nhóm nếu hệ số của biến giả có ý nghĩa thống kê
7.2 HỒI QUI VỚI MỘT BIẾN ĐỊNH LƯỢNG VÀ MỘT BIẾN GIẢ CÓ HAI ĐẶC TÍNH
Xét phương trình sau:
Yi = B1 + B2Di + B3Xi + ui (9.6)
Yi = lương trung bình hàng năm
Di = 1 nếu là nam = 0 nếu là nữ
Xi = số năm kinh nghiệm Lương trung bình
Của một giáo viên nữ?
E(Yi|D=0,Xi) = B1 + B3Xi
Của một giáo viên nam?
Trang 4E(Yi|D=1,Xi) = B1 + B2 + B3Xi
Sử dụng file table9-2ee.txt để lượng phương trình trên
Kiểm định và giải thích ý nghĩa?
LƯU Ý HỒI QUI BIẾN GIẢ:
Để phân biệt 2 thuộc tính, ta dùng một biến giả vì nếu dùng 2 biến giả sẽ dẫn đến hiện tượng cộng tuyến hoặc đa cộng tuyến (D2 = 1 – D1, hoặc D1 = 1 – D2)
Nguyên tắc chung: Nếu một biến định tính có m thuộc tính thì ta tạo (m-1) biến giả
Gán giá trị 1 và 0 chỉ là ngẫu nhiên, nhưng các hệ số ước lượng có thể thay đổi khi ta qui ước khác Khi gán giá trị cần định nghĩa rõ ràng
Thuộc tính được gán giá trị 0 được xem như thuộc tính cơ sở (base, benchmark, comparison, …) và hệ số tung độ gốc (chung) B1 là hệ số tung độ gốc của thuốc tính cơ sở
Hệ số B2 (của biến D) được gọi là hệ số cắt chênh lệch (differential intercept coefficient)
Ví dụ 9.4: Tác động của khác biệt sản phẩm (product differentiation) lên suất sinh lợi của vốn chủ sở hữu (Y)?
Y = 1.399 + 1.49Di + 0.246X2i – 9.507X3i – 0.016X4i
Trang 5se (1.380) (0.056) (4.244) (0.017)
t (1.079) (4.285) (-2.240) (-0.941)
n = 48 R2 = 0.26
D = 1 nếu có khác biệt sản phẩm
= 0 nếu không có khác biệt sản phẩm
X2 = Market share (thị phần)
X3 = Firm size (qui mô doanh nghiệp)
X4 = Industry growth rate (tốc tộ tăng trưởng của ngành)
Kiểm định và giải thích ý nghĩa?
7.3 HỒI QUI VỚI MỘT BIẾN ĐỊNH LƯỢNG VÀ MỘT BIẾN GIẢ CÓ HƠN HAI ĐẶC TÍNH
Ta có phương trình sau:
Yi = B1 + B2D2i + B3D3i + B4Xi + ui (9.13)
Yi = chi tiêu cho du lịch hàng năm
D2i = 1 nếu tốt nghiệp cấp 3
= 0 nếu chưa tốt nghiệp cấp 3
D3i = 1 nếu tốt nghiệp đại học
= 0 nếu chưa tốt nghiệp đại học
Xi = thu nhập hàng năm Như vậy, chưa tốt nghiệp cấp 3 được xem như thuộc tính cơ sở và B1 là hệ số tung độ gốc của thuộc tính này
Ví dụ 9.5: File table9-3ee.txt về mối quan hệ giữa chi tiêu cho du lịch với thu nhập và giáo dục:
Trang 6Kiểm định và giải thích ý nghĩa?
7.4 HỒI QUI VỚI MỘT BIẾN ĐỊNH LƯỢNG VÀ HAI BIẾN GIẢ
Ta có phương trình sau:
Yi = B1 + B2D2i + B3D3i + B4Xi + ui
Yi = lương hàng năm
D2i = 1 nếu là giáo viên nam
= 0 nếu là giá viên nữ
D3i = 1 nếu có học vị tiến sỹ
= 0 nếu chưa có học vị tiến sỹ
Xi = số năm kinh nghiệm Lương trung bình
Giáo viên nữ, chưa có học vị tiến sỹ:
E(Yi|D2=0,D3=0,Xi) = B1 + B4Xi (9.19)
Giáo viên nam, chưa có học vị tiến sỹ:
E(Yi|D2=1,D3=0,Xi) = (B1 + B2) + B4Xi (9.20)
Giáo viên nữ, có học vị tiến sỹ:
E(Yi|D2=0,D3=1,Xi) = (B1 + B3) + B4Xi (9.21)
Trang 7 Giáo viên nam, có học vị tiến sỹ:
E(Yi|D2=1,D3=1,Xi) = (B1 + B2 + B3) + B4Xi (9.21) Các trường hợp mở rộng:
Mô hình với nhiều biến định lượng và nhiều biến giả
Ngoài ra, có thể sử dụng các biến giả để kiểm định xem có sự khác biệt giữa hệ số của biến giải thích định lượng, ví dụ:
Yi = B1 + B2D2i + B3Xi + B4D2iXi + ui
Yi = lương hàng năm
D2i = 1 nếu có học vị tiến sỹ = 0 nếu chưa có học vị tiến sỹ
Xi = số năm kinh nghiệm (Sẽ được làm rõ hơn ở phần bài tập)
7.5 Ý NGHĨA CỦA CÁC HỆ SỐ HỒI QUI BIẾN GIẢ
7.5.1 Hàm tuyến tính
Yi = B1 + B2D2i + B3Xi + B4D2iXi + ui
Yi = lương hàng năm
D2i = 1 nếu có học vị thạc sỹ = 0 nếu có bằng cử nhân
Xi = số năm kinh nghiệm
B1 = Lương khởi điểm trung bình của giáo viên có bằng cử nhân
B2 = Chênh lệch về lương khởi điểm trung bình của giáo viên có bằng thặc ỹ
so với có bằng cử nhân
B3 = Mức thay đổi tiền lương trung bình của giáo viên có bằng cử nhân theo số năm kinh nghiệm
B4 = Chênh lệch về mức thay đổi tiền lương trung bình theo số năm kinh nghiệm của giáo viên có bằng thạc sỹ so với có bằng cử nhân
7.5.2 Dạng hàm log - lin
Xét phương trình sau đây:
lnYi = B1 + B2D2i + B3lnXi + ui
Yi = lương hàng năm
D2i = 1 nếu có học vị thạc sỹ
Trang 8= 0 nếu có bằng cử nhân
Xi = số năm kinh nghiệm Phần trăm thay đổi của Y khi biến giả thay đổi từ 0 lên 1 = (antilog(B2) - 1)*100 (phần trăm chênh lệch về lương trung bình của giáo viên có bằng thạc sỹ so với cử nhân)
7.6 ỔN ĐỊNH CẤU TRÚC VÀ HỒI QUI BIẾN GIẢ
Thay vì ước lượng 3 phương trình (7.55), (7.56), và (7.57) và thực hiện kiểm định Chow, ta có thể sử dụng phương pháp biến giả và kiểm định ý nghĩa của hệ số biến giả (kiểm định t)
Hạn chế của kiểm định Chow: Không cho biết sự khác nhau giữa các giai đoạn là do hệ số cắt hay hệ số gốc
Giả sử 2 phương trình cho 2 giai đoạn khác nhau như sau:
1970 – 1981:
Yt = A1 + A2Xt + u1t (9.23)
1982 – 1995
Yt = B1 + B2Xt + u2t (9.24) Có 4 khả năng:
A1 = B1 và A2 = B2: Hai phương trình giống nhau hoàn toàn
A1 ≠ B1 và A2 = B2: Hai phương trình có đồ thị song song
A1 = B1 và A2 ≠ B2: Hai phương trình có cùng hệ số cắt
A1 ≠ B1 và A2 ≠ B2: Hai phương trình hoàn toàn khác nhau
Sử dụng biến giả?
Yt = C1 + C2Dt + C3Xt + C4(Dt.Xt) + ut (9.25)
C2 = hệ số cắt chênh lệch (differential intercept) C4 = độ dố chênh lệch (differential slope)
Ví dụ 9.7: Sử dụng file table9-5ee.txt và ước lượng phương trình (9.25)
Trang 9Kiểm định và giải thích ý nghĩa?
Viết phương trình của 2 giai đoạn?
1970 – 1981
1982 – 1995
7.7 BIẾN GIẢ VÀ PHÂN TÍCH MÙA VUï
Ví dụ 9.9: Mối quan hệ giữa chi tiêu và thu nhập ở Úc giai đoạn từ 1977Q1-1980Q4 (Y = chi tiên cho tiêu dùng cá nhân (PCE), X = thu nhập khả dụng cá nhân (PDI)
Cách đặt biến giả mùa? 3 biến D2, D3, D4 hoặc D1, D2, D3, hoặc D1, D3, D4, …
Trang 10Kiểm định và giải thích ý nghĩa?
Kiểm định xem hệ số gốc có khác nhau giữa các quí hay không?
Trang 11Kiểm định và giải thích ý nghĩa?
Trang 12BÀI TẬP NHÓM SỐ 5
Yêu cầu làm theo nhóm, nộp bài làm qua email: ptbinh@ueh.edu.vn và nộp bản in (hoặc viết tay) và buổi học tiếp theo Bài tập này sẽ được tính vào điểm quá trình của môn học
5.1 Xem xét hai mô hình sau đây:
Yi = B0 + B1Xi + B2D2i + B3D3i + ui (5.1a)
Yi = B0 + B1Xi + B2D2i + B3D3i + B4(D2iXi) + B5(D3iXi) + ui (5.1b)
Y = thu nhập hàng năm của người tốt nghiệp MBA (Thạc sĩ quản trị kinh doanh)
X = Số năm làm việc
D2 = 1 nếu tốt nghiệp MBA Harvard
= 0 nếu không phải Harvard
D3 = nếu tốt nghiệp MBA ở Wharon
= 0 nếu không tốt nghiệp Wharton
a Dấu kỳ vọng của các hệ số hồi qui của mô hình (5.1a) là gì?
b Giải thích ý nghĩa các hệ số B2 và B3 ở mô hình (5.1a)?
c Giải thích ý nghĩa các hệ số B4 và B5 ở mô hình (5.1b)?
d Nếu các hệ số B4 và B5 có ý n ghĩa thống kê, thì Anh/Chị sẽ sử dụng mô hình (5.1a) hay (5.1b)?
e Trình bày các bước kiểm định giả thiết H0: B4 = B5 = 0?
5.2 Huang và cộng sự đã xây dựng hàm cầu cà phê ở Mỹ giai đoạn quí I – 1961 đến quí II – 1977 như sau:
t
^
Q
ln = 1.2789 - 0.1647lnP t + 0.5115lnI t + 0.1483lnP ’ t - 0.0089T
t (2.14) (1.13) (0.55) (-3.36)
- 0.0961D1t - 0.1570D2t - 0.0097D3t
(-3.74) (-6.03) (-0.37) R2 = 0.80
Trong đó:
Q = Lượng cầu cà phê/người
P = Giá so sánh của 1 cân cà phê (giá gốc năm 1967)
I = Thu nhập khả dụng/người
P’ = Giá so sánh của 1 cân trà (giá gốc năm 1967)
T = Biến xu thế
D1 = 1 cho quí I
Trang 13D2 = 1 cho quí II
D3 = 1 cho quí III
ln = log tự nhiên
a Giải thích các hệ số của P, I, và P’?
b Cầu cà phê có co giãn theo giá không?
c Anh chị giải thích ý nghĩa của hệ số của biến T như thế nào?
d Kiểm định giả thiết: Độ co giãn của cầu cà phê theo thu nhập bằng 1?
e Giải thích ý nghĩa các biến giả D1, D2, và D3?
f Viết phương trình cầu cà phê cho từng quí?
5.3 Trong nghiên cứu về số giờ lao động của công ty bảo hiểm ký gởi liên bang (FDIC) đã bỏ ra để thanh tra hoạt động của 91 ngân hàng, R.J.Miller đã ước lượng được hàm số sau đây:
Y
ln ^ = 2.41 + 0.3674lnX 1 + 0.2217lnX 2 + 0.0803lnX 3 - 0.1755D1
se (0.047) (0.062) (0.028) (0.290)
+ 0.2799D2 + 0.5634D3 - 0.2572D4
(0.104) (0.165) (0.078) R2 = 0.766
Trong đó:
Y = Số thời gian lao động của thanh tra FDIC
X1 = Tổng tài sản của ngân hàng
X2 = Tổng số văn phòng ở ngân hàng
X3 = Tỷ số giữa vốn cho vay nhỏ lẻ/tổng vốn cho vay của ngân hàng
D1 = 1 nếu xếp loại quản lý là “tốt”
D2 = 1 nếu xếp loại quản lý là “khá”
D3 = 1 nếu xếp loại quản lý là “được”
D4 = 1 nếu việc thanh tra được thực hiện kết hợp với cơ quan nhà nước
a Giải thích kết quả nghiên cứu
b Giải thích ý nghĩa các hệ số hồi qui của các biến giả?
5.4 Sử dụng file Table9-7be.wfl để kiểm định giả thiết rằng các phương sai của nhiễu (error variances) trong hai giai đoạn từ quí IV 1958 đến quí III 1966 và quí
IV 1966 đến quí II 1971 là như nhau?