Bản chất của biến giả - Biến giả cho sự thay đổi trong hệ số chặn Biến giả cho sự thay đổi trong hệ số góc Biến giả và Kiểm định tính ổn định cấu trúc của mô hình Hồi qui tuyến tính từng khúc Biến phụ thuộc là biến giả Mô hình xác suất tính tuyến tính (LPM) Mô hình Probit và Logit Biến bị chặn: mô hình Tobit
Trang 1CHƯƠNG 7
HỒI QUI VỚI BIẾN GIẢ VÀ BIẾN BỊ CHẶN
Bản chất của biến giả - Biến giả cho sự thay đổi
trong hệ số chặn
Biến giả cho sự thay đổi trong hệ số góc
Biến giả và Kiểm định tính ổn định cấu trúc của mô
hình
Hồi qui tuyến tính từng khúc
Biến phụ thuộc là biến giả
Mô hình xác suất tính tuyến tính (LPM)
Mô hình Probit và Logit
Trang 2Bản chất của biến giả - Biến giả cho sự thay đổi trong hệ số chặn
Trong phân tích hồi qui, có 2 loại biến chính: biến định
lượng và biến định tính.
Các biến định lượng: giá trị của những quan sát đó
là những con số
Biến định tính thường biểu thị có hay không có một
tính chất hoặc biểu thị các mức độ khác nhau của một tiêu thức thuộc tính nào đó, chẳng hạn như
giới tính, tôn giáo, chủng tộc, nơi cư trú, …
Những biến định tính này cũng có sự ảnh
hưởng đối với biến phụ thuộc và phải được đưa vào mô hình hồi quy.
Trang 3Bản chất của biến giả - Biến giả cho sự thay đổi trong hệ số chặn
Biến giả (D) thường có 2 giá trị:
D = 1: nếu quan sát có một thuộc tính nào
đó, và
D = 0: nếu không có thuộc tính đó.
Biến giả cũng được đưa vào mô hình hồi
quy giống như một biến định lượng,
Chúng được dùng để chỉ sự khác biệt
giữa 2 nhóm quan sát: có và không có một thuộc tính nào đó
Trang 4Bản chất của biến giả - Biến giả cho sự thay đổi trong hệ số chặn
Ví dụ: giả sử ta muốn xem có sự khác biệt nào
không về tiền công giữa nam và nữ với những điều kiện về công việc như nhau.
Hàm hồi quy ngẫu nhiên cho một quan sát:
wagei = 0 + 1Di + ’X + ui, Trong đó D là biến giả về giới tính: D = 1 nếu là
nam và 0 nếu là nữ; X là vector chỉ những đặc
điểm cá nhân và công việc.
Nếu D=1: wagei = 0 + 1 + ’X + ui,
Nếu D=0: wagei = 0 + ’X + ui,
Vậy hệ số 1 đo lường sự khác biệt của hệ số 0
giữa nhóm nam và nữ
Trang 5 Biến giả cho sự thay đổi trong hệ số chặn
Trang 6 Nếu biến định tính được chia ra m nhóm, chúng ta
phải sử dụng (m -1) biến giả.
Ví dụ: Ta có thể chia trình độ học vấn thành các cấp học: 1) cấp một trở xuống, 2) cấp hai, 3) cấp
Nhóm không được biểu diễn bởi biến giả đgl nhóm
cơ sở, hay nhóm đối ứng, hay nhóm so sánh, …
Giả định rằng hệ số góc là giống nhau cho các nhóm
và phần sai số ngẫu nhiên u có cùng phân phối cho các
nhóm
Trang 7Biến giả cho sự thay đổi trong hệ số chặn
Lưu ý: mô hình hồi quy có thể chỉ bao
gồm những biến giả
Khi đó, mô hình đgl “Mô hình phân
tích phương sai” (ANOVA model)
Hệ số của các biến giả sẽ cho biết sự
khác biệt về giá trị trung bình của
biến phụ thuộc giữa các nhóm
Trang 8 Một ví dụ khác, giả sử rằng chúng ta có số
liệu về tiêu dùng C và thu nhập Y của một số
hộ gia đình Thêm vào đó, chúng ta cũng có
Trang 9 Chúng ta sẽ sử dụng những biến định tính
này bằng các biến giả như sau:
1 nếu giới tính là nam
0 nếu là nữ
D1 =
1 nếu tuổi từ 25 đến 50
0 nhóm tuổi khác
D3 =
1 nếu học vấn < trung học
Trang 10 Khi đó chúng ta chạy phương trình hồi qui:
Trang 11Biến giả cho sự thay đổi trong hệ số góc
biệt về hệ số góc giữa hai nhóm.
Trang 12Biến giả và Ki ểm định tính ổn định cấu trúc
của mô hình
Ta có bảng số liệu sau về thu nhập và
tiết kiệm ở Mỹ từ năm 1970 – 1995
Vào năm 1982, Mỹ rơi vào khủng hoảng
kinh tế
Ta có thể giả định có sự thay đổi cấu
trúc trong mối quan hệ giữa tiết kiệm và thu nhập,
Ta chia số liệu ra 2 giai đoạn và đặt:
D = 1: cho số liệu từ 1982 và 0 cho giai
đoạn trước đó.
Trang 14Biến giả và Ki ểm định tính ổn định cấu trúc của mô hình
Ta có mô hình hồi quy:
Y t = α1 + α2D t + β1X t + β2(D t X t ) + u t
Trang 15Hồi qui tuyến tính từng khúc
Hệ số góc của biến độc lập, X, có thể thay
đổi khi X đạt một mức ngưỡng nào đó.
Phân tích mô hình có sự thay đổi về độ dốc,
nhưng cũng chỉ giới hạn trong trường hợp đoạn thẳng được ước lượng vẫn là liên tục
Công ty trả hoa hồng cho các đại lý dựa vào
doanh thu, nếu doanh thu dưới mức x* thì cách tính tiền hoa hồng khác với cách tính tiền hoa hồng khi doanh thu trên mức x*
Trang 17 Ước lượng hàm:
y = + x + xD + u (7.8)
Trong đó: y: tiền hoa hồng; x: doanh thu
x*: giá trị ngưỡng của doanh thu
Trang 18Biến phụ thuộc là biến giả
Biến giả có thể có 2 hoặc nhiều giá trị nhưng
trong trường hợp này chúng ta chỉ xem xét
trường hợp nó chỉ có 2 giá trị: 0 hoặc 1
Trang 19Mô hình xác suất tuyến tính và hàm phân
biệt tuyến tính
Chúng ta viết mô hình xác suất tuyến
tính dưới dạng hồi qui thông thường như
sau:
yi = Pi = E(yi|xi) = i’xi + ui (7.9)
với E(ui) = 0
Kỳ vọng có điều kiện E(yi|xi) = ’ixi được
giải thích như là xác suất có điều kiện để
sự kiện xảy ra khi biến xi đã xảy ra
Trang 20Mô hình xác suất tuyến tính
Vì E(yi|xi) là một xác suất nên:
0 E(yi|xi) 1
Tuy OLS không đòi hỏi ui phải có phân
phối chuẩn, nhưng ta vẫn giả định nó
có phân phối chuẩn để phục vụ cho việc suy diễn
Giả định này bị vi phạm, vì thực sự ui
theo phân phối Bernoulli
Xét mô hình LPM 2 biến, ta có:
Trang 21Mô hình xác suất tuyến tính
ui = Yi - 1 - 2Xi
Khi Yi = 1, ui = 1 - 1 - 2Xi, với xác suất pi,
Khi Yi = 0, ui = -1 -2Xi, với xác suất 1- pi,
Ước lượng OLS vẫn không chệch, nên nếu dùng để
ước lượng điểm, kết quả vẫn tin cậy.
Có hiện tượng phương sai sai số thay đổi, do ui
theo phân phối Bernoulli nên:
Var(ui) = Pi(1 – Pi) với Pi = ’iXi
E(yi|xi) có thể vượt khoảng (0,1) nếu Xi có giá trị lớn.
R2 sẽ rất nhỏ
Trang 23Mô hình Probit và Logit
Trong mô hình LPM, ta có:
yi = Pi = E(yi|xi) = F(i’ x i) = i’ x i + ui,
Trong đó: i’ x i = 0 + 1x1 + 2x2 + … + kxk
Do yi là một xác suất nên thay vì ta dùng F( i’xi) là
hàm tuyến tính như LPM, ta có thể cho F(xi) là một
hàm tích lũy xác suất (c.d.f).
Khi đó, chắc chắn 0 E(y i |xi) = F(i’ x i) 1
Tùy theo dạng của F(i’ x i) được chọn, ta có các mô
hình: “lựa chọn nhị phân” (binary choice) khác
nhau:
F(i’ x i) là c.d.f của phân phối chuẩn: probit model
F( x) là c.d.f của phân phối logistic: logit model
Trang 24“Bi ến ẩn” và Mô hình Probit và
Logit
quan sát i:
yi* = x i ’ + vi,
Trong đó vi thỏa các giả định của CLRM
Giả sử ta quan sát được yi khi yi* vượt một ngưỡng
Trang 25Mô hình logit và probit
Tác động biên (marginal effect) của x i lên P i là:
Trong đó f(.) là p.d.f của F(.).
với i và phụ thuộc vào giá trị của x i , không
giống như các mô hình tuyến tính.
lên P i ứng với các giá trị cụ thể của các x i
' i i
x
x
F x
Trang 26Mô hình logit và probit
i
' i
x
x '
i i
i i
e
e x
F P
x y
' i
x
/ x
' i
2 1
Đây là các mô hình phi tuyến tính nên ước lượng bằng phương pháp ML (Maximum Likelihood)
Trang 27Mô hình logit và probit
Trang 28Ước lượng ML của mô hình Logit và Probit
dựng hàm log-likelihood của các quan sát i.
Trang 29Ước lượng ML của mô hình Logit và
Probit
ước lượng của sao cho L() cực đại.
xấp xỉ phân phối chuẩn
để kiểm định mức ý nghĩa của các ước lượng.
những phân phối xấp xỉ nên để có độ tin cậy cao, cở mẫu n phải lớn.
Trang 30P
1 0
) 1
Trang 31Mô hình Probit:
phân phối chuẩn
ij j
Trang 32Biến bị chặn: mô hình Tobit
Mô hình Tobit được sử dụng để phân
tích trong lý thuyết kinh tế lượng lần đầu tiên bởi nhà kinh tế học James Tobin năm 1958
Trang 33 Nó còn có tên gọi khác là mô hình hồi
qui chuẩn được kiểm duyệt (censored regression model)
hoặc mô hình hồi qui có biến phụ thuộc
bị chặn (limited dependent variable
regression model)
bởi vì có một số quan sát của biến phụ
thuộc y* bị chặn hay được giới hạn
Trang 34 Ví dụ, Tobin xem xét vấn đề chi tiêu
cho việc mua xe ôtô
Chúng ta muốn ước lượng hệ số co giãn
của thu nhập đối với nhu cầu mua xe
ôtô
Đặt y* là chi tiêu cho mua xe ôtô và x
là thu nhập, mô hình Tobit được trình
bày như sau:
y* = xi + ui ui ~ IN(0, 2)
Trang 35 Mô hình Tobit: chi tiêu mua xe ô tô
mô hình cho số giờ làm việc
yi = xi + ui cho các quan sát có chi tiêu mua xe là số dương
mua xe
yi
=
mô hình tiền lương
yi = xi + ui cho những người có việc làm
Hi
=
yi = xi + ui cho những người có việc làm
Wi
=
Trang 36 Bây giờ ước lượng phương trình hồi qui bội
n1
RSS
i