[r]
Trang 1CHƯƠNG 4
BIẾN GIẢ TRONG PH
HỒI QUY
ÂN TÍCH
BIẾN GIẢ
1 Bi ế t c á ch đ ặ t bi ế n gi ả MỤC
biến giả quy
trong phân tích hồi
2
NỘI DUNG
Khái niệm biến giả
1
Sử dụng biến giả trong mô hình hồi quy
2
3 Ứng dụng sử dụng biến giả
4.1 KHÁI NIỆM
�Biến định lượng: các giá trị quan sát được thể hệ bằng con số
�Biến định tính: thể hiện một số tính chất nào đó
�Để đưa những thuộc tính của biến định tính vào mô hình hồi quy, cần lượng chúng => sử dụng biến giả (dummy variables)
hóa
4
4.2 Sử dụng biến giả trong mô hình hồi quy
Ví dụ 5.1: Xét mô hình Yi= β1+ β2Xi
với
+ β3Di+ Ui
Y
X
D=1
D=0
Tiền lương (triệu đồng/tháng)
Bậc thợ
nếu công nhân làm trong khu vực tư nhân
nếu công nhân làm trong khu vực nhà nước
D được gọi là biến giả trong mô hình
4.2 Sử dụng biến giả trong mô hình hồi quy
(5.2) (5.3)
E(Y/X,D=0) = β1
E(Y/X,D=1) = β1
β2Xi
+ + β2Xi+ β3
(5.2): tiền việc trong (5.3): tiền việc trong
lương trung bình của công nhân làm khu vực quốc doanh với bậc thợ là X lương trung bình của công nhân làm khu vực tư nhân với bậc thợ là X
Trang 24.2 Sử dụng biến giả trong mô hình hồi quy
β2
β3
tốc độ tăng
chênh lệch
lương theo bậc thợ tiền lương trung bình của công nhân làm việc ở hai khu vực và cùng bậc thợ
theo (Giả thiết của mô hình: tốc độ tăng lương
bậc thợ ở hai khu vực giống nhau)
7
= β1+ β2Xi+ β3Di
E(Y/X,Z) Y
β ˆ +βˆ
β ˆ
3
βˆ1
X
Hình 4.1 mức thu nhập bình quân tháng của người lao động tại KVQD và KVTN khi có bậc thợ là X
8
4.2 Sử dụng biến giả trong mô hình hồi quy
Ví dụ 4.2: Xét sự phụ thuộc của thu nhập (Y)
(triệu đồng/tháng) vào thời gian công tác (X)
(năm) và nơi làm việc của người lao động
(DNNN, DNTN và DNLD)
Dùng 2 biến giả Z1và Z2 với
�Z1i
�Z1i
�Z2i
�Z2i
=1
=0
=1
=0
nơi
nơi
nơi
nơi
làm làm làm làm
việc việc việc việc
tại tại tại tại
DNNN nơi khác DNTN nơi khác
�Z1i= 0 và Z2i= 0 phạm trù cơ sở
9
4.2 Sử dụng biến giả trong mô hình hồi quy
E(Y/X,Z1,Z2) = β1+ β2Xi +β3Z1i+β4Z2i
= β1 β2Xi
β2Xi
E(Y/X,Z1=0,Z2=0) E(Y/X,Z1=1,Z2=0) E(Y/X,Z1=0,Z2=1)
+ +
β4
+
= β1+ β2Xi
• β3 chênh lệch thu nhập trung bình của nhân viên làm việc tại DNNN và
thời gian làm việc X năm
DNLD khi có cùng
• β4
viên gian
chênh lệch thu nhập làm việc tại DNTN và làm việc X năm
trung bình của nhân DNLD khi có cùng thời
10
4.2 Sử dụng biến giả trong mô hình hồi quy
thu nhập còn phụ thuộc vàotrìnhđộ
động (từ đại học trở lên, cao đẳng và
Ví dụ 4.3
người
khác)
lao
1: nếu trình độ từ đại học trở lên
D1i =
0: trường hợp khác
1: nếu trình độ cao đẳng
D2i =
0: trường hợp khác
Mộtchỉtiêuchấtlượngcónphạmtrù(thuộc
tính)khácnhauthìdùngn-1biếngiả
4.2 Sử dụng biến giả trong mô hình hồi quy
VD 4.4: Khảo sát lương của giáo viên
số năm giảng dạy
theo
Mô hình: Yi= β1+ β3Xi
Trong đó Y X và
lương giáo viên
số năm giảng dạy xem xét yếu tố giới tính có tác động đến thu nhập không
Trang 34.2 Sử dụng biến giả trong mô hình hồi quy
�TH1: Lương khởi điểm của gv nam và nữ
khác nhau nhưng tốc độ tăng
năm giảng dạy như nhau
lương theo số
�TH2: Lương khởi điểm như
tốc độ tăng lương khác nhau
nhau nhưng
�TH3: Lương khởi điểm và tốc độ tăng
lương khác nhau
13
4.2 Sử dụng biến giả trong mô hình hồi quy
TH1: Dịch chuyển số hạng tung độ gốc
β1+ β2Z + β3X
Hàm SRF ứng với
β ˆ1 với
β ˆ1
nữ (Z=0) :
β ˆ3
Hàm SRF ứng
Y ˆ
nam (Z=1) :
β ˆ β ˆ3
14
4.2 Sử dụng biến giả trong mô hình hồi quy
Y Yˆ =βˆ1+βˆ2+βˆ3X
βˆ1 βˆ3
Yˆ = + X
βˆ1+ βˆ2
β1, β 2 , β3 > 0
β ˆ
1
0
5.2 Lương khởi điểm của gv nam và nữ nhauX
15
4.2 Sử dụng biến giả trong mô hình hồi quy
TH2: Dịch chuyển số hạng độ dốc Hàm PRF:
Y= β1+ β2X + β3(ZX) + U Với ZX gọi là biến tương tác
Hàm SRF ứng với nữ (Z=0) :
β ˆ1 β ˆ
Y ˆ
ứng
(β2
Yˆ = β1 + β2X +β3X = β1 + + β3) X
16
4.2 Sử dụng biến giả trong mô hình hồi quy
Y
βˆ + ( βˆ βˆ
Yˆ = 1 2+ 3)X
β ˆ
1 β ˆ
2
Yˆ = + X
β 1 , β 2 , β 3 > 0
βˆ1
0
X
Hình 4.3 Mức tăng lương theo số năm giảng dạy của gv nam và nữ khác nhau
4.2 Sử dụng biến giả trong mô hình hồi quy
TH3: Dịch chuyển số hạng tung độ gốc và số hạng độ dốc
Hàm PRF: Y= β1+ β2Z + β3X + β4(ZX)+ U Hàm SRF ứng
Y ˆ
với nữ (Z=0) :
β ˆ1 β ˆ3
Hàm SRF ứng với nam (Z=1) :
ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ
Yˆ = β1+β2+β3X + β4X = ( β1+ β2) + (β3+β4)X
Trang 45.2 Sử dụng biến giả trong mô hình hồi quy
Y
= ( β ˆ + β ˆ ) + ( β ˆ + β ˆ )X
Yˆ 1 2 3 4
β ˆ
1 β ˆ
3
Yˆ = + X
βˆ1+ βˆ2
β1, β 2 , β3, β 4 > 0
βˆ1
0
Hình 5.4 Lương khởi điểm và mức tăng X
lương của gv nam và nữ khác nhau
19
4.3 Ứng dụng sử dụng biến giả 4.3.1
Y Z
Sử dụng biến giả trong phân tích hồi quy biến phụ thuộc
2 biến
biến định doanh số doanh số
tính bán ở thị bán ở thị
Z Z
=
=
1 0
trường thành thị trường nông thôn
β ˆ β ˆ
ˆ = +
Y i 1 2 Z i
20
Mối quan hệ giữa doanh số bán và thị trường
Sản lượng bán (ngàn sản phẩm) Thị trường
Sản l
37 Nông thôn
40 Thành thị
42 Thành thị
35 Nông thôn
37 Nông thôn
48 Thành thị
35 Nông thôn
43 Thành thị
45 Thành thị
37 Nông thôn
Bảng số liệu biến thị trường sau khi đặt biến giả
Y Z
37 0
40 1
42 1
35 0
37 0
48 1
35 0
43 1
45 1
37 0
Bảng Y và Z và những giá trị tương ứng TT Y Z Z2 Y2 ZY 1 37 0
2 40 1
3 42 1
4 35 0
5 37 0
6 48 1
7 35 0
8 43 1
9 45 1
10 37 0