Bài giảng Kinh tế lượng - Chương 5: Hồi quy với biến giả cung cấp các kiến thức giúp người học có thể biết cách đặt biến giả, nắm được phương pháp sử dụng biến giả trong phân tích hồi quy. Mời các bạn cùng tham khảo nội dung chi tiết.
Trang 1LOG O
Chương 5:
HỒI QUY VỚI BIẾN GIẢ
GV Phan Trung Hiếu
-Biết cách đặt biến giả.
-Nắm được phương pháp sử dụng biến giả trong
phân tích hồi quy.
2
I Khái niệm về biến giả:
I Định nghĩa:
-Biến định lượng:các giá trị quan sát được thể hiện bằng một con số
-Biến định tính: giá trị của nó không thể hiện được bằng một con số, nó thể hiện đặc điểm, tính chất nào đó.
Một biến định tính có thể có một đặc điểm, hai đặc điểm, ba đặc điểm hoặc nhiều hơn
3
Biến định tính Đặc điểm 1 Đặc điểm 2
Điểm bán hàng Thành thị Nông thôn
Bằng cấp Có bằng
đại học
Không có bằng đại học
Biến định tính ĐĐ1 ĐĐ2 ĐĐ3
Địa bàn công tác Thành
phố
Nông thôn Miền núi Tình trạng sở hữu
của doanh nghiệp
Tư nhân
Quốc doanh
Liên kết với nước ngoài
4
Làm sao để đưa biến định tính vào mô hình?
Lượng hóa biến định tính.
Gáncho mỗi đặc điểm của biến định tính một con số.
Sau khi lượng hóa, biến định tính gọi là biến giả.
5
II Mô hình hồi quy với biến giả:
Số biến giả = Số đặc điểm - 1
-Thường được lượng hóa cho các đặc điểm bằng hai
con số: 0 và 1.
Hồi quy với 1 biến định tính với 2 đặc điểm:
Ta đặt 1 biến giả Z, trong đó
Zi = 0 : đặc điểm 1.
Zi = 1 : đặc điểm 2.
Hoặc ngược lại.
6
Ví dụ 4.1:Khảo sát thu nhập của giảng viên theo trình
độ (cử nhân-CN hay thạc sĩ-ThS) ta được bảng số liệu sau
a) Hãy đặt biến giả và tạo lập bảng số liệu theo biến giả.
b) Hãy tìm hàm hồi quy tuyến tính mẫu của thu nhập
theo trình độ và nêu ý nghĩa của hàm hồi quy và ý nghĩa của các hệ số hồi quy.
Trang 2Giải
a)
Gọi Y: thu nhập của giảng viên (triệu đồng/tháng).
Cách 1:
0
i
Z nếu giảng viên cĩ trình độ cử nhân.
1
i
Z nếu giảng viên cĩ trình độ thạc sĩ.
Ta cĩ bảng số liệu sau khi đặt biến giả:
8
b)
1 4, 44;
2 3, 62;
( ) : 4, 44 3,62
Ý nghĩa của hàm hồi quy:
Z i 0 Y i 4,44 : thu nhập trung bình của giảng viên
cĩ trình độ ……… là ……… triệu đồng/tháng.
Z i 1 Y i 4, 44 3,62 8, 06 : thu nhập trung bình của giảng viên cĩ trình độ ………… là …… triệu đồng/tháng.
Ý nghĩa của các hệ số hồi quy:
1 4, 44
cho biết nếu giảng viên cĩ trình độ ………
thì thu nhập trung bình là …… triệu đồng/tháng.
2 3, 62
cho biết mức chênh lệch về thu nhập trung
bình giữa …………và ……… là ……… triệu đồng/tháng.
9
Cách 2:
0
i
Z nếu giảng viên cĩ trình độ thạc sĩ.
1
i
Z nếu giảng viên cĩ trình độ cử nhân.
Ta cĩ bảng số liệu sau khi đặt biến giả:
a)
10
b)
1 8, 06;
2 3, 62;
( ) : 8, 06 3,62
Ý nghĩa của hàm hồi quy:
Z i 1 Y i 8,06 3,62 4,44 : thu nhập trung bình của giảng viên cĩ trình độ ……… là ……… triệu đồng/tháng.
Ý nghĩa của các hệ số hồi quy:
1 8, 06
cho biết nếu giảng viên cĩ trình độ ………
thì thu nhập trung bình là …… triệu đồng/tháng.
2 3, 62
cho biết mức chênh lệch về thu nhập
trung bình giữa …………và ……… là ……… triệu đồng/tháng.
Z i 0 Y i 8, 06 : thu nhập trung bình của giảng viên cĩ trình độ ………… là …… triệu đồng/tháng.
Ta đặt 2 biến giả Z1, Z2trong đĩ
1
1: đặcđiểm1
0 : đặc điểm khác
i
Z
2
1: đặc điểm 2
0 : đặc điểm khác
i
Z
Khi đĩ, Z1i= Z2i= 0 : đặc điểm 3
Hồi quy với 1 biến định tính với 3 đặc điểm: Ví dụ 4.2: Khảo sát thu nhập của giảng viên theo trình
độ (cử nhân-CN; thạc sĩ-ThS và tiến sĩ-TS) ta được bảng số liệu sau
Trang 313
a) Hãy đặt biến giả và tạo lập bảng số liệu theo biến
giả.
Gọi Y: thu nhập của giảng viên (triệu đồng/tháng).
1
1 : cử nhân
0 : trình độ khác
i
2
1: thạc sĩ
0 : trình độ khác
i
Z
Như vậy, ta cĩ
Cử nhân: và
Thạc sĩ: và
Tiến sĩ: và
14
Ta cĩ bảng số liệu sau khi đặt biến giả:
15
b) Hãy tìm hàm hồi quy tuyến tính mẫu của thu
nhập theo trình độ và nêu ý nghĩa của hàm hồi quy.
1 10,82;
2 6,38;
3 2, 76
16
(SRF) :Y i 10,82 6, 38 Z i 2, 76Z i
Ý nghĩa của hàm hồi quy:
Z1iZ2i 0 Y i 10,82 thu nhập trung bình của giảng viên cĩ trình độ …… là …… triệu đồng/tháng.
Z1i 1,Z2i 0 Y i 10,82 6,38 4, 44 thu nhập trung bình của giảng viên cĩ trình độ …… … là …
triệu đồng/tháng.
Z1i 0,Z2i 1 Y i 10,82 2,76 8,06 thu nhập trung bình của giảng viên cĩ trình độ …… … là …
triệu đồng/tháng.
17
c) Nêu ý nghĩa của các hệ số hồi quy
1 10,82
cho biết thu nhập trung bình của giảng viên
cĩ trình độ ………… là ……… triệu đồng/tháng.
2 6, 38
cho biết mức chênh lệch về thu nhập
trung bình giữa ………và ………… là …… triệu
đồng/tháng Nĩi cách khác, thu nhập trung bình của
………cao hơn ………… là ……… triệu đồng/tháng
3 2, 76
cho biết mức chênh lệch về thu nhập trung
bình giữa ……… và ………… là ………triệu
đồng/tháng Nĩi cách khác, thu nhập trung bình của
……… cao hơn ……… là ……… triệu đồng/tháng.
chuẩn để so sánh, ta gọi đặc điểm tiến sĩ là đặc điểm cơ sở.
III Kỹ thuật sử dụng biến giả:
18
Hồi quy với 1 biến định lượng và 1 biến định tính với 2 đặc điểm:
Ta cĩ 1 biến lượng X và ta đặt 1 biến giả Z, trong đĩ
Zi= 0 : đặc điểm 1.
Zi= 1 : đặc điểm 2.
Hoặc ngược lại.
Trang 4Ví dụ 4.3: Khảo sát lương của giáo viên theo
số năm giảng dạy, ta có mô hình
trong đó
Y: lương giáo viên,
X: số năm giảng dạy,
và xem xét yếu tố giới tính có tác động đến
thu nhập không?
Z: giới tính với Z=1: nam; Z=0: nữ.
Y X U
20
TH1: Lương khởi điểm của GV nam và nữ
năm giảng dạynhư nhau.
TH2: Lương khởi điểm là như nhau nhưng
tốc độ tăng lươnglàkhác nhau.
TH3: Lương khởi điểm là khác nhau và tốc
độ tăng lươngcũngkhác nhau
21
TH1: Dịch chuyển số hạng tung độ gốc
Hàm PRF:
Hàm SRF ứng với nữ (Z=0):
Hàm SRF ứng với nam (Z=1):
0
Y X
Y X U
Y X
22
Để xét xem yếu tố giới tính có thực sự ảnh hưởng đến lương của giáo viên hay không thì ta phải tiến hành kiểm định giả thuyết
Ý nghĩa của các hệ số hồi quy: TH2: Dịch chuyển số hạng độ dốc
Hàm PRF:
Hàm SRF ứng với nữ (Z=0):
Hàm SRF ứng với nam (Z=1):
0
Y X
0 1
Y X
Y
Trang 525
Để xét xem yếu tố giới tính có thực sự ảnh hưởng đến
lương của giáo viên hay không thì ta phải tiến hành
kiểm định giả thuyết
26
Ý nghĩa của các hệ số hồi quy:
27
TH3: Dịch chuyển cả số hạng độ dốc và số
hạng tung độ gốc
Khi đó
Hàm PRF:
Hàm SRF ứng với nữ (Z=0):
Hàm SRF ứng với nam (Z=1):
0 10 1
28
Để xét xem yếu tố giới tính có thực sự ảnh hưởng đến lương của giáo viên hay không thì ta phải tiến hành kiểm định giả thuyết
29
Ý nghĩa của các hệ số hồi quy:
30
Trang 6 Hồi quy với 1 biến định lượng và 1 biến định
tính với nhiều hơn 2 đặc điểm:
Ví dụ 4.4: Giả sử chúng ta muốn hồi quy thu
nhập của một giảng viên theo thâm niên và nơi
giảng dạy (thành phố, đồng bằng, miền núi).
Y (triệu đồng/tháng): Thu nhập của giảng viên.
X (năm): Thâm niên giảng dạy.
Z1 = 1: thành phố; Z1 = 0: nơi khác.
Z2 = 1: đồng bằng; Z2 = 0: nơi khác.
Mô hình hồi quy
1 2 1 2 3 1 4 2
E Y X Z Z X Z Z
32
Khi đó, ta có
: Thu nhập trung bình của giảng viên miền núi.
E Y X Z Z X
E Y X Z Z X :Thu
nhập trung bình của giảng viên thành phố.
E Y X Z Z X :Thu nhập trung bình của giảng viên đồng bằng.
IV So sánh cấu trúc:
33
Xem trang …
V Hồi quy tuyến tính từng khúc:
34
Ví dụ 5.6: Doanh thu dưới X* thì tiền hoa hồng
sẽ khác với khi doanh thu trên X*.
Hàm hồi quy có dạng
Y Tiền hoa hồng
X Doanh thu X* Giá trị ngưỡng sản lượng
Zi =1 nếu Xi> X*
Zi =0 nếu Xi≤ X*
*
Y X X X Z U
Y
X
*
X
Hình 5.1 Hàm tuyến tính từng khúc
•Kiểm định giả thiết H: 3=0
Nếu bác bỏ H: hàm hồi quy thay đổi cấu trúc
VI Phân tích mùa:
Y chi tiêu cho tiêu dùng
X thu nhập
Z = 1 nếu quan sát trong mùa (tháng 1-6)
Z = 0 nếu quan sát không nằm trong mùa (tháng 7-12)
i i
Yˆˆ1ˆ2 ˆ3 Yˆi ˆ1ˆ2X iˆ3Z iˆ4X i Z i(*)
TH1: Nếu yếu tố mùa
chỉ ảnh hưởng đến hệ
số chặn
TH1: Nếu yếu tố mùa
chỉ ảnh hưởng đến hệ
số chặn
TH2: Nếu yếu tố
mùa có ảnh hưởng đến hệ số góc
TH2: Nếu yếu tố
mùa có ảnh hưởng đến hệ số góc
Mô hình * có tính tổng quát hơn Qua việc kiểm định giả thiết để biết được hệ số góc nào có ý nghĩa.
Trang 7
: Hai hồi quy là như nhau : Hai hồi quy là khác nhau
H H
SO SÁNH CẤU TRÚC (KIỂM ĐỊNH TÍNH ỔN ĐỊNH CẤU TRÚC)
Giả thiết: Cho số liệu về Y và X giữa hai thời kì (giai đoạn) I và II
Các câu hỏi thường gặp:
-Hai hồi quy giữa hai thời kì cĩ khác nhau khơng?
-Cĩ sự khác nhau về mặt cấu trúc hồi quy giữa hai thời kì (giai đoạn) khơng?
-Cĩ sự khác nhau về biến phụ thuộc Y giữa hai thời kì (giai đoạn) khơng?
PHƯƠNG PHÁP KIỂM ĐỊNH CHOW:
Các bước làm:
Bước 1: Tiến hành hồi quy tồn bộ số liệu, với cỡ mẫu là n quan sát, ta được RSS
Bước 2 (Tiến hành hồi quy từng giai đoạn):
-Giai đoạn I: cĩ n1 quan sát, tiến hành hồi quy trong giai đoạn I, ta được RSS1
-Giai đoạn II: cĩ n2 quan sát, tiến hành hồi quy trong giai đoạn II, ta được RSS2
Chú ý: nn1n2
Bước 3: Đặt giả thiết:
Bước 4: Tính RSS RSS1RSS2
RSS RSS n k F
k RSS
, k là số biến trong mơ hình
Bước 6: Tìm F k n ( , 2 )k (tra bảng phân phối Fisher hoặc đề bài sẽ cho sẵn)
Bước 7 (Kết luận): -Nếu F F k n( , 2 ) k thì ta chấp nhận H
-Nếu F F k n( , 2 ) k thì ta bác bỏ H
PHƯƠNG PHÁP BIẾN GIẢ:
Các bước làm:
Bước 1: Đặt biến giả
Bước 2: Lập bảng số liệu mới gồm
… … … (Lấy tương ứng số liệu cột X nhân với số liệu cột
Z) Tiến hành hồi quy cho bảng số liệu mới: Y theo X, Z, XZ Giả sử, mơ hình cần ước lượng là
3 3
H
H (Dùng kiểm định T hoặc phương pháp p_value)
4 4
H
H (Dùng kiểm định T hoặc phương pháp p_value)
Bước 6 (Kết luận):
3 0 và 4 0
Hai hồi quy là khác nhau
3 0 và 4 0
3 0 và 4 0
3 0 và 4 0 Hai hồi quy là như nhau
Trang 8
: Hai hồi quy là như nhau : Hai hồi quy là khác nhau
H H
1948 0,08 10,0 1957 0,95 17,7
1949 0,20 10,6 1958 0,82 18,6
1950 0,10 11,0 1959 1,04 19,7
1951 0,12 11,9 1960 1,53 21,1
1952 0,41 12,7 1961 1,94 22,8
1953 0,50 13,5 1962 1,75 23,9
1954 0,43 14,3 1963 1,99 25,2 Tiến hành hồi quy Y theo X cho tồn bộ số liệu trên, ta được kết quả
Included observations: 18
C -1,082
X 0,1178
Sum squared resid: 0,5722
Tiến hành hồi quy Y theo X trong thời kì I (từ năm 1946 đến 1954), ta được kết quả
Included observations: 9
C -0,26625
X 0,047
Sum squared resid: 0,1396
Tiến hành hồi quy Y theo X trong thời kì II (từ năm 1955 đến 1963), ta được kết quả
Included observations: 9
C -1,75
X 0,1504
Sum squared resid: 0,1931
Với mức ý nghĩa 5%, cĩ sự khác nhau về mặt cấu trúc hồi quy giữa hai thời kì khơng?
Giải
0, 05
Ta cĩ: RSS ………
RSS 1 ……
RSS 2 ……
RSS RSS RSS ………
RSS RSS n k
F
k RSS
Vì ……… nên ta ……… H và ……… H, nghĩa là………
………
Trang 9Ví dụ 4.6: Số liệu về tiết kiệm (Y) và thu nhập (X) ở nước Anh từ năm 1946 đến 1963 cho ở bảng sau
Thời kì I Y X Thời kì II Y X
1946 0,36 8,8 1955 0,59 15,5
1947 0,21 9,4 1956 0,90 16,7
1948 0,08 10,0 1957 0,95 17,7
1949 0,20 10,6 1958 0,82 18,6
1950 0,10 11,0 1959 1,04 19,7
1951 0,12 11,9 1960 1,53 21,1
1952 0,41 12,7 1961 1,94 22,8
1953 0,50 13,5 1962 1,75 23,9
1954 0,43 14,3 1963 1,99 25,2 Đặt
Lập bảng số liệu mới
Z Y X XZ Z Y X XZ
1 0,36 8,8 8,8 0 0,59 15,5 0
1 0,21 9,4 9,4 0 0,90 16,7 0
1 0,08 10,0 10,0 0 0,95 17,7 0
1 0,20 10,6 10,6 0 0,82 18,6 0
1 0,10 11,0 11,0 0 1,04 19,7 0
1 0,12 11,9 11,9 0 1,53 21,1 0
1 0,41 12,7 12,7 0 1,94 22,8 0
1 0,50 13,5 13,5 0 1,75 23,9 0
1 0,43 14,3 14,3 0 1,99 25,2 0 Tiến hành hồi quy cho bảng số liệu mới: Y theo X, Z, XZ, ta được
Variable Coefficien
t Std Error t-Statistic Prob
C -1.750172 0.331888 -5.273377 0.0001
X 0.150450 0.016286 9.238172 0.0000
Z 1.483923 0.470362 3.154852 0.0070
XZ -0.103422 0.033260 -3.109471 0.0077 Với mức ý nghĩa 5%, cĩ sự khác nhau về mặt cấu trúc hồi quy giữa hai thời kì khơng?
Giải
0, 05
Gọi 3 là hệ số hồi quy của biến Z; 4 là hệ số hồi quy của biến XZ
-Kiểm định giả thiết
3 3
H
H Ta cĩ p value _ nên ta ……… H và
-Kiểm định giả thiết
4 4
H
H Ta cĩ p value _ nên ta ……… H và
……… H, nghĩa là ……… (2)
1: đối với thời kì I
0 : đối với thời kì II
i Z
Trang 10đặt nhà máy (Bắc, Trung, Nam) Bằng kiến thức kinh tế, anh chị hãy
a) Đề xuất mô hình hồi quy các quan hệ trên nhằm so sánh mức lương của Nam so với Nữ và phụ
thuộc và miền Bắc, miền Nam so với miền Trung
b) Nêu ý nghĩa của các hệ số trong mô hình đã đề xuất
Bài 2: Dưới đây là một phần của bảng kết quả khi sử dụng phần mềm Eviews để phân tích số liệu của
một trường đại học về mức lương của giáo sư đại học (Y: ngàn USD/năm), số năm kinh nghiệm giảng dạy (X: năm) và giới tính (nam: Z = 1, nữ: Z = 0) của 15 người
a) Viết hàm hồi quy tuyến tính mẫu của mức lương của giáo sư đại học theo số năm kinh nghiệm giảng
dạy và giới tính Cho biết ý nghĩa của các hệ số hồi quy riêng
b) Với độ tin cậy 96%, tìm khoảng tin cậy của các hệ số hồi quy
c) Với mức ý nghĩa 5%, hãy cho biết giới tính có ảnh hưởng đến mức lương của giáo sư đại học hay
không?
Bài 3: Dưới đây là một phần của bảng kết quả khi sử dụng phần mềm Eviews để phân tích số liệu về
lượng hàng bán được của một sản phẩm Y (tấn/tháng), thu nhập của người tiêu dùng X (triệu đồng/tháng) và nơi bán (thành phố: Z = 1, nông thôn: Z = 0) tại 8 khu vực bán hàng
a) Viết hàm hồi quy tuyến tính mẫu của Y theo X và Z Cho biết ý nghĩa của các hệ số hồi quy riêng b) Tìm các tổng bình phương độ lệch
c) Giả sử, ứng với cùng một thu nhập X = 3 triệu đồng/tháng, hãy cho biết lượng hàng bán được trung
bình ở thành phố và ở nông thôn
d) Với độ tin cậy 95%, tìm khoảng tin cậy của hệ số hồi quy của biến X
e) Có một ý kiến cho rằng: hệ số hồi quy của biến X khác 2 Với mức ý nghĩa 1%, có nên tin vào ý
kiến đó không?
f) Với mức ý nghĩa 5%, hãy cho biết nơi bán có ảnh hưởng đến lượng hàng bán được không?
g) Kiểm định sự phù hợp của hàm hồi quy mẫu với mức ý nghĩa 5%
h) Với mức ý nghĩa 5%, có nên bỏ biến Z ra khỏi mô hình không? Biết rằng mô hình hồi quy tuyến
tính mẫu hai biến của Y theo X có hệ số xác định là 0,90711
Bài 4: Người ta cho rằng chi tiêu mặt hàng A (Y: triệu đồng/tháng) không chỉ phụ thuộc vào thu nhập
của người tiêu dùng (X: triệu đồng/tháng) mà còn phụ thuộc vào giới tính của người tiêu dùng (D = 1 nếu là nam và D = 0 nếu là nữ) Với số liệu một mẫu gồm 20 quan sát, người ta đã ước lượng được mô
Trang 11Bài tập Kinh tế lượng
6, 426 0, 098 2, 453 0, 025 (3,628) (0, 032) (0,988) (0, 011)
Se
a) Nêu ý nghĩa của các hệ số hồi quy
b) Tìm khoảng tin cậy của hệ số hồi quy của biến XD với độ tin cậy 95%
c) Với mức ý nghĩa 5%, chi tiêu về mặt hàng A của nam và nữ có giống nhau hay không?
Bài 5: Xét hàm hồi quy mẫu
Y X Z , trong đó Y là mức chi tiêu cho mặt hàng A (100 ngàn đồng/tháng), X là thu nhập của người tiêu dùng (triệu đồng/tháng), Z là giới tính (Z = 1 nếu là nam và Z = 0 nếu là nữ) Với số liệu một mẫu có kích thước n = 20, người ta tìm được kết quả như sau
2
4,1365 0,5133 0,2053 0,325 ( 4,889) (11,35) (0,557) (2, 42) 0,7485
t R
a) Nêu ý nghĩa của các hệ số hồi quy
b) Kiểm định giả thuyết H:2 0,6 với mức ý nghĩa 5%
c) Tính hệ số xác định mô hình có hiệu chỉnh
d) Kiểm định sự phù hợp của mô hình với mức ý nghĩa 5%
e) Với mức ý nghĩa 5%, chi tiêu về mặt hàng A của nam và nữ có khác nhau hay không?
Bài 6: Cho bảng kết quả sau được xử lý bằng Eviews
trong đó Y là tổng chi phí (USD), X là tổng sản lượng (sản phẩm), Z = 0 nếu 1000X5000 (Phân khúc 1)và Z = 1 nếu 6000X 10000 (Phân khúc 2)
a) Viết phương trình hồi quy tuyến tính mẫu
b) Viết phương trình hồi quy tuyến tính mẫu ứng với mỗi phân khúc
c) Một ý kiến cho rằng khi tổng sản lượng tăng 1 sản phẩm thì tổng chi phí trung bình của phân khúc 2
tăng nhiều hơn tổng chi phí trung bình của phân khúc 1 Với mức ý nghĩa 1%, hãy nhận xét về ý kiến này