Các biến độc lập Xi trong các mô hình đã nghiên cứu thông thường là những biến định lượng, giá trị quan sát là những con số Tuy nhiên có những trường hợp các biến độc lập này là những bi
Trang 1HỒI QUY VỚI
BIẾN GIẢ
Chương 4
Trang 2Các biến độc lập Xi trong các mô hình đã nghiên cứu thông thường là những biến định lượng, giá trị quan sát là những con số
Tuy nhiên có những trường hợp các biến độc lập này là những biến định tính.
Ví dụ : Thu nhập, chi tiêu, chi phí, doanh thu v.v
Ví dụ : tốt – xấu, cao – thấp, nhanh – chậm…
Trang 3I BẢN CHẤT CỦA BIẾN GIẢ
Biến định tính thường biểu thị có hay không có một tính chất hoặc là các mức độ khác nhau của một tiêu thức thuộc tính nào đó
Ví dụ : giới tính (nam hay nữ), tôn giáo, dân tộc, nơi sinh, hình thức sở hữu, ngành nghề kinh doanh v.v…
Để lượng hoá các biến định tính, trong phân tích hồi quy người ta dùng biến giả (dummy variables)
Trang 4Ví dụ, giữa hai ngôi nhà có cùng các đặc trưng, một có
hồ bơi trong khi ngôi nhà còn lại không có
1 Trường hợp các biến định tính chỉ có hai lựa chọn
Tương tự, giữa hai nhân viên của một công ty có cùng tuổi, học vấn, kinh nghiệm, một người là nam
và người kia là nữ…
II Hồi qui với biến độc lập đều là
biến định tính.
Trang 5 Lấy ví dụ về lương và đặt Yi là tiền lương hàng tháng của nhân viên thứ i trong công ty Để đơn giản, ở đây chúng ta bỏ qua các biến khác có ảnh hưởng đến lương và chỉ tập trung vào giới tính
1 Trường hợp các biến định tính chỉ có hai lựa chọn
Vì biến giới tính không phải là một biến định lượng một cách trực tiếp được nên chúng ta định nghĩa một biến giả gọi là D (Dummy variables)
II Hồi qui với biến độc lập đều là
biến định tính.
Trang 61 Trường hợp các biến định tính chỉ có hai lựa chọn
Lưu ý là cách định nghĩa này là hoàn toàn ngẫu nhiên Nhóm mà giá trị D bằng 0 gọi là nhóm điều khiển (Control group)
Biến giả này là biến nhị nguyên chỉ nhận giá trị 1 với nam nhân viên và 0 với nữ nhân viên
Bây giờ chúng ta sẽ thiết lập và ước lượng một mô hình sử dụng biến giả như một biến giải thích Dạng đơn giản nhất của mô hình như sau:
II Hồi qui với biến độc lập đều là
biến định tính.
Trang 7II Hồi qui với biến độc lập đều là
biến định tính.
1 Trường hợp các biến định tính chỉ có hai lựa chọn
i i
Tạm thời bỏ qua sai số Ui
Trang 8II Hồi qui với biến độc lập đều là
biến định tính.
1 Trường hợp các biến định tính chỉ có hai lựa chọn
1 là lương trung bình của nhóm điều khiển
(nhân viên nữ)
Lưu ý: Thủ tục ước lượng phương trình hồi quy được tiến hành bình thường như những mô hình
ở các chương trước bằng phương pháp OLS.
2 là chênh lệch về lương trung bình của
một nhân viên nam so với nhân viên nữ.
Trang 9Để xét xem giữa hai nhân viên có
sự phân biệt về giới hay không ta tiến
hành kiểm định giả thiết
Trang 10II Hồi qui với biến độc lập đều là
Chú ý: số các biến giả luôn luôn ít hơn một biến so với số các lựa chọn.
Trang 11Nếu chúng ta có tuổi chính xác của người chủ hộ, biến
này có thể đưa vào mô hình như là biến định lượng
II Hồi qui với biến độc lập đều là
biến định tính.
2 Trường hợp các biến định tính có nhiều hơn
hai lựa chọn
Tuy nhiên, nếu chúng ta chỉ có nhóm tuổi (ví dụ người
chủ hộ thuộc nhóm tuổi dưới 25, từ 25 đến 55 và trên 55), chúng ta sẽ có biến định tính "nhóm tuổi của chủ hộ” có 3 lựa chọn
Trang 12II Hồi qui với biến độc lập đều
D Nếu chủ hộ trên 55 tuổi
Nếu chủ hộ thuộc nhóm tuổi khác
Trang 13II Hồi qui với biến độc lập đều
i
Y 1 2 2 3 3
Trang 14Đối với hộ gia đình dưới 25 tuổi
Đối với hộ gia đình từ 25 đến 55 tuổi:
Đối với hộ gia đình trên 55 tuổi
Trang 15II Hồi qui với biến độc lập đều
là biến định tính.
2 Trường hợp các biến định tính có nhiều hơn
hai lựa chọn
Như vậy, 1 cho chúng ta biết tiền tiết kiệm trung bình
một tháng của một hộ gia đình mà chủ hộ dưới 25 tuổi
2 biểu thị chênh lệch về tiền tiết kiệm trung bình một
tháng của một hộ gia đình mà chủ hộ thuộc nhóm tuổi từ
25 đến 55 tuổi so với nhóm tuổi dưới 25
3 biểu thị chênh lệch về tiền tiết kiệm trung bình một
tháng của một hộ gia đình mà chủ hộ thuộc nhóm tuổi
trên 55 so với nhóm tuổi dưới 25
Trang 16II Hồi qui với biến độc lập định
lượng và định tính.
1 Trường hợp có một biến định tính với 2 lựa chọn:
Bước tiếp theo trong phân tích là thêm các biến độc lập có thể định lượng được Để minh họa, ta lấy lại ví dụ về tiền lương ở trên.
• Đặt Yi : là tiền lương hàng tháng của nhân viên thứ i.
• Gọi Xi : là kinh nghiệm của nhân viên thứ I
• Với Di =1 : nhân viên nam
• Với Di =0 : nhân viên nữ Nếu bỏ qua yếu tố giới tính, chỉ xét mối quan hệ giữa tiền lương hàng tháng và kinh nghiệm, một mô hình hồi quy đơn cho quan hệ này là:
i i
Y 1 2
Trang 17Lúc này, câu hỏi đặt ra là :"Giữa hai nhân viên có
cùng kinh nghiệm, có sự khác biệt trong tiền lương tháng do giới tính không?"
1 Trường hợp có một biến định tính với 2 lựa chọn:
Khi đó, nếu tính đến biến giả , mô hình sẽ trở thành
i i
Trang 18II Hồi qui với các biến độc lập định
lượng và các biến định tính.
1 Trường hợp có một biến định tính với 2 lựa chọn:
Đối với Nữ Yi 1 3 X i
Đối với Nam Yi ( 1 2 ) 3 Xi
Một giả thiết tự nhiên cần kiểm định là "không có sự khác biệt trong quan hệ giữa hai nhóm"
Vì vậy, chúng ta kiểm định giả thiết
H0: 2 =0
H1: 2 0 Kiểm định t với bậc tự do n-3
Trang 19II Hồi qui với các biến độc lập định
Trang 20II Hồi qui với các biến độc lập định
lượng và các biến định tính.
3 Trường hợp có nhiều hơn một biến định tính.
Chúng ta có thể xác định số biến giả được đưa vào mô hình như sau:
1
( 1)
k
i i
Trang 21Ví dụ minh hoạ
Bảng dưới đây là số liệu giả thiết về mức lương giáo sư đại học (Y), số năm kinh nghiệm giảng dạy (X) và giới tính (Di=1:nam; Di=0:nữ)
Y i X i D i 23,0 11 1 19,5 9 0 24,0 10 1 21,0 12 0 25,0 13 1 22,0 12 0 26,5 14 1 23,1 14 0
Y i X i D i 25,0 15 0 28,0 15 1 29,5 16 1 26,0 16 0 27,5 17 0 31,5 18 1 29,0 18 0
Trang 22Ví dụ minh hoạ
1) Tìm hàm hồi quy
2) Giới tính có ảnh hưởng đến mức lương của giáo
sư đại học hay không ?
3) Dự báo mức lương của một giáo sư nam có số năm kinh nghiệm giảng dạy là 17 năm với độ tin cậy 95%
4) Dự báo mức lương của một giáo sư nữ có số năm kinh nghiệm giảng dạy là 19 năm với độ tin cậy 95%