Trong rất nhiều hàm hồi quy, người ta đưa vào biến giải
thích mà nó được tạo bởi sự kết hợp của một vài yếu tế khác nhau. Ví dụ, trong nghiên cứu vĩ mô về tăng trưởng theo mô hình Solow, người fa sử dụng hàm mô tả sau:
123
Nhóm công nhân là nữ giới:
E(WAGE | MALE = 0) = + 8,SCHOOL + B,EXPER (5.9)
Như ta thấy, hệ số ứ, thể hiện sự khỏc biệt về tiền lương
trung bình giữa hai cá nhân có cùng số năm học (SCHOOL) va số năm lam viée (EXPER), nhưng khác nhau về bằng cấp. Kết quả ước lượng ở ví dụ 5.1 cho thấy By =1.47, và hệ số này là có
ý nghĩa. Điều đó thể hiện rằng, có sự khác biệt thực sự về tiền
lương trung bình theo giới. Sự chênh lệch về tiền lương trung
bình đó được biểu diễn ở đề thị 5.2 bên dưới.
Một cách khác để mô tả sự khác biệt về bậc lương trung -_ bình theo giới tính là như sau: Đặt FƑ#MALE = 1, nếu cá nhân đó là nữ và bằng 0, nếu là nam. Vì vay, FEMALE =1-MALE. Khi
đó, phương trình xác định tiền lương được viết lại dưới dang:
WAGE = B; + BayMALE + BopREMALE + B3SCHOOL + B,EXPER + ¢
(5.10) Do vậy, sự khác biệt về lương theo giới tính sẽ là:
8; = Pau — Bop ˆ
Mặc dù xem ra có vẻ trực quan, cách làm này khiến ta bị rơi
vào cái gọi là “bay phan loai” (dummy trap). Van dé 1a trong phương trình hồi quy (5.10), ta thấy: MALE+FEMALE = 1. Tức là, Biến giải thích đi kèm với 2, được biểu diễn tuyến tính qua
—=các biến giải thích đi kèm với”; „- Bi, Tie la hang cia ma ~
trận các biến giải thích bằng zero. Hay chúng ta vi phạm giả thuyết A5 của mô hình hồi quy. Và do đó, việc ước lượng được
các tham số hồi quy là không khả thi (Xem lại Chương III về giả
thuyết A5). Như sẽ nêu trong chương tiếp sau, điều đó dẫn đến
đa công tuyén tuyét d6i (perfect multicollinearity). Vi vay, 48 tranh dummy trap, đối với hai nhóm đối tượng, ta chỉ sử dụng một biến giả mà thôi.
126
WAGE
SCHOOL Đồ thị 5.2. Tiên lương trung bình theo số năm học phổ thông
(số năm làm việc được giữ nguyên, không đổi) 4.2. Trường hợp có nhiều nhóm đối tượng
Khi có nhiều hơn hai nhóm đối tượng, ta cần nhiều hơn số
biên giả đê đánh giá sự khác biệt về bậc giữa các nhóm đó.
Chẳng hạn như trong ví dụ 5. 1, thay vì giới, ta quan tâm đến sự khác biệt về học vấn:
WAGE = B, + 8,EDU + 8,EXPER +e (511) Trong đó, EDU 1a bién về trình độ học vấn, được chia thành
4 nhóm: cao đẳng: đại học (ký hiệu là BA); có bằng MBA; va tiến sĩ (PhD). Một cách làm giản đơn là ta chỉ dùng một biến
EDU, mà nó nhận các giá trị 0 đối với nhóm thứ nhất, bằng 1 đối với nhóm thứ hai, bằng 2 đối với nhóm thứ ba, bằng 3 đối với
nhóm cuối cùng. Nhưng với cách tiếp cận như vậy, ta đã mặc nhiên coi rằng, sự khác biệt về bậc lương theo trình độ học vẫn là như nhau ở mọi cấp. Rõ ràng, đòi hỏi như vậy không phải lúc nào cũng phù hợp với thực tế. Cách tiếp cận linh hoạt hơn là tách ZDU thành 3 biến giả như sau:
WAGE = ủ\ + 8;yBA + 8;u BA + 8;,PhD + 8, EÄXPER +e (5.12) Sự tương ứng về bậc lương ứng với từng cấp học vấn sẽ là:
127
Cao ding: WAGE = ỉ, + ỉ,EXPER Daihoc: WAGE = 6, + B,, + B,EXPER Thạc sĩ: WAGE = B, + Bay + B,EXPER
Tiénsi: WAGE=£, + Bp + B,EXPER
Ta muốn nhẫn mạnh lại rằng, ở đây ta chỉ sử dụng có 3 biến giả (dummy) cho 4 nhóm đối tượng khác nhau để tránh dummy trap.
4.3. Khác biệt về hệ số góc
Ngoài việc đánh giá sự chênh lệch về tiền lương trung bình
giữa các nhóm đối tượng khác nhau về giới. Trong ví dụ 5.1,
biến giả còn có thể được sử dụng để đánh giá sự khác biệt về tác
động riêng phần của số năm công tác (ZXPER) lên tiền lương.
Cụ thể, ta viết lại phương trình hồi quy trong ví dụ 5.Í như sau:
WAGE = Bị + B„MALE + PaSCHOOL+ f„EXPER + BsEXPER * RANK +
Trong đó, biến giả ®ANK = 1 nếu đó là công nhân bậc cao, và RANK = 0, nếu đó là công nhân bậc thấp. Vì vậy:
Đối với nhóm công nhân bậc cao:
E(WAGE| RANK =1) = B, + 8,MALE + B,SCHOOL +(f, + B,)EXPER
Đối với nhóm công nhân bậc thấp:
E(WAGE| RANK =0) = ủ, + 0,MALE + B,SCHOOL + B,EXPER
Như vậy, nếu cá nhân là việc công nhân bậc cao, thì việc có
thêm một năm kinh nghiệm, về trung bình, tiền lương sẽ tăng
vào khoảng (Z,+ Z2„). Nếu cá nhân là công nhân bậc thấp, thì thêm một năm kinh nghiệm sẽ hưởng thêm về tiền lương là /,.
Vi vay, Bs đo lường sự khác biệt về tác động riêng phần của số 128
năm công tác lên tiền lương, với giả thuyết là các yêu tố khác là không đổi. Dưới đây là đồ thị biểu diễn sự chênh lệch đó:
WAGE
A
EXPER Dé thi 5.3. Ti Tần lương trung bình theo SỐ năm công tác,
suc dung dummy variable 4.4. Phân tích ảnh hướng của tính mùa
Việc sử dụng biến giả đặc biệt hữu hiệu trong những, phân tích có tính mùa. Hãy xem lại ví dụ về tiêu thụ điện của hộ gia đình ở Mỹ theo nhiệt độ khí hậu. Vào mùa hè, khi nhiệt độ nóng lên, nhu cầu dùng điều hòa, quạt đây mức tiêu thụ điện tăng. Vì . . vậy, chúng ta kỳ vọng hệ số / mang dâu dương. Nhưng vào
mùa đông, khi nhiệt độ â ấm lên, ta kỳ vọng như cầu tiêu thụ điện cho lò sưởi giảm đi. Vì vậy, dấu của / sẽ là âm. Để đánh giá được những ảnh hưởng mang tính mùa của khí hậu tới nhu cầu tiêu thụ điện, ta sử đụng các biến giả như sau: o, nhận giá trị bằng 1, nếu là mùa đông, và 0 nếu vào mùa khác. Tương tự, D, nhận giá trị bằng 1, nếu là mùa xuân, và 0 nếu vào mùa khác;
vaD, nhan giá trị bằng 1, nếu là mùa hè, và 0 vào các mùa còn lại.
Nhớ lại rằng, mụ hỡnh ban đầu cú đạng: # = z+ ỉ7 +Ê.
By giờ, hãy đặc @=a,D,+ a,D,+0,D, và
8=ð,é,+,D, + ủ;D,. Dạng hàm mụ tả đầy đủ tỏc động của nhiệt độ theo mùa tới nhu cầu tiêu thụ điện được viết lại như sau:
129
E=ay taD,+a,D, tơ,D, + 8T +,DT+8,D,T+0,ÐT+e
Vi vậy, ứng với từng mùa, nhu cầu tiêu thụ điện được ước lượng như sau:
a A
Mùa thu: E= aot BoP
Mùa đông: E= (0+ a) + Bo* By \T Mùa xuân: E= (20+ a2)+ Bot By yr
Mùa hè: E =(co+a)+(Bot+ BaT
Như chúng ta đã thấy, việc sử dụng biển giả cho phép thể hiện được các quy luật mang tính rùa một cách khá linh hoạt.
BÀI TẬP CÓ LỜI GIẢI
1. Với hàm hồi quy: SUB = -562.676 - 1.558AGE + 0.139AGE2 + 17305AIR - 1418AIR” + 011IIY - 595% ¥ + 0.496HOME + ứ
Với R? = 0.9425; ESS = 2521.934; n = 40. /
a. Kiểm định sự phù hợp của mô hình với mức ý nghĩa 5%.
b. Hãy cho biết tác động biên, hệ số co giãn của SUB theo các biến có ở trong mô hình (nếu tác động biên, hệ số co giãn phụ thuộc vào một biến giải thích khác, hay tinh tác động biên, hệ sô co giãn này này ở giá trị trung bình
c—e~ela-các-biến); biết:4GE'=8,57; 4TR-= 6;38,-P-—9209;68;=—