Trường hợp các biến định tính chỉ có hai lựa chọn Vậy, β1 là lương trung bình của nhóm điều khiển nhân viên nữ và β2 là khác biệt kỳ vọng của lương trung bình của hai nhóm cho cả tổng th
Trang 1Chương 6: BIẾN ĐỘC LẬP
ĐỊNH TÍNH (HOẶC BIẾN GIẢ)
Prepared by Thanh Thai Economics Faculty - NTU
Trang 2I Hồi qui với biến độc lập đều là
biến định tính.
1 Trường hợp các biến định tính chỉ có hai lựa chọn
Ví dụ, giữa hai ngôi nhà có cùng các đặc trưng, một có hồ bơi trong khi ngôi nhà còn lại không có Tương tự, giữa hai nhân viên của một công ty có cùng tuổi, học vấn, kinh nghiệm, một người là nam và người kia là nữ…
Để phát triển về mặt lý thuết, chúng ta lấy ví dụ về lương và đặt
Yi là tiền lương hàng tháng của nhân viên thứ i trong công ty Để đơn giản về mặt sư phạm, ở đây chúng ta bỏ qua các biến khác có ảnh hưởng đến lương và chỉ tập trung vào giới tính Vì biến giới tính không phải là một biến định lượng một cách trực tiếp được nên chúng ta định nghĩa một biến giả gọi là D (Dummy variables), biến giả này là biến nhị nguyên chỉ nhận giá trị 1 với nam nhân viên và 0 với nữ nhân viên Lưu ý là cách định nghĩa này là hoàn toàn ngẫu nhiên Nhóm mà giá trị D bằng 0 gọi là nhóm điều khiển (Control group)
Trang 3Đối với nam: (6.2)
1 Trường hợp các biến định tính chỉ có hai lựa chọn
Chúng ta giả sử là sai số ngẫu nhiên thỏa mãn các giả thiết của
mô hình hồi qui tuyến tính cổ điển Chúng ta có thể lấy kỳ vọng có
điều kiện của Y với D cho trước và được các phương trình sau:
Đối với nữ: (6.3)
1
Trang 4I Hồi qui với biến độc lập đều là
biến định tính.
1 Trường hợp các biến định tính chỉ có hai lựa chọn
Vậy, β1 là lương trung bình của nhóm điều khiển (nhân viên nữ)
và β2 là khác biệt kỳ vọng của lương trung bình của hai nhóm cho cả tổng thể (chênh lệch về lương trung bình của một nhân viên nam so với nhân viên nữ)
Để xét xem giữa hai nhân viên có sự phân biệt về giới hay không
ta tiến hành kiểm định giả thiết H0: β2=0 và H1:β2 ≠ 0 Kiểm định thích hợp là kiểm định t với bậc tự do df = n-2
Lưu ý: Thủ tục ước lượng phương trình (6.1) được tiến hành bình thường như những mô hình ở các chương trước bằng phương pháp OLS.
Trang 5I Hồi qui với biến độc lập đều là
từ 25 đến 55 và trên 55), chúng ta xem xét biến định tính "nhóm tuổi của chủ hộ" như thế nào? Thủ tục ở đây là chọn một trong những nhóm này làm nhóm kiểm soát và xác định các biến giả cho hai nhóm còn lại Cụ thể hơn, chúng ta định nghĩa:
Trang 6I Hồi qui với biến độc lập đều là
biến định tính.
2 Trường hợp các biến định tính có nhiều hơn hai lựa chọn
Nhóm điều khiển là nhóm mà cả D1i và D2i đều bằng 0, có nghĩa
là tất cả những hộ gia đình mà chủ hộ dưới 25 tuổi Một mô hình đơn
giản mô tả quan hệ giữa tiền tiết kiệm và nhóm tuổi như sau:
1 nếu chủ hộ từ 25 đến 55 tuổi
0 nếu chủ hộ thuộc nhóm tuổi khác
D1i=
1 nếu chủ hộ trên 55 tuổi
0 nếu chủ hộ thuộc nhóm tuổi khác
D2i=
Trang 7I Hồi qui với biến độc lập đều là
Đối với hộ gia đình dưới 25 tuổi: (6.4)E Y D ( / 1i = D2i = = 0) β1
Đối với hộ gia đình từ 25 đến 55 tuổi:
Trang 8Như vậy, (6.4) cho chúng ta biết tiền tiết kiệm trung bình một tháng của một hộ gia đình mà chủ hộ dưới 25 tuổi Tương tự, (6.5) cho chúng ta biết tiền tiết kiệm trung bình một tháng của một hộ gia đình mà chủ hộ từ 25 đến 55 tuổi và (6.6) cho chúng ta biết tiền tiết kiệm trung bình một tháng của một hộ gia đình mà chủ hộ trên 55 tuổi.
I Hồi qui với biến độc lập đều là
biến định tính.
- β2 biểu thị chênh lệch về tiền tiết kiệm trung bình một tháng của một hộ gia đình mà chủ hộ thuộc nhóm tuổi từ 25 đến 55 tuổi so với nhóm tuổi dưới 25
- β3 biểu thị chênh lệch về tiền tiết kiệm trung bình một tháng của một hộ gia đình mà chủ hộ thuộc nhóm tuổi trên 55 so với nhóm tuổi dưới 25
Chú ý: Để tránh trường hợp bẫy biến giả (dummy variables trap), số các biến giả luôn luôn ít hơn một biến so với số các lựa chọn.
Trang 9II Hồi qui với các biến độc lập định
lượng và các biến định tính.
1 Trường hợp có một biến định tính với 2 lựa chọn:
Bước tiếp theo trong phân tích là thêm các biến độc lập có thể định lượng được Để minh họa, ta lấy lại ví dụ về tiền lương ở trên
- Đặt Yi : là tiền lương hàng tháng của nhân viên thứ i
- Gọi Xi : là kinh nghiệm của nhân viên thứ i
- Với Di =1 : nhân viên nam
- Với Di =0 : nhân viên nữ Bây giờ, ta bỏ qua yếu tố giới tính, chỉ xét mối quan hệ giữa tiền
lương hàng tháng và kinh nghiêm, một mô hình hồi quy đơn cho quan hệ
Trang 10II Hồi qui với các biến độc lập định
lượng và các biến định tính.
1 Trường hợp có một biến định tính với 2 lựa chọn:
Lưu ý là bây giờ ta có thể kiểm soát được kinh nghiệm và có thể hỏi "Giữa hai nhân viên có cùng kinh nghiệm, có sự khác biệt trong tiền
lương tháng do giới tính không?" Một cách đơn giản để trả lời câu hỏi
này là đặt tung độ gốc β1 trong phương trình (6.7) khác nhau đối với nam
và nữ Thực hiện việc này bằng cách giả sử là: β1 = β3 + β4Di và thay
vào (6.7) ta có mô hình kinh tế lượng:
Trang 11II Hồi qui với các biến độc lập định
Trang 122 Trường hợp có một biến định tính với
nhiều hơn 2 lựa chọn:
II Hồi qui với các biến độc lập định
lượng và các biến định tính.
Lấy lại ví dụ về tiền tiết kiệm của các hộ gia đình ở trên, bây giờ ta
thêm một biến định lượng vào mô hình đó là thu nhập của họ (được ký
hiệu là X).Từ đó, chúng ta có thể xây dựng một mô hình kinh tế lượng
như sau:
Y = β + β β β D + D + + X U
Giả sử mô hình thỏa mãn các giả thiết của mô hình hồi qui tuyến tính
cổ điển Chúng ta lấy kỳ vọng có điều kiện của Y với điều kiện đã cho
của thu nhập X và của các biến D cho trước ta được các mô hình sau:
Trang 132 Trường hợp có một biến định tính với
nhiều hơn 2 lựa chọn:
II Hồi qui với các biến độc lập định
lượng và các biến định tính.
Đối với hộ gia đình dưới 25 tuổi:
(6.11)1 2 1 4
Trang 142 Trường hợp có một biến định tính với nhiều hơn 2 lựa chọn:
II Hồi qui với các biến độc lập định
lượng và các biến định tính.
Một số giả thuyết rất thú vị Để kiểm định giả thuyết gia đình ở nhóm tuổi cao hơn có hành vi giống gia đình ở nhóm tuổi trẻ hơn, chúng ta đơn giản chỉ tiến hành kiểm định t đối với các hệ
số β2 hoặc β3 bằng 0 Để kiểm định giả thuyết "không có sự khác biệt
trong hàm tiết kiệm theo độ tuổi", giả thuyết là H0: β2=β3=0 và giả thuyết đối là H1: ít nhất một trong các hệ số khác không Giả thuyết này
được kiểm định bằng kiểm định Wald Hoặc để kiểm định giả thuyết
"không có sự khác biệt trong hành vi giữa hai nhóm tuổi trung niên và cao tuổi", nghĩa là β2=β3 Giả thuyết này có thể được kiểm định bằng nhiều phương pháp khác nhau
Trang 153 Trường hợp có nhiều hơn một biến định tính.
II Hồi qui với các biến độc lập định
lượng và các biến định tính.
Phân tích biến giả dễ dàng mở rộng cho trường hợp trong đó có nhiều biến định tính Để minh họa, hãy xem xét hàm tiết kiệm được mô tả trước đây, trong đó Y là tiền tiết kiệm của hộ gia đình
và X là thu nhập của hộ gia đình Có thể đưa ra giả thuyết là ngoài tuổi của chủ hộ, các yếu tố khác như sở hữu nhà, trình độ học vấn, tình trạng nghề nghiệp, cũng là các yếu tố xác định tiết kiệm của hộ gia đình
Giả sử ta có thông tin là chủ hộ có trình độ sau đại học, có trình độ đại học, chỉ tốt nghiệp trung học; Chủ hộ có thể làm một trong những nghề sau: quản lý, công nhân lành nghề, công nhân không có tay nghề, thư ký, kinh doanh tự do Cũng tương tự, ta không biết chính xác tuổi của chủ hộ nhưng biết được ông/bà ta thuộc nhóm tuổi nào,…
Trang 163 Trường hợp có nhiều hơn một biến định tính.
II Hồi qui với các biến độc lập định
Trang 173 Trường hợp có nhiều hơn một biến định tính.
II Hồi qui với các biến độc lập định
lượng và các biến định tính.
1 nếu chủ hộ từ 25 đến 55 tuổi
0 nếu chủ hộ thuộc nhóm tuổi khác
D1i=
1 nếu chủ hộ trên 55 tuổi
0 nếu chủ hộ thuộc nhóm tuổi khác
D2i=
1 nếu chủ hộ sở hữu căn nhà
0 nếu điều kiện khác
D3i=
Trang 183 Trường hợp có nhiều hơn một biến định tính.
II Hồi qui với các biến độc lập định
Trang 193 Trường hợp có nhiều hơn một biến định tính.
II Hồi qui với các biến độc lập định
lượng và các biến định tính.
1 nếu chủ hộ là nhà quản lý
0 nếu điều kiện khác
D6i =
1 nếu chủ hộ là công nhân lành nghề
0 nếu điều kiện khác
D7i =
Trang 203 Trường hợp có nhiều hơn một biến định tính.
II Hồi qui với các biến độc lập định
lượng và các biến định tính.
1 nếu chủ hộ là thư ký
0 nếu điều kiện khác
D8i =
1 nếu chủ hộ kinh doanh tự do
0 nếu điều kiện khác
D9i =
Trang 213 Trường hợp có nhiều hơn một biến định tính.
II Hồi qui với các biến độc lập định
Nên lưu ý là đặc điểm của nhóm điều khiển như sau: chủ hộ có
độ tuổi dưới 25, là công nhân không có tay nghề, với trình độ học vấn
chỉ ở bậc trung học và không sở hữu nhà Một cách rất dễ dàng, chúng ta
cũng có thể ước lượng mô hình trên và tính được tiền tiết kiệm trung
bình của một hộ gia đình với những điều kiện của biến X và các biến D
cho trước và nêu ý nghĩa của nó
Trang 22III Sử dụng biến giả trong phân
tích mùa.
Như chúng ta đều biết, nhiều chuỗi thời gian trong kinh tế cũng như trong các lĩnh vực khác có tính chất mùa vụ rõ rệt Một ví dụ về việc sự dụng biến giả xuất hiện trong ước lượng tác động mùa của các biến độc lập Chúng ta xem xét quan hệ E = α + βT +U, đây là quan hệ giữa việc tiêu thụ điện năng và nhiệt độ Trong mùa hè khi nhiệt độ tăng, nhu cầu máy lạnh sẽ đẩy việc tiêu thụ điện năng lên cao Do vậy, chúng ta kỳ vọng β có dấu dương, cho ra một quan hệ dương giữa E và
T Tuy nhiên, vào mùa đông khi nhiệt độ tăng nhu cầu cho việc sưởi ấm nhà thấp hơn và từ đó chúng ta mong đợi β có dấu âm về mùa đông, cho ra quan hệ âm giữa E và T Bằng cách nào chúng ta có thể ghi nhận tác động mùa lên E của biến định tính "mùa" có bốn loại: xuân, hạ, thu
và đông? Việc này được thực hiện bằng cách sử dụng 3 biến giả được gọi là biến giả theo mùa Mùa thu được sử dụng làm mùa điều khiển:
Trang 23III Sử dụng biến giả trong phân
Trang 24III Sử dụng biến giả trong phân
Trang 25IV Kiểm định sự thay đổi về
cấu trúc.
Mối quan hệ giữa biến phụ thuộc và các biến độc lập
có thể có một sự thay đổi về mặt cấu trúc (còn được gọi là sự bất ổn định về cấu trúc hay những gián đoạn về cấu trúc), có nghĩa là, mối quan hệ giữa biến phụ thuộc và các biến độc lập
có thể thay đổi từ thời đoạn này sang thời đoạn khác Sự thay đổi đó thể hiện ở sự khác nhau giữa hệ số độ dốc, hệ số tung
độ gốc hoặc cả hai Để tìm hiểu vấn đề này chúng ta xét ví dụ sau:
Số liệu tiết kiệm (Y) và thu nhập cá nhân (X) ở nước Anh từ năm 1946 đến năm 1963 cho ở bảng sau (đơn vị tính: triệu pound)
Trang 26IV Kiểm định sự thay đổi về
Trang 27Có 4 khả năng xảy ra đối với hai hồi quy trên:
IV Kiểm định sự thay đổi về
cấu trúc.
Giả sử chúng ta muốn biết mối quan hệ giữa tiết kiệm (Y) và thu nhập (X) có thay đổi giữa hai thời kỳ hay không Ta xét các hàm hồi quy ứng với từng thời kỳ như sau:
Thời kỳ I: Yi = α1 + α2Xi + U1i (i=1,2, ,n1) (6.15a)
X
Trang 28IV Kiểm định sự thay đổi về
X
Trang 29IV Kiểm định sự thay đổi về
Bước 1: Chia mẫu gồm n quan sát thành hai nhóm - nhóm 1 gồm
n1 quan sát đầu tiên và nhóm 2 gồm những quan sát còn lại n2 = n - n1 Ước lượng mô hình một cách riêng biệt (với k hệ số hồi quy) đối với từng nhóm một (hàm hồi quy 6.15a và 6.15b) và tính toán tổng bình phương các phần dư tương ứng với từng mô hình (6.15a) và (6.15b) lần lượt là RSS1 với bậc tự do d.f là n1-k và RSS2 với bậc tự do d.f là
n2 - k
Đặt: RSS = RSS1 + RSS2 với bậc tự do d.f là n1 - k + n2 - k = n - 2k
Trang 30IV Kiểm định sự thay đổi về
cấu trúc.
1 Phương pháp kiểm định dựa trên việc chia cắt mẫu
(Kiểm định Chow)
Bước 2: Bây giờ ta ước lượng mô hình lần nữa nhưng với
chung cả mẫu gồm n quan sát Giả sử mô hình hồi quy đó như sau: Yi = β1 + β2Xi + Ui (6.16) Sau khi ước lượng xong ta thu được tổng bình phương các phần dư là RSS với số bậc tự do
là n - k = n1 + n2 - k (trong đó k là số tham số được ước lượng, đối với
Trang 31Giả thuyết chúng ta cần kiểm định là H0: "không có sự thay đổi về cấu trúc" và giả thuyết đối là H1: "có sự thay đổi cấu trúc" Để kiểm định giả thuyết trên chúng ta tính Fc và so sánh với giá trị tới hạn ở mức ý nghĩa α là Fα(k, n1+n2-2k) Nếu Fc lớn hơn Fα(k, n1+n2-2k) thì bác bỏ giả thuyết H0 cho rằng “không có sự thay đổi về cấu trúc”, ngược lại thì không bác bỏ giả thuyết H0 Một giả thuyết quan trọng đằng sau kiểm định này là phương sai sai số của hai mẫu là như nhau.
IV Kiểm định sự thay đổi về
cấu trúc.
1 Phương pháp kiểm định dựa trên việc chia cắt mẫu
(Kiểm định Chow)
Trang 32IV Kiểm định sự thay đổi về
cấu trúc.
2 Phương pháp biến giả.
Kiểm định sự thay đổi về cấu trúc cũng có thể thực hiện bằng cách sử dụng kỹ thuật biến giả được giới thiệu trong chương này Phương pháp này được minh họa ở đây cho ví dụ về tiết kiệm và thu nhập ở Anh giai đoạn từ 1946 đến 1963
Mô hình cơ bản là:
Yi = α + βXi + Ui (6.17)Bây giờ chúng ta định nghĩa một biến giả như sau:
1 đối với thời kỳ I
0 đối với thời kỳ II
Di=
Trang 33IV Kiểm định sự thay đổi về
cấu trúc.
2 Phương pháp biến giả.
Để kiểm định xem cấu trúc cho hai thời kỳ có khác nhau không, đặc trưng mẫu phải được giả sử như sau:
α = α1 + α2Di và β = β1 + β2Di thay thế những thông số này vào phương trình (6.17), chúng ta có được mô hình như sau:
Yi = α1 + α2Di + β1Xi + β2DiXi + Ui (6.18)
Để ước lượng mô hình (6.18) trước tiên chúng ta tạo một biến mới Zi
= DiXi Kế đến chúng ta hồi quy Y theo một hằng số, Di, Xi, và Zi
Trang 34IV Kiểm định sự thay đổi về
cấu trúc.
2 Phương pháp biến giả.
Chúng ta giả thuyết rằng mô hình (6.18) thỏa mãn các giả thuyết của mô hình hồi quy tuyến tính cổ điển, ta lấy kỳ vọng hai vế của phương trình (6.18) với điều kiện Xi và Di cho trước ta được các
mô hình cho hai thời kỳ như sau:
Đối với thời kỳ II: E(Y/Xi , Di = 0) = α1 + β1Xi (6.19a)
Đối với thời kỳ I: E(Y/Xi , Di = 1) = (α1 + α2) + (β1 + β2)Xi (6.19b)
Mô hình (6.19a) cho biết tiền tiết kiệm trung bình ở thời kỳ I và
mô hình (6.19b) cho biết tiền tiết kiệm trung bình ở thời kỳ II
Trang 35IV Kiểm định sự thay đổi về
cấu trúc.
2 Phương pháp biến giả.
Bằng cách so sánh hai mô hình (6.19a) và (6.19b) ta có thể kiểm định một loạt các giả thuyết khác nhau Chẳng hạn như, giả thuyết rằng α2 = β2 = 0 cho thấy không có sự thay đổi cấu trúc nào Một kiểm định t đối với giả thuyết β2 = 0 sẽ cho ta biết có sự thay đổi
về cấu trúc ở hệ số góc giữa hai thời kỳ hay không Và một kiểm định t với giả thuyết α2 = 0 sẽ cho ta biết có sự thay đổi về cấu trúc ở hệ số tung độ gốc giữa hai thời kỳ hay không Rõ ràng phương pháp dùng biến giả có một thuận lợi hơn so với việc chia cắt mẫu Nói cách khác, chúng ta có thể kiểm định nếu chúng ta mong muốn như vậy, chỉ một vài hệ số hồi quy đối với thay đổi về cấu trúc hơn là quan hệ toàn bộ