Chúng ta cũng sẽ chì ra biến giả có thể được sử dụng như thế nào trong phạm vi hồi quy để giải thích cho sự kiện là có những quan sát trong phạm trù thuộc tính đã cho gắn với một tập các
Trang 1CHƯƠNG IV
HỐI Q ur VỚI BIẾN GlÂTrong các mô hình hồi quy tuyến tính mà chúng ta đã xem xét lừ các chương trước cho đến nay thì các biến giải thích đêu là các biến số lượng Các biến đó có thể nhận giá trị bằng số Chẳng hạn, tiền lương cùa cán bộ, doanh số bán ra cùa một cửa hàng, chi tiêu cho quảng cáo, cung tiền, là những biến số iượng Nhưng trong thực tế có nhiều trường hợp các biến giải thích (hoặc thậm chí cả biến phụ thuộc) là biến chất luợng Trong chương này ta sẽ nghiên cứu hồi quy khi biến giải thích là biến chất lượng
4.1 BẢN CHẤT CỦA BIẾN GIẢ- MÔ HÌNH TRONG ĐÓ BIEN g i ả i t h íc h
đó khồng vào đại học Chúng ta cũng sẽ chì ra biến giả có thể được sử dụng như thế nào trong phạm vi hồi quy để giải thích cho sự kiện là có những quan sát trong phạm trù (thuộc tính) đã cho gắn với một tập các tham số h'ổi quy còn các quan sát khác ưong phạm trù thứ 2 (hoặc thứ 3) lại gắn với những tham số hồi quy khác Biến giả được sử dụng trong mô hình hồi quy giống như biến số lượng thông thường
Giả sử một công ty sử dụng 2 quá trình sản xuất (kí hiẹu quá trình sản xuất A
và quá trình sản xuất B) để sản xuất ra một loại sản phẩm Giả sử sản phẩm thu được từ mỗi một quá trình sản xuất là đại lượng ngẵii nhiên có phân phối chuẩn và cí> kỳ vọng khác nhau nhưng phương sai như nhau Chúng ta có thể biểu thị quá
t r ì n h sản xuất đ ồ như một phương trình h ồ i quy
trong đó Yi là sản lượng sản phẩm gắn với quá trình thứ i
0 là biến giả nhạn 1 trong 2 giá trị:
83
Trang 2Di =
1 nếu sản lượng sản phẩm thu được từ quá trình sản xuất A
0 nếu sản lượng sản phẩm thu được từ quá trình sản xuất B
Mô hình hồi quy trên đây giống như mo hình hồi quy 2 biến mà chúng ta gập trước đây chi khác là biến số luợng X được thay bằng biến giả D Cân cứ vào mô hình này chúng ta có thể biết duợc sản lượng trung bình do quá ưình sản xuất A có khác với sản lượng trung bình do quá trinh sản xuất B tạo ra hay khống?
Hệ số chặn Pi của hồi quy tuyến tính đo sin lượng trung bình gắn với quá trình sản xuít B, trong khi đố độ dđc P2 của dL\'rug ìj'0i quy đo sự khác nhau vồ sản lượng sinh ra do việc thay đổi từ quá trình sản xuất B đến quá trình sản xuất A Điều nàý có thể thấy bằng cách lấy giá trị kỳ vọng cả 2 vế cùa phuong trình(4.1) ứng với D| = 0 và D| = 1:
E(Yj I Di = 0) =Pi E(Yi I Di = 1) =p! + p2
Kiểm định giả thiết Ho: pỉ = 0 cung cấp kiểm định về giả thiết là khổng có sụ khác nhau v i sản lượng.do quá trình sản xuất A và B tạo ra Điều này dẻ làm đuợc như dã chi ra iruớc dây •
Thù tục biến giả có thể dễ đàng m í rộr>ir cho’ trường li'ip biến định tín;) có nhiều hen 2 phạm lrù Chẳng hạn Uorig ilú dụ ò Irêa ta gi'ả thiết có 3 quá trìuh sản
xuất khác nhau có thể sử dụng á i sản xuất ra úi', pkíừn và ngnời ta hv vọng giải
thíc.1 cho vấn dề là sản lượng duợc sản xuất ra cho mỗi quá Irình có thể xhông Ẹhir nhau Trong trường hợp này ta sẽ đita v\o 2 biến giả là Di và D2 Chúng ta sẽ xét
mô hình':
Yi = Pi +P2D11 +P.1D21 + Ụ (4.2)trọng dó :
1 nếu sản lượng sàn phẩm thu được từ quá trình sản xiiất
0 nếu sản lưọiig sàn phẩm.tlui được từ q -á trìnl khác
D]
-■ 1 nếu sản lượn3 ĩàn phẩm thu đuợc lir quá trình sả>.\ xu i: 'Jể I "
O2- ' 0 uếu sản iuợr<5 ràâ phếm thu ù u ạ c ư quá trình khác
, Nhu vậy 3 quá trình sản su it này Uược biểu tlụ dưới dụng Jác kếi hỢi sao ù a
các giá trị của các biến giả:
! Quá trìnii sản xuất D, Di
84
Trang 3Bằng viộc lấy kỳ vọng cho mỗi một trong 3 trường hợp này chúng ta cố thể
giải thích kết quả hồi quy:
p3 đo thay đổi trung bình về sản lượng khi thay đổi từ quá trình sản xuất c sang quá trình sản xuất B
Kiểm định giả thiết Ho: P2 = 0 có nghĩa là không có sự khác nhau giữa quá trinh sản xuất A và quá trình sản xuất c Giả thiết Ho: P3 = 0 cũng có ý nghĩa tương tự nhưng lại so sánh 2 quá trình sản xuất B và c
Thí dụ: Để xem xét kết quả sản luợng do 2 quá trình sản xuất A và B có khấc nhau hay không người ta tiến hành lấy một mẫu được cho trong bảng dưới đây Hãy phân tích kết quả tíồi qui thu được
Dựa vào các k ít quả dưới đây ta thấy ràng sản lượng trung binh 1 ca của quá trình sản xuất B ước lượng là 18000 kg = P i, còn sản lượng trung bình 1 ca đã duọc ước luợng của quá trình sản xuất A là 21,280 kg = + P 2
B ảng 4.1
Quá trình sản xuất A là 1,
quá trình sản xuất B là 0
.Sản lượng trong 1 ca hoạt động
Trang 4(Se) = (0,44)
(p) =• (0,000)
R2 = 0.8737 p2 có ý nghĩa về mặt thống kê, kết quả chỉ ra rang sản lượng trung bình cùa
2 quá trinh đó là khác nhau Hôi quy trẽn có thể mô tả trên hình 4.1
Trước khi chuyển sang mục sau ta cần một số chú ý:
l ề Để phân biệt 2 phạm trù nam hoặc nữ hay quá trình sản xuất À hoặc B ngưỉri ta dùng một biến giả Để phân biệt 3 phạm trù nguời ta dùng 2 biến giả Một cách tổng quát để phân biệt N phạm trù người ta dùng N -l biến giậ Số biến giả thấp hơn số phạm trù là 1 dể tránh tính đa cộng tuyến hoàn hảo Để phãn biệt 3 quá trình sàn xuất A, B và c ta chỉ sử dụng 2 biến giả Di và E>2 nếu ta đua thêm 1 biến giả D3 nữa chảng hạn
■ 1 nếu sản ỉượng săn phẩm thu được từ quá trình sản xuất c.
D3 = ' 0 nếu sản lượng sản phẩm thu được từ quá trình sản xuất khácế
Thì việc đua thêm Dj vào không cho thêm thôag tin mà lại gặp đa cộng tuyến hoàn hảo (xem chương VI) Trong trường hợp này thì ước lượng bình phuơng
bé nhất cùa các tham số hồi quy không thể thu được Có hiện tượng đa tuyến tính hoàn hảo vì:
Dj= 1 - D ,-D 2
2 Phạm trù đuợc gán giá trị 0 được coi li phạm trù cơ sở Phạm trù được gọi là co sở theo nghĩa việc so sánh đuợc tiến bành với phạm trù này Như vậy trong mô Kinh trên quá tình sản xuất c là phạm trù cơ sở, nghĩa là nếu ta uớc lượng hồi quy (4.2) vổi Di = ữ, P2 =
0, thì chi có quá trinh sản xuất c, hệ số chăn sẽ là P |
86
Trang 53 ể Hẹ số P gắn với biến giả Dj được gọi là hộ sổ chặn chêch lệch, vì nó cho biết giá trị của hệ sõ chặn của phạm trù nhận giá trị bằng 1 sẽ khác bao nhiêu với
hệ số chặn cùa phạm trù cơ sở.
4.2 HỒI QUY VỚI MỘT BIỂN LUỢNG VÀ MỘT BIẾN CHẤT
Trong mục này ta sẽ xét mô hình hồi quy chì có một biến lượng và một biến chất vói sổ phạm trù nhiều hơn hoặc bàng 2 Trường hợp có nhiều biến lượng và một biến chất thì thủ tục cũng được xét tương tự như ta sẽ làm dưới đây chỉ khác là
số biến luợng sẽ tăng lên Để đễ theo dõi trong mục này ta chia ra, làm 2 trường
hợp: trường hợp 1 khi biến chất chỉ có hai phạm trù, trưcmg hợp 2 khi biến chất có nhiều hơn 2 phạm trù
1 T rường hợp khi biến chất chỉ có 2 phạm trù
Trong trường hợp này, mô hình hồi qui sẽ đơn giản vì theo chú ý ở trên khi
biến chất có 2 phạm trù thì chì cần đạt 1 biến giả là đủ Thí dụ ta xét mô hình sau:
Trong đó:
Yj: Là tiền lương hàng tháng cùa một công nhân cơ khí i,
X i : bậc thợ cùa công nhân i,
D i = 1 nếu công nhân i làm việc trong khu vục tư nhân,
D I = 0 nếu công nhân i ỉàm việc trong khu vực quốc doanh
Mô hình có một biến luọng đó là bậc thợ cùa người cổng nhân và một biến chất chỉ
lỗ cồng nhân đó làm việc thuộc khu vực nào Nếu ta già thiết E(UÍ) = 0 ttó (4.3) có thể cho
ta thấy liệu tiền Iutmg của nguời công nhân làm việc ờ khu vực tư nhân có khác tiền lương
của người 'công nhân làm việc ở khu vục nhà nước không nếu các điều kiện khác không
thay đổi Bằng'cách lấy kỳ vọng cả 2 vế (4.3) ta đuạc:
Tiền lương trung bình cùa nguời công nhân cơ khí làm việc trong khu vục nhà nuức:
Tiên lương tu n g bình của người công nhân cơ khí làm việc trong khu vực tư nhân:
E(Yi I Xj, Di = 0) = Pi +p3Xj (4.3.1)
E(Yj I X , Di—1) - (Pi + P2) + IỈ3XÌ (4.3.2)
87
Trang 6Hình 4.2
Hình 4.2 chỉ cho chúng ta thấy ràng tiền lương của công nhân cơ khí làm việc trong khu vực tư nhân và nhà nước tính theo bậc thợ có cùng độ dốc p3 nhung lại khác nhau về hệ số chặn Nói một cách khác mô htah này giả thiết rằng mức tiền lương trung bình của người công nhân ngành cơ khí làm việc ò khu vực tu nhân khấc với mức tiền lương trung bình cùa công nhân cơ khí làm việc ở khu vục nhà nước nhung tốc độ tăng luong trung bình theo bậc thì như nhau
NẾU giả thiết về tốc đồ đã nêu trẽn là cố giá trị thì kiểm định giả thiết răng 2
hồi quy (4.3.1) và (4.3.1) có cùng bệ s6 chặn có thể tiến hìn h dễ dàng bằng cách
uớc lượng tò i quy (4.3) và chú rằng ý nghĩa về mặt thống kê của Pj đã được ước lượng trẽn cơ sở của kiểm định t Nếu t chi ra rằng jj 2 là có ý nghĩa vầ mật thổng
kê thì chúng ta từ bỏ giả thiết Hũ là tiền lương của cổng nhằn cơ khí ở 2 khu vục kinh tế là như nhau
2 Trường họp khi biến chất có nhiều hơn 2 phạm trù
Khi biến ch ít có nhiều hơn 2 phạm trù thì vấn dề cũng khổng phức tạp hon nhiêu bởi vì theo chú ý ở trẽn nếu sô' phạm trù là N thì ta đưa vào mô hình hồi quy
N - 1 biến giả làm biến giải thích
Thí dụ căn cứ vào số liệu chéo người ta muốn hồi quy thu nhập hàng năm của một cán bộ giảng dạy đại học đối với tuổi nghề giảng dạy và vùng mà,anh ta giảng dạy Vì biến vùng là biến chất, trên thực tế chúng ta có thể căn cứ vào 3 vùng khác nhau trong cả nước, là Bắc, Trung, Nam Như vây trong trường hợp này, biến chất
của ta có 3 phạm trù, theo chú ý ờ trên ta sẽ đưa vào mồ hình hồi quy 2 biến giả.
Giả sử rằng cả 3 hồi quy có cùng độ dốc nhưng khác nhau hệ số chăn, chúng
ta có mổ bình sau:
Yj = Pi + PjDiì +P3D2Ì + P4XÌ + l í Trong đó Y| thu nhập hàng Dăm cùa một giảng viên đại học
(4.4)
Trang 7Xị: tuổi nghề của giảng viên
Ị l nếu giảng viên i thuộc một truỉrng đại học ở miền Bắc.
1 - I 0 nếu giảng viên thuộc một trường không phải ở miền Bắc
1 nếu giảng viên i thuộc một truờng dại học miền Nam
0 nếu giảng viên thuộc một trưèmg không phải ở miền Nam.
Như vậy, ta coi giảng viên thuộc một trường đại học ở miên Trung là phạm trù
cơ sở, hệ số chặn chênh lệch p2 và cho chúng ta biết hệ số chặn cùa các phạm
trù khác với hệ số chặn của phạm trù ca sà bao nhiêu Chúng ta có thể tính được
nếu giả thiết E(Ụ) = 0 thì từ (4.4) ta có:
Thu nhập tnmg bình cùa một cán bộ giảng dạy ờ một truờng đại học ở miên Thing:
E(Yi ID, = 0 ,D2 = 0, J i ) = p1 + p4Xi (4.4.1)Thu nhập trung bình cùa một cán bộ giảng dạy ở một trường đại học miên Bắc:
E(Yi I D, = 1, Da = 0, X,) = (p, + p2) + p4xi (4.4.2)
Thu nhập trung bình của mộl cán bộ giảng dạy ở trường đại học miền Nam:
E(Yi I D, = 0, Dj = 1, x ;) = (Pi + p3) + P,Xi (4.4.3)Giả sử pi > 0 ta có minh họa sau:
Hình 4.3 Thu nhập của một cán bộ giảng dạy đại học trong
mối quan.hộ với tuổi ngh'ê và vùng mà anh ta giảng dạy
Sau khi ước lượng hồi quy (4.4) chúng ta dễ thấy rằng liệu có sự khác nhau v'ê
thu nhập của cán bộ giảng dạy ở các miền khác nhau cùa đất nước không.
Thí dụ : Cãn cú vào số liệu chéo về doanh thu trên đầu người từ các tỉnh và thu nhập quốc dân tính theo dâu người của các tình đó Người ta muốn hồi qui logarit R (log thu nhập/ngưòi) đối với logarit G (log thu nhập quốc dân/ngưòi) và tính vùng của mỗi tỉnh Theo cách phân chia đã biếl 1 tỉnh thuộc 1 trong 3 vùng Bắc (N) Trung (Q hoặc Nam (S) Số liệu cho trong bảng 4.3
89
Trang 8Mô hình hồi quy l à :
L og Rị = Pi + P2D1Ì +P3D2Ì + P4 logG i + l í
Trong đó:
Log R: ln(thu nhập/người)
Log G: ln ( thu nhập quốc dân /người)
1 nếu tỉnh đó thuộc mièn Bắc
0 nếu tỉnh đó không phải là tỉnh miền Bác
D , i =
1 nếu tỉnh đó thuộc miền Nam
^ = 0 nếu tinh đó khổng phải là tinh miền Nam
Kết quả hồi quy như sau:
Trang 9logRi = -15,040082 - 0,42196 D, - 0,337541)2 + 1,94474 log G|
Ta có thể viết 3 phương trinh hồi quy:
Miền Trung: log Rị = -1 5 ,0 4 + 1,93 log Gi
Miên Bắc: log R| = -15,46 + l,91i log Gi
Miền N am : log Rị = - 15,83 + 1,9.') log G i
Theo chú ý ở trên p2 cho ta biết log (doanh thu) thay dổi khi chuyển từ tình miền Trung đến một tinh miền Bắc
P 3 cho ta biết doanh thu thay đổi khi chuyển từ miền Trung đến một tình miền Nan*.4.3 HỒI QUY VỚI MỘT BIỂN LUỢNG VÀ HAI BIẾN CHẤT
Trong mục này ta xét hồi quy với 1 biến lượng và 2 biến chất Nguyên tắc đã
trình bày à trên duợc mở rộng cho trường hợp này Số biến giả được đưa vào mô
hình hồi quy phụ thuộc vào số biến chất và các phạm trù mà mỗi biến chất có.Thí dụ: Chúng ta hãy quay lại thí dụ vê thu nhập cùa một giảng viên đại học, bây giờ chúng ta giả thiết thêm rằng giới tính của giảng viên cũng là nhân tổ quan trọng để xác định thu nhập của giảng viên Như vậy ta có 2 biến chất:
Yi là thu nhập hàng nẫm của giảng viên đại học
Xi là tuổi nghề của giảng viên i
1 nếu giảng viên thuộc tiirờng đại học miền Bắc
D ii = • 0 nếu giảng viên không thuộc trường đại học miền Bắc
1 nếu giảng viên thuộc trường đại học miền Nam
D 2 i = 0 nếu giảng viên không thuộc trường đại học miền Nam
• 1 nếu giảng viên là nam
D 3i = 0 nếu giảng viên là nữ
Phạm trù cơ sở bây giờ ỉà giảng viên nữ thuộc một trường đại học miền Trung Già sử E(U) = 0 chúng ta có thể thu được kết quà sau bằng cách lấy kỳ vọng có điều kiên cả 2 vế (4.5)
Thu nhập trung bình cùa 1 giảng viên nữ ở một truờng đại học miền Trung
91
Trang 10E(Y, I D,= 0, Dj = 0, Dj = 0, x,).=p, + PsX;
Thu nhập trung bình của 1 giảng viên nam ở một truờng đại học miần Trung
E(Yi I D,= 0, E>2 = 0, D, = 1 Xi) = (Pi +P4) + p3x>
Thu nhập trung bình của 1 giảng viên nữ ở một truờng đại học miền'Bắc
các tập số liệu mà chúng ta sử dụng là các tập số liệu (fan nhưng liệu môt mô bình
đã cho có thổ áp dụng cho hai tập số hay không? Chẳng hạn khi nghiên cứu mối q’lan hẹ giũa tiết kiẽm và thu nhập trước và sau chuyển đổi kinh tế cùa nước ta Vì thế chúng ta cần phát triển phương pháp chung để ứm xem liệu 2 hồi quy có khác
nhau hay không? Sự khác nhau nếu có thì ở hệ số chặn, hệ số góc híiy cả hai.
Thí dụ: Ta có hồi quy:
Thời kỳ irước cải tổ:
Yi = Xi + X ị X ì + Uii (4.5a)với i = l,n,
Thời kỳ sau cải tổ:
t-ong đó X thu nhập; Yià tiết kiệm; Ưii, U i là các ĩihiẽu trong 2 hồi quy
Có 4 khà năng xảy ra đối với 2 hồi quy này:
I X| = và x 2 = 72, nghĩa là 2 hồi quy đòng nhất, írên đồ thị chúng chồng
khlt ìin nha-., điều ní.y chỉ ra ở hình 4 /m
92
Trang 112 Xi * 7i và Xa = 72, nghĩa là 2 hồi quy có cùng hộ số góc, điều này chì ra ở
a Hai hồi quy trùng nhau; b Hai hồi quy song song;
c Hai hồi quy cócùpg hệ số chặn; d Hai hồi quy hoàn toàn khác nhau
Để kiểm định sự bằng nhau của hệ số hồi quy chúng ta có thể sử dụng một trong hai kỹ thuật: kiểm định Chow và sử dụng biến già Sau đay chúng ta xét cả hai kỹ th u ậ t
2 So sánh 2 hồi quy - kiểin định Chow
Một trong những phucmg pháp phổ biến để kiểm định sự khác nhau giũa hai hôi quy là kiểm định của Chow Kiểm định này dựa trôn những giả thiết sau:
93
Trang 12a Các nhiễu H i và Uy có phân phối chuẩn có kỳ vọng bằng 0 và phuơng sai khổng dổi và dều bàng ơ 2:
Uii ~ N ( 0 ,ơ2)
l i j - N ( 0 ,ơ 2)
b Cấc Uii và XẶj có phân phối độc lập
Với giả thiết đã cho thì thù tục kiểm định Chow là như sau:
Bước 1 Kết hợp tấi cả các quan sất của 2 thời kỳ lại ta được n = n, + n2 quan sát rồi ước luợng hồi quy gộp Mô hình gộp của (4.5a) và (4.5b) lúc này có thể viết dưới dạng:
Từ hồi quy này chúng ta thu đơợc tổng bình phuơng cấc phần dư là RSS với số bậc tự do n, + n2 - k (trong đó k là số tham số duợc ước lượng, trong mô hình (4.6)
tM k=2
Bướcĩ uồc luợng riêng từng hồi quy (4.5a) và (4.5b) và thu được tổng bình
phuong các phần dư tuơng ứng từ mô hình (4.5a) là RSS| và tù mô hình (4.5b) là
3 So sánh hai hồi quy ■ thủ tục biến giả
Kiém định Chow cho phép ta so sánh 2 hồi quy Sau dây ta sẽ trinh bày thù tục biến g iỉ mà cũng sẽ cho ta gộp ỉất cả Di và n2 quan sát lại với nhau và uớc luợng hồi quy sau:
Yi= p ,+ PjDì + p3Xi + P«(D|Xi) + Ụ (4.8)Giả sử Y| và Xị là tiết kiệm và thu nhập trước và sau khi chuyển đổi kinh tế
94
Trang 13D , = 0 đối với quan sát thuộc vào trước thời điểm chuyển đổi
1 đối với quan sát thuộc vào sau thời điểm chuyển đổi
Để thấy được ứng dụng của mô hình (4.8) ta lấy kỳ vọng có dĩèu kiện cả hai
vế cùa phương trình này với già thiết E(Ụ) = 0 chúng ta thu đurợc:
E(Yi I Di = 0, Xi) = Pi + P3XÌ (4.8a)
E(Y, ID, = 1 Xi) = O i + k ) + (P 3 + PO X, (4.8b)Với ỷ nghĩa các kí hiộu đã cho ờ trên ta có thể giải thích như sau:
(4.8a) là hàm tiết kiêm trung bình cho thời kỳ trước chuyển đổi kinh tế diễn ra.(4.8b) là hàm tiết kiêm trung bình từ khi chuyển đổi kinh tế vê sau Hai hàm này hoàn toàn giống như hai hàm đã cho (4.5a) và (4.5b) cho nên uớc lượng (4.8) cũng tương đứơng với việc uớc lượng hàm (4.5a) và (4.5b)
Trong (4.8) thì p2 chính là hệ số chặn biểu thị sự khác nhau cùa tiết kiệm giữa
2 thời kỳ còn (3* chính là hệ sô' độ dốc khác nhau nó chỉ ra rằng hệ số góc cùa hàm
tiết kiộm trước khi chuyển đổi khác với hộ số góc cùa thời kỳ từ khi chuyển đổi kinh tế là bao nhiều
4.5 ẢNH HUỞNG CỦA TUƠNG TÁC GIỮA CÁC B Ế N g i ả
Chúng ta xét mô hình sau:
Y| = p!+ P2D2Ì + P3D3Ì+ p4 Xj + t í trong đó: Ỵ là chi tiêu hàng năm v‘ê quần áo,
1 nếu là sinh viên
0 nếu là công nhân viênNgụ ý cùa mô hình trên đây là ảnh hưởng chênh lệch của biến giả giới tính D2
là hằng SỐ qua 2 tầng lớp sinh viên và công nhân viên và ảnh hường chênh lệch D, cũng là hàng số qua 2 giới Điều này có nghĩa là nếu chi tiêu trung bình về quần áo của nữ cao hơn của nam tw điều này cũng đúng với cả hai tầng lớp Tương tự cõng
có thể nói ràng chì tiêu trung bình v'6 quần áo của sinh viên nhiều hơn cùa công nhân viên thì đi'êu đó cũng đúng dù nó là nam hay tiữ
95
Trang 14Trong nhiều áp dụng thi giả thiết như vây khống duy trì đuọc Nữ sinh có thể tiêu dùng nhiều quần áo hcm nam công nhăn viên Nói một cách khác có thể có ảnh hường tương tác giữa 2 biến chất D2 và Dj và do đó ảnh huỏng của chúng lên frung bình Y có thể không phải là phép cộng đem giản như trôn mà là nh ìn như mổ hình sau:
Y; = Pi + P2P + P j D j ì + P*(D2ìDjì) + PsXị + u (4.10)
Từ (4.10) ta thu được chi tiêu trung bình về quần áo cùa một nữ sinh sẽ là
E(YI D2 = 1, Dj = 1, Xi) = (Pi + p2 + + P4) + p 5x;
Trong dó p2 là ảnh hưồng chênh lệch của nfc, p3 là ảnh hưởng chênh lệch cùa sinh viên, còn p< là ảnh hưởng chẽnh lệch của nữ sinh p4 cho ta biết chi tiêu trang binh về quần áo của một nữ sinh khác khác với chi tiêu trung bình của nam và nữ công nhân viên Điều này cho biết sự tuơng tác giữa các biến giả làm thay đổi ảnh hưởng cùa 2 thuộc tính đã đuợc xem xét 1 cách riêng rẽ như tbế nào
Để kiểm dinh hệ số P4 - tuong tác của các biến giả - có ý nghiã về mặt thống
kẽ hay khổng, có thể kiểm định t
4.6 SỬDỤNG BIẾN GIẢ TRONG PHÂN TÍCH MÙA
Như chúng ta đã biết nhiều chuỗi thời gian trong kinh tế có tính chất thời vụ rít rõ, chẳng hạn doanh số bán của các cửa hàng bán quần áo vào 10 ngày trưóc lết hàng năm, doanh số bán ra của cửa hàng văn phòng phẩm vào dầu năm h ọ c , Thông thường người ta muốn loại nhãn tố mùa khỏi chuỗi thời gian để người ta cố thể tập trung vào các thành phần khác của chuỗi thời gian nhu khuynh hướng tăng hoặc giảm hoàn toàn đều đặn theo một thời kỳ thối gian dài Quá trình loại thành phần khỏi chuỗi thời gian thu được như vây gọi là chuỗi thời gian dã được điều chình
theo mùa Có một số phương pháp điều chinh theo mùa của chuỗi thời gian, trong
mục này ta xét phương pbáp biến giả
Hoàn toàn như đã trình bày ở trên việc đưa biến giả vào đề loại yếu tố kbỏi
chuỗi thời gian được thực hiện, dựa ưẽn các giả thiết:
1 Yếu tố thòi vụ chỉ ảnh hưởng đến hệ số chặn của hồi qui, hoặc: 2 Yếu tố thòi vụ ảnh huởng đến cả hệ số góc
96
Trang 15Ung với mỗi giả thiết, mô hình được xem xét cũng khác nhau Để thuận tiện trình bày, ta xét:
Nghiên cứu mối liên hệ giữa thu nhập với chi tiêu cho quần áo, dụng cụ gia đình, người ta thu thập được một mẫu ngỉu nhiên kích thước n và cho ràng mỏi một quí có thổ biểu thị mẫu theo mùa Khi đó mô hình như sau:
Yi = P 1 + p2p 2i + 33D 3l+ p4D Ji + P5X + IÍ (4.11)Trong đó:
Y| biểu thị chi tiêu của nguời tiêu đùng v ỉ các loại hàng nói trên
Xj là thu nhập người tiêu dùng i
1 nếu quan sát nằm ồ quí 2
0 nếu quan sát nằm ồ quí khác
1 nếu quan sát nàm ở quí 3
D2 =
Dj =
D 4 =
0 nếu quan sát nằm ở quí khác
1 nếu quan sát nấm ở quí 4
0 nếu quan sát nằm ở quí khác
Trong mô hình trên la giả thiết biến có 4 phạm trù, nên ta dùng 3 biến giả, phạm trù cơ sờ là quí I N ha vậy nếu có ảnh hưởng theo' mùa của từng quí khác nhau thì hê số chặn p2, 03 và p4 khác nhau có ý nghĩa v í mặt thống kê Mỗi một hệ
sơ chặn cho ta biết chi tiêu trung bình ở mỗi quí khác vối quí I như thế nìo Với giả thiết E(Ụ) = 0 ta có: Chi tiêu trung bình về các khoản đã kể trền trong quí I là:
E(Y| I D2 = 0, E>3 - 0, D4 = 0, XI) = Pi + PsXị
chi tiêu trung bình v ỉ các khoản đã kể trên trong quí n là:
E(Yi I D2 = 1, D3 = 0, D4 = 0, Xị) = (pi +pĩ) +PsXi
chi tiêu trung bình về các khoản dã kể trên trong quỉ m là:
phường pháp tương tự như tr đã tìn h bày ở trên ta di đến mô hình:
Yi= p, + 02 Díi + Pj D Ji+ p4 D« + p5Xi + p6(D,,Xi) +
97
Trang 16Nhu vậy viộc phân tích thời vụ có thé sử dụng 2 mô hình (4.11) và (4.12) Tuy nhiẽn mô lủnh (4.12) tổng quát hơn, để tránh sự khổng thích hợp ta nên sử dụng
mô hỉnh (4.12) Qua việc ước lượng hồi quy (4.12) chúng ta có thể biết được hẹ số góc nào có ý nghĩa, hệ số góc nào khỗng có ý nghĩa
4.7 HỒI QUY TUYẾN TÍNH TÙNG KHỨC
Hầu hết các mổ hình kinh tế luợng mà chúng ta nghiên cứu cho đến nay hần tíết đều là các mô hình liên tục theo nghía là cả biến độc lập và biến phụ thuộc lấy
một s6 lớn giá trị và sự thay đổi nhỏ trong một biến này có ảnh hưởng do đuợc đến
biến khác Điều này đã được cải biên khi chúng ta sừ dụng thù tục biến giả để giải thíctì cho sụ khác nhau về hê số chăn hay độ dốQ hoặc cả hệ số chặn và độ dốc Bây giờ chúng ta mò rộng sự phân tích cho phép thay đổi độ dốc, nhưng hạn chế ràng đoạn thẳng đuợc uớc lượng vẫn là liên tục Thí dụ chi ra ở hình 4.5, mô hình đúng là một mô hình liên tục hay có sự thay đổi về kết cấu
Nếu chúng ta xẹm xét tiêu dùng của nước ta trước và san khi chuyển dổi thì chúng ta thấy mỡ hình có dạng như hình 4.5
ở đây cần nhấn mạnh rằng mộ hình đang xem xét khác với các mô hình có biến già đă được bình bày trong mục truớc bời vì chúng ta giả thiết rằng không có
sự m ít liên tục hoặc sụ dịch chuyển trong múc tiêu dừng từ năm này qua năm khác Mô hình nhừ vậy chúng ta gọi là mô hình tuyến tính từng khúc, ở hình 4.5
mô hình gồm 2 đoạn Chúng ta sẽ thấy mô hlnh có thể ước lượọg được bằng phương pháp bình phương nhỏ nhất với việc sừ dụng biến giả thích hợp
Để ước lượng mô hình đã cho trong hình 4.5, chúng ta giả thiết Ang tiêu dùng nước ta trong 2 thời kỳ trước và sau chuyển đổi khác nhau Gọi năm chuyển đổi kinh tế (từ cơ chế kế hoạch sang cơ chế thị trường) là to Ta xét mô hình sau:
Y' A
Ỵ = p1+(32X, + p3(Xt - X tt)Dl + U , (4.13)Y,: tiêu d ù n g ; X: thu nhập
98
Trang 17X ị : thu nhập trong năm bắt đầu chuyển giai đoạn từ cơ chế có kế hoạch
sa n g tơ chế thị trường
1 nếu t > to
D| = •
0 nếu là giá trị khác cùa t
Với giả thiết E(U) = 0 chúng ta thấy ngay ràng: trung bình của tiẽu dùng trong những năm trước khi chuyển đổi kinh tế là:
E(Y, I D| = 0, Xi) = Pi +(32X, (4.14)
và vói D, = 1 thì ta có
E(Y, I D, = 1, X) = (B, - PjX , ^ (P2 + P,)X, (4.15)Vậy 02 cho độ đốc của đường hồi quy trước khi chuyển đỏi (p2 + pj) cho đô dốc cùa đường hồi quy sau khi chuyển đổi
Chú ý rằng không có sự gián đoạn vì
E(Yị ) = (3, + p2X ị , theo phương trình (4.14)
= 0i-3.iXti) + (p3 + P3)X,0
= P i+ P2 X ,
Ta cũng chú ý rằng khi p3 = 0 Ihì phuong trình (4.13) sẽ trờ thành phương tìn h của đường thẳng, vậy kiểm định p3 = 0 sẽ cung cấp cho ta kiểm định đơn giản
về sự thay đổi cấu trúc
Nhung vấn dề sẽ như thế nào nếu mô hình có nhiều Ihay đổi vê cấu trúc ứng vái to và t|, thi mô hình thich hợp sẽ là:
a ẽT hì dụ 4.1: Cho mức tiêu dùng theo đẩu người và thu nhập sau thuế của
Mỹ trong thời kỳ 1929-1970 Trong thời gian này có xảy ra chiên tranh thế giđri thứ hai từ 1941-1946 Dựa vào kết quả sau đây hãy cho biết " chiến tranh" có ảnh
99
Trang 18hưởng đên tiêu dùng không? Trong đó D= 1 trong thời kỳ 1941-1946 và bằng khổng trong các năm khác.
Ordinary Least Squares Estimation
Dependent variable is c
42 observations used for estimation from 1929 to 1970
Regressor Coefficient Standard Error T-Ratio[Prob]
R-Squaied 98940 F-statistic F( 2, 39) 1820.4[.000]
R-Bar-Squared 98886 S.E of Regression 42.5410
Residual Sum of Squares 70S79.9 Mean of Dependent Variable Ỉ498.S
S.D of Dependent Variable 403.0243 Maximum of Log-likelihood -215.558
Theo kết quả trên p J = -20,4,92 < 0; tj = -10,90, p-value = 0,000 Do dó ta kết
luận: Chiến tranh thế giới thứ n có ảnh hưòng đến tíea dùng/ đẩu người ờ Mỹ và
lim giảm mức này
Trên dồ thị cho
hỉnh ảnh trực giác
vẻ mức tiêu dùng
giảm trong thời kỳ
chiến tranh thế giới
thứhaiằ
b Thí dụ 4.2: Cho tỷ số giũa chỉ số giá các mạt hàng sơ ché*ờ các nước
kém phát triển và chì số giá các mặt hàng chế biến nhập từ các nuớc công nghiệp trong khoảng thời gian 1950-1986 Trong khoảng thời gian này, từ 1973- 1974, người ta thấy có biéh động lón vể tỳ số này Dựa vào đổ thị dưới đây, người ta thấy100
Trang 19có bước nhẩy và xu thế của tỷ số này đã thay đổi Bằng kiểm định Chow và kỹ thuật biến giả hãy xem xét vấn đề trên.
Các biến sđ: TOT - Tỳ số giữa chỉ số giá các mặt hàng sơ chế ở các nước kém phát
triển và chì số giá các mặt hàng chế biến nhập từ các nước công nghiệp T- biến xu thế( T|950 — 1 T„ 86 = 37).
i ể Kiểm định Chow
• ú ớ c lượng m ô hình trong suốt thòi kỳ 1950-1986
Ordinary Least Squares EstimationDependent variable is TOT
37 observations used for estimation from 1950 to 1986
R e s i d u a l Sum of Squares 53831 Mean of Dependent Variable 1.0369 S.D of D ependent Variable 14502 Maximum of Log-likelihood 25.7588
*****************************************************************
101
Trang 20• ứ ớc lượng mô hình trong suốt thời kỳ 1950-1972
Ordinary Least Squares Estimation
****************************************************** *********** Dependent variable is TOT
23 observations used for estimation from 1950 to 1972
Regressor Coefficient Standard Eưor T-Ratio[Prob]
R-Squared 65420 F-statistic F( 1, 21) 39.7295[.000]
R-Bar-Squared 63774 S.E of Regression 072199
Residual Sum of Squares 10947 Mean of Dependent Variable 1.0553 S.D of Dependent Variable 11996 Maximum of Log-likelihood 28.8621
* * * * * + afr 4* * * * * * * * * * * * * * a*e 4c $ 4c 4c * * % * * * * * * * * * * $ % * % sfc 4c 9fc * 3fc * * * * * * * * * % * * * * *
• ứ ớ c lượng mổ hình trong suốt thời kỳ 1973-1986
Ordinary Least Squares Estimation
* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * ** * 9|( * * % * afc * % * % * 3fc * 9fc * * * * 3fc * afe * * * * * *Dependent variable is TOT
14 observations used for estimation from 1973 to 1986
Regressor Coefficient Standard Error T-Ratio[Prob]
***************************************************************** R-Squared 68405 F-statistic F( 1, 12) 25.9806[.000]
R-Bar-Squared 65772 S.E of Regression 10516
Residual Sum of Squares Mean of Dependent Variable 1.0067
S.D o f Dependent Variable 17975 Maximum of Log-likelihood 12.7456