Tuy nhiên, kết quả phân tích chưa tốt vì trong thực tế có rất nhiều các yếu tố cũng ảnh hưởng đến tổng chi tiêu của hộ gia đình trong một năm như số nhân khẩu trong hộ, tuổi của chủ hộ[r]
Trang 1BÀI 3 MÔ HÌNH HỒI QUY BỘI
Hướng dẫn học:
Bài này sẽ tiếp nối ý tưởng phân tích trong bài 2 Nội dung của bài 2 đề cập đến việc
đánh giá tác động của một biến độc lập X lên giá trị trung bình của biến phụ thuộc Y khi
các giả thiết từ 1 đến 3 thỏa mãn Tuy nhiên, mô hình hồi quy đơn (còn gọi là hồi quy hai biến) thường vi phạm giả thiết 2, một giả thiết quan trọng, do trong thực tế rất ít khi sự thay đổi của biến phụ thuộc lại chỉ do một nguyên nhân (1 biến độc lập) gây nên Khi đó kết quả ước lượng sẽ không có giá trị sử dụng Do đó, cần phải xây dựng mô hình hồi quy bội với nhiều biến độc lập (hay còn gọi là hồi quy nhiều biến) Tính ưu việt của mô hình hồi quy bội ở chỗ nó cho phép đánh giá tác động riêng của từng biến độc lập lên biến phụ thuộc trong điều kiện các biến độc lập khác của mô hình là không đổi Đây chính là một tiền đề quan trọng cho việc phân tích tác động giữa các đại lượng trong kinh
tế – xã hội Ngoài ra, việc đưa thêm các biến số thích hợp vào mô hình đồng nghĩa với việc có thêm nhiều nguyên nhân giải thích cho sự thay đổi của biến phụ thuộc, do đó góp phần cải thiện chất lượng dự báo của mô hình
Các nội dung trong bài sẽ giới thiệu về mô hình hồi quy k biến (với k ≥ 2), phương pháp OLS
cho mô hình hồi quy bội, hệ số xác định bội và một vài dạng mô hình trong kinh tế – xã hội
Để học tốt bài này sinh viên cần thực hiện:
Học đúng lịch trình của môn học theo tuần
Theo dõi các ví dụ và tính toán lại các kết quả
Đọc tài liệu: Đọc tài liệu: Nguyễn Quang Dong, Nguyễn Thị Minh, 2012, Giáo trình kinh tế lượng, NXB Đại học Kinh tế quốc dân
Sinh viên tự học, làm việc theo nhóm, trao đổi với giảng viên
Tham khảo các thông tin từ trang Web của môn học
Nội dung:
Giới thiệu về mô hình hồi quy k biến (cấu trúc và các giả thiết)
Mô tả lại phương pháp OLS cho trường hợp tổng quát k biến, định lý Gauss – Markov
Tìm hiểu về hệ số xác định bội đo độ phù hợp của hàm hồi quy
Nghiên cứu một số mô hình cụ thể thường gặp trong kinh tế – xã hội
Mục tiêu:
Sau khi học xong bài này, sinh viên cần đảm bảo được các yêu cầu sau:
Dựa vào vấn đề nghiên cứu biết cách xây dựng mô hình hồi quy nhiều biến
Phân tích kết quả ước lượng mô hình từ phương pháp OLS (đánh giá tác động của từng biến độc lập đến giá trị trung bình của biến phụ thuộc) với số liệu một mẫu cụ thể
Dự báo giá trị của biến phụ thuộc tại các mức giá trị cụ thể của biến độc lập
Đánh giá sự phù hợp của hàm hồi quy trong mẫu qua hệ số xác định
Linh hoạt phân tích mô hình với các tình huống thường gặp trong kinh tế – xã hội
Trang 2T ình huống dẫn nhập
Trong các bài trước, ta đã làm quen với phân tích mối quan hệ giữa hai biến kinh tế là tổng thu nhập và chi tiêu trong năm của các thành viên trong hộ gia đình Mẫu được lựa chọn là 100 hộ gia đình (số liệu VHLSS 2012) Với vấn đề nghiên cứu đặt ra là phân tích tác động của thu nhập đến chi tiêu của hộ gia đình trong năm, biến chi tiêu được lựa chọn là biến phụ thuộc còn biến độc lập là thu nhập Tuy nhiên, kết quả phân tích chưa tốt vì trong thực tế có rất nhiều các yếu tố cũng ảnh hưởng đến tổng chi tiêu của hộ gia đình trong một năm như số nhân khẩu trong hộ, tuổi của chủ hộ, số năm đi học của chủ hộ… Do đó để tăng tỷ lệ giải thích cho sự thay đổi của chi tiêu (CT), ngoài thu nhập (TN) ta có thể thêm các biến độc lập khác như số người trong hộ (SN), tuổi chủ hộ (TCH)… Các biến này sẽ làm chất lượng dự báo chi tiêu từ giá trị các biến độc lập tốt hơn
Mô hình hồi quy bội giản lược nhất trong tình huống này là mô hình với hai biến độc lập là thu nhập và số người trong hộ Trong kinh tế, đây là hai nhân tố ảnh hưởng mạnh đến số tiền chi tiêu của hộ gia đình Tuy nhiên, trong thực tế khi dựa vào số liệu VHLSS, điều đó có đúng không thì cần phải ước lượng mô hình và phân tích Một vài câu hỏi nghiên cứu đặt ra như sau:
Phải chăng khi thu nhập tăng lên thì chi tiêu cũng tăng trong điều kiện số nhân khẩu trong hộ không đổi?
Có thể nói rằng việc có thêm người sẽ khiến chi tiêu của hộ tăng lên với mức thu nhập vẫn như trước?
Bao nhiêu phần trăm sự thay đổi của chi tiêu được giải thích bởi hai yếu tố thu nhập và
số người?
Các câu hỏi này sẽ được trả lời khi ta xây dựng mô hình và phân tích kết quả
Kết quả ước lượng mô hình và độ tin cậy của dự báo phụ thuộc khá nhiều vào việc định dạng cấu trúc mô hình (xác định biến độc lập và biến phụ thuộc) Do đó, ta sẽ khởi đầu bằng việc xây dựng mô hình hồi quy tổng quát k biến số
Trang 33.1 Mô hình hồi quy K biến
Mô hình hồi quy trong đó: biến phụ thuộc Y phụ thuộc vào (k – 1) biến độc lập
X2,…,Xk có dạng như sau:
Hàm hồi quy tổng thể (PRF): E(Y| X2,, Xk) = 1 + 2 X2 + … + kXk (3.1)
Mô hình hồi quy tổng thể (PRM): Y = 1 + 2 X2 + … + kXk + u (3.2)
Ta biết rằng dù mô hình có nhiều biến độc lập nhưng vẫn tồn tại những yếu tố tác động đến biến phụ thuộc nhưng không đưa vào mô hình vì nhiều lý do (không có số liệu hoặc không muốn đưa vào) Do đó trong mô hình vẫn tồn tại sai số ngẫu nhiên u đại diện cho các yếu tố khác ngoài các biến Xj (j = 2,3, ,k) có tác động đến Y nhưng không đưa vào mô hình như là biến số
Xét một mẫu ngẫu nhiên với n quan sát cụ thể, ta có hồi quy mẫu như sau:
ki k i
Yˆ ˆ ˆ ˆ
2 2
Hoặc ˆYi ˆ1 ˆ2X2i ˆkXki ei Với ei là phần dư tại quan sát I, được tính bởi công thức sau: eiY Yi ˆi
Giả thiết 1: Việc ước lượng được dựa trên cơ sở mẫu ngẫu nhiên
Giả thiết 2: Kỳ vọng của sai số ngẫu nhiên tại mỗi giá trị (X2i,,…, Xki) bằng 0:
Giả thiết 3: Phương sai của sai số ngẫu nhiên tại các giá trị (X2i,,…, Xki) đều bằng nhau: Var(u| X2i,…, Xki) = σ2
Giả thiết 4: Giữa các biến độc lập Xj không có quan hệ cộng tuyến hoàn hảo, nghĩa là không tồn tại hằng số λ2, , λk không đồng thời bằng 0 sao cho: λ 2 X2 + … + λ kXk = 0
Trong các giả thiết trên, chỉ có giả thiết 4 là mới so với các giả thiết trong bài 2 Có thể nhận thấy nếu giữa các biến Xj(j = 2,3,,k) có quan hệ cộng tuyến hoàn hảo thì
sẽ có ít nhất một trong các biến này sẽ suy ra được từ các biến còn lại Do đó, giả thiết
4 được đưa ra để loại trừ tình huống này
Xuất phát từ hàm hồi quy tổng thể:
E(Y| X2,…, Xk) = 1 + 2 X2 + … + k X k
Hệ số 1: bằng giá trị trung bình của biến phụ thuộc Y khi các biến độc lập trong mô
hình nhận giá trị bằng 0 Tuy nhiên, trong thực tế, hệ số này ít được quan tâm
Các hệ số góc j ( j = 2, 3, , k): thể hiện tác động riêng của biến Xj lên giá trị trung
bình của biến phụ thuộc (còn được gọi là hệ số hồi quy riêng) Cụ thể, khi X j tăng hoặc
giảm 1 đơn vị, trong điều kiện các biến độc lập khác không đổi, thì Y trung bình sẽ thay
đổi j đơn vị
Có thể nhận thấy ba khả năng có thể xảy ra đối với các hệ số góc:
Trang 4 Hệ số j > 0: khi đó mối quan hệ giữa Y và X j là thuận chiều, nghĩa là khi X j tăng
(hoặc giảm) trong điều kiện các biến độc lập khác không đổi thì Y cũng sẽ tăng
(hoặc giảm)
Hệ số j < 0: khi đó mối quan hệ giữa Y và X j là ngược chiều, nghĩa là khi X j tăng (hoặc
giảm) trong điều kiện các biến độc lập khác không đổi thì Y sẽ giảm (hoặc tăng)
Hệ số j = 0: có thể cho rằng giữa Y và X j không có tương quan với nhau, cụ thể là
Y có thể không phụ thuộc vào X j hay là X j không thực sự ảnh hưởng tới Y
Dựa vào kết quả ước lượng với một mẫu cụ thể, ta có thể đánh giá được mối quan hệ giữa biến phụ thuộc và các biến độc lập trong mô hình một cách tương đối Sau đây, ta
sẽ nghiên cứu một ví dụ để hiểu rõ về ý nghĩa của các hệ số trong mô hình hồi quy
Ví dụ 3.1 Khi phân tích tác động của lượng phân bón hữu cơ và lượng phân bón vô cơ
lên năng suất lúa, ta có thể xây dựng mô hình như sau:
NS = 1 + 2 HC + 3 VC + u
Trong đó NS là năng suất lúa/ha là biến phụ thuộc, các biến độc lập: HC là lượng phân bón hữu cơ/ha, VC là lượng phân bón vô cơ/ha
Kết quả ước lượng mô hình với số liệu của 30 vùng chuyên canh nông nghiệp như sau:
VC HC
NS 1,50,35 0,12 Giải thích về mối quan hệ giữa các biến như sau:
Khi không sử dụng phân bón cả hai loại hữu cơ và vô cơ (biến HC = VC = 0), năng
suất lúa/ha trung bình đạt 1,5 đơn vị
Nếu lượng phân bón hữu cơ tăng (giảm) 1 đơn vị và mức phân bón vô cơ không thay đổi thì năng suất lúa/ha trung bình sẽ tăng (giảm) 0,35 đơn vị
Nếu lượng phân bón vô cơ tăng (giảm) 1 đơn vị và mức phân bón hữu cơ không thay đổi thì năng suất lúa/ha trung bình sẽ tăng (giảm) 0,12 đơn vị
Có một sự khác biệt quan trọng giữa mô hình hồi quy bội và mô hình hồi quy hai biến:
Mô hình hồi quy bội cho phép đánh giá tác động riêng của từng biến độc lập lên biến phụ thuộc trong khi các biến độc lập khác không đổi Đây là ưu điểm của mô hình hồi quy bội trong phân tích kinh tế – xã hội vì trong thực tế rất khó để giữ các biến ở trạng thái không đổi nhưng với mô hình có nhiều biến, điều kiện này được đặt ra để phân tích ảnh hưởng của từng nguyên nhân khác nhau (các biến độc lập) đến kết quả là sự biến thiên của biến phụ thuộc
Sau khi xây dựng và tìm hiểu ý nghĩa của các hệ số hồi quy trong mô hình, vấn đề tiếp theo ta quan tâm là làm thế nào để có được các ước lượng đáng tin cậy cho các hệ số này Cũng như với mô hình hồi quy hai biến, ta sẽ sử dụng phương pháp bình phương nhỏ nhất (OLS) để ước lượng các hệ số trong mô hình hồi quy k biến Nội dung tiếp theo sẽ đề cập đến phương pháp này
Xét mô hình k biến:
Y = 1 + 2 X2 + … + k X k + u
Trang 5Giả sử có một mẫu quan sát với giá trị thực tế là (Y i , X2i, …, X ki ) với (i = 1, 2, …, n)
Ta sẽ sử dụng thông tin từ mẫu để xây dựng các ước lượng cho các hệ số j (j = 1, 2,
…, k), ký hiệu là ˆ (j = 1, 2, …, k) Từ các giá trị ước lượng này có thể viết thành j hàm hồi quy mẫu như sau:
k
k X X
Yˆ ˆ ˆ ˆ
2 2
Tại mỗi quan sát i, hàm hồi quy mẫu được viết thành:
ki k i
Yˆ ˆ ˆ ˆ
2 2
Trong đó Yˆ là giá trị ước lượng cho Y i i và sai lệch giữa hai giá trị này được gọi là phần
dư với cách tính:
i i
i Y Y
e ˆ Tương tự như mô hình hồi quy hai biến, phương pháp OLS nhằm xác định các giá trị
j
ˆ (j = 1, 2, …, k) sao cho tổng bình phương các phần dư là bé nhất:
ˆ ( ) ( ) ( , , , )
Khi đó, các giá trị ˆ,ˆ , ,ˆk
2
1 sẽ là nghiệm của hệ gồm k phương trình sau:
1 1
1 2
1
ˆ
ˆ
ˆ
n k
i n k
i
k
k i i i k k i i
k
f
0
n
Với điều kiện số quan sát trong mẫu lớn hơn số hệ số hồi quy cần ước lượng và giả thiết 4 được thỏa mãn thì hệ phương trình trên sẽ có nghiệm duy nhất Việc giải hệ phương trình khá dễ dàng qua các phầm mềm kinh tế lượng và thống kê nếu số biến không quá lớn Các giá trị ước lượng bằng phương pháp OLS dựa trên số liệu mẫu cụ thể được xem như là các ước lượng điểm của các hệ số trong tổng thể
Với mô hình hồi quy bội (hồi quy k biến với k > 2), việc giải hệ phương trình để tìm các
ước lượng hệ số ˆ (j j1, 2, , )k sẽ trở nên khó khăn hơn so với mô hình hồi quy 2 biến
do đó ta sẽ có được các kết quả này với sự giúp của các phần mềm kinh tế lượng
Tù kết quả ước lượng từ phương pháp OLS, ta có thể khai thác các thông tin để đánh giá tác động của biến độc lập đối với sự thay đổi của biến phụ thuộc thông qua ý nghĩa các hệ số hồi quy Sau đây, ta sẽ quay trở lại phân tích tình huống dẫn nhập đưa ra trong phần đầu của bài học
Ví dụ 3.2 Số liệu trong mẫu chọn ngẫu nhiên 100 hộ gia đình trên địa bàn thành phố
Hà Nội (VHLSS 2012) Biến phụ thuộc là tổng chi tiêu trong năm của hộ (CT, đơn vị tính là triệu đồng/năm), hai biến độc lập đưa vào mô hình là tổng thu nhập trong năm của hộ (TN, triệu đồng/năm) và số người trong hộ (SN, đơn vị tính là người)
Trang 6TT CT TN SN STT CT TN SN STT CT TN SN
1 97 107 2 41 172 149 4 81 273 285 5
2 100 118 2 42 156 162 4 82 276 290 5
3 100 119 2 43 165 164 4 83 281 312 5
4 114 148 2 44 155 166 4 84 277 325 5
5 126 155 2 45 173 183 4 85 294 340 5
6 177 193 2 46 189 203 4 86 294 360 5
7 171 217 2 47 232 228 4 87 333 385 5
8 175 250 2 48 210 239 4 88 337 392 5
9 205 294 2 49 207 254 4 89 161 113 6
10 205 294 2 50 210 258 4 90 213 154 6
11 218 309 2 51 235 267 4 91 243 203 6
12 241 333 2 52 274 298 4 92 229 227 6
13 233 347 2 53 282 325 4 93 288 271 6
14 242 362 2 54 275 334 4 94 264 272 6
15 266 375 2 55 289 344 4 95 308 358 6
16 280 385 2 56 296 349 4 96 334 362 6
17 108 107 3 57 298 351 4 97 337 380 6
18 142 117 3 58 304 361 4 98 336 392 6
19 130 143 3 59 281 364 4 99 345 394 6
20 157 148 3 60 293 370 4 100 360 398 6
21 132 154 3 61 302 372 4
22 140 160 3 62 303 374 4
23 158 163 3 63 318 378 4
24 148 173 3 64 297 396 4
25 182 183 3 65 161 112 5
26 178 184 3 66 201 159 5
27 188 186 3 67 185 179 5
28 171 211 3 68 190 193 5
29 185 215 3 69 211 195 5
30 213 229 3 70 211 202 5
31 182 236 3 71 226 220 5
32 207 252 3 72 208 224 5
33 212 274 3 73 245 225 5
34 246 276 3 74 230 227 5
35 228 306 3 75 249 239 5
36 252 346 3 76 246 240 5
37 292 394 3 77 261 259 5
38 278 396 3 78 236 263 5
39 135 134 4 79 233 265 5
40 169 144 4 80 248 284 5
Trang 7Kết quả thu được như sau:
CT 3,961 0,612TN 15, 432SN
Ta giải thích kết quả ước lượng như sau:
Hệ số chặn ˆ1 = – 3,961 Hệ số chặn trong mô hình này không có ý nghĩa thực tế
vì nó mang giá trị âm
Hệ số góc ˆ2= 0,612 thể hiện tác động riêng của thu nhập lên chi tiêu của hộ gia đình Cụ thể giá trị này cho biết nếu thu nhập của hộ gia đình tăng (hoặc giảm) 1 triệu đồng/năm và số người trong hộ không thay đổi thì mức chi tiêu trung bình trong năm của hộ gia đình tăng 0,612 triệu đồng Con số này chính là khuynh hướng tiêu dùng cận biên Giá trị này phù hợp với lý thuyết kinh tế vì khuynh hướng tiêu dùng cận biên nằm trong khoảng từ 0 đến 1, nghĩa là khi thu nhập tăng thì chi tiêu cũng tăng nhưng mức tăng nhỏ hơn so với mức tăng của thu nhập
Hệ số góc ˆ3= 15,432 thể hiện tác động riêng của số người trong hộ lên chi tiêu của hộ Khi số nhân khẩu trong hộ tăng thêm một người, trong khi thu nhập vẫn giữ nguyên ở mức cũ thì số tiền chi tiêu trung bình của hộ sẽ tăng thêm 15,432 triệu/năm
Cũng có thể cho rằng nếu thu nhập gia tăng 1 triệu đồng và hộ có thêm 1 người thì mức chi tiêu trung bình của hộ sẽ tăng khoảng 16,044 triệu (= 0,612 + 15,432)
Có thể dự báo mức chi tiêu của hộ tại một mức thu nhập và số nhân khẩu cụ thể từ kết quả ước lượng mô hình Cụ thể là nếu tổng thu nhập của hộ là 150 triệu/năm và
hộ có 4 người thì mức chi tiêu trung bình là:
Như vậy các gia đình sẽ chi tiêu gần hết thu nhập của họ Nếu thu nhập là 200 triệu/năm và gia đình vẫn chỉ có 4 người thì hộ sẽ chi tiêu số tiền là 180,212 triệu, nghĩa là các gia đình bắt đầu có tiền tiết kiệm (trung bình là 19,788 triệu/năm)
Ví dụ 3.3 Đánh giá về nhu cầu vay vốn ngân hàng của 50 doanh nghiệp sản xuất xi
măng dựa trên tác động của quy mô sản xuất và lãi suất cho vay của ngân hàng, ta có kết quả như sau:
32,5 2, 65 0,81
Trong đó I là nhu cầu vốn vay của doanh nghiệp (tỷ đồng), Q là sản lượng dự kiến doanh nghiệp làm ra trong một năm (tấn), R là lãi suất cho vay của ngân hàng (%) Khi đó:
Hệ số chặn ˆ1= 32,5 cho biết nếu sản lượng của doanh nghiệp bằng 0 và lãi suất cho vay của ngân hàng bằng 0% thì nhu cầu vay vốn sẽ là 32,5 tỷ đồng Giá trị này cũng không có ý nghĩa trong thực tế nên khi phân tích mô hình ta cũng không cần quan tâm đến nó quá nhiều
Hệ số góc ˆ2= 2,56 cho biết ảnh hưởng riêng của qui mô sản lượng dự kiến đến nhu cầu vay vốn của doanh nghiệp Cụ thể nó cho biết khi sản lượng tăng thêm 1
TN 50,SN 4
CT | 3,961 0,612 150 15, 432 4 149,567