Hãy giải thích mối quan hệ giữa tỉ lệ tử vong của trẻ sơ sinh và các biến khác đã cho, bằng những lập luận mang tính cách kinh tế và lô gic.. Rồi từ đó đối chiếu đồ thị với các giải thíc
Trang 1Nguồn tin : khoa tóan thống kê – ĐHKT
a Vẽ đồ thị phân tán về tỉ lệ lạm phát cho mỗi quốc gia theo thời gian Cho nhận xét tổng quát về lạm phát của 5 nước ?
Trang 3Nhận xét: NHìn chung tỷ lệ lạm phát của có đều có xu hướng tănglên, nhưng trong đó Đức và Nhật chỉ tăng chậm.
b Lạm phát nước nào biến thiên nhiều hơn giải thích ?
c Ươc lượng mô hình hồi qui: Lạm phát theo thời gian cho từng quốc gia theo giả định
Trang 4Variable Coefficient Std Error t-Statistic Prob
R-squared 0.788624 Mean dependent var 5.123810
Adjusted R-squared 0.777499 S.D dependent var 3.694984
S.E of regression 1.742926 Akaike info criterion 4.039401
Sum squared resid 57.71804 Schwarz criterion 4.138879
Durbin-Watson stat 1.131804 Prob(F-statistic) 0.000000
- Ước lượng mô hình hồi qui Anh:
Dependent Variable: ANH
Method: Least Squares
Date: 05/10/10 Time: 21:03
Sample: 1960 1980
Included observations: 21
Trang 5Variable Coefficient Std Error t-Statistic Prob
R-squared 0.651809 Mean dependent var 8.547619
Adjusted R-squared 0.633483 S.D dependent var 6.321046
S.E of regression 3.826801 Akaike info criterion 5.612328
Sum squared resid 278.2437 Schwarz criterion 5.711806
Durbin-Watson stat 1.141176 Prob(F-statistic) 0.000010
ANH = 0.3229437229 + 0.8224675325*NAMMOHINH
Khi số năm tăng thêm 1 năm thì về trung bình tỷ lệ lạm phát của nướcAnh tăng lên 0.823%
0 5 10 15 20 25
- Ước lượng mô hình hồi qui Nhật:
Dependent Variable: NHAT
Method: Least Squares
Trang 6C 5.215152 1.919155 2.717421 0.0137
R-squared 0.081565 Mean dependent var 7.347619
Adjusted R-squared 0.033226 S.D dependent var 4.632992
S.E of regression 4.555374 Akaike info criterion 5.960885
Sum squared resid 394.2773 Schwarz criterion 6.060364
Durbin-Watson stat 1.175297 Prob(F-statistic) 0.209493
- Ước lượng mô hình hồi qui Đức:
Dependent Variable: DUC
Method: Least Squares
Trang 7C 3.593939 1.468324 2.447648 0.0243
R-squared 0.035098 Mean dependent var 4.638095
Adjusted R-squared -0.015687 S.D dependent var 3.458248
S.E of regression 3.485266 Akaike info criterion 5.425359
Sum squared resid 230.7945 Schwarz criterion 5.524837
Durbin-Watson stat 2.328057 Prob(F-statistic) 0.416112
- Ước lượng mô hình hồi qui Phap:
Dependent Variable: PHAP
Method: Least Squares
Trang 8NAMMOHINH 0.486104 0.071244 6.823112 0.0000
R-squared 0.710166 Mean dependent var 6.714286
Adjusted R-squared 0.694912 S.D dependent var 3.579146
S.E of regression 1.976933 Akaike info criterion 4.291363
Sum squared resid 74.25703 Schwarz criterion 4.390842
Durbin-Watson stat 0.961869 Prob(F-statistic) 0.000002
PHAP = 1.853246753 + 0.4861038961*NAMMOHINH
Khi số năm tăng thêm 1 năm thì về trung bình tỷ lệ lạm phát
của nước Pháp tăng lên 0.48610%.
0 2 4 6 8 10 12 14 16
- Anh và US:
Trang 9Dependent Variable: ANH
Method: Least Squares
R-squared 0.704636 Mean dependent var 8.547619
Adjusted R-squared 0.689091 S.D dependent var 6.321046
S.E of regression 3.524566 Akaike info criterion 5.447784
Sum squared resid 236.0287 Schwarz criterion 5.547263
Durbin-Watson stat 0.439091 Prob(F-statistic) 0.000002
ANH = 3.942998281 + 1.344882282*ANHLP
Khi lạm phát của US tăng lên 1% thì về trung bình làm phát của Anh
sẽ tăng lên 1.345%
- Nhật và US:
Dependent Variable: NHAT
Method: Least Squares
R-squared 0.447610 Mean dependent var 7.347619
Adjusted R-squared 0.418536 S.D dependent var 4.632992
S.E of regression 3.532831 Akaike info criterion 5.452469
Sum squared resid 237.1370 Schwarz criterion 5.551947
Durbin-Watson stat 0.534453 Prob(F-statistic) 0.000912
NHAT = 5.795072835 + 0.6981471192*NHATLP
Khi lạm phát của US tăng lên 1% thì về trung bình làm phát của Nhật
sẽ tăng lên 0.7%
-Đức va US:
Trang 10Dependent Variable: DUC
Method: Least Squares
R-squared 0.351757 Mean dependent var 4.638095
Adjusted R-squared 0.317639 S.D dependent var 3.458248
S.E of regression 2.856691 Akaike info criterion 5.027598
Sum squared resid 155.0530 Schwarz criterion 5.127076
Durbin-Watson stat 1.202348 Prob(F-statistic) 0.004600
DUC = 4.860462352 + 0.4578146464*DUCLP
Khi lạm phát của US tăng lên 1% thì về trung bình làm phát của Đức
sẽ tăng lên 0.46%
-Pháp Và US:
Dependent Variable: PHAP
Method: Least Squares
R-squared 0.013294 Mean dependent var 6.714286
Adjusted R-squared -0.038637 S.D dependent var 3.579146
S.E of regression 3.647635 Akaike info criterion 5.516428
Sum squared resid 252.7996 Schwarz criterion 5.615906
Durbin-Watson stat 0.273299 Prob(F-statistic) 0.618704
PHAP = 6.25177575 + 0.2907996784*PHAPLP
Khi lạm phát của US tăng lên 1% thì về trung bình làm phát của Pháp
sẽ tăng lên 0.29%
Trang 11Nhận xét chung:
Từ kết quả trên ta thấy tỉ lệ lạm phát của Anh chịu ảnh hưởng nhiều bởi tỉ lệ
lạm phát của Hoa Kì ( tăng lên 1.345%) , còn tỉ lệ lạm phát của Nhật ( 0.7%)
và Đức (0.46%), Pháp ( 0.29%) ít chịu ảnh hưởng bởi tỉ lệ lạm phát của HoaKì
Bài tập 2 :
Nhà phân tích học viện nghiên cứu Anh ngữ đã thu thập dữ liệu
từ 8 sinh viên khác nhau trong một lớp Bảng dữ liệu gốc được trình bài như sau :
điểm Anh Văn
Cho từng cặp môn học tương ứng , anh chị :
a Ươc lượng mô hình hồi qui tuyến tính cho tập dữ liệu nói trên? - Đọc
và nhận xét phương trình hồi qui của anh chị? - Đưa ra kết luận tổngquát ?
Điểm môn Khoa học và của sinh viên có thể dự đóan điểm của môn Anh văn hay không:
Dependent Variable: DIEMANHVAN
Method: Least Squares
Date: 05/11/10 Time: 21:13
Sample: 1 8
Included observations: 8
Trang 12Variable Coefficient Std Error t-Statistic Prob
R-squared 0.183299 Mean dependent var 7.462500
Adjusted R-squared 0.047182 S.D dependent var 3.605130
S.E of regression 3.519055 Akaike info criterion 5.566580
Sum squared resid 74.30247 Schwarz criterion 5.586440
Durbin-Watson stat 1.325655 Prob(F-statistic) 0.289950
Dependent Variable: DIEMANHVAN
Method: Least Squares
R-squared 0.337396 Mean dependent var 7.462500
Adjusted R-squared 0.226962 S.D dependent var 3.605130
S.E of regression 3.169724 Akaike info criterion 5.357484
Sum squared resid 60.28290 Schwarz criterion 5.377344
Durbin-Watson stat 2.104833 Prob(F-statistic) 0.131069
DIEMANHVAN = 1.691256533 + 0.6099068394*DIEMTOAN
Khi điểm toán tăng lên một điểm thì về trung bình điểm môn anh văn
sẽ tăng lên 0.6 điểm
Trang 13 Kết Luận tổng quát: Ta thấy hệ số tương quan của 2 mô hình thấp(R2<0.5) do đó nó không giải thích dược tất cả các biến đưa váo trong môhình Có nghĩa là điểm môn Khoa Học và môn Toán ảnh hưởng rất ít đếnđiểm của môn Anh văn
b Giải thích ý nghĩa của hệ số tương quan ? Giải thích ý nghĩa của
hệ số độ dốc và tung độ gốc của phương trình hồi qui ?
Ý nghĩa của hệ số tương quan:
R2 đo lường mối tương quan giữa biến phụ thuộc với biến độc lập R2
ở 2 mô hình trên đều rất nhỏ (18.32 % và 33.74% ) chứng tỏ điểm của mônAnh Văn không phụ thuộc nhiều vào môn khoa học hay môn toán
Ý nghĩa của hệ số độ dốc v à tung độ gốc:
Ta có tập dữ liệu sau bao gồm 64 quan sát của các quốc gia với các biến
số được giải thích bên dưới của bảng số liệu :
Trang 14Trong đó: - CM : Tỉ lệ tử vong của trẽ sơ sinh (%)
- FLR : Tỉ lệ biết chử của dân số (%)
- PGNP : GNP bình quân đầu người (Đô la)
- TFR : Tỉ lệ sinh chung của dân số (%)
Trang 151 Hãy giải thích mối quan hệ giữa tỉ lệ tử vong của trẻ sơ sinh và các biến khác đã cho, bằng những lập luận mang tính cách kinh tế và lô gic ? - Sau đó vẽ biểu đồ phân tán giữa CM và FLR; CM và PGNP; CM
và TFR Rồi từ đó đối chiếu đồ thị với các giải thích của anh chị lúc ban đầu ( nêu lên sự phù hợp và không phù hợp với lời giải thích ban đầu)
- Tỷ lệ tử vong và tỷ lệ biết chữ: Hai biến này có mối quan hệ nghịch biến, nếu tỷ lệ biết chữ thấp thì tỷ lệ tử vong sẽ cao và ngược lại
- Tỷ lệ tử vong và GNP bình quân đầu người: Khi GNP bình quân đầu ngườităng lên thì tỷ lệ tử vong của trẻ sơ sinh sẽ giảm đi vì khi đó trẻ sẽ được chăm sóc tốt và toàn diện hơn Ngược lại
- Tỷ lệ tử vong và tỷ lệ sinh chung của dân số: Nếu tỷ lệ sinh chung tăng lên thì-> dân số tăng lên-> gia đình sẽ đông con hơn->nghèo->không chăm sóc đầy đủ cho con cái->tỷ lệ tử vong tăng
Biểu đồ phân tán giữa CM và FLR:
Trang 16- Không phù hợp với lời giải thích ban đầu vì : qua biểu đồ cho thấy khi tỷ
lệ sinh tăng ( giảm ) tỷ lệ tử cũng tăng ( giảm ) theo Đây là mối quan hệ tỉ lệthuận
CM và FLR
Trang 17Qua đồ thị cho thấy tỉ lệ biết chữ của dân số càng cao thì tỉ lệ tử vong của trẻ
sơ sinh càng thấp và ngược lại Phù hợp với lời giải thích ban đầu
2 Anh chị hãy xây dựng mô hình hồi qui đơn cho CM va PGNP Nhận xét các thông tin chính từ mô hình nầy như ý nghĩa thống kê của
R-squared 0.152769 S.D dependent var 75.97807
S.E of regression 69.93413 Akaike info criterion 11.36374
Trang 18Sum squared resid 303228.5 Schwarz criterion 11.43120
Log likelihood -361.6396 F-statistic 12.35987
3 Hãy xây dựng mô hình hồi qui bội cho quan hệ CM; FLR và PGNP Nhận xét thông tin chính từ mô hình nầy , như ý nghĩa thống kê của hệ số , hệ số xác định R 2
-7 0.0000
PGNP -0.005647 0.002003
2.81870
-3 0.0065
R-squared 0.707665
Mean dependent var
141.500
0Adjusted R-
squared 0.698081 S.D dependent var
75.9780
7
Trang 19S.E of regression 41.74780
Akaike info criterion
10.3469
1Sum squared resid 106315.6 Schwarz criterion
10.4481
1Log likelihood -328.1012 F-statistic
73.8325
4Durbin-Watson
Hệ số R2 = 70.76% được xem là không tốt vì không giải thích được tất
cả các biến đưa vào mô hình
4 So sánh mô hình đơn và mô hình bội anh chị có nhận xét gì về
hệ số hồi qui tìm được của biến PGNP , nếu phải chọn hệ số PGNP của
mô hình nào để giải thích tác động của PGNP lên CM ? Tại sao?
Trang 20PGNP -0.005511 0.001878 -2.934275 0.0047
TFR 12.86864 4.190533 3.070883 0.0032
R-squared 0.747372 Mean dependent var 141.5000
Adjusted
R-squared 0.734740 S.D dependent var 75.97807
S.E of regression 39.13127 Akaike info criterion 10.23218
Sum squared resid 91875.38 Schwarz criterion 10.36711
Log likelihood -323.4298 F-statistic 59.16767
EDU 2
HEX C
INC C
MOR T
PHY S
Trang 23Trong đó : - MORT : Tỉ lệ tử vong chung trên 100.000 dân số
- INCC : Thu nhập đầu người tính bằng USD
- POV : Tỉ lệ của những người dân trong nước sống dưới mứcnghèo khó
- EDU1 : Tỉ lệ dân số đã học trung học
- EDU2 : Tỉ lệ dân số đã học trung học và đại học
- ALCC : Tiêu dùng cồn ( rượu) tính bằng lít trên đầu người
- TOBC : Tiêu dùng thuốc lá đầu người tíng bằng bao
- HEXC : Chi tiêu y tế bình quân đầu người (USD)
- URB : Tỉ lệ dân số sống tại các khu vực thành thị
- AGED : Tỉ lệ dân số có độ tuồi trên 65
- PHYS : Các cán bộ y tế trên 1000.000 dân
Yêu cầu :
1 Chọn biến Mort là biến phụ thuộc – Đối với từng biến giải thích, hãy
lý giải tại sao nó có thể có tác động lên tỉ lệ tử vong tổng thể và chỉ ra hướng tác động nầy?
- Thu nhập (INCC): nếu không có thu nhập sẽ dẫn đến nghèo đói,bệnh tật không có tiền mua thuốc…
- Tỉ lệ của những người dân trong nước sống dưới mức nghèo khó(POV): Không có thu nhập, nghèo đói -> thiều ăn, bệnh tật…
- Tỷ lệ EDU1 và EDU2: Tỉ lệ dân số đã học trung học và tỉ lệ dân số đã họctrung học và đại học càng cao thi trình độ dân trí của người dân càng cao,
Trang 24mới tiếp thu được những kiến thức tiến bộ về sức khỏe, y tế, khoa học….từ
đó có thể giảm bớt được tỉ lệ tử vong chung
- Tiêu dùng cồn ( rượu) tính bằng lít trên đầu người(ALCC): Uốngrượu sẽ dẫn đến tai nạn, bệnh tật-> tử vong
- Hút thuốc(TOBC): Dẫn tới các căn bênh về đường hô hấp
-Chi tiêu y tế: Khi bị bệnh cẫn phải tới bênh viên nhưng nếu chi tiêucho y tế thấp sẽ dẫn đến không có thuốc chữa bệnh-> tử vong
- Tỉ lệ dân số sống tại các khu vực thành thị(URB): Dân số sống ởthành thị sẽ mắc phải sống trong môi trường ô nhiễm, tiếng ồn-> mắc một sốcăn bệnh
- Tỉ lệ dân số có độ tuồi trên 65(AGED): Những người cao tuổi khảnăng chống lại bệnh tật, thời tiết kém-> dễ tử vong
- Các cán bộ y tế(PHYS): Cán bộ y tế mà ít, kém chất lượng cũng sẽdẫn đến tỷ lệ tử vong chung
2 Ước lượng mô hình hồi qui đa biến bao gồm tất cả những biến giải thích đang có? Thực hiện kiểm định cho mức ý nghĩa tổng quát – Nhận xét sự thích hợp ? Kiểm định mức ý nghĩa đối với từng hệ số hồi qui ở mức = 10% và xác định các biến mà anh chị có thể muốn
bỏ qua.
Dependent Variable: MORT
Method: Least Squares
0.27700
9 0.7832AGED 4126.895 322.3451
12.8027
2 0.0000
ALCC -25.91511 11.09681
2.33536
-6 0.0246
Trang 25-1 0.0376HEXC 0.073889 0.034127
2.16508
8 0.0364INCC 0.004511 0.005817
0.77555
1 0.4426PHYS 0.640384 0.263636
2.42904
4 0.0197POV 549.8647 308.5540
1.78206
9 0.0823TOBC 1.470480 0.353504
4.15973
2 0.0002
URB -32.45556 35.64423
0.91054
-2 0.3680
R-squared 0.948570
Mean dependent var
855.005
9Adjusted R-
squared 0.935713 S.D dependent var
137.966
0S.E of regression 34.98117
Akaike info criterion
10.1359
2Sum squared resid 48947.30 Schwarz criterion
10.5525
9Log likelihood -247.4660 F-statistic
73.7759
2Durbin-Watson
Ta thấy hệ số Prob(F-statistic) < nên ta bác bỏ H0 có nghĩa là có ít nhất 1 biến có ý nghĩa thống kê trong mô hình này
Trang 26Nhận xét sự thích hợp:
Kiểm định mức ý nghĩa đối với từng hệ số hồi qui ở mức = 10% và xác định các biến mà anh chị có thể muốn bỏ qua.
Qua kiểm đinh hệ số Prob ta thấy tất cả các biến trong mô hình đếu có
ý nghĩa thống kê, chỉ trừ 3 biến EDU1> , INCC> , URB> là không có
ý nghĩa thống kê nên đây là các biến ta có thể bỏ qua
3 Đầu tiên hãy thực hiện một kiểm định WALD đối với việc bỏ tất cả những biến nầy Sau đó, bỏ tất cả chúng và ước lượng lại mô hình hãy đánh giá chất lượng của phép hồi qui mới nầy ?
Mô hình thu hẹp:
Dependent Variable: MORT
Method: Least Squares
C
73.7683
6 94.44515 0.781071 0.4390HEXC
0.08981
6 0.027059 3.319302 0.0018
EDU2
843.880
-0 352.41-0-0 -2.394597 -0.-0211
ALCC
25.2588
-8 10.23731 -2.467337 0.0177AGED
4167.31
9 307.4568 13.55416 0.0000PHYS
0.47965
4 0.193828 2.474637 0.0174POV
452.765
5 161.4134 2.805006 0.0075TOBC
1.56351
2 0.286509 5.457105 0.0000
Trang 270.94690
3
Mean dependent var
855.005
9Adjusted R-
34.2814
0
Akaike info criterion
10.0501
8Sum squared resid
-7 F-statistic
109.547
9Durbin-Watson
Dependent Variable: MORT
Method: Least Squares
0.27700
9 0.7832AGED 4126.895 322.3451
12.8027
2 0.0000
ALCC -25.91511 11.09681
2.33536
-6 0.0246EDU1 68.77913 196.8405
0.34941
5 0.7286
EDU2 -1180.217 548.8868
2.15020
-1 0.0376HEXC 0.073889 0.034127 2.16508 0.0364
Trang 288INCC 0.004511 0.005817
0.77555
1 0.4426PHYS 0.640384 0.263636
2.42904
4 0.0197POV 549.8647 308.5540
1.78206
9 0.0823TOBC 1.470480 0.353504
4.15973
2 0.0002
URB -32.45556 35.64423
0.91054
-2 0.3680
R-squared 0.948570
Mean dependent var
855.005
9Adjusted R-
squared 0.935713 S.D dependent var
137.966
0S.E of regression 34.98117
Akaike info criterion
10.1359
2Sum squared resid 48947.30 Schwarz criterion
10.5525
9Log likelihood -247.4660 F-statistic
73.7759
2Durbin-Watson
- Ước lượng lại mô hình:
Dependent Variable: MORT
Method: Least Squares
Date: 05/16/10 Time: 13:50
Trang 29Sample: 1 51
Included observations: 51
Variable
Coefficient Std Error t-Statistic Prob
C
73.7683
6 94.44515 0.781071 0.4390HEXC
0.08981
6 0.027059 3.319302 0.0018
EDU2
843.880
-0 352.41-0-0 -2.394597 -0.-0211
ALCC
25.2588
-8 10.23731 -2.467337 0.0177AGED
4167.31
9 307.4568 13.55416 0.0000PHYS
0.47965
4 0.193828 2.474637 0.0174POV
452.765
5 161.4134 2.805006 0.0075TOBC
855.005
9Adjusted R-
34.2814
0
Akaike info criterion
10.0501
8Sum squared resid
-7 F-statistic
109.547
9Durbin-Watson
Trang 3025.2588845*ALCC + 4167.318921*AGED + 0.4796537478*PHYS +
452.7654879*POV + 1.563511835*TOBC
- Đánh giá chất lượng của phép hồi quy mới:
- Việc đưa 3 biến không có ảnh đến biến phụ thuộc MORT đã gây ra hiệntượng đa cộng tuyến, làm cho mô hình ban đầu có hệ số tương quan R2 cao,trị thống kê mất ý nghĩa, làm cho chúng ta có đánh giá sai lầm về mô hình
- R2 = 94.69% được đánh giá là tốt, vì giải thích đầy đủ các biến đưa vào môhình, tức là mô hình đưa ra có ý nghĩa thống kê
4.Trở lại với mô hình gốc ban đầu ( Mô hình không giới hạn U) , lần lượt mỗi lần bỏ một biến có ít ý nghĩa nhất và ước lượng lại Đánh giá chất lượng của phép hồi qui mới ?
Bỏ EDU1
Dependent Variable: MORT
Method: Least Squares
C
92.8195
6 102.7758 0.903127 0.3717AGED
4144.66
2 314.8831 13.16254 0.0000
ALCC
24.6364
-3 10.-36-327 -2.-37728-3 0.0222
EDU2
1057.35
-9 416.-9455 -2.535-966 0.0151HEXC
0.07805
2 0.031636 2.467190 0.0179INCC
0.00407
0 0.005617 0.724592 0.4728PHYS 0.59159 0.221220 2.674242 0.0107
Trang 31469.579
1 203.7221 2.304998 0.0263TOBC
1.42636
2 0.326631 4.366888 0.0001
URB
35.9798
855.005
9Adjusted R-
34.6046
3
Akaike info criterion
10.0997
6Sum squared resid
-8 F-statistic
83.7530
3Durbin-Watson
MORT = 92.8195617 + 4144.66192*AGED - 24.63643081*ALCC -
1057.359357*EDU2 + 0.07805159076*HEXC + 0.004070138276*INCC + 0.5915970828*PHYS + 469.5791064*POV + 1.426361908*TOBC -
Dependent Variable: MORT
Method: Least Squares
Date: 05/16/10 Time: 14:02
Trang 32Sample: 1 51
Included observations: 51
Variable
Coefficient Std Error t-Statistic Prob
C
103.090
9 101.2163 1.018521 0.3143AGED
4127.92
8 312.2544 13.21976 0.0000
ALCC
25.1996
-4 10.275-48 -2.-452-40-4 0.018-4
EDU2
911.481
-5 363.0489 -2.-510630 0.0160HEXC
0.08961
6 0.027160 3.299569 0.0020PHYS
0.55067
1 0.212676 2.589252 0.0132POV
396.285
3 175.8333 2.253755 0.0295TOBC
1.53302
4 0.289927 5.287621 0.0000
URB
24.6373
855.005
9Adjusted R-
34.4084
1
Akaike info criterion
10.0732
6Sum squared resid
-2 F-statistic
95.2335
0Durbin-Watson 1.62947 Prob(F-statistic) 0.00000
Trang 33stat 2 0
MORT = 103.0909379 + 4127.928148*AGED - 25.19963943*ALCC - 911.4814852*EDU2 + 0.08961614111*HEXC + 0.5506708875*PHYS + 396.2853088*POV + 1.533024196*TOBC - 24.63729751*URB
Sau khi ước lượng lại mô hình ta thấy: R2 = 0.948413 cao do vẫn còn hiện tượng đa cộng tuyến
6.Tiếp tục quá trình nầy cho đến khi tất cả các biến còn lại đều có ý nghĩa Mô hình cuối nầy có giống như mô hình giới hạn R mà các bạn thu được từ kết quả câu 3 hay không ? từ kết quả đó bạn có suy gẫm gì?
Bỏ EDU1 Và INCC và URB
Dependent Variable: MORT
Method: Least Squares
C
73.7683
6 94.44515 0.781071 0.4390AGED
4167.31
9 307.4568 13.55416 0.0000
ALCC
25.2588
-8 10.23731 -2.467337 0.0177
EDU2
843.880
-0 352.41-0-0 -2.394597 -0.-0211HEXC
0.08981
6 0.027059 3.319302 0.0018PHYS
0.47965
4 0.193828 2.474637 0.0174POV
452.765
5 161.4134 2.805006 0.0075
Trang 349Adjusted R-
34.2814
0
Akaike info criterion
10.0501
8Sum squared resid
-7 F-statistic
109.547
9Durbin-Watson
MORT = 73.76835504 + 4167.318921*AGED - 25.2588845*ALCC -
843.8800387*EDU2 + 0.08981575805*HEXC + 0.4796537478*PHYS + 452.7654879*POV + 1.563511835*TOBC
Sau khi bỏ tất cả các biến không có tác động đến MORT, ta thấy môhình thu được giống mô hình đã ước lượng lại ở câu 3
Qua kết quả trên cho ta thấy: hậu quả của hiện tượng đa cộng tuyến là
nó làm cho chúng ta lầm tưởng rằng mô hình không giới hạn ban đầu có ýnghĩa thống kê, các biến đưa vào mô hình đều có tác động đến biến phụthuộc do R2 rất lớn ( tức giải thích được tất cả các biển đưa vào mô hình )
Dễ làm cho chúng ta có những kết luận sai lầm về mô hình ban đầu
Bài 5:
Tổng cục thống kê quốc gia của Đài Loan đưa ra một số dữ liệu về GDP thực của khu vực nông nghiệp từ năm 1958 đến 1972 như sau :
- Y : GDP thực của khu vực nông nghiệp ( triệu USD)
- X2 : Số ngày lao động hằng năm của khu vực nông nghiệp ( triệungày công lao động )
- X3 : Vốn thực của khu vực nông nghiệp hằng năm ( triệu USD)
Trang 35Trong đó T là biến xu thế theo thời gian
R là năng suất lao động trung bình thay đổi theo thời gian T.đặt Y* = lnY