LỜI MỞ ĐẦUNhư chúng ta đã biết, nếu như kinh tế vi mô và vĩ mô mô tả sự vận động của nền kinh tế, thì kinh tế lượng cung cấp các phân tích về mặt lượng mối quan hệ giữa các hiện tượng ki
Trang 2TRƯỜNG ĐẠI HỌC NGOẠI THƯƠNG KHOA KINH TẾ VÀ KINH DOANH QUỐC TẾ
Trang 3MỤC LỤC
LỜI MỞ ĐẦU
A BẢNG SỐ LIỆU SỐ 24
I MÔ TẢ THỐNG KÊ SỐ LIỆU:
1. Tổng quan:
2. Mô tả chi tiết các biến trong mô hình:
II MÔ HÌNH HỒI QUI VÀ PHÂN TÍCH HỒI QUI:
1. Phân tích mối quan hệ tương quan giữa các biến:
2. Chạy mô hình hồi qui và phân tích kết quả:
3. Một số kiểm định F:
III KIỂM ĐỊNH VÀ SỬA CHỮA CÁC KHUYẾT TẬT CỦA MÔ HÌNH:
1. Vấn đề đa cộng tuyến:
2. Vấn đề về phương sai sai số thay đổi:
B BẢNG SỐ LIỆU SỐ 58
I MÔ TẢ THỐNG KÊ SỐ LIỆU:
1. Tổng quan:
2. Mô tả chi tiết các biến trong mô hình:
II MÔ HÌNH HỒI QUI VÀ PHÂN TÍCH HỒI QUI:
1. Phân tích mối quan hệ tương quan giữa các biến:
2. Chạy mô hình hồi qui và phân tích kết quả:
3. Một số kiểm định F:
III KIỂM ĐỊNH VÀ SỬA CHỮA CÁC KHUYẾT TẬT CỦA MÔ HÌNH
1. Vấn đề đa cộng tuyến:
2. Vấn đề về phương sai sai số thay đổi:
TÀI LIỆU THAM KHẢO
Trang 4LỜI MỞ ĐẦU
Như chúng ta đã biết, nếu như kinh tế vi mô và vĩ mô mô tả sự vận động của nền kinh tế, thì kinh tế lượng cung cấp các phân tích về mặt lượng mối quan hệ giữa các hiện tượng kinh tế, cùng với sự tác động qua lại giữa chúng, trên cơ sở các số liệu thu thập từ thực tế, nhằm củng cố thêm các giả thiết, từ đó đưa ra các quyết định đúng đắn hơn Đặc biệt, trong thời đại công nghệ phát triển mạnh mẽ như hiện nay, sự đòi hỏi phải phân tích định lượng các hiện tượng kinh tế trong quá trình hoạch định chính sách vĩ mô, việc dự báo và dự đoán phải có độ tin cậy cao,… kinh tế lượng ngày càng đóng một vai trò quan trọng, và bản thân nó cũng không ngừng được hoàn thiện và phát triển.
Sau quá trình học tập và nghiên cứu, dưới sự chỉ dẫn tận tình của cô Đinh Thị Thanh Bình, nhóm chúng em đã tiếp nhận được lượng kiến thức mà môn học truyền tải, tự đó có thể hoàn thành báo cáo về bảng số liệu 24 và 58 Chúng em rất mong nhận được những ý kiến nhận xét của cô và các bạn để bài làm có thể hoàn thiện hơn!
Trang 5A BẢNG SỐ LIỆU SỐ 24
Bất kì một quốc gia nào trên thế giới muốn giữ vững trật tự, kỉ cương của xã hội cũng đều đặt
ra hệ thống luật pháp của riêng mình; và bất cứ ai vi phạm hệ thống ấy cũng đều bị bắt và xử lý theo pháp luật.
Vậy số lần phạm tội trộm cắp tài sản bị bắt giữ, thu nhập hợp pháp tính trong năm, thời gian kết án trung bình trong năm,… có ảnh hưởng như thế nào đến số lần bị bắt giữ trong năm? Để hiểu
rõ hơn, sâu sắc hơn về vấn đề trên, nhóm chúng em đã sử dụng bộ số liệu 24; bộ số liệu này dựa trên những nghiên cứu trong năm 1986 - một mốc thời gian cụ thể.
Trang 6I MÔ TẢ THỐNG KÊ SỐ LIỆU:
1 Tổng quan:
Sau quá trình thảo luận nhóm cũng như xem xét ý nghĩa của từng biến trong file bảng số liệu
24, nhóm chúng em đã quyết định chọn mô hình hồi quy gồm các biến như sau:
● Biến phụ thuộc: narr86
● Biến độc lập: (bao gồm 5 biến)
Dưới đây là kết quả thu được của nhóm khi tiến hành mô tả thống kê biến phụ thuộc và các
biến độc lập bằng lệnh miêu tả biến des:
des narr86 nparr86 ptime86 avgsen black inc86
storage display value
variable name type format label variable label
-
-narr86 byte %9.0g # times arrested, 1986
nparr86 byte %9.0g # property crme arr., 1986ptime86 byte %9.0g mos in prison during 1986avgsen float %9.0g avg sentence length, mos.black byte %9.0g =1 if black
inc86 float %9.0g legal income, 1986, $100s
Trang 7Dựa vào kết quả trên, ta có bảng tổng hợp sau:
Tên biến Định dạng hiển thị Đơn vị tính Ý nghĩa biến
narr86 %9.0g - Số lần bị bắt trong năm 1986
nparr86 %9.0g - Số lần phạm tội trộm cắp tài sản bị bắt
giữ trong năm 1986
inc86 %9.0g trăm đô Thu nhập hợp pháp tính trong năm
1986
Black %9.0g
-= 1 nếu là người da đen
=0 nếu là không là người da đen avgsen %9.0g tháng Thời gian kết án trung bình
ptime86 %9.0g tháng Số tháng ngồi tùtrong năm 1986
Sau đó sử dụng lệnh Sum để tiếp tục mô tả các biến trên:
sum narr86 nparr86 avgsen ptime86 inc86 black
Variable | Obs Mean Std Dev Min Max
Trang 8Kết quả của lệnh Sum cho ta biết số quan sát (Obs), giá trị trung bình (Mean), độ lệch chuẩn
(Std Dev.), giá trị lớn nhất (Max), giá trị nhỏ nhất (Min) của các biến.
Dựa theo kết quả trên, ta có bảng tổng hợp sau:
Biến Số quan
sát
Giá trị trung bình Độ lệch chuẩn Giá trị nhỏ nhất Giá trị lớn nhất narr86 2725 0.4044037 0.8590768 0 12
2 Mô tả chi tiết các biến trong mô hình:
Để mô tả chi tiết các biến đã chọn, dùng lệnh tab:
a) Số lần bị bắt giữ trong năm 1986.
Trang 9− Ý nghĩa c a ủ Cum: có 97.25% trong t ng s 2725 s quan sát mà S l n b b t gi ổ ố ố ố ầ ị ắ ữ trong năm 1986 ≤ 2.
b) Số lần phạm tội trộm cắp tài sản bị bắt giữ trong năm 1986.
− S l n ph m t i tr m c p tài s n b b t gi n m trong kho ng t 0 đ n 8 Trong đó ố ầ ạ ộ ộ ắ ả ị ắ ữ ằ ả ừ ế
m c 0 có t n su t đáng k nh t là 2469 chi m 90,61% , theo sau đó là s gi m xu ng ứ ầ ấ ể ấ ế ự ả ố
Trang 10đáng k các m c ti p theo V i s l n ph m t i tr m c p tài s n b b t gi là 8 ể ở ứ ế ớ ố ầ ạ ộ ộ ắ ả ị ắ ữ chi m ít nh t, ch có 0,07% ế ấ ỉ
− Ý nghĩa c a ủ Cum: có 99.63% trong t ng s 2725 s quan sát mà s l n ph m t i tr m ổ ố ố ố ầ ạ ộ ộ
c p tài s n b b t gi trong năm 1986 ≤ 3 ắ ả ị ắ ữ
c) Thời gian kết án trung bình.
Trang 13more − Thu nh p h p pháp tính trong năm 1986 dao đ ng trong kho ng t 0 đ n 54100$ v i ậ ợ ộ ả ừ ế ớ
t n su t cao nh t v n là m c 0 v i 650 l n xu t hi n chi m 23,85% Nhìn chung, thu ầ ấ ấ ẫ ứ ớ ầ ấ ệ ế
Biến black = 1 nếu là người da đen, xuất hiện 439 lần chiếm 16,11%.
Biến black =0 nếu là không phải người da đen, xuất hiện 2286 lần chiếm 83,89%
Nhìn chung, số lượng người da đen chiếm tỉ lệ thấp hơn so với người da màu khác trong mối quan hệ với số lần bị bắt giữ trong năm 1986.
Trang 14II MÔ HÌNH HỒI QUI VÀ PHÂN TÍCH HỒI QUI:
❖ Hàm hồi quy tổng thể (PRF) và hàm hồi quy mẫu (SRF):
Chọn biến phụ thuộc Y là narr86, các biến độc lập X1, X2, X3, X4, X5 lần lượt là nparr86,
avgsen, ptime86, inc86, black.
Như vậy ta có hàm hồi qui tổng thể PRF biểu diễn mối quan hệ phụ thuộc giữa Y và các biến
X như sau:
Narr86 = + * nparr86 + * avgsen + * ptime86 + * inc86 + * black +
Hàm hồi qui mẫu SRF là:
+ * nparr86 + * avgsen + * ptime86 + * inc86 + * black
1 Phân tích mối quan hệ tương quan giữa các biến:
Thực hiện lệnh corr có bảng tương quan giữa biến phụ thuộc narr86 và các biến độc lập như
- Hệ số tương quan giữa narr86 và nparr86 là 0.6608
- Hệ số tương quan giữa narr86 và avgsen là 0.0293
- Hệ số tương quan giữa narr86 và ptime86 là -0.0299
- Hệ số tương quan giữa narr86 và inc86 là -0.1900
- Hệ số tương quan giữa narr86 và black là 0.1493
Trang 15Như vậy, ta có thể thấy trong các nhân tố được nghiên cứu, biến nparr86 có mối tương quan mạnh nhất đến narr86, hay nói cách khác số lần phạm tội trộm cắp tài sản bị bắt giữ trong năm
1986 có ảnh hưởng khá lớn đến số lần bị bắt trong năm 1986 Hệ số tương quan mang dấu dương cũng thể hiện mối quan hệ cùng chiều giữa các biến, như nếu số lần phạm tội trộm cắp tài sản bị bắt giữ trong năm 1986 tăng thì số lần bị bắt giữ trong năm 1986 cũng tăng
Ngược lại, biến avgsen ít ảnh hưởng nhất đến narr86, hay mối tương quan giữa thời gian
kết án trung bình và số lần bị bắt giữ trong năm 1986 không mạnh như các yếu tố khác Hệ số tương quan giữa 2 biến mang dấu dương, chứng tỏ chúng có quan hệ cùng chiều, nếu thời gian kết án trung bình tăng thì số lần bị bắt giữ trong năm 1986 tăng nhưng không đáng kể.
Ngoài ra, vì giá trị tuyệt đối của các chỉ số đều nhỏ hơn 0.8 nên dự đoán sẽ không xảy ra hiện tượng đa cộng tuyến.
2 Chạy mô hình hồi qui và phân tích kết quả:
* Sử dụng lệnh hồi qui reg ta có kết quả như sau:
reg narr86 nparr86 avgsen ptime86 inc86 black
Source | SS df MS Number of obs = 2725 -+ - F( 5, 2719) = 452.37 Model | 912.915316 5 182.583063 Prob > F = 0.0000 Residual | 1097.43184 2719 403615977 R-squared = 0.4541 -+ - Adj R-squared = 0.4531 Total | 2010.34716 2724 738012906 Root MSE = 63531
narr86 | Coef Std Err t P>|t| [95% Conf Interval] -+ - nparr86 | 1.138975 .0255741 44.54 0.000 1.088828 1.189121 avgsen | .0074017 .0035952 2.06 0.040 0003521 .0144513 ptime86 | -.02286 .0064938 -3.52 0.000 -.0355933 -.0101267 inc86 | -.0012251 .0001887 -6.49 0.000 -.0015952 -.000855 black | .1654735 .0338007 4.90 0.000 0991958 .2317511 _cons | .3063096 .0181962 16.83 0.000 2706299 .3419893 -
Trang 16Phương trình hồi qui mẫu của mô hình là:
narr86 = 0.3063096 + 1.138975* nparr86 + 0.0074017 * avgsen-0.02286* ptime86 -
− Hệ số xác định điều chỉnh = 0.4531
Trang 17− Ý nghĩa các hệ số hồi quy trong mô hình:
Với điều kiện các yếu tố khác không đổi thì :
▪ = 0.3063096 có nghĩa khi giá tr các bi n đ c l p = 0 thì s l n b b t trong năm 1986 là ị ế ộ ậ ố ầ ị ắ 0.3063096 l n ầ
▪ = 1.138975 có nghĩa số lần phạm tội trộm cắp tài sản bị bắt giữ trong năm 1986 tăng lên 1 đơn vị thì tổng số lần bị bắt giữ tăng lên 1.138975 lần.
▪ = 0.0074017 có nghĩa nếu thời gian kết án trung bình tăng lên 1 tháng thì số lần bị bắt giữ tăng 0.0074017 lần.
▪ = -0.02286 có nghĩa là nếu số tháng ngồi tù trong năm 1986 tăng lên 1 tháng thì số lần bị bắt giữ giảm đi 0.02286 lần.
▪ = -0.0012251có nghĩa nếu thu nhập hợp pháp tính trong năm 1986 tăng lên 100$ thì số lần bị bắt giữ giảm đi 0.0012251 lần.
▪ = 0.1654735 có nghĩa nếu là người da đen thì số lần bị bắt giữ cao hơn so với da màu khác 0.1654735 lần.
3 Một số kiểm định F:
a) Kiểm định sự phù hợp của mô hình:
- Mục đích: xem xét trường hợp các tham số của biến độc lập đồng thời bằng 0 có thể xảy ra hay không.
- Có cặp giả thuyết thống kê:
Nếu giá trị Prob > F nhỏ hơn mức ý nghĩa thì bác bỏ Ho, chấp nhận H1 tức là hàm hồi quy mẫu phù hợp.
Trang 18test nparr86 avgsen ptime86 inc86 black
Như vậy, Prob > F = 0.0000, nhỏ hơn mức ý nghĩa , vì thế bác bỏ Ho.
→ Hệ số hồi qui của các biến độc lập không đồng thời bằng 0 mô hình hồi qui phù hợp.
b) Kiểm định giả thuyết về hệ số hồi qui:
- Mục đích: kiểm định ảnh hưởng của từng biến độc lập lên giá trị trung bình của biến phụ
thuộc narr86.
- Có cặp giả thuyết thống kê:
N u giá tr Prob > F nh h n m c ý nghĩa thì bác b H ế ị ỏ ơ ứ ỏ o, ch p nh n H ấ ậ 1, t c là bi n đ c ứ ế ộ
l p đó có ý nghĩa th ng kê đ i v i narr86 ậ ố ố ớ
Trang 19III KIỂM ĐỊNH VÀ SỬA CHỮA CÁC KHUYẾT TẬT CỦA MÔ HÌNH:
1 Vấn đề đa cộng tuyến:
a) Bản chất:
Đa cộng tuyến là một lỗi của mô hình phân tích hồi quy, xảy ra khi giữa các biến độc lập X i
trong mô hình hồi quy đa biến có tương quan tuyến tính với nhau
b) Nguyên nhân:
Có 3 nguyên nhân gây ra vấn đề đa cộng tuyến:
●Đa cộng tuyến hoàn hảo xảy ra khi đặt mô hình sai, trên thực tế hiện tượng đa cộng tuyến hoàn hảo ít khi xảy ra.
●Đa cộng tuyến không hoàn hảo xảy ra do bản chất hiện tượng kinh tế xã hội mà các biến độc lập đã có sẵn mối quan hệ cộng tuyến với nhau.
●Đa cộng tuyến không hoàn hảo xảy ra do số liệu điều tra không đủ lớn, hay số liệu điều tra không ngẫu nhiên.
Các dạng mô hình dễ xảy ra đa cộng tuyến:
- Hồi quy dạng các biến độc lập được bình phương sẽ xảy ra đa cộng tuyến, đặc biệt khi phạm
vi giá trị ban đầu của biến độc lập là nhỏ.
- Các biến độc lập vĩ mô được quan sát theo chuỗi thời gian.
c) Cách phát hiện đa công tuyến:
➢ Cách 1: Dùng lệnh corr [indep] để kiểm định đa cộng tuyến Nếu giữa 2 biến có giá trị corr
> 0.8 thì mô hình có khả năng xảy ra đa cộng tuyến.
Sử dụng phần mềm stata và lệnh corr, ta thu được kết quả như sau:
corr nparr86 avgsen ptime86 inc86 black
Từ bảng số liệu trên, ta thấy giá trị corr của các biến rất nhỏ so với 0.8 nên mô hình không
tồn tại đa cộng tuyến.
Trang 20➢ Cách 2: Dùng lệnh vif Nếu Mean VIF > 10 thì mô hình có hiện tượng đa cộng tuyến.
Sử dụng phần mềm stata và lệnh vif, ta thu được kết quả như sau:
Từ bảng kết quả trên, ta thấy Mean VIF < 10 => Mô hình không tồn tại vấn đề đa cộng tuyến.
Kết luận: Từ các cách kiểm định khác nhau trên, ta thấy không tồn tại vấn đề đa cộng tuyến trong
− Do định dạng không đúng dạng hàm của mô hình Có thể do bỏ sót biến thích hợp hoặc giải tích của hàm là sai.
− Do số liệu không phản ánh đúng bản chất của hiện tượng kinh tế, chẳng hạn xuất hiện các quan sát ngoại lai Quan sát ngoại lai là các quan sát khác biệt rất nhiều ( quá nhỏ hoặc quá lớn) với các quan sát khác trong mẫu Việc đưa vào hay loại bỏ các quan sát này ảnh hưởng rất lớn đến phân tích hồi quy.
− Do kỹ thuật thu thập, bảo quản và xử lý số liệu được cải tiến nên sai số có xu hướng
Trang 21− Do con người học được hành vi trong quá khứ Chẳng hạn, lỗi của người đánh máy càng
ít nếu thời gian thực hành càng tăng…
c) Cách phát hiện dấu hiệu của phương sai sai số thay đồi:
➢ Cách 1: Xem xét đồ thị của phần dư:
Trong cách này ta sẽ sử dụng đồ thị của sai số của hồi qui e (phần dư) với giá trị dự đoán Y i (biểu diễn sự tương quan giữa e và Y i ).
Từ cơ sở dữ liệu đã cho và phần mềm stata, sử dụng lệnh rvfplot, yline (0) ta xây dựng
được Đồ thị sau:
Dựa vào lí thuyết kinh tế lượng đã được học và đồ thị vừa xây dựng được, ta thấy các giá trị trên đồ thị phân bố không đồng đều, các giá trị tuy có xoay xung quanh giá trị trung bình bằng 0 (đường ngang màu đỏ), tuy nhiên tỉ lệ rời xa giá trị trung bình bằng 0 còn khá lớn Vì thế, ta có thể
dự đoán được mô hình có hiện tượng phương sai sai số thay đổi.
Trang 22imtest, white
White's test for Ho: homoskedasticity
against Ha: unrestricted heteroskedasticity
-Từ bảng trên, kết quả kiểm định bằng lệnh imtest, white cho thấy Prob > chi2 = 0.0000 < 0.05
=> Bác bỏ giả thiết H0, H1 đúng hay mô hình có phương sai sai số thay đổi (với mức ý nghĩa 5%).
➢ Cách 3: Dùng kiểm định Breusch – Pagan:
Cặp giả thuyết:
Sử dụng phần mềm stata và lệnh hettest, ta thu được kết quả như sau:
hettest
Breusch-Pagan / Cook-Weisberg test for heteroskedasticity
Ho: Constant variance
Variables: fitted values of narr86
chi2(1) = 315.85
Prob > chi2 = 0.0000
Từ kết quả thu được, ta thấy Prob > chi2 = 0.0000 < 0.05 => Bác bỏ giả thiết H0, H1 đúng hay mô hình có phương sai sai số thay đổi (với mức ý nghĩa 5%).
Kết luận: Vì kết quả của các kiểm định trên thống nhất nên có thể kết luận được rằng có xảy ra
hiện tượng phương sai sai số thay đổi trong mô hình.
Trang 23d) Cách khắc phục hiện tượng phương sai sai số thay đổi
Để khắc phục hiện tượng phương sai sai số thay đổi, chúng ta dùng lệnh robust, thu được kết
quả:
reg narr86 nparr86 avgsen ptime86 inc86 black, robust
Linear regression Number of obs = 2725 F( 5, 2719) = 148.18 Prob > F = 0.0000 R-squared = 0.4541 Root MSE = 63531
| Robust
narr86 | Coef Std Err t P>|t| [95% Conf Interval] -+ - nparr86 | 1.138975 .0478223 23.82 0.000 1.045203 1.232747 avgsen | .0074017 .0045754 1.62 0.106 -.00157 .0163733 ptime86 | -.02286 .0040695 -5.62 0.000 -.0308396 -.0148804 inc86 | -.0012251 .0001533 -7.99 0.000 -.0015257 -.0009244 black | .1654735 .0445903 3.71 0.000 0780391 .2529078 _cons | .3063096 .0187887 16.30 0.000 2694681 .3431511 -
Với cách này, mô hình đã khắc phục được hiện tượng phương sai sai số thay đổi trong mô hình.