Kinh tế lượng sử dụng các công cụ phương pháp của thống kê toán để tìm ra bản chất của các số liệu thống kê, đưa ra kết luận về các số liệu thống kê thu thập được từ đó có thể đư
Trang 1TRƯỜNG ĐẠI HỌC NGOẠI THƯƠNG
-BÁO CÁO THỰC HÀNH KINH TẾ LƯỢNG
Đề tài 1 : “Lập mô hình phân tích sự ảnh hưởng của một số yếu
tố đến tiền lương của CEO”
(file data: 19_CEOSAL2)
Đề tài 2 : “Lập mô hình phân tích sự ảnh hưởng của một số yếu
tố đến điểm trung bình môn tích lũy của sinh viên”
(file data : 41_GPA3)
Giáo viên hướng dẫn: TS Đinh Thị Thanh Bình Lớp: KTE309(2-1314).11_LT
Hà Nội, ngày 09 tháng 04 năm 2014.
Trang 2DANH SÁCH NHÓM VÀ PHÂN CÔNG CÔNG VIỆC
1 Nguyễn Thu Trang 1211110687 File 41 : Thiết lập mô hình
2 Nguyễn Ngọc Trâm 1213310118 File 41 : Kiểm định và phát hiện lỗi
mô hình
3 Lê Khánh Toàn – Nhóm trưởng 1213310117
File 41 : Sửa lỗi và đánh giá mô hình
4 Nguyễn Khắc Tôn 1111210061 File 19 : Thiết lập mô hình
5 Hoàng Thị Thùy Trang 1212230068 File 19 : Kiểm định và phát hiện lỗi
mô hình
6 Tống Minh Trang 1213310125 File 19 : Sửa lỗi và đánh giá mô
hình
Trang 4MỤC LỤC
LỜI MỞ ĐẦU 5
PHẦN I: FILE 19_CEOSAL2 6
I CƠ SỞ LÝ THUYẾT VỀ VẤN ĐỀ NGHIÊN CỨU 6
II THIẾT LẬP, KIỂM ĐỊNH, PHÂN TÍCH LỖI, SỬA LỖI MÔ HÌNH 6
1 THIẾT LẬP MÔ HÌNH 6
a Chọn biến phụ thuộc và các biến độc lập 6
b Mô hình hồi quy tổng thể và hàm hồi quy mẫu 7
c Miêu tả biến 8
d Lập bảng tương quan 18
e Chạy mô hình và diễn giải ý nghĩa hệ số hồi quy 19
2 KIỂM ĐỊNH MÔ HÌNH 21
a Kiểm định ý nghĩa ý nghĩa thống kê của các biến: 21
b Kiểm định sự phù hợp của mô hình 22
c Kiểm định đa ràng buộc tuyến tính 23
3 PHÂN TÍCH MÔ HÌNH 24
a Kiểm định đa cộng tuyến 24
b Kiểm định phương sai sai số thay đổi 26
c Kiểm định định dạng mô hình 27
4 SỬA CÁC LỖI CỦA MÔ HÌNH 28
III ĐÁNH GIÁ MÔ HÌNH 31
1 Mô hình hồi quy mẫu : 31
2 Mô hình hồi quy sau khi thực hiện phép biến đổi logarit 31
PHẦN II: FILE 41_GPA3 32
I CƠ SỞ LÝ THUYẾT VỀ VẤN ĐỀ NGHIÊN CỨU 32
II THIẾT LẬP, KIỂM ĐỊNH, PHÂN TÍCH LỖI, SỬA LỖI MÔ HÌNH 32
1 THIẾT LẬP MÔ HÌNH 32
a Chọn biến phụ thuộc và các biến độc lập 32
b Mô hình hồi quy tổng thể và hàm hồi quy mẫu 33
c Miêu tả biến 34
Trang 5d Lập bảng tương quan 46
e Chạy mô hình và diễn giải ý nghĩa hệ số hồi quy 47
2 KIỂM ĐỊNH MÔ HÌNH 49
a Kiểm định ý nghĩa thống kê của các biến 49
b Kiểm định sự phù hợp của mô hình 50
c Kiểm định đa ràng buộc tuyến tính 51
3 PHÂN TÍCH MÔ HÌNH 51
a Kiểm định đa cộng tuyến 51
b Kiểm định phương sai sai số thay đổi 53
c Kiểm định định dạng mô hình 55
4 SỬA LỖI MÔ HÌNH 56
III ĐÁNH GIÁ MÔ HÌNH 58
1 Mô hình hồi quy mẫu : 58
2 Mô hình hồi quy sau khi thực hiện phép biến đổi logarit. 59
KẾT LUẬN 60
TÀI LIỆU THAM KHẢO 61
Trang 6LỜI MỞ ĐẦU
Kinh tế lượng (Econometrics) là môn khoa học xã hội trong đó các công cụ của lý thuyết kinh tế, toán học và suy đoán thống kê được áp dụng để phân tích các vấn đề kinh tế Kinh tế lượng sử dụng các công cụ phương pháp của thống kê toán để tìm ra bản chất của các số liệu thống kê, đưa ra kết luận về các số liệu thống kê thu thập được từ đó có thể đưa ra các dự báo về các hiện tượng kinh tế.
Từ khi ra đời đến nay, kinh tế lượng đã đem lại cho các nhà kinh tế một công cụ đo lường sắc bén để đo các quan hệ kinh tế Là những sinh viên đang theo học khối ngành kinh tế, chúng
em nhận thấy được sự cần thiết của việc học tập và tìm hiểu về Kinh tế lượng trong việc phân tích logic và nghiên cứu vấn đề Để hiểu sâu hơn về việc đưa Kinh tế lượng vào trong thực tế
cuộc sống và áp dụng Kinh tế lượng sao cho đúng và hiệu quả, nhóm em xin xây dựng bài BÁO CÁO THỰC HÀNH KINH TẾ LƯỢNG dưới sự hướng dẫn của TS Đinh Thị Thanh Bình.
Trong bài tiểu luận, nhóm đã sử dụng công cụ phân tích kinh tế lượng là phần mềm stata để phân tích, nghiên cứu dựa trên số liệu của 2 file dữ liệu:
• 19_CEOSAL2: "Phân tích sự ảnh hưởng của một số yếu tố đến tiền lương của CEO”
• 41_GPA3: " Phân tích ảnh hưởng của các yếu tố tới điểm trung bình môn tích lũy của
sinh viên"
Đây là lần đầu tiên nhóm cùng nhau nghiên cứu vấn đề bằng việc ứng dụng dụng phương pháp kinh tế lượng Do những hạn chế về kiến thức thực tế, phương pháp nghiên cứu, thời gian nghiên cứu nên bài tiểu luận không tránh khỏi những thiếu sót Rất mong nhận được đóng góp từ
TS Đinh Thị Thanh Bình để bài nghiên cứu được hoàn thiện hơn.
Chúng em xin chân thành cảm ơn cô!
Trang 7PHẦN I: FILE 19_CEOSAL2
I CƠ SỞ LÝ THUYẾT VỀ VẤN ĐỀ NGHIÊN CỨU
Nghiên cứu cho thấy có nhiều yếu tố khác nhau ảnh hưởng tới tiền lương của người lao động.sự tác động của mỗi yếu tố là khác nhau.tại việt nam thanh niên có độ tuổi từ 18 tới 25 có nhiều đóng góp nhưng họ không phải là những người giàu có.ngược lại những người có độ tuổi
>= 50 lại là những người có thu nhập cao nhất.
Người có học vấn càng cao thì thu nhập càng cao Hay nghiên cứu gần đây của Caponi và Plesca (2007) chỉ ra rằng những người tốt nghiệp đại học thu nhập cao hơn người chỉ tốt nghiệp phổ thông trung học từ 30 tới 40%.yếu tố ngành nghề cũng là một trong nhũng yếu tố quyết định về tiền lương của người lao động.
Trên cơ sở những lý thuyết liên quan, đề tài nghiên cứu của nhóm “Các yếu tố ảnh hưởng đến tiền lương của CEO” sẽ phân tích, nghiên cứu xu hướng và mức độ tác động của các nhân
II THIẾT LẬP, KIỂM ĐỊNH, PHÂN TÍCH LỖI, SỬA LỖI MÔ HÌNH 1 THIẾT LẬP
MÔ HÌNH
a Chọn biến phụ thuộc và các biến độc lập
Từ file số liệu 19_CEOSAL2 và sử dụng lệnh “des” trong phần mềm stata, ta thu được kết quả
Trang 8
comten byte %9.0g years with company
Sorted by:
-File 19_CEOSAL2 được lập vào 23:44 ngày 17/08/1999 bao gồm 15 biến, 177 quan sát Dựa vào những lý thuyết nêu ở trên và dự liệu của file 19_CEOSAL2, nhóm quyết định chọn biến lsalary là biến phụ thuộc, các biến lsales lmktval ceoten age comten grad là các biến độc lập.
b Mô hình hồi quy tổng thể và hàm hồi quy mẫu
− Mô hình hồi quy tổng thể:
lsalary age comten ceoten lmktval lsales grad
Trang 9c Miêu tả biến
• Sử dụng lệnh “des lsales lmktval ceoten age comten grad ” ta thu được kết quả như
sau:
grad 9% Số nguyên =1 nếu tốt nghiệp đại học
lsales 9% Số nguyên Logarit của doanh thu công ty năm 1990
lmktval 9% Số nguyên Logarit của giá trị thị trường công ty
Trang 11• Sử dụng lệnh sum:
sum lsalary lsales lmktval ceoten comten grad age
Tên biến Số quan Trung Độ lệch Giá trị Giá trị lớn quan sát
• Sử dụng lệnh “tab1 lsales lmktval ceoten comten grad age” để xem xét bảng phân
phối tần suất các giá trị của các biến:
tab1 lsales lmktval ceoten comten grad age
-> tabulation of lsales
Trang 13log(sales) | Freq Percent Cum.
Trang 21Trước khi chạy hồi quy mô hình, chúng ta xem xét mức độ tương quan giữa các biến sử
dụng lệnh corr lsalary age college comten sales ceotenta thu được ma trận tương quan giữa các
biến như sau:
Trang 22corr lsalary age college comten sales ceoten
Nhận xét: Từ ma trận tương quan, ta rút ra một số điểm sau:
- Mức độ tương quan giữa biến phụ thuộc lsalaryvới các biến độc lập age, comten ,ceoten, lsales, grad,lmktvalkhông đồng đều, trong khi tương quan của lsalary với sales là tương đối lớn
(r = -0.4098) thì tương quan của lsalary với comten lại yếu hơn nhiều (r=-0.0023).
- Tương quan của các biến độc lập với nhau là không lớn, chỉ có tương quan của age và
comten là cao hơn cả (r = 0.4794).
- Kì vọng dấu:
• r(lsalary, lsales) = 0.5300 > 0 nên kỳ vọng 1 có giá trị dương
• r(salay, lmktval) = 0.4815 >0 nên kỳ vọng 2 có giá trị dương
• r(salay,ceoten) = 0.1147 > 0 nên kỳ vọng 3 có giá trị dương
• r(salay, age) = 0.0906 > 0 nên kỳ vọng 4 có giá trị dương
• r(salay, comten) = -0.0023 < 0 nên kỳ vọng 5 có giá trị âm
• r(salay, grad) = 0.0131 > 0 nên kỳ vọng 6 có giá trị dương
e Chạy mô hình và diễn giải ý nghĩa hệ số hồi quy
• Hồi quy biến lsalary theo các biến lsales lmktval ceoten age comten gradbằng lệnh
reg, ta có:
reg lsalary lsales lmktval ceoten age comten grad
Trang 23- Số quan sát đưa vào phân tích obs = 177
- Phần tổng bình phương các độ lệch giữa giá trị lsalary với giá trị trung bình của nó SST
= 64.6462131
- Tổng bình phương tất cả các sai lệch giữa giá trị của biến lsalary nhận được từ hàm hồi
quy mẫu với giá trị trung bình của chúng SSE = 22.908898
- Tổng bình phương các phần dư SSR = 41.737315
- Sai số chuẩn của ước lượng Root MSE =0.49549
- Mức độ phù hợp của mô hình so với thực tế là R2 =0.3544có nghĩa là tính phù hợp của
mô hình là không cao Nó thể hiện rằng các biến độc lập trong mô hình giải thích được 35.44% sự thay đổi của tiền lương trung bình của CEO.
Hệ số hồi quy Khoảng tin cậy 2 phía với độ tin cậy 95%
Trang 24với giả thiết các yếu tố khác không đổi, khi số năm làm CEO ở công ty tăng = 0.01676 > 0:
lên 1 năm thì tiền lương trung bình của CEO năm 1990 tăng lên 1.676%
̂
Với giả thiết các yếu tố khác không đổi, khi số tuổi của CEO tăng thêm 1 = 0.000148 > 0:
tuổi thì tiền lương trung bình năm 1990 của CEO tăng 0.0148%
̂
: Với giả thiết các yếu tố khác không đổi, khi số năm kinh nghiệm ở công = −0.0104312 < 0
ty tăng thêm một năm thì tiền lương trung bình năm 1990 của CEO giảm 1.04312 %
̂
: Với giả thiết các yếu tố khác không đổi, nếu CEO tốt nghiệp đại học thì = -0.0979702 < 0
tiền lương trung bình của CEO năm 1990 giảm 9.79702%
2 KIỂM ĐỊNH MÔ HÌNH
a Kiểm định ý nghĩa ý nghĩa thống kê của các biến:
Với mô hình thiết kế ở trên, chúng ta tiến hành kiểm định ý nghĩa thống kê của các biến độc lập.
4 =
6 = 0
1 ≠ 0( = 4,6)
Trang 25−
( )
- Phương pháp kiểm định: Kiểm định bằng phương pháp p- value.
- Quy tắc kiểm định: nếu giá trị p-value lớn hơn mức ý nghĩa α = 0,05 thì ta có cơ sở bác
bỏ giả thuyết H0, chấp nhận giả thuyết H1.
Từ kết quả chạy hồi quy,các giá trị p-value của các biến độc lập age, grad có giá trị p-value lớn hơn mức ý nghĩa 0,05, các biến này không có ý nghĩa thống kê tại mức ý nghĩa 5%.
b Kiểm định sự phù hợp của mô hình
- Phương pháp kiểm định: Kiểm định bằng phương pháp p-value.
- Quy tắc kiểm định: Nếu giá trị p-value nhỏ hơn mức ý nghĩa = 0.05 thì bác bỏ H0 , chấp nhận H 1
Dùng lệnh "test", kết quả thu được:
test lsales lmktval ceoten age comten grad
( 1) lsales = 0
Trang 26Kết luận: Mô hình hồi quy phù hợp
c Kiểm định đa ràng buộc tuyến tính
Sau khi chạy hồi quy hàm hồi quy mẫu, nhận thấy giá trị ước lượng ̂
4 có giá trị rất nhỏ (0.000148)
Đặt vấn đề: Có thể bỏ biến age ra khỏi mô hình không?
- Phương pháp kiểm định: sử dụng giá trị p-value
- Quy tắc kiểm định: nếu giá trị p-value nhỏ hơn mức ý nghĩa = 0.05 thì bác bỏ H 0 , chấp
Ta sử dụng lệnh "test" như trên nhưng chỉ với biến sales Vì
Kết luận: Bỏ biến age ra khỏi mô hình vì yếu tố age không ảnh hưởng đến biến
tiền lương của CEO.
=> Vậy các biến độc lập của mô hình là lsales, lmktval, ceoten, comten, grad.
Trang 273 PHÂN TÍCH MÔ HÌNH
a Kiểm định đa cộng tuyến
Để kiểm định mô hình có mắc phải lỗi đa cộng tuyến hay không, nhóm đã sử dụng 3
cách khác nhau được trình bày dưới đây:
• Cách 1 : R2 cao nhưng tỉ số t thấp
- Nguyên tắc kiểm định: Trong trường hợp R2 cao (thường R2 >0.8) mà tỉ số t thấp
(thường |t|< 1) thì mô hình có dấu hiệu của đa cộng tuyến.
- Kết quả chạy hồi quy:
reg lsalary lsales lmktval ceoten age comten grad
-+ - F( 6, 170) = 15.55
Model | 22.908898 6 3.81814967 Prob > F = 0.0000 Residual | 41.737315 170 245513618 R-squared = 0.3544 -+ - Adj R-squared = 0.3316
Total | 64.6462131 176 367308029 Root MSE = 49549 -
lsalary | Coef Std Err t P>|t| [95% Conf Interval] -+ -
lsales | 1927726 0399535 4.82 0.000 1139037 2716415 lmktval | 1006935 0492993 2.04 0.043 003376 1980111 ceoten | 01676 0057118 2.93 0.004 0054849 0280351 age | 000148 0052337 0.03 0.977 -.0101834 0104794 comten | -.0104312 0036879 -2.83 0.005 -.0177112 -.0031512 grad | -.0979702 0779818 -1.26 0.211 -.2519076 0559672 _cons | 4.58892 3386964 13.55 0.000 3.920328 5.257512 -
- Từ kết quả hồi quy mô hình ở trên, ta xác định được R2 = 0.3544< 0.8 vàphần lớncác tỉ
số |t| lớn hơn 1.
Kết luận: không phát hiện ra lỗi đa cộng tuyến trong mô hình hồi quy.
• Cách 2 : tương quan cặp giữa các biến độc lập cao
- Nguyên tắc kiểm định: nếu hệ số tương quan cặp giữa các biến độc lập cao (r > 0.8) thì
có khả năng tồn tại đa cộng tuyến.
- Kết quả bảng tương quan giữa các biến độc lập:
Trang 28corr lsales lmktval ceoten age comten grad
Kết luận: Không phát hiện ra lỗi đa cộng tuyến.
• Cách 3 : Sử dụng nhân tử phóng đại phương sai
- Nguyên tắc kiểm định: Nếu giá trị nhân tử phóng đại phương sai tương ứng của từng
biến độc lập lớn (VIF(Xj) > 10) thì mô hình có khả năng mắc lỗi đa cộng tuyến.
- Sử dụng lệnh “vif” ta có kết quả:
Trang 29Kết luận: không phát hiện lỗi đa cộng tuyến trong mô hình.
Kết luận chung về lỗi đa cộng tuyến của mô hình
cộng tuyến đều cho cùng kết quả là không phát hiện hình không mắc đa cộng tuyến.
: với 3 cách kiểm định lỗi đa
ra lỗi Ta có thể kết luận mô
Để kiểm định mô hình có lỗi phương sai sai số thay đổi hay không, nhóm đưa ra 3 cách kiểm định dưới đây:
• Cách 1: (định tính) Xem xét biểu đồ phần dư của giá trị dự đoán ̂
- Nguyên tắc kiểm định: nếu độ rỗng của biểu đồ rải của phần dư tăng hoặc giảm khi
̂ tăng thì giả thiết về phương sai sai số không đổi có thể không được thỏa mãn.
Trang 30• Cách 2 : sử dụng kiểm định White
ố ℎô ổ đổ
1: ℎươ ố ℎ ổ đổ
- Nguyên tắc kiểm định: với mức ý nghĩa = 0.05, nếu giá trị p-value <0.05 thì có cơ sở bác bỏ0 và chấp nhận 1
- Sử dụng lệnh “imtest, white” ta thu được:
imtest, white
White's test for Ho: homoskedasticity
against Ha: unrestricted heteroskedasticity
Kết luận : Mô hình có lỗi phương sai sai số thay đổi.
Kết luận chung về lỗi phương sai sai số thay đổi: với 2 cách kiểm định trên ta
nhận thấy mô hình mắc lỗi phương sai sai số thay đổi.
c Kiểm định định dạng mô hình
Theo kết quả kiểm định ở phần II 2 thì tất cả các hệ số hồi quy đều có ý nghĩa thống kê ở mức ý nghĩa 5%, nên các biến đưa vào mô hình là cần thiết và không thể loại bỏ ra khỏi mô hình.
Trang 31Để kiểm tra mô hình có lỗi định dạng sai do thiếu biến hay không, nhóm đã sử dụng kiểm định Ramsey.
- Nguyên tắc kiểm định: với mức ý nghĩa = 0.05, nếu giá trị p-value <0.05 thì có cơ sở bác bỏ0 và chấp nhận 1
Chạy lệnh “ovtest” bằng stata, ta thu được kết quả sau:
ovtest
Ramsey RESET test using powers of the fitted values of lsalary
Ho: model has no omitted variables
- Từ kết quả thu được ở trên, nhận thấy giá trị p-value = 0.0163<0.05 nên có cơ sở bác bỏ giả thuyết H 0 , chấp nhận H 1
Kết luận: Mô hình đã bỏ sót biến.
4 SỬA CÁC LỖI CỦA MÔ HÌNH
Sửa lỗi phương sai sai số thay đổi trong mô hình hồi quy mẫu
Trong phần này, để sửa lỗi phương sai sai số thay đổi nhóm sử dụng phương pháp biến đổi logarit (Theo giả thiết : Hạng hàm sai) Bởi vì, việc ước lượng hồi quy có thể làm giảm phương sai của sai số thay đổi do tác động của phép biến đổi logarit.
Trong mô hình có 6 biến độc lập, để có thể logarit hóa, thì biến đó phải luôn dương, vì vậy
nhóm quyết định chọn 2 biến age và comten để thực hiện logarit hóa.
Thực hiện phép biến đổi logarit với biến hsrank ta thu được mô hình :
=+∗ +∗ +∗ + ∗ ( ) + ∗ ( ) + ∗ +
Trang 32Trong đó : logage = ln(age)
logcomten = ln(comten) Tạo biến logrank trong Stata : gen logage = ln(age)
gen logcomten = ln(comten)
Chạy hồi quy ta thu được kết quả :
reg lsalary grad ceoten lsales lmktval logage logcomten
-+ - F( 6, 170) = 15.05
Model | 22.4222752 6 3.73704587 Prob > F = 0.0000 Residual | 42.2239378 170 248376105 R-squared = 0.3468 -+ - Adj R-squared = 0.3238
Total | 64.6462131 176 367308029 Root MSE = 49837
-lsalary | Coef Std Err t P>|t| [95% Conf Interval] -+ -
grad | -.0878596 0780784 -1.13 0.262 -.2419877 0662686 ceoten | 0166873 0057263 2.91 0.004 0053835 027991 lsales | 1903752 0403187 4.72 0.000 1107855 269965 lmktval | 1027612 049553 2.07 0.040 0049428 2005796 logage | -.1423442 2777695 -0.51 0.609 -.6906659 4059775 logcomten | -.1369917 0575226 -2.38 0.018 -.2505424 -.023441 _cons | 5.328336 1.060177 5.03 0.000 3.235529 7.421143 -
Mô hình hồi quy :
Trang 33Đồng thời các giá trị p-value đều nhỏ hơn 0,05 nên các biến độc lập trong mô hình đều có
ý nghĩa thống kê ở mức ý nghĩa 5%.
Nhóm tiến hành kiểm tra lỗi phương sai sai số thay đổi trong mô hình hồi quy sau khi
thêm trọng số bằng kiểm định White:
imtest, white
White's test for Ho: homoskedasticity
against Ha: unrestricted heteroskedasticity