Trên cơ sở những lý thuyết liên quan, đề tài nghiên cứu của nhóm “Các yếu tố ảnh hưởng đến tiền lương của CEO” sẽ phân tích, nghiên cứu xu hướng và mức độ tác động của các
Trang 1TRƯỜNG ĐẠI HỌC NGOẠI THƯƠNG
Đề tài 1 : “Lập mô hình phân tích sự ảnh hưởng
của một số yếu tố đến tiền lương của CEO”
(file data: 19_CEOSAL2)
Đề tài 2 : “Lập mô hình phân tích sự ảnh hưởng
của một số yếu tố
đến điểm trung bình môn tích lũy của sinh viên”
(file data :41_GPA3)
Giáo viên hướng dẫn: TS Đinh Thị Thanh
Bình
Lớp: KTE309(2-1314).11_LT
Hà Nội, ngày 09 tháng 04 năm 2014.
Trang 2DANHSÁCH NHÓM VÀ PHÂN CÔNG CÔNG VIỆC
1 Nguyễn Thu Trang 1211110687 File 41 : Thiết lập mô hình
2 Nguyễn Ngọc Trâm 1213310118 File 41 : Kiểm định và phát hiện lỗi mô hình
3 Lê Khánh Toàn – Nhóm
File 41 : Sửa lỗi và đánh giá
mô hình
4 Nguyễn Khắc Tôn 1111210061 File 19 : Thiết lập mô hình
5 Hoàng Thị Thùy Trang 1212230068 File 19 : Kiểm định và phát hiện lỗi mô hình
6 Tống Minh Trang 1213310125 File 19 : Sửa lỗi và đánh giá mô hình
Trang 3MỤC LỤC
LỜI MỞ ĐẦU 6
PHẦN I: FILE 19_CEOSAL2 7
I CƠ SỞ LÝ THUYẾT VỀ VẤN ĐỀ NGHIÊN CỨU 7
II THIẾT LẬP, KIỂM ĐỊNH, PHÂN TÍCH LỖI, SỬA LỖI MÔ HÌNH 7
1 THIẾT LẬP MÔ HÌNH 7
a Chọn biến phụ thuộc và các biến độc lập 7
b Mô hình hồi quy tổng thể và hàm hồi quy mẫu 8
c Miêu tả biến 9
d Lập bảng tương quan 19
e Chạy mô hình và diễn giải ý nghĩa hệ số hồi quy 20
2 KIỂM ĐỊNH MÔ HÌNH 22
a Kiểm định ý nghĩa ý nghĩa thống kê của các biến: 22
b Kiểm định sự phù hợp của mô hình 23
c Kiểm định đa ràng buộc tuyến tính 24
3 PHÂN TÍCH MÔ HÌNH 25
a Kiểm định đa cộng tuyến 25
b Kiểm định phương sai sai số thay đổi 27
c Kiểm định định dạng mô hình 28
4 SỬA CÁC LỖI CỦA MÔ HÌNH 29
III ĐÁNH GIÁ MÔ HÌNH 32
1 Mô hình hồi quy mẫu : 32
2 Mô hình hồi quy sau khi thực hiện phép biến đổi logarit 32
PHẦN II: FILE 41_GPA3 33
I CƠ SỞ LÝ THUYẾT VỀ VẤN ĐỀ NGHIÊN CỨU 33
II THIẾT LẬP, KIỂM ĐỊNH, PHÂN TÍCH LỖI, SỬA LỖI MÔ HÌNH 33
1 THIẾT LẬP MÔ HÌNH 33
a Chọn biến phụ thuộc và các biến độc lập 33
b Mô hình hồi quy tổng thể và hàm hồi quy mẫu 34
c Miêu tả biến 35
Trang 4d Lập bảng tương quan 47
e Chạy mô hình và diễn giải ý nghĩa hệ số hồi quy 48
2 KIỂM ĐỊNH MÔ HÌNH 50
a Kiểm định ý nghĩa thống kê của các biến 50
b Kiểm định sự phù hợp của mô hình 51
c Kiểm định đa ràng buộc tuyến tính 52
3 PHÂN TÍCH MÔ HÌNH 52
a Kiểm định đa cộng tuyến 52
b Kiểm định phương sai sai số thay đổi 54
c Kiểm định định dạng mô hình 56
4 SỬA LỖI MÔ HÌNH 57
III ĐÁNH GIÁ MÔ HÌNH 60
1 Mô hình hồi quy mẫu : 60
2 Mô hình hồi quy sau khi thực hiện phép biến đổi logarit 60
KẾT LUẬN 61
TÀI LIỆU THAM KHẢO 62
Trang 5LỜI MỞ ĐẦU
Kinh tế lượng (Econometrics) là môn khoa học xã hội trong đó các công cụ của lý thuyết kinh tế, toán học và suy đoán thống kê được áp dụng để phân tích các vấn đề kinh tế Kinh tế lượng sử dụng các công cụ phương pháp của thống kê toán để tìm ra bản chất của các số liệu thống kê, đưa ra kết luận về các số liệu thống kê thu thập được từ đó có thể đưa ra các dự báo về các hiện tượng kinh tế
Từ khi ra đời đến nay, kinh tế lượng đã đem lại cho các nhà kinh tế một công cụ đo lường sắc bén để đo các quan hệ kinh tế Là những sinh viên đang theo học khối ngành kinh tế, chúng
em nhận thấy được sự cần thiết của việc học tập và tìm hiểu về Kinh tế lượng trong việc phân tích logic và nghiên cứu vấn đề Để hiểu sâu hơn về việc đưa Kinh tế lượng vào trong thực tế
cuộc sống và áp dụng Kinh tế lượng sao cho đúng và hiệu quả, nhóm em xin xây dựng bài BÁO CÁO THỰC HÀNH KINH TẾ LƯỢNG dưới sự hướng dẫn của TS Đinh Thị Thanh Bình.
Trong bài tiểu luận, nhóm đã sử dụng công cụ phân tích kinh tế lượng là phần mềm stata để phân tích, nghiên cứu dựa trên số liệu của 2 file dữ liệu:
19_CEOSAL2: "Phân tích sự ảnh hưởng của một số yếu tố đến tiền lương của CEO”
41_GPA3:" Phân tích ảnh hưởng của các yếu tố tới điểm trung bình môn tích lũy của sinh viên"
Đây là lần đầu tiên nhóm cùng nhau nghiên cứu vấn đề bằng việc ứng dụng dụng phương pháp kinh tế lượng Do những hạn chế về kiến thức thực tế, phương pháp nghiên cứu, thời gian nghiên cứu nên bài tiểu luận không tránh khỏi những thiếu sót Rất mong nhận được đóng góp từ
TS Đinh Thị Thanh Bình để bài nghiên cứu được hoàn thiện hơn.
Chúng em xin chân thành cảm ơn cô!
Trang 6PHẦN I: FILE 19_CEOSAL2
Nghiên cứu cho thấy có nhiều yếu tố khác nhau ảnh hưởng tới tiền lương của người lao động.sự tác động của mỗi yếu tố là khác nhau.tại việt nam thanh niên có độ tuổi từ 18 tới 25 có nhiều đóng góp nhưng họ không phải là những người giàu có.ngược lại những người có độ tuổi
>= 50 lại là những người có thu nhập cao nhất.
Người có học vấn càng cao thì thu nhập càng cao Hay nghiên cứu gần đây của Caponi và Plesca (2007) chỉ ra rằng những người tốt nghiệp đại học thu nhập cao hơn người chỉ tốt nghiệp phổ thông trung học từ 30 tới 40%.yếu tố ngành nghề cũng là một trong nhũng yếu tố quyết định về tiền lương của người lao động.
Trên cơ sở những lý thuyết liên quan, đề tài nghiên cứu của nhóm “Các yếu tố ảnh hưởng đến tiền lương của CEO” sẽ phân tích, nghiên cứu xu hướng và mức độ tác động của các nhân
tố: lsales lmktval ceoten age comten grad lên lsalary.
1 THIẾT LẬP MÔ HÌNH
Từ file số liệu 19_CEOSAL2và sử dụng lệnh “des” trong phần mềm stata, ta thu được kết quả
-variable name type format label -variable label
salary int %9.0g 1990 compensation, $1000s
-age byte %9.0g in years
college byte %9.0g =1 if attended college
Trang 7grad byte %9.0g =1 if attended graduate schoolcomten byte %9.0g years with company
ceoten byte %9.0g years as ceo with company
sales float %9.0g 1990 firm sales, millions
profits int %9.0g 1990 profits, millions
mktval float %9.0g market value, end 1990, mills.lsalary float %9.0g log(salary)
lsales float %9.0g log(sales)
lmktval float %9.0g log(mktval)
comtensq int %9.0g comten^2
ceotensq int %9.0g ceoten^2
profmarg float %9.0g profits as % of sales
Sorted by:
-File19_CEOSAL2được lập vào 23:44 ngày 17/08/1999 bao gồm 15 biến, 177 quan sát Dựa vào những lý thuyết nêu ở trên và dự liệu của file 19_CEOSAL2, nhóm quyết định chọn biến lsalarylà biến phụ thuộc, các biến lsales lmktval ceoten age comten grad là các biến độc lập.
Mô hình hồi quy tổng thể:
(PRF):lsalary= β0+ β1∗ lsales +β2∗ lmktval+ β3∗ ceoten+ ¿
β4∗ comten+β5∗ grad +β6∗ age+ui
Hàm hồi quy mẫu:
(SRF):^ lsalary= ^ β0+ ^ β1lsales∗+^ β2lmktval∗+^ β3∗ ceoten+ ^ β4∗ comten+ ¿
^
β5∗ grad +^ β6∗ age
Trong đó: ui: yếu tố ngẫu nhiên (nhiễu)
Biến phụ thuộc
Biến độc lập Biến định lượng Biến định tính
Trang 8c Miêu tả biến
Sử dụng lệnh “des lsales lmktval ceoten age comten grad ” ta thu được kết quả như
sau:
des lsales lmktval ceoten age comten grad
storage display value
variable name type format label variable label
lsales float %9.0g log(sales)
-lmktval float %9.0g log(mktval)
ceoten byte %9.0g years as ceo with company
age byte %9.0g in years
comten byte %9.0g years with company
grad byte %9.0g =1 if attended graduate school
Giải thích các biến:
Tên biến Hiển thị
dạng
Kiểu dữ
lsalary 9% Số thực Logarit của tiền lương trung bình năm 1990
của CEO
grad 9% Số nguyên =1 nếu tốt nghiệp đại học
comten 9% Số nguyên Số năm làm việc ở công ty Năm lsales 9% Số nguyên Logarit của doanh thu công ty năm 1990
lmktval 9% Số nguyên Logarit của giá trị thị trường công ty
Sử dụng lệnh sum:
sum lsalary lsales lmktval ceoten comten grad age
Trang 9Variable | Obs Mean Std Dev Min Max -+ - lsalary | 177 6.582848 .6060594 4.60517 8.575274 lsales | 177 7.231025 1.432086 3.367296 10.84545 lmktval | 177 7.39941 1.133414 5.958425 10.72327 ceoten | 177 7.954802 7.150826 0 37 comten | 177 22.50282 12.29473 2 58 -+ - grad | 177 .5310734 .5004492 0 1 age | 177 56.42938 8.42189 33 86
Tên
biến
Số quan sát
Trung bình
Độ lệch chuẩn
Giá trị nhỏ nhất
Giá trị lớn nhất
Số lượng quan sát thiếu giá trị lsalary 177 6.582848 0.6060594 4.60517 8.575274 0
Sử dụng lệnh “tab1 lsales lmktval ceoten comten grad age” để xem xét bảng phân
phối tần suất các giá trị của các biến:
tab1 lsales lmktval ceoten comten grad age
Trang 18Trước khi chạy hồi quy mô hình, chúng ta xem xét mức độ tương quan giữa các biến sử
dụng lệnh corr lsalary age college comten sales ceotenta thu được ma trận tương quan giữa các
biến như sau:
corr lsalary age college comten sales ceoten
(obs=177)
| lsalary age college comten sales ceoten -+ - lsalary | 1.0000
Trang 19- Mức độ tương quan giữa biến phụ thuộc lsalaryvới các biến độc lập age, comten ,ceoten,
lsales, grad,lmktvalkhông đồng đều, trong khi tương quan của lsalary với sales là tương
đối lớn (r = -0.4098) thì tương quan của lsalary với comten lại yếu hơn nhiều
(r=-0.0023).
- Tương quan của các biến độc lập với nhau là không lớn, chỉ có tương quan của age và
comten là cao hơn cả (r = 0.4794).
- Kì vọng dấu:
r(lsalary, lsales) = 0.5300 > 0 nên kỳ vọng β1 có giá trị dương
r(salay, lmktval) = 0.4815 >0 nên kỳ vọng β2 có giá trị dương
r(salay,ceoten) = 0.1147 > 0 nên kỳ vọng β3 có giá trị dương
r(salay, age) = 0.0906 > 0 nên kỳ vọng β4 có giá trị dương
r(salay, comten) = -0.0023 < 0 nên kỳ vọng β5 có giá trị âm
r(salay, grad) = 0.0131 > 0 nên kỳ vọng β6 có giá trị dương
e Chạy mô hình và diễn giải ý nghĩa hệ số hồi quy
Hồi quy biến lsalary theo các biến lsales lmktval ceoten age comten gradbằng lệnh reg, ta có:
reg lsalary lsales lmktval ceoten age comten grad
Source | SS df MS Number of obs = 177 -+ - F( 6, 170) = 15.55 Model | 22.908898 6 3.81814967 Prob > F = 0.0000 Residual | 41.737315 170 245513618 R-squared = 0.3544 -+ - Adj R-squared = 0.3316 Total | 64.6462131 176 367308029 Root MSE = 49549
lsalary | Coef Std Err t P>|t| [95% Conf Interval] -+ - lsales | 1927726 .0399535 4.82 0.000 1139037 .2716415 lmktval | 1006935 .0492993 2.04 0.043 003376 .1980111 ceoten | .01676 .0057118 2.93 0.004 0054849 .0280351 age | .000148 .0052337 0.03 0.977 -.0101834 .0104794 comten | -.0104312 .0036879 -2.83 0.005 -.0177112 -.0031512 grad | -.0979702 .0779818 -1.26 0.211 -.2519076 .0559672 _cons | 4.58892 .3386964 13.55 0.000 3.920328 5.257512 -
Trang 20-Từ kết quả chạy hồi quy, ta có phương trình hồi quy mẫu:
^
lsalary=4.58892+0 000148∗age+0.100693∗lmktval−0.0104312∗comten+0.1927726∗lsales+0 01676∗ceoten
−0.0979702∗grad
- Số quan sát đưa vào phân tích obs = 177
- Phần tổng bình phương các độ lệch giữa giá trị lsalary với giá trị trung bình của nó SST
= 64.6462131
- Tổng bình phương tất cả các sai lệch giữa giá trị của biến lsalary nhận được từ hàm hồi
quy mẫu với giá trị trung bình của chúng SSE = 22.908898
- Tổng bình phương các phần dư SSR = 41.737315
- Sai số chuẩn của ước lượng Root MSE =0.49549
- Mức độ phù hợp của mô hình so với thực tế là R2 =0.3544có nghĩa là tính phù hợp của
mô hình là không cao Nó thể hiện rằng các biến độc lập trong mô hình giải thích được
35.44% sự thay đổi của tiền lương trung bình của CEO.
Với độ tin cậy 95% ta có khoảng tin cậy 2 phía của các hệ số hồi quy:
Hệ số hồi quy Khoảng tin cậy 2 phía với độ tin cậy 95%
β1=0.1927726>0:Với giả thiết các yếu tố khác không đổi, mức lương trung bình của CEO năm
1990tăng 19.27726% khi doanh thu của công ty tăng1%.
^
β2=0.1006935>0 :Với giả thiết các yếu tố khác không đổi, giá trị thị trường của công ty tăng 1%
thì tiền lương trung bình của CEO năm 1990tăng 10.06935%
Trang 21β3=0 01676>0: với giả thiết các yếu tố khác không đổi, khi số năm làm CEO ở công ty tăng lên
1 năm thì tiền lương trung bình của CEO năm 1990 tăng lên 1.676%
a Kiểm định ý nghĩa ý nghĩa thống kê của các biến:
Với mô hình thiết kế ở trên, chúng ta tiến hành kiểm định ý nghĩa thống kê của các biến độc lập.
- Giả thuyết kiểm định: { H0: β4= β6=0
H1: βj≠ 0( j=4, 6)
Sử dụng thống kê t = β ^j− βj
Se (^βj) ~ T (n-k-1)
- Phương pháp kiểm định: Kiểm định bằng phương pháp p- value.
- Quy tắc kiểm định: nếu giá trị p-value lớn hơn mức ý nghĩa α = 0,05 thì ta có cơ sở
bácbỏ giả thuyết H0, chấp nhận giả thuyết H1.
Từ kết quả chạy hồi quy,các giá trị p-value của các biến độc lập age, grad có giá trị p-value lớn hơn mức ý nghĩa 0,05, các biến này không có ý nghĩa thống kê tại mức ý nghĩa 5%
Giả thuyết kiểm định: { H0: β1= β2= β3= β5=0
H1: βj≠ 0( j=1,2, 3,5)
Từ kết quả chạy hồi quy, các giá trị p-value của các biến độc lập lsales lmktval ceoten
comten đều nhỏ hơn mức ý nghĩa α= ¿ 0,05, các biến này có ý nghĩa thống kê tại mức ý nghĩa 5%.
Trang 22f Kiểm định sự phù hợp của mô hình
- Phương pháp kiểm định: Kiểm định bằng phương pháp p-value.
- Giả thuyết kiểm định : { H0: β1= β2= β3= β4= β5= β6= 0
H1: c óí tnhất 1 βj≠ 0( j= ´ 1, 6) Giả thuyết này tương đương với: { H0: R2= O
Trong đó: k là số biến độc lập, k = 6
n: là số quan sát, n = 177
- Quy tắc kiểm định: Nếu giá trị p-value nhỏ hơn mức ý nghĩa α=0.05 thì bác bỏ H0, chấp nhận
H1.
Dùng lệnh "test", kết quả thu được:
test lsales lmktval ceoten age comten grad
Kết luận: Mô hình hồi quy phù hợp
Sau khi chạy hồi quy hàm hồi quy mẫu, nhận thấy giá trị ước lượng ^β4 có giá trị rất nhỏ (0.000148)
Đặt vấn đề: Có thể bỏ biến age ra khỏi mô hình không?
Trang 23- Ta xây dựng giả thuyết: { H0: β4=0
H1: β4≠ 0
- Phương pháp kiểm định: sử dụng giá trị p-value
- Quy tắc kiểm định: nếu giá trị p-value nhỏ hơn mức ý nghĩa α=0.05 thì bác bỏ H0, chấp nhận H1.
test age
( 1) age = 0
F( 1, 170) = 0.00
Prob > F = 0.9775
Ta sử dụng lệnh "test" như trên nhưng chỉ với biến sales
Vì giá trị P-value = 0.9775 >0.05 nên chấp nhận H0.
Kết luận : Bỏ biến age ra khỏi mô hình vì yếu tố age không ảnh hưởng
đến biến tiền lương của CEO.
=> Vậy các biến độc lập của mô hình là lsales,lmktval,ceoten,comten,grad.
3 PHÂN TÍCH MÔ HÌNH
a Kiểm định đa cộng tuyến
Để kiểm định mô hình có mắc phải lỗi đa cộng tuyến hay không, nhóm đã sử dụng 3 cách khác nhau được trình bày dưới đây:
Cách 1 : R2 cao nhưng tỉ số t thấp
- Nguyên tắc kiểm định: Trong trường hợp R2 cao (thường R2 >0.8) mà tỉ số t thấp
(thường |t|< 1) thì mô hình có dấu hiệu của đa cộng tuyến.
- Kết quả chạy hồi quy:
reg lsalary lsales lmktval ceoten age comten grad
Source | SS df MS Number of obs = 177
Trang 24 Kết luận : không phát hiện ra lỗi đa cộng tuyến trong mô hình hồi quy.
Cách 2 : tương quan cặp giữa các biến độc lập cao
- Nguyên tắc kiểm định: nếu hệ số tương quan cặp giữa các biến độc lập cao (r > 0.8) thì
có khả năng tồn tại đa cộng tuyến.
- Kết quả bảng tương quan giữa các biến độc lập:
corr lsales lmktval ceoten age comten grad
Kết luận : Không phát hiện ra lỗi đa cộng tuyến.
Cách 3 : Sử dụng nhân tử phóng đại phương sai
- Nguyên tắc kiểm định: Nếu giá trị nhân tử phóng đại phương sai tương ứng của từng
biến độc lập lớn (VIF(Xj) > 10) thì mô hình có khả năng mắc lỗi đa cộng tuyến.
Trang 25- Sử dụng lệnh “vif” ta có kết quả:
Kết luận : không phát hiện lỗi đa cộng tuyến trong mô hình.
Kết luận chung về lỗi đa cộng tuyến của mô hình : với 3 cách kiểm định lỗi đa
cộng tuyến đều cho cùng kết quả là không phát hiện ra lỗi Ta có thể kết luận mô hình không mắc đa cộng tuyến.
h Kiểm định phương sai sai số thay đổi
Để kiểm định mô hình có lỗi phương sai sai số thay đổi hay không, nhóm đưa ra 3 cách kiểm định dưới đây:
Cách 1 : (định tính) Xem xét biểu đồ phần dư của giá trị dự đoán l ^ salary
- Nguyên tắc kiểm định: nếu độ rỗng của biểu đồ rải của phần dư tăng hoặc giảm khi
^
lsalary tăng thì giả thiết về phương sai sai số không đổi có thể không được thỏa mãn.
- Sử dụng lệnh “rvfplot, yline (0)” ta thu được đồ thị phần dư của giá trị dự đoán ^ lsalary:
Trang 26Từ biểu đồ trên, nhận thấy độ rỗng của biểu đồ rải của phần dư có sự thay đổi (độ rộng tăng lên) khi ^ lsalary giảm.
Kết luận : mô hình có nhiều khả năng bị lỗi phương sai sai số thay đổi.
Cách 2 : sử dụng kiểm định White
- Cặp giả thuyết kiểm định: { H0: phương sai sai số không đổi
H1: phương sai sai số thay đổi
- Nguyên tắc kiểm định: với mức ý nghĩa α=0.05, nếu giá trị p-value <0.05 thì có cơ sở
bác bỏ H0 và chấp nhận H1.
- Sử dụng lệnh “imtest, white” ta thu được:
imtest, white
White's test for Ho: homoskedasticity
against Ha: unrestricted heteroskedasticity
Trang 27 Kết luận : Mô hìnhcó lỗi phương sai sai số thay đổi.
Kết luận chung về lỗi phương sai sai số thay đổi : với 2 cách kiểm định trên ta
nhận thấy mô hìnhmắc lỗi phương sai sai số thay đổi.
Theo kết quả kiểm định ở phần II 2 thì tất cả các hệ số hồi quy đều có ý nghĩa thống kê ở mức ý nghĩa 5%, nên các biến đưa vào mô hình là cần thiết và không thể loại bỏ ra khỏi mô hình.
Để kiểm tra mô hình có lỗi định dạng sai do thiếu biến hay không, nhóm đã sử dụng kiểm định Ramsey.
- Cặp giả thuyết cần kiểm định: { Ho: Môhình không thiếu biến H 1: Mô hìnhthiếu biến
- Nguyên tắc kiểm định: với mức ý nghĩa α=0.05, nếu giá trị p-value <0.05 thì có cơ sở
bác bỏ H0 và chấp nhận H1.
Chạy lệnh “ovtest” bằng stata, ta thu được kết quả sau:
ovtest
Ramsey RESET test using powers of the fitted values of lsalary
Ho: model has no omitted variables
F(3, 167) = 3.53
Prob > F = 0.0163
Trang 28- Từ kết quả thu được ở trên, nhận thấy giá trị p-value = 0.0163<0.05 nên có cơ sở bác bỏ giả thuyết H0, chấp nhận H1.
Kết luận : Mô hình đã bỏ sót biến.
4 SỬA CÁC LỖI CỦA MÔ HÌNH
Sửa lỗi phương sai sai số thay đổi trong mô hình hồi quy mẫu
Trong phần này, để sửa lỗi phương sai sai số thay đổi nhóm sử dụng phương pháp biến đổi logarit (Theo giả thiết : Hạng hàm sai) Bởi vì, việc ước lượng hồi quy có thể làm giảm phương sai của sai số thay đổi do tác động của phép biến đổi logarit.
Trong mô hình có 6 biến độc lập, để có thể logarit hóa, thì biến đó phải luôn dương, vì vậy
nhóm quyết định chọn 2 biến age và comten để thực hiện logarit hóa.
Thực hiện phép biến đổi logarit với biến hsrank ta thu được mô hình :
lsalary= β0+ β1∗ ceoten+ β2∗ g rad+ β3∗ lsales+ ¿
β4∗log(age)+ β5∗log(comten)+ β6∗ lmktval+ui
lsalary= β0+ β1∗ ceoten+ β2∗ grad +β3∗ lsales+ ¿
β4∗ logage+ β5∗ logcomten+β6∗ lmktval+ui
Trong đó : logage = ln(age)
logcomten = ln(comten)
Tạo biến logrank trong Stata : gen logage = ln(age)
gen logcomten = ln(comten)
Chạy hồi quy ta thu được kết quả :
reg lsalary grad ceoten lsales lmktval logage logcomten
Source | SS df MS Number of obs = 177 -+ - F( 6, 170) = 15.05 Model | 22.4222752 6 3.73704587 Prob > F = 0.0000 Residual | 42.2239378 170 248376105 R-squared = 0.3468 -+ - Adj R-squared = 0.3238 Total | 64.6462131 176 367308029 Root MSE = 49837
Trang 29Sau khi chạy hồi quy mô hình mới, mức độ phù hợp của mô hình R2 = 0.3468, giảm đi
một chút so với trước đó R2 = 0.3544.
Đồng thời các giá trị p-value đều nhỏ hơn 0,05 nên các biến độc lập trong mô hình đều có
ý nghĩa thống kê ở mức ý nghĩa 5%.
Nhóm tiến hành kiểm tra lỗi phương sai sai số thay đổi trong mô hình hồi quy sau khi
thêm trọng số bằng kiểm định White:
imtest, white
White's test for Ho: homoskedasticity
against Ha: unrestricted heteroskedasticity
Trang 30-Kết quả kiểm định có p-value = 0.0675 > 0.05 => có cơ sở chấp nhận giả thuyết phương sai sai
số không đổi.
Kết luận : lỗi phương sai sai số thay đổi trong mô hình hồi quy mẫu ban đầu đã
Từ kết quả trên nhận thấy tất cả các giá trị vif đều nhỏ hơn 10 => mô hình sau khi logarit hóa
biến age và comten không bị mắc lỗi đa cộng tuyến.
1 Mô hình hồi quy mẫu :
^
lsalary=4.58892+0.01676∗ceoten−0.0979702∗grad +0.1927726∗lsales−0.000148∗age−0.0104312∗comten+0.1006935∗lmktval
- Tất cả các biến độc lập đưa vào mô hình đều có ý nghĩa thống kê ở mức ý nghĩa 5%
- Các biến độc lập giải thích được 35.44% sự biến động của tiền lương.
- Không có lỗi đa cộng tuyến, không có lỗi thừa biến trong mô hình.
- Tuy nhiên mô hình hồi quy mẫu mắc lỗi phương sai sai số thay đổi, và lỗi thiếu biến
Mô hình tương đối tốt.
4 Mô hình hồi quy sau khi thực hiện phép biến đổi logarit
^
lsalary=5.328336+0.0166873∗ceoten−0.0878596∗grad +0.1903752∗lsales−0.1423442∗logage−0.1369917∗logcomten+0.1027612∗lmktval