Các nội dung chính trong chương 7 Điều kiện vận dụng mô hình hồi qui tuyến tính bội thuộc bài giảng Kinh tế lượng trình bày về các nội dung lần lượt như sau: kiểm tra các điều kiện áp dụng mô hình, số liệu quan sát sai lệch, các biến giả (dummy), phương pháp từng bước, sự tương tác (Interaction).
Trang 1Điều kiện vận dụng mô hình hồi qui tuyến tính bội
Trang 2Các nội dung chính
mô hình
Trang 3Các điều kiện vận dụng mô hình
thuộc
và phân phối giống nhau theo phân phối chuẩn với
không có sai số
thẳng, (không có bội tương quan giữa các biến độc lập - multicollinearity)
Trang 4Mô hình với ảnh hưởng cố định ngược
với mô hình với ảnh hưởng ngẫu nhiên
với các mô hình có ảnh hưởng cố định
có ảnh hưởng ngẫu nhiên
một phân phối chuẩn đa biến
Trang 5Tuyến tính
Trang 61000 0
-1000 -2000
Trang 740 20
0 -20
Trang 8Scatterplot Dependent Variable: prix
Regression Adjusted (Press) Predicted Value
400000 300000
200000 100000
Trang 9-1 ,75
-2 ,25
-2 ,75
-3 ,25
-3 ,75
Histogram Dependent Variable: prix
10 0
Std Dev = 1,00 Mean = 0,00
N = 319,00
Trang 10,50 ,25
Trang 11Hai kiểm định nhanh để kiểm
tra phân phối chuẩn
phân phối là không chuẩn với sai số ở mức rủi ro 5%
n 6
skewness
Z
n 24
kurtose
Z
Trang 12Phép biến đổi các biến
thường xuyên không đạt được:
(errors) của mô hình
tham số hiện diện trong mô hình làtuyến tính, ngay cả khi các biến độclập không tuyến tính
Trang 13Phép biến đổi các biến
Trang 14X , Y log '
' X log
'
Trang 15Y
X ln
'
Y
tiếp
Trang 16Y
X log '
X
' X
Y
tiếp
Trang 17X
1 '
X
, Y
1 '
' X '
Y
Trang 18e 1
Y ln
Y
Trang 19Diễn giải các hệ số
logarithm
trung bình (mean) của Y
logarithm
hiểu là: sự biến đổi 100% dẫn đến một
của Y
Trang 20Diễn giải các hệ số
các số logarithms
phần trăm biến đổi trung bình của Y của
với Xk.
tiếp
Trang 21Những quan sát lệch lạc (outliers)
(hat values)
đổi quan trọng ước lượng các tham số của mô hình
một giá trị “không bình thường” (anormal) so với các giá trị của các biến độc lập
độ lệch chuẩn của đường trung tâm trong đồ thị phần dư (residues)
residuals”
Trang 22Các yếu tố của ma trận mũ “hat
matrix” hi
giá trị được điều chỉnh
n nj i
ij 2
j 2 1
j 1
Trang 23hoặc bằng 50, quan sát được xem là một điểm bẫy nếu nó lớn hơn 2(p+1)/n
điểm bẫy nếu nó lớn hơn 3(p+1)/n (với ví dụ: 9/319=0,028)
khoảng không (trên đồ thị) của các biến độc lập.
tiếp
Trang 24hai bên ở mức rủi ro 5% (gần bằng 2)
*
1
i i
i i
e t
2 p n
Trang 25
tất cả các số liệu và các hệ số đạt được bằng việc rút ra quan sát thứ i
i
SR h D
YX i
e SR
Trang 26Những quan sát sai lệch (outliers)
Phải làm gì với các giá trị sai lệch ?
chứng minh được
tiếp
Trang 27Những quan sát sai lệch (outliers)
tiếp
Trang 28Centered Leverage Value
Minimum Maximum Mean Std Deviation N
Dependent Variable: prix
a
Trang 29Những quan sát sai lệch (outliers)
tiếp
Trang 30Casewise Diagnostics a
3,166 $195,250 $93,887.19 $101,362.81 2,095 $260,650 $193577.3 $67,072.66 -3,282 $170,200 $275273.7 -$105,073.66 3,514 $278,000 $165513.3 $112,486.70 2,935 $331,000 $237035.5 $93,964.50 -2,670 $58,500 $143966.3 -$85,466.34 -2,647 $90,250 $174996.4 -$84,746.37 -2,640 $70,600 $155110.4 -$84,510.41 -2,650 $65,950 $150802.3 -$84,852.29 -2,374 $102,150 $178147.7 -$75,997.67 -2,473 $96,400 $175556.2 -$79,156.23 -3,674 $106,250 $223881.6 -$117,631.58 -2,363 $126,100 $201761.0 -$75,660.96 -2,691 $130,100 $216263.4 -$86,163.36 -3,184 $123,900 $225828.6 -$101,928.61
Case Number 5
171 213 246 247 260 288 290 291 299 306 307 308 315 316
Std Residual prix
Predicted Value Residual
Dependent Variable: prix
Trang 32tiếp
Trang 34Diễn giải hệ số của biến giả
Ví dụ:
Y: tiền lương năm tính bằng triệu đô la
Trung bình, nam thu nhập năm trên 6000$, các điều kiện khác không đổi
Trang 36Standardized Coeff icients
t Sig Tolerance VIF
Beta
Standardized Coeff icients
t Sig Tolerance VIF
Collinearity Statistics
Dependent Variable: prix
a
Trang 37Durbin-W atson
Predictors: (Constant), age, surface
Durbin-W atson
Predictors: (Constant), voisinage, surface, age
a
Dependent Variable: prix
b
Trang 38Những tác dụng của mã hóa (Effects coding)
thay thế các dòng lấy giá trị 0 đối với tất
cả các biến giả liên quan đến một biến cụthể bằng một giá trị -1
phần chênh lệch so với trung bình vàkhông so với loại chênh lệch
Trang 39Effects coding
tiếp
Trang 40Durbin-W atson
Predictors: (Constant), voisinage, surface, age
Durbin-W atson
Predictors: (Constant), voisinage, surface, age
Trang 41Effects coding
Coefficients a
33506,107 6682,137 5,014 ,000 64,409 2,733 ,636 23,570 ,000 ,885 1,130 -1114,692 114,857 -,291 -9,705 ,000 ,716 1,397 50673,109 5682,565 ,282 8,917 ,000 ,646 1,548
Beta
Standardi zed Coefficients
t Si g Tol erance VIF
Beta
Standardized Coeffi cients
t Sig Tol erance VIF
Trang 42chặt chẽ nhất với biến phụ thuộc.
độ giải thích mà chúng đem lại.
Trang 43Đóng góp của một biến
độc lập
ta muốn đo sự đóng góp của nó
, …, Xp)
được giải thích của Y (TSS)
k
X
Trang 44Từ l’ANOVA của hồi qui
Từ l’ANOVA của hồi qui
Trang 45Hệ số xác định thành phần của
vẫn giữ nguyên không đổi (được kiểm
soát)
k
X
) , ,
, , ,
| (
) , ,
(
) , ,
, , ,
| (
1 1
1 1
1 1
1 2
,
1 , 1 , ,
1
.
p k
k k
p
p k
k k
p k
k
Yk
X X
X X
X ESS X
X ESS TSS
X X
X X
X
ESS r
Trang 46) ,
(
)
| (
2 1
2 1
2 1
2 2 1
X X
ESS X
X ESS TSS
X X
Trang 47Đóng góp của một tập con các biến độc lập
Cho X s là một tập con của các biến độc lập của
mô hình trong đó ta muốn đo sự đóng góp của nó
RSS(Xs| tất cả các biến trừ Xs)
=RSS(X1 , …, Xp)-RSS(tất cả các biến trừ Xs)
tổng biến đổi được giải thích của Y (TSS)
Trang 48Đóng góp của một tập con các biến độc lập
Trang 49Kiểm định một phần của mô hình
chúng với Y
cách có ý nghĩa mô hình khi tất cả các biến khác bao gồm trong mô hình
các phần được kiểm định
Trang 50Kiểm định thành phần F đối với sự
đóng góp của một tập con các biến
) bien cac
ca tat (
/ ) bien tru
cac ca
tat
| (
MSS
m X
RSS
X
Trang 51Kiểm định thành phần F đối với sự
đóng góp của một biến
Các giả thuyết:
H0 : biến X j không cải thiện một cách có ý nghĩa
mô hình khi tất cả các biến khác bao gồm trong mô hình
H1 : biến X j cải thiện một cách có ý nghĩa mô hình
khi các biến khác bao gồm trong mô hình
ca tat (
/ ) bien tru
cac ca
tat
| (
MSS
m X
RSS
X
Trang 52lại Đưa biến có liên quan từng phần lớn nhất với biến phụ thuộc vào mô hình, có chú ý đến các biến đã được đưa vào
mô hình trước đó.
ý nghĩa hay không Nếu đúng ta chuyển sang bước 3, nếu không, phải rút các biến không còn ý nghĩa nữa ra khỏi mô hình.
Nếu còn các biến có liên quan thành phần một cách có ý nghĩa, ta quay lại bước 2, nếu không ta dừng thuật toán này lại.
Trang 53 X2 : mức giá– sự cảm nhận về mức giá của khách hàng
X3 : tính linh hoạt của giá–sự cảm nhận về thiện chí mà các nhân viên giao dịch của HATCO chấp nhận đàm phán giá.
X4 : hình ảnh – hình ảnh của HATCO trong mắt các khách hàng dưới góc
độ là nhà cung cấp
X5 : dịch vụ -chất lượng chung của dịch vụ
X6 : năng lực bán hàng-cảm nhận về năng lực bán hàng của HATCO
X7 : chất lượng sản phẩm
X9 : tỉ trọng của nhà cung cấp –phần trăm các sản phẩm cung cấp bởi HATCO so với các nhà cung cấp khác.
tiếp
Trang 54Durbin-W atson
Predictors: (Constant), qualite du produit, service, force de vente,
flexibilite du prix, niveau de prix, image, vitesse de livraison
(Cons tant) vitesse de livraison niveau de prix
f lexibilite du prix image
service
f orce de vente qualite du produit
Model
1
B Std Error
Unstandardized Coef f icients
Beta
Standardized Coef f icients
t Sig Toleranc e V IF
Collinearity Statistics
Dependent V ariable: importanc e
a
Trang 55Phương pháp từng bước
tiếp
Trang 56Durbin-W atson
7,974 ,603 ,666 13,221 ,000 ,996 1,004 3,336 ,327 ,515 10,210 ,000 ,996 1,004 -6,520 3,247 -2,008 ,047
7,621 ,607 ,637 12,547 ,000 ,936 1,068 3,376 ,320 ,521 10,562 ,000 ,993 1,007 1,406 ,591 ,121 2,378 ,019 ,939 1,064
Beta
Standardized Coef f icients
t Sig Tolerance VIF
Collinearity Stat istics
Dependent Variable: import ance
a
Trang 57Mi nimum Tolerance Coll inearity Statistics
Predictors in the Model: (Constant), service
Trang 58các mức chênh lệch của một biến độc lập khác
0 1 1 2 2 3 1 2
Trang 59ảnh hưởng của sự tương tác
được đo lường bởi 1 + 3 X 2
0 1 1 2 2 3 1 2
Trang 600 0.5 1 1.5
Y
Y = 1 + 2X1 + 3X2 + 4X1X2
Trang 61tương tác có thể xãy ra giữa diện tích
và tuổi của ngôi nhà
giữa hai biến này
Trang 62Durbin-W atson
Predictors: (Constant), voisinage, SUR_AGE, surface
Beta
Standardized Coefficients
t Sig Tolerance VIF
Collinearity Statistics
Dependent Variable: prix
a
Trang 63Sự cộng tuyến giữa các biến độc lập (multicolinearity)
lập
độc lập vượt quá 0.8 và tương quan giữa biến phụ thuộc và các biến độc lập lớn hơn tương quan giữa các biến độc lập, coi như không có
đa cộng tuyến
Trang 64Kiểm tra đa cộng tuyến
(Tolerance)
khác
cộng tuyến Một giá trị dung sai bằng 0.10 tương ứng với một sự tương quan bội 0.95 Đó là giá trị giới hạn mà chúng ta giữ lại mô hình
biến này của mô hình để chú ý đến việc thực hiện các phép biến đổi các biến
Trang 65Standardi zed Coefficien ts
Collinearity Statis tics
Dependent Variable: prix
a
Kiểm tra đa cộng tuyến
(Tolerance)
tiếp
Trang 66Phép biến đổi để làm ổn định
phương sai
Nói chung, sự ổn định của phương sai
làm chuẩn hóa sự phân phối của biến
Khi phương sai của các phần dư
(residues) của mô hình tăng lên với giá trị của một biến độc lập, một phép biến đổi có thể là chia tất cả mô hình ban đầu cho X:
Điều này là tương đương với việc áp
dụng phương pháp bình phương bé nhất (WLS)
X X
X X
Trang 67Phép biến đổi để làm ổn định
phương sai
lớn (hệ số biến thiên, tình trạng hiệnhành đối với các biến kinh tế), mộtphép biến đổi logarithmic nói chungcho phép:
của các sai số của mô hình
tiếp