2252016 1 CHƯƠNG 2 HỒI QUY ĐƠN SIMPLE LINEAR REGRESSION HÀM HỒI QUY HAI BIẾN TÍNH CHẤT CỦA HỆ SỐ ƯỚC LƯỢNG Y X 70 80 65 100 90 120 95 140 110 160 115 180 120 200 140 220 155 240 150 260 mức chi tiêu (Y đôla tuần) và thu nhập (X đôla tuần) 1 Ước lượng hệ số hồi quy Nêu ý nghĩa của hệ số hồi quy 2 Tính hệ số xác định Nêu ý nghĩa của R2 3 Ước lượng khoảng tin cậy của hệ số hồi quy 4 Biến X có thật sự ảnh hưởng đến biến Y hay không với độ tin cậy 95% 5 Ước lượng độ lệch chuẩn của Y xung quanh đư.
Trang 1CHƯƠNG 2 HỒI QUY ĐƠN
SIMPLE LINEAR REGRESSION
mức chi tiêu (Y đôla/ tuần)
và thu nhập (X đôla/ tuần)
1 Ước lượng hệ số hồi quy Nêu ý nghĩa của hệ số hồi
quy
2 Tính hệ số xác định Nêu ý nghĩa của R2
3 Ước lượng khoảng tin cậy của hệ số hồi quy
4 Biến X có thật sự ảnh hưởng đến biến Y hay không
với độ tin cậy 95%
5 Ước lượng độ lệch chuẩn của Y xung quanh đường hồi quy với độ tin cậy 95%
6 Có ý kiến cho rằng phương sai phần dư là 85 Hãy kiểm định phương sai phần dư với độ tin cậy 95%.
7 Lập bảng ANOVA
8 Mô hình có phù hợp không với độ tin cậy là 95% ?
Trang 29 Ứớc lượng/dự báo giá trị của Y khi X=100
USD/tuần
10 Dự đoán giá trị trung bình và cá biệt của Y khi
X=100 USD/tuần với độ tin cậy là 95% ?
11 Khi X thay đổi 1% thì Y bình quân thay đổi thế
Câu 1) Hãy ước lượng MH
HQ Nêu ý nghĩa của hệ số
Vậy hàm hồi quy là: Y ˆi 24, 4545 0, 5091 Xi
NÊU Ý NGHĨA HỆ SỐ HỒI QUY?
Câu 1) Hãy ước lượng MH HQ
Nêu ý nghĩa của hệ số hồi quy
Trang 3( 1là tung độ gốc của đường hồi quy mẫu): mức chi tiêu
bình quân hàng tuần của một người là 24.4545 đôla ngay cả khi thu
nhập của người này hàng tuần bằng 0 trong điều kiện các yếu tố khác
không đổi
2 0.5091
( 2là hệ số góc, hệ số độ dốc của đường hồi quy mẫu):
(trong trường hợp này, 2là khuynh hướng tiêu dùng biên) khi thu nhập
tăng 1 đôla/tuần thì chi tiêu tiêu dùng bình quân của một gia đình tăng là
0.5091 đôla/tuần trong điều kiện các yếu tố khác không đổi
ESS (Tổng bình phương được giải thích bởi SRF)
RSS (tổng bình phương do các yếu tố ngẫu nhiên gây ra)
Hệ số xác định (Coefficient of Determination)
R2 – Hệ số xác định (Coefficient of Determination) để đo mức độ phù hợp của hàm hồi quy; 0 R2 1
+ Khi R2 = 1 đường hồi quy phù hợp “hoàn hảo”
+ Khi R2 = 0 thì X và Y không có quan hệ
Trang 4
2.2 Các giả thiết của MH HQ tuyến tính
- Giả thiết 1: Mô hình hồi quy tuyến tính là tuyến tính đối với các tham số,
nó có thể không tuyến tính đối với biến
- Giả thiết 2: Biến giải thích X là biến phi ngẫu nhiên, nghĩa là giá trị của X
được cố định trong các lần lấy mẫu lặp lại
- Giả thiết 3: Các giá trị của X có thể thay đổi, tức là có ít nhất 1 giá trị Xi
khác so với những giá trị còn lại
Một cách trực quan nếu X không đổi (X nhận 1 giá trị duy nhất) trong
khi Y thay đổi thì cũng không thể có đường hồi quy
- Giả thiết 4: Kỳ vọng sai số bằng 0: ( ) 0
cho trung bình của chúng ảnh hưởng lên Yi =0.
- Giả thiết 5: Phương sai của u ibằng nhau (phương sai thuần nhất)
- Giả thiết 6: u ivà Xi không tương quan với nhau: cov (u i,j)=0
- Giả thiết 7: Không có tự tương quan giữa các u i: cov(u i,Xi)=0 Nghĩa là:
sai số ở quan sát này không ảnh hưởng đến sai số ở quan sát khác
Định lý Gauss-Markov:
Với 7 giả thiết cơ bản ở trên, các ước lượng của phương pháp bình phương nhỏ nhất sẽ là
các ước lượng tuyến tính, không chệch và
có phương sai nhỏ nhất trong lớp các ước
lượng tuyến tính không chệch
Khoảng tin cậy của β1, β2,
+ được gọi là giới hạn tin cậy trên
Biểu thức (*) mang ý nghĩa: Nếu tiến hành xây dựng khoảng tin
cậy ( ˆ 2- ; ˆ 2+) 100 lần với độ tin cậy 1 - thì tính trung bình có 100(1 - ) số lần các khoảng này sẽ chứa giá trị đúng của β2 rơi đúng vào khoảng này
Trang 5
Ước lượng khoảng tin cậy hệ số HQ
Khoảng tin cậy β2
Trong đó, t/2 là giá trị của đại lượng ngẫu nhiên T phân phối
theo quy luật Student với bậc tự do (n – 2) sao cho P(T> t/2) =
Ước lượng khoảng tin cậy hệ số HQ
2 i
i 1
eRSS =
i 1
var( ) ;x
mà x i2X i2n X( )2322000 10 * (170) 233000
2 42,1588var( ) 0,001277533000
2 2 se( ) var( ) 0,035742
Độ tin cậy 95% thì t/2(n-2)= t0,025(8)=2,306 Vậy khoảng tin cậy của 2 :
0,5091 2,306*0,035742 hay 0,4268 < 2 <0,5914
Trang 6i 1
1 n
2 i
i 1
X322000var( ) = 42.15875 41.13672
Ước lượng khoảng tin
cậy phương sai hồi quy
Khoảng tin cậy của 2
Trang 7TSS (Total Sum of Squares)
ESS (Explained Sum of Squares)
RSS (Residual Sum of Squares)
Hệ số xác định (Coefficient of Determination)
R2 – Hệ số xác định (Coefficient of Determination) để đo mức độ phù hợp của hàm hồi quy; 0 R2 1
+ Khi R2 = 1 đường hồi quy phù hợp “hoàn hảo”
+ Khi R2 = 0 thì X và Y không có quan hệ
Câu 4
Tính hệ số xác định (hoặc tỷ lệ biến thiên của Y có
thể giải thích được bằng X là bao nhiêu? ) Nêu ý
nghĩa của R2
2.6 Kiểm định giả thiết về các hệ số
hồi quy β 1 , β 2
Ở phần trước, ta đã tìm hiểu được mối quan hệ giữa X và Y mà theo
đó, khi X thay đổi 1 đơn vị thì Y thay đổi β2 đơn vị
Câu hỏi đặt ra là 2ta tính được từ bộ số liệu có thực sự có ý nghĩa không? Hay nói cách khác, người ta nghi ngờ rằng β2 = 0, tức là X và Y độc lập với nhau mặc dù bộ dữ liệu của mẫu 2ta thu được khác không
Vậy làm cách nào từ bộ dữ liệu mẫu, ta có thể bác bỏ nghi ngờ này?
Để kiểm định β2 ta có thể dùng một trong ba cách kiểm định sau:
Cách 1: Kiểm định giả thiết theo phương pháp khoảng tin cậy
Cách 2: Kiểm định giả thiết theo phương pháp giá trị tới hạn t Cách 3: Kiểm định giả thiết theo phương pháp giá trị p_value
Trang 8 Cách 1: Kiểm định giả thiết theo phương pháp khoảng tin cậy
bỏ giả thiết H0 với mức ý nghĩa α
Ngược lại nếu ˆ2 ˆ2 t/ 2* se ˆ2 2 ˆ2 t/ 2* se ˆ2
Kiểm định giả thiết hệ số hồi quy của X trong hàm hồi quy tổng thể
bằng 0 với mức ý nghĩa α = 5% và nêu ý nghĩa kết quả
Ta kiểm định giả thiết: H0 : β2 = 0 H1: β2 ≠ 0
Khoảng tin cậy của β2: β2 Є( ˆ 2 t/2* se ˆ 2
) = (0,5091 2,306*0,035742 )
Hay 0,4268 < 2 <0,5914
Do β2 = 0 không thuộc khoảng tin cậy trên nên ta bác bỏ giả thiết H0
với mức ý nghĩa α = 5%
Ý nghĩa: β2 là hệ số của thu nhập X trong hàm hồi quy được chấp
nhận có giá trị khác 0, điều này có nghĩa là ta thừa nhận yếu tố thu nhập
thực sự có ảnh hưởng đến tiêu dùng
Cách 1: Kiểm định giả thiết theo phương pháp
phương pháp giá trị tới hạn t
Đặt giả thiết: H0 : β2 = β2 H1: β2 ≠ β2 Bước 1: tính giá trị
*
2 2 2
ˆtˆ
Nếu t > t/2(n-k) thì ta bác bỏ giả thiết H0 với mức
ý nghĩa α Nếu t < t/2(n-k) thì ta nói không có cơ sở để bác
bỏ giả thiết H0 với mức ý nghĩa α
Trang 9Loại giả thiết Gt: H0 Gt: H1 Miền bác bỏ
Cách 2: Kiểm định giả thiết theo
phương pháp giá trị tới hạn t
Kiểm định giả thiết hệ số hồi quy của X trong hàm hồi quy tổng thể bằng 0 với mức ý nghĩa α
= 5% và nêu ý nghĩa kết quả
Kiểm định : H0 : β2 = 0 H1 : β2 ≠ 0 , α =5%
*
2 2 2
ˆ 0, 5 0 9 1 0
t 1 4 , 2 4 3
ˆ 0, 0 3 5 7 4 2( )
α = 5%
Cách 2: Kiểm định giả thiết theo phương pháp giá trị tới hạn t
Cách 3: Kiểm định giả thiết theo
phương pháp giá trị p_value
Quy tắc ra quyết định như sau:
Nếu p < α thì ta bác bỏ giả thiết H0 với
mức ý nghĩa α
Nếu p α thì ta nói không có cơ sở để bác
bỏ giả thiết H0 với mức ý nghĩa α
Dependent Variable: YMethod: Least SquaresDate: 12/25/11 Time: 18:47Sample: 1 10
Included observations: 10
Variable Coefficient Std Error t-Statistic Prob
Adjusted R-squared 0.957319 S.D dependent var 31.42893S.E of regression 6.493003 Akaike info criterion 6.756184Sum squared resid 337.2727 Schwarz criterion 6.816701Log likelihood -31.78092 Hannan-Quinn criter 6.689797
Prob(F-statistic) 0.000001
Trang 10Câu 6
Kiểm định phương sai phần dư với độ tin cậy 95%.
2.7 Kiểm định giả thiết về σ 2
Giả sử ta cần kiểm định giả thiết:
Bước 3: so sánh t với t/2(n-k) Quy tắc ra quyết định như sau:
Vì 2 = 3,968 không thuộc miền bác bỏ nên không có cơ sở để
bác bỏ giả thiết H0
Câu hỏi: Có ý kiến cho rằng phương sai chuẩn của sai số ngẫu nhiên
là 2= 85 Với mức ý nghĩa α = 5% thì ý kiến trên có đúng không?
2.7 Kiểm định giả thiết về σ 2
Câu 8
Mô hình có phù hợp không với độ tin cậy là 95% ?
Trang 11Cách 1: Kiểm định giả thiết theo
phương pháp giá trị tới hạn
Chúng ta kiểm định giả thiết: H0: R2 = 0 , H1: R2 0
Bước 2: Tra bảng F với mức ý nghĩa α và hai bậc tự do (k-1, n –
k) ta được giá trị tới hạn F (1, n k )
Bước 3: So sánh F0 và Fα (k-1, n-k)
Quy tắc ra quyết định:
Nếu F F (k1,n k ) thì ta bác bỏ giả thiết H0 với mức ý nghĩa α
Nếu F < F (k1,nk)thì ta nói không có cơ sở để bác bỏ giả thiết H0
2 2
( 2) 0, 96206 * (10 2)
R n R
12 Viết hàm SRF khi X là trăm đôla/tuần, Y theo
xy R
R
Trang 12Có hai loại dự báo: dự báo điểm và dự báo khoảng Trong đó
dự báo khoảng gồm 2 nhóm: dự báo giá trị trung bình và dự
báo giá trị riêng biệt Y0 khi X=X0
2.9.1 Dự báo điểm
Giả sử X = X0, ta muốn E(Y/X0) = 1+ 2 X0 Đường hồi quy
mẫu cho ta ước lượng điểm của E(Y/X0)
Yvẫn sai khác so với giá trị thực Y0 của nó Do đó, thông thường ta dùng dự báo khoảng để tăng độ chính xác trong việc dự báo:
Với hệ số tin cậy 1-, dự báo khoảng của E(Y|X0) là
[Ŷ0 - t/2*se(Ŷ0) < E(Y/X0)< Ŷ0 + t/2*se(Ŷ0)]
với
0 0
)var(
1 2
2 0
X X n
Trang 13
2.9.2 Dự báo khoảng
b) Dự báo giá trị riêng biệt Y0 khi X=X0
Nếu muốn dự báo giá trị riêng biệt Y0 khi X=X0 với độ tin cậy
;1
1)var(
1 2
2 0 0
X X n Y
- Dự báo điểm Y012X024, 4545 0,5091*100 75, 3636
2
2 0
2 0
2 1
X X Y
t/2 = t0,025 = 2,306
Vậy dự báo khoảng trung bình chi tiêu khi thu nhập ở mức 100 USD/tuần với độ tin cậy là 95% là (73,3636 2,306 * 3,2366) hay 67,9< E(Y/X=100)< 82,8
Hãy dự báo giá trị trung bình và giá trị riêng biệt của chi tiêu
cho tiêu dùng khi thu nhập ở mức 100 USD/tuần với độ tin
cậy là 95%
- Dự báo giá riêng biệt
0 2
0 0
2 1
sánh kết quả này với kết quả về dự báo khoảng của giá trị trung bình, ta
thấy khoảng tin cậy của giá trị riêng biệt (Y0) rộng hơn khoảng tin cậy
của giá trị trung bình (E(Y/X0))
Dependent Variable: Y Method: Least Squares Included observations: 6 Variable Coefficient Std Error t-Statistic Prob
F-statistic 36.0000 Durbin-Watson stat Prob(F-statistic) 0.00388
BÀI TẬP
Trang 14• Mô hình hồi quy hai biến còn gọi là mô hình hồi quy đơn vì chỉ có một biến độc lập Mô hình hồi quy hai biến tuyến tính yêu cầu phương trình hồi quy phải tuyến tính trong hệ số.
KẾT LUẬN
1
và
2
Sai số hồi quy có thể đến từ: (1) bỏ sót biến,
(2) dạng hàm sai, (3) sai số đo lường, (4) tính
ngẫu nhiên của các biến số kinh tế
KẾT LUẬN
Ước lượng hệ số theo phương pháp bình phương tối thiểu thông thường (OLS) là tìm bộ giá trị hệ số hồi quy sao cho tổng bình phương của sai số là nhỏ nhất Nếu mô hình hồi quy thỏa mãn các giả thiết của OLS thì theo định lý Gauss – Markov các hệ số hồi quy mẫu là ước lượng tuyến tính không thiên lệch tốt nhất cho các tham số của hồi quy tổng thể
Nếu thỏa mãn các giả thiết của OLS thì hệ số hồi quy tuân theo phân phối hình chuông, từ đó chúng ta có thể xây dựng trị thống kê kiểm định giả thiết thống kê liên quan đến tham số hồi quy Phép kiểm định phổ biến nhất là H0:
β2 = 0 Quy tắc quyết định nhanh là giá trị
*
2 2
ˆ t ˆ
Trang 15KẾT LUẬN
Mức độ phù hợp của mô hình hồi quy R2 được đo lường bằng tỷ lệ
tổng bình phương biến thiên giải thích được bằng hồi quy
1 Có bao nhiêu cách kiểm định hệ số hồi quy? Ý nghĩa của hệ số hồi
quy và ý nghĩa của kiểm định
2 Có bao nhiêu cách kiểm định hệ số xác định? Ý nghĩa của hệ số
xác định và ý nghĩa của kiểm định
3 Có bao nhiêu dạng cơ bảndự báo giá trị của biến phụ thuộc
Thank You!
Trang 16CHƯƠNG 3: MỞ RỘNG MÔ
HÌNH HỒI QUI HAI BIẾN
Mô hình tuyến tính lôgarit
Mô hình log-lin
Mô hình lin-log
Mô hình nghịch đảo
5 MÔ HÌNH HỒI QUY CƠ BẢN VÀ PHƯƠNG PHÁP ĐỔI ĐƠN VỊ
Hồi quy qua gốc tọa độ
Contents
MỤC TIÊU:
• Hồi quy qua gốc tọa độ và kỹ thuật hồi quy
qua gốc tọa độ
• Đơn vị đo lường: thay đổi đơn vị đo lường
của biến phụ thuộc hay thay đổi đơn vị đo
lường của biến độc lập.
• Hiểu ảnh hưởng của lựa chọn mô hình
khác nhau cho các biến số của mô hình
hồi quy, từ đó rút ra bài học kinh nghiệm
2 2
2 2
e Y Y Y
Trang 17 Tính var(2):
Var (2)= 2 2 2 2
1ar( ) ar( )
1
i
e n
Nói chung trong trường hợp tổng quát:
- Đầu tiên, ta hồi quy mô hình có tung độ góc:
thống kê thì ta hồi quy lại mô hình đó với mô hình hồi
Thí dụ: Lý thuyết mô hình định giá tài sản vốn (CAMP –
capital Asset Pricing Model)
Mô hình định giá tài sản vốn CAMP là mô hình mô tả
mối quan hệ giữa rủi ro và lợi nhuận kỳ vọng Trong mô
hình này, lợi nhuận kỳ vọng của một chứng khoán bằng lợi
nhuận phi rủi ro cộng với một khoản bù rủi ro dựa trên cơ sở
rủi ro toàn hệ thống của chứng khoán đó
R : lợi nhuận kỳ vọng của cổ phiếu Ý nghĩa của chỉ
số này là nhà đầu tư chỉ giữ chứng khoán có rủi ro cao khi
lợi nhuận kỳ vọng đủ lớn để bù đắp cho khoản rủi ro này
m
R : lợi nhuận kỳ vọng của danh mục thị trường
j
: hệ số đo lường mức độ biến động lợi nhuận cổ
phiếu cá biệt so với mức độ biến động lợi nhuận danh mục
cổ phiếu trên thị trường
xy R
R
Trang 18Số tuyệt đối
• là chỉ tiêu biểu hiện quy mô, khối lượng của
hiện tượng hoặc quá trình kinh tế- xã hội trong
điều kiện thời gian và không gian cụ thể
• Đơn vị tính số tuyệt đối có thể là đơn vị hiện vật
tự nhiên (cái, con, chiếc, kg, mét, v.v ), đơn vị
hiện vật quy ước tức là đơn vị quy đổi theo một
tiêu chuẩn nào đó (nước mắm quy theo độ
đạm; than quy theo hàm lượng calo; xà phòng
quy theo tỷ lệ chất béo; đơn vị tiền tệ(đồng,
nhân dân tệ, đô la…đơn vị thời gian (giờ, ngày,
tháng, năm)
SỐTƯƠNG ĐỐI (TRONGTHỐNG KÊ)
• là chỉ tiêu biểu hiện quan hệ so sánh giữa hai chỉ tiêu thống kê cùng loại nhưng khác nhau về thời gian hoặc không gian, hoặc giữa hai chỉ tiêu khác loại nhưng có quan hệ với nhau
• Trong hai chỉ tiêu để so sánh của số tương đối,
sẽ có một số được chọn làm gốc (chuẩn) để so sánh
• biểu hiện bằng số lần, số phần trăm (%)
Xét mô hình hồi quy mũ: Yi j i2eu i
Ta biết khi lượng thay đổi tuyệt đối (X2 X1) rất nhỏ thì giá trị Xsẽ tiến
về dX Vậy ta có thể viết lại (1) như sau:
Sự thay đổi tương đối của biến phụ thuộc Y bằng hệ số β2 nhân cho sự
thay đổi tương đối của biến độc lập X
Hay nói cách khác, khi X thay đổi 1% thì Y thay đổi β2(%)
3.3 Mô hình tuyến tính lôgarít:
Các nhà kinh tế, nhà kinh doanh, và chính phủ thường quan tâm tới việc xác định tốc độ tăng trưởng của một biến kinh tế như dân số, GNP, lượng cung tiền, việc làm, năng suất, thâm hụt thương mại,.v.v…
Giả sử ta có mô hình: lnY i12 2i u i
Ta lấy đạo hàm hai vế: 2
dY d
Y Một sự thay đổi tương đối của Y được giải thích bằng 2nhân sự thay đổi tuyệt đối
100 ( 100)
Y Y Y Y
Như vậy, khi X tăng/giảm 1 đơn vị thì Y sẽ tăng/giảm ( 2 100)%
3.4 Các mô hình bán lôgarit (semilog):
3.4.1 Mô hình log-lin:
Trang 19Năm RGDP Năm RGDP Năm RGDP
Thí dụ: Tổng giá trị sản phẩm nội địa thực (đơn vị: USD),
(năm gốc: 1987) theo thời gian tính từ năm 1972-1991. Mô hình hồi quy: lnRGDPt 1 2t ut
Trong giai đoạn năm 1972-1991, GDP thực của Hoa
Kỳ tăng với tốc độ trung bình là 2.47%/năm khi các yếu tố khác không đổi
Thí dụ với Y là GNP và X là lượng cung tiền (theo định
nghĩa M2) Giả sử xem GNP tăng lên bao nhiêu (về giá trị
tuyệt đối) nếu lượng cung tiền tăng lên 1%
Không giống mô hình tăng trưởng thường quan tâm tới
việc tìm xem Y tăng lên bao nhiêu % khi X tăng 1 đơn vị
Bây giờ ta quan tâm tới việc tìm sự thay đổi tuyệt đối của Y
khi X thay đổi 1% Một mô hình phục vụ cho mục tiêu này
có dạng:
Yi = i + 2lnXi + Ui
Như vậy, nếu X thay đổi đi 0,01 (hay 1%), thay đổi tuyệt
đối của Y là 0,01 (2)
Áp dụng mô hình này để nghiên cứu các mối quan hệ như
lượng cung tiền ảnh hưởng tới GNP, diện tích trồng trọt ảnh
hưởng tới sản lượng cây trồng, diện tích sử dụng căn nhà tác
2
= 2584.785 trong khoảng thời gian từ 1973 đến 1987, lượng cung tiền tăng 1% kéo theo sự tăng lên của GNP bình quân khoảng 25.85 tỷ USD
Trang 203.5 Mô hình nghịch đảo:
Các mô hình có dạng mô hình nghịch đảo
i i
thay đổi β đơn vị Log – log LnY = 1 + 2lnX 2 Khi X tăng 1% thì Y thay đổi
β%
Log – lin LnY = 1+ 2X 2Y Khi X tăng 1 đơn vị thì Y
thay đổi 100β (%) Lin - log Y = 1+ 2lnX 2 Khi X tăng 1% thì Y thay đổi
(β/100) đơn vị Nghịch
đảo
- 2 Khi X tăng 1 đơn vị thì Y thay đổi β2(1/XY) đơn vị.
i i
2) Mô hình tuyến tính log-log :
và của Y Hay nói cách khác, ta có công thức như sau :
Trang 21MỤC TIÊU:
Hiểu ý nghĩa và ứng dụng của hồi
quy bội.
Mô hình hồi quy 3 biến.
Ý nghĩa hệ số hồi quy
Hệ số xác định và hệ số xác định
Trang 22Hàm hồi quy mẫu
ii,kki
,33i,221
i k k i 3 3 i 2 2 1 i i i
k
thiểu tổng bình phương phần dư cho kết quả ước lượng hiệu
0 X X ˆ
X ˆ X ˆ ˆ Y 2 e
0 X ˆ
X ˆ X ˆ ˆ Y 2 e
i k n
1 i
i n n i 3 3 i 2 2 1 i k
n 1 i
2 i
i 2 n
1 i
i n n i 3 3 i 2 2 1 i 2
n 1 i
2 i
n 1 i
i n n i 3 3 i 2 2 1 i 1
n 1 i
2 i
i ˆ ˆ X ˆX e
Nhắc lại các giả định
(1) Kỳ vọng của sai số hồi quy bằng 0: E eiX2,i, X3,i 0
(2) Không tự tương quan: cov ei, ej 0 , i≠j
(5) Không có sự đa cộng tuyến hoàn hảo giữa X2 và X3
(6) Dạng hàm của mô hình được xác định một cách đúng đắn
Ước lượng mô hình hồi quy ba biến:
PHẦN I MÔ HÌNH HỒI QUY BA BIẾN:
Trang 23Hàm hồi quy mẫu
Phương pháp tối thiểu tổng bình phương phần dư cho
Y ˆ
KẾT QUẢ ƯỚC LƯỢNG HỆ SỐ THEO OLS
3322
1 Y ˆ X ˆ X
2 n
1 i
i 3 i 2 n
1 i 2 n
1 i 2
n 1 i
i 3 i 2 n
1 i i 3 i n
1 i 2 n
1 i i 2 i 2
x x x
x
x x x
y x
x y ˆ
i 3 i
2
i 3
1 i
i 3 i 2 n
1 i 2 n
1 i 2
n 1 i
i 3 i 2 n
1 i i 2 i n
1 i 2 n
1 i i 3 i 3
x x x
x
x x x
y x
x y ˆ
i 3 i
2
i 2
Ta có số liệu của một mẫu gồm 11 quan sát như sau
- Y là doanh số bán (triệu đồng).
-X2là chi phí chào hàng ( triệu đồng)
- X3là chi phí quảng cáo (triệu đồng.)
mức ý nghĩa 5% Cho biết ý nghĩa của việc kiểm định này.
4) Xác định khoảng tin cậy của phương sai của nhiễu, với độ tin cậy 95%.
Trang 245) Kiểm định giả thiết H 0 : σ 2 =0.5 ; H 1 : σ 2 ≠ 0.5,
với mức ý nghĩa 2%.
6) Nếu chi phí quảng cáo không đổi, khi chi phí
chào hàng tăng lên 1% thì doanh số bán được
thay đổi bao nhiêu %?
7) Kiểm định sự phù hợp của hàm SRF, với mức
ý nghĩa 5%.
Câu 8 a) Người ta cho rằng tất cả các biến trong
mô hình đều không có tác động tới Y Nhận định điều này với mức ý nghĩa 5%
đến Y Nhận định điều này với mức ý nghĩa 5%
9) Lựa chọn mô hình
10)Có phải ảnh hưởng của chi phí chào hàng
gấp đôi ảnh hưởng của chi phí quảng cáo lên lợi
nhuận không? với α=5%
1)Tìm hàm hồi quy mẫu
và cho biết ý nghĩa của các hệ số hồi quy riêng.
Trang 25Hàm hồi quy mẫu
i i 3 3 i 2 2 1
Y ˆ
KẾT QUẢ ƯỚC LƯỢNG HỆ SỐ THEO OLS
3322
1 Y ˆ X ˆ X
2 n
1 i
i 3 i 2 n
1 i 2 n
1 i 2
n 1 i
i 3 i 2 n
1 i i 3 i n
1 i 2 n
1 i
i 2 i 2
x x x
x
x x x
y x
x y ˆ
i 3 i
2
i 3
1 i
i 3 i 2 n
1 i 2 n
1 i 2
n 1 i
i 3 i 2 n
1 i i 2 i n
1 i 2 n
1 i
i 3 i 3
x x x
x
x x x
y x
x y ˆ
i 3 i
2
i 2
1) Tìm hàm hồi quy mẫu và cho biết
ý nghĩa của các hệ số hồi quy
Y 2.7024 0.413X 0.315X e
Dependent Variable: Y Method: Least Squares Date: 10/17/12 Time: 14:27 Sample: 1 11
Included observations: 11 Variable Coefficient Std Error t-Statistic Prob
C 2.702409 1.227329 2.201861 0.0588 X2 0.413041 0.078870 5.237001 0.0008 X3 0.315474 0.063600 4.960299 0.0011 R-squared 0.919439 Mean dependent var 13.81818 Adjusted R-squared 0.899298 S.D dependent var 2.358736 S.E of regression 0.748510 Akaike info criterion 2.485536 Sum squared resid 4.482138 Schwarz criterion 2.594053 Log likelihood -10.67045 Hannan-Quinn criter 2.417132 F-statistic 45.65163 Durbin-Watson stat 2.863419 Prob(F-statistic) 0.000042
Trang 26
Câu 2)
2a) Nếu chi phí quảng cáo không đổi, chi phí
bán hàng tăng 1 đơn vị thì doanh số bán thay
đổi thế nào với ý nghĩa là 2%
2b) Nếu chi phí bán hàng không đổi, chi phí
quảng cáo tăng 1 đơn vị thì doanh số bán thay
đổi thế nào với ý nghĩa là 2%
Biết công thức tính sai số chuẩn như sau:
2
2 2
x v
x x x x
x x x x x
Trang 27R-squared 0.919439 Mean dependent var 13.81818
Adjusted R-squared 0.899298 S.D dependent var 2.358736
S.E of regression 0.748510 Akaike info criterion 2.485536
Sum squared resid 4.482138 Schwarz criterion 2.594053
Log likelihood -10.67045 Hannan-Quinn criter 2.417132
F-statistic 45.65163 Durbin-Watson stat 2.863419
Ý nghĩa khoảng ước lượng?
Ý nghĩa: Nếu tiến hành xây dựng khoảng tin cậy
Với điều kiện các yếu tố khác không đổi, khi X tăng 1
đơn vị thì Y bình quân tăng trong khoảng từ
Ý nghĩa khoảng ước lượng?
3) Kiểm định giả thiết H 0 :
β 2 = 0 ; H 1 : β 2 ≠ 0, với mức ý nghĩa 5% Cho biết ý nghĩa của việc kiểm định này.
www.themegallery.com Company Logo
Trang 28k
t se
cậy của phương sai
của nhiễu, với độ tin
1 /2 0.975
17.53455;
2.179731 Khoảng tin cậy của var(Ui)= σ2là:
(n k) (n k),
Trang 295) Kiểm định giả thiết H 0 : σ 2 =0.5 ;
0
(n k) (11 3)0.560267
8.964272 0.5
6) Nếu chi phí quảng cáo không đổi,
khi chi phí chào hàng tăng lên 1% thì
doanh số bán được thay đổi bao nhiêu
13.8182 Y
Vậy khi chi phí chào hàng tăng lên 1% thì doanh số bán được bình quân tăng lên 0.3478(%), với điều kiện chi phí quảng cáo không đổi.
6) Nếu chi phí quảng cáo không đổi, khi chi phí chào hàng tăng lên 1% thì doanh số bán được thay đổi bao nhiêu %?
Trang 307) Kiểm định sự phù hợp của
hàm SRF, với mức ý nghĩa 5%.
2 2
2
ES
i e
Kiểm định mức ý nghĩa chung của mô hình
Trong hồi quy bội, mô hình được cho là không có
sức mạnh giải thích khi toàn bộ các hệ số hồi quy đều
Fk)-(n
SS
R
1)-(k
Trang 31(U) gọi là mô hình không bị ràng buộc (Unrestricted
model), (R) gọi là mô hình bị ràng buộc (Restricted
RSS / (n k) (1 R ) / (n k) Với mức ý nghĩa α, tra bảng ta có giá trị tới hạn Fα(k-m, n-k)
theo bạn thì ta có nên thêm biến X3vào mô hình (A)
để trở thành mô hình (B) hay không, với mức ý nghĩa
5%?
2 2
Ở hồi quy đơn để đo mức độ phù hợp của hàm hồi quy
ta dùng hệ số xác định (coefficient of determination)
R2giải thích mức độ phù hợp của hàm hồi quy, nghĩa là mô hình hồi quy giải thích được bao nhiêu % sự thay đổi của biến phụ thuộc.
Tuy nhiên trong mô hình hồi quy tuyến tính đa bội thì R2bộc
lộ những nhược điểm của nó và người ta sử dụng thêm chỉ số
Trang 32e n k n
Ta dùng R2để so sánh hai mô hình khác nhau xem mô hình
nào tốt hơn chỉ khi cả hai mô hình đều thỏa điều kiện:
• Biến đưa vào có ý nghĩa thống kê.
•Biến mới đưa vào mô hình sẽ làm cho tăng lên
theo bạn thì ta có nên thêm biến X3vào mô hình (A)
để trở thành mô hình (B) hay không, với mức ý nghĩa
Trang 3310)Có phải ảnh hưởng của chi phí
chào hàng gấp đôi ảnh hưởng của chi
phí quảng cáo lên doanh số không?
với α=5%
- Y là doanh số bán (triệu đồng).
10) Kiểm định giả thiết H0: β2=2.β3 ; H1: β2≠2.β3
Cách 1:
Ta có mô hình (U): Y= β1+β2X2+ β3X3+U
Mô hình (R): Y= β1+(2β3)X2+ β3X3+U
Y= β1+β3(2X2+X3)+ U Đặt Z=2X2+X3
Trang 3410) Kiểm định giả thiết H0: β2=2.β3 ; H1: β2≠2.β3
Included observations: 11 Variable Coefficient Std Error t-Statistic Prob
C 2.702409 1.227329 2.201861 0.0588 X2 0.413041 0.078870 5.237001 0.0008 X3 0.315474 0.063600 4.960299 0.0011 R-squared 0.919439 Mean dependent var 13.81818 Adjusted R-squared 0.899298 S.D dependent var 2.358736 S.E of regression 0.748510 Akaike info criterion 2.485536 Sum squared resid 4.482138 Schwarz criterion 2.594053 Log likelihood -10.67045 Hannan-Quinn criter 2.417132 F-statistic 45.65163 Durbin-Watson stat 2.863419 Prob(F-statistic) 0.000042
10) Kiểm định giả thiết H0: β2=2.β3 ; H1: β2≠2.β3
R-squared 0.904032 Mean dependent var 13.81818
Adjusted R-squared 0.893368 S.D dependent var 2.358736
S.E of regression 0.770233 Akaike info criterion 2.478719
Sum squared resid 5.339335 Schwarz criterion 2.551064
Log likelihood -11.63296 Hannan-Quinn criter 2.433116
F-statistic 84.78082 Durbin-Watson stat 2.580024
α=5% → Fα(k-m,n-k) = F0.05(1,8)= 5.318
Ta có FW< F0.05(1,8) nên chấp nhận giả thiết H0 Vậy ảnh hưởng của chi phí chào hàng gấp đôi ảnh hưởng của chi phí quảng cáo lên lợi nhuận với α=5%
Y 2.7024 0.413X 0.315X e
Trang 35R-squared 0.919439 Mean dependent var 13.81818
Adjusted R-squared 0.899298 S.D dependent var 2.358736
S.E of regression 0.748510 Akaike info criterion 2.485536
Sum squared resid 4.482138 Schwarz criterion 2.594053
Log likelihood -10.67045 Hannan-Quinn criter 2.417132
F-statistic 45.65163 Durbin-Watson stat 2.863419
Prob(F-statistic) 0.000042
Đặt δ= β2-2β3→ β2= δ +2β3Y= β1+β2X2+ β3X3+U = β1+δX2+β3 Z+U
Kiểm định giả thiết H0: δ=0 ; H1: δ≠0 α=5% →
Cách 2: kđ t gián tiếp 10) Kiểm định giả thiết H0: β2=2.β3 ; H1: β2≠2.β3
Ta có mô hình (U): Y= β1+β2X2+ β3X3+U
|t|=|-1.236924 | < tinv(0.05,11-3)=2.306
=> Nên chấp nhận giả thiết H 0
Trang 36R-squared 0.919439 Mean dependent var 13.81818
Adjusted R-squared 0.899298 S.D dependent var 2.358736
S.E of regression 0.748510 Akaike info criterion 2.485536
Sum squared resid 4.482138 Schwarz criterion 2.594053
Log likelihood -10.67045 Hannan-Quinn criter 2.417132
F-statistic 45.65163 Durbin-Watson stat 2.863419
Trang 381 Bản chất của biến giả
2 Hồi quy với một biến định lượng và một biến định tính
3 Hồi quy với một biến định lượng và hai biến định tính
4 Sử dụng biến giả trong phân tích mùa.
5 So sánh hai hồi quy 5.1 Sử dụng kiểm định Chow 5.2 Sử dụng kỹ thuật biến giả
6 Hồi quy tuyến tính từng khúc.
NỘI DUNG
Biến định tính thường biểu thị có hay không có
một tính chất hoặc biểu thị các mức độ khác nhau
của một tiêu thức thuộc tính nào đó
Ví dụ : giới tính (nam hay nữ), tôn giáo, dân tộc,
nơi sinh, hình thức sở hữu, ngành nghề kinh
doanh v.v…
Để lượng hoá các biến định tính, trong phân tích hồi quy
người ta dùng biến giả (dummy variables)
1 Bản chất của biến giả
2.1 Biến định tính chỉ có hai lựa chọn
i i
2 Hồi quy với một biến định tính
Như vậy, mức chênh lệch thu nhập bình quân của nam so với nữ là β2. Hay nói, thuộc tính giới tính
nữ là thuộc tính cơ sở ứng với D = 0
Trang 39Yilà chi tiêu của một hộ gia đình thứ i.
2.2 Biến định tính có nhiều hơn hai lựa chọn
2 Hồi quy với một biến định tính
2.2 Biến định tính có nhiều hơn hai lựa chọn
2 Hồi quy với một biến định tính
Đối với hộ gia đình dưới 25 tuổi
Đối với hộ gia đình từ 25 đến 55 tuổi:
Đối với hộ gia đình trên 55 tuổi
Một mô hình đơn giản mô tả quan hệ giữa chi tiêu và
nhóm tuổi như sau:
i i i
Y 1 2 2 3 3
2.2 Biến định tính có nhiều hơn hai lựa chọn
2 Hồi quy với một biến định tính
Như vậy, 1cho chúng ta biết chi tiêu trung bình một tháng của một hộ gia đình mà chủ hộ dưới 25 tuổi.
2biểu thị chênh lệch về chi tiêu trung bình một tháng của một
hộ gia đình mà chủ hộ thuộc nhóm tuổi từ 25 đến 55 tuổi so với nhóm tuổi dưới 25
3biểu thị chênh lệch về chi tiêu trung bình một tháng của một hộ gia đình mà chủ hộ thuộc nhóm tuổi trên 55 so với nhóm tuổi dưới 25.
2.2 Các biến định tính có nhiều hơn hai lựa chọn
Như vậy, biến định tính có 2 thuộc tính ta chọn 1 biến, 3 thuộc tính ta chọn 2 biến Vậy m thuộc tính thì có (m-1) biến
Trang 401 Trường hợp có một biến định tính với 2 lựa chọn:
Bước tiếp theo trong phân tích là thêm các biến độc lập có thể
định lượng được Để minh họa, ta lấy lại ví dụ về tiền lương ở
trên.
• Đặt Yi: là tiền lương hàng tháng của nhân viên thứ i.
• Gọi Xi: là kinh nghiệm của nhân viên thứ i
• Với Di=1 : nhân viên nam
• Với Di=0 : nhân viên nữ
Nếu bỏ qua yếu tố giới tính, chỉ xét mối quan hệ giữa tiền
lương hàng tháng và kinh nghiệm, một mô hình hồi quy đơn cho
quan hệ này là:
III Biến độc lập là biến định tính
và biến định lượng
i i i
Lúc này, câu hỏi đặt ra là :"Giữa hai nhân viên có cùng kinh nghiệm, có sự khác biệt trong tiền lương tháng do giới tính không?"
1 Trường hợp có một biến định tính với 2 lựa chọn:
Khi đó, nếu tính đến biến giả , mô hình sẽ trở thành
i i i
III Biến độc lập là biến định tính
và biến định lượng
Có sự khác biệt gì giữa các mô hình sau?
Với Y: chi tiêu, X: thu nhập, D=1: nam và D=0: nữ
III Biến độc lập là biến định tính
và biến định lượng
Thí dụ:khảo sát số lượng tủ lạnh bán được tại Mỹ với Dum1 là quý 1, dum2 là quý 2, dum3 là quý 3
FRIG DUM1 DUM2 DUM3