Đặc điểm của đường hồi quy mẫuMột khi thu được các ước lượng từ mẫu, ta có thể vẽ được đường hồi quy mẫu và đường này có những đặc tính sau:... Giá trị ước lượng trung bình của Y bằng v
Trang 1CHƯƠNG 2
HỒI QUY ĐƠN BIẾN
Trang 21 Bi t đ ế ượ c ph ươ ng pháp ướ c
Trang 6= +
Trang 72.1 MÔ HÌNH
Trong đó
• Sử dụng phương pháp bình phương nhỏ nhất thông thường (OLS) để tìm ,
Trang 9Ordinary least squares OLS ).
Với n cặp quan sát, muốn
n
i
Trang 102.2 PHƯƠNG PHÁP OLS
Điều kiện (*) có nghĩa tổng bình phương các sai lệch giữa giá trị thực tế (Yi ) và giá trị tính theo hàm hồi quy mẫu là nhỏ nhất.
Bài toán thành tìm , sao cho f min
Điều kiện để phương trình trên đạt cực trị là:
e
n
1 i
i
n
1 i
i 2
1 i
=
−
=β
−β
−
−
=β
Trang 11= +
Y X
X X
Y X
n
2 2
1
2 1
ˆ ˆ
ˆ ˆ
β β
β β
Hay
Trang 12i i
X n
X
Y X n X
Y
1
2 2
1 2
) (
.
ˆ
β
X X
xi = i −
Y Y
i i
2
x
x y ˆ
Trang 14Đặc điểm của đường hồi quy mẫu
Một khi thu được các ước lượng từ mẫu, ta có thể vẽ được đường hồi quy mẫu và đường này
có những đặc tính sau:
Trang 15Đặc điểm của đường hồi quy mẫu
1 Nó đi qua giá trị trung bình mẫu của X và Y, do
15
Hình 2.2: Đường hồi quy mẫu qua giá trị trung bình
Trang 16Đặc điểm của đường hồi quy mẫu
2 Giá trị ước lượng trung bình của Y bằng với giá trị trung bình của Y quan sát.
3 Giá trị trung bình của sai số ei bằng 0: ē = 0.
4 Sai số ei không có tương quan với giá trị dự báo của Yi.
5 Sai số ei không có tương quan với Xi.
01
Y
0
=
∑n X e
Trang 17CÁC TỔNG BÌNH PHƯƠNG ĐỘ LỆCH
17
2
^ 2
Trang 18• TSS (Total Sum of Squares - Tổng bình phương sai số tổng cộng)
• ESS: (Explained Sum of Squares - Bình phương sai số được giải thích)
• RSS: (Residual Sum of Squares - Tổng bình phương sai số)
i i
i i
e
Trang 20TSS = ESS + RSS →
HỆ SỐ XÁC ĐỊNH R 2
TSS
RSS TSS
ESS
+
=
1
phù hợp của hàm hồi quy mẫu.
i
Yˆ
Trang 212 1
2
2 2 2
i
y
e TSS
RSS TSS
ESS R
1 2 1 2
Trang 22Nhược điểm: R2 tăng khi số biến X đưa vào mô hình tăng, dù biến đưa vào không có ý nghĩa.
=>Sử dụng R2 điều chỉnh (adjusted R2 -R2) để quyết định đưa thêm biến vào mô hình
Trang 23HỆ SỐ XÁC ĐỊNH ĐIỀU CHỈNHR2
k n
n ) R (
• Khi k > 1, R2 < R2 Do vậy, khi số biến X
tăng,R2 sẽ tăng ít hơn R2
• Khi đưa thêm biến vào mô hình mà làm
choR2 tăng thì nên đưa biến vào và ngược
lại
23
Trang 24Hệ số tương quan r: đo lường mức độ chặt chẽ
của quan hệ tuyến tính giữa 2 đại lượng X và Y
x y
x
y r
1
2 1
2 1
HỆ SỐTƯƠNG QUAN r
Trang 25• Hệ số tương quan có tính chất đối xứng: rXY = rYX
• Nếu X, Y độc lập theo quan điểm thống kê thì hệ số tương quan giữa chúng bằng 0
• r chỉ là đại lượng đo sự kết hợp tuyến tính hay phụ
thuộc tuyến tính, r không có ý nghĩa để mô tả quan hệ phi tuyến
TÍNH CHẤT HỆ SỐTƯƠNG QUAN r
1
Trang 27HIỆP TƯƠNG QUAN MẪU
27
1
) )(
( )
X
X Y
X Cov
X
Đo lường mức độ quan hệ giữa X và Y
Trang 282.3 Các giả thiết của phương pháp OLS
• Giả thiết 1: Các giá trị Xi được xác định trước và không phải là đại lượng ngẫu nhiên VD: Mẫu 1 Mẫu 2
Chi tiêu Y Thu nhập X
Trang 29• Giả thiết 2: Kỳ vọng hoặc trung bình số học của các sai số là bằng 0 (zero conditional
mean), nghĩa là E(U/Xi) = 0
• Giả thiết 3: Các sai số U có phương sai bằng nhau (homoscedasticity)
Var(U/Xi) = σ2
29
2.3 Các giả thiết của phương pháp OLS
Trang 31Phương sai sai số không đồng nhất: var(Ui|
Xi) = σi2
31
2.3 Các giả thiết của phương pháp OLS
Trang 32• Giả thiết 4: Các sai số U không có sự tương quan, nghĩa là
Cov(Ui, Ui’) = E(UiUi’) = 0, nếu i ≠ i’
Trang 33Một số kiểu mẫu biến thiên của thành phần
nhiễu
33
Trang 342.3 Các giả thiết của phương pháp OLS
• Giả thiết 5: Các sai số U độc lập với biến giải thích Cov(Ui, Xi) = 0
• Giả thiết 6: Đại lượng sai số ngẫu nhiên có phân phối chuẩn Ui ~ N(0, δ2 )
Trang 36Sai số chuẩn của các ước lượng OLS
σ2: phương sai nhiễu của tổng thể
σ2 = Var (Ui ) -> thực tế khó biết được giá trị σ2 -> dùng ước lượng không chệch
var: phương sai
se: sai số chuẩn
2
ˆ i
σ
Trang 37Sai số chuẩn của các ước lượng OLS
37
)
ˆ var(
)
ˆ ( β1 = β1
)
ˆ ( β2 = β2
Trang 38Sai số chuẩn của hồi quy: là
độ lệch tiêu chuẩn các giá trị
Y quanh đường hồi quy mẫu
Sai số chuẩn của các ước lượng OLS
2 ˆ
Trang 39Định lý Gauss-Markov
• Định lý: Với những giả thiết (từ 1 đến 5) của mô hình hồi quy tuyến tính cổ điển,
mô hình hồi quy tuyến tính theo phương pháp bình phương tối thiểu là ước lượng tuyến tính không chệch tốt nhất , tức là, chúng là BLUE.
39
Trang 40Định lý Gauss-Markov
• Một ước lượng được gọi là “ước lượng không chệch tuyến tính tốt nhất” (BLUE) nếu thỏa các điều kiện:
– Nó là tuyến tính, có nghĩa là một hàm tuyến
tính của một biến ngẫu nhiên,
– Nó không chệch,
– Nó có phương sai nhỏ nhất, hay còn gọi là
ước lượng hiệu quả (efficient estimator). E(βˆj) = β j
β
Trang 412.4 KHOẢNG TIN CẬY CỦA HỆ SỐ HỒI QUY
Xác suất của khoảng (βi - εi, βi + εi) chứa giá trị thực của βi là 1 - α hay:
P(βi - εi ≤ βi ≤ βi + εi) = 1 - α với
2 /
Trang 422.4 KHOẢNG TIN CẬY CỦA HỆ SỐ HỒI QUY
– ( βi - εi, βi + εi) : là khoảng tin cậy,
Trang 432.4 KHOẢNG TIN CẬY CỦA σ 2
, : giá trị của đại lượng ngẫu nhiên phân phối theo quy luật với bậc tự do n-2 thỏa điều kiện
43
2 / )
(
; 1
) ( χ 2 > χ12−α /2 = − α P χ 2 > χα2/2 = α
P
2
2 /
1 α
χ − 2
2 /
α
χ
2χ
α
χ σ
σ
χ −α ≤ ( − 2) ˆ ≤ α ) =1−
2 2
2 / 1
n P
α χ
σ σ
χ
σ
α α
ˆ)2(
ˆ)2
(
2 / 1
2 2
2 2 /
2 n
n P
hay
Trang 442.5 KIỂM ĐỊNH GIẢ THUYẾT
• Do Ui theo phân phối chuẩn, các ước lượng OLS của β1 và β2 cũng theo phân phối
chuẩn vì chúng là các hàm số tuyến tính của Ui.
• Chúng ta có thể áp dụng các kiểm định t, F, và χ2 để kiểm định các giả thuyết về các
ước lượng OLS.
Trang 451 Kiểm định giả thuyết về hệ số hồi quy
45
* 1
* 0
:
:
i i
* 0
H
H
β β
* 0
:
:
i i
iH
H
i
β β
Trang 46Cách 1: Phương pháp giá trị tới hạn
Bước 1: Tính t
Bước 2: Tra bảng t-student để có giá trị tới hạn
Bước 3: Quy tắc quyết định
* 1
* 0
t
)
ˆ (
i
i i
Trang 47Miền bác bỏ Ho Miền bác bỏ Ho
Miền chấp nhận Ho
Trang 48Cách 2: Phương pháp khoảng tin cậy
*
i i
i i
β ∈ − +
ˆ ˆ
1 Kiểm định giả thuyết về hệ số hồi quy
Trang 49i
i i
T
P ( > i ) =
1 Kiểm định giả thuyết về hệ số hồi quy
Trang 50Thực tế H0 đúng H0 sai
Quyết định
Không bác
bỏ Quyết định đúng, xác suất 1-α suất β (Sai lầm loại 2) Quyết định sai, xác
Bác bỏ Quyết định sai, xác suất α Quyết định đúng, xác suất 1-β
(Sai lầm loại 1)
Trang 530 t
Miền bác bỏ Ho
Trang 54Kiểm định giả thiết H0: R2 = 0
(tương đương H0: β2= 0) với mức ý nghĩa α hay độ tin cậy 1 - α
Bước 1:
Tính
a Phương pháp giá trị tới hạn
Bước 2: Tra bảng F với mức ý nghĩa α và hai bậc tự
(
R
n
R F
Trang 56Miền bác bỏ Ho Miền chấp nhận Ho
Thống kê F
Trang 57Với mô hình hồi quy
Cho trước giá trị X = X0, hãy dự báo giá trị trung bình và giá trị cá biệt của Y với mức ý nghĩa αhay độ tin cậy 1 - α
* Ước lượng điểm
0 2
Trang 58* Dự báo giá trị trung bình của Y
)
ˆ
;
ˆ ( )
/
E
) 2 / , 2 (
1 (
ˆ )
ˆ
2 0
2 0
Y
Với:
2.6 DỰ BÁO
Trang 590 0
1 1
(
ˆ )
ˆ
2 0
2 0
0
∑ −
+ +
Y Y
2.6 DỰ BÁO
2 0
0
Var
Trang 602.7 HỒI QUY VÀ ĐƠN VỊ ĐO CỦA BIẾN
Nếu đơn vị đo của biến X, Y thay đổi thì không
cần hồi quy lại Mô hình hồi quy mới là
i i
ˆ
ˆ
i
e X
Trong đó
i i
2 1
* 2
Trang 62a.Hãy lập mô hình hồi quy mẫu biễu diễn mối phụ thuộc về nhu cầu vào đơn giá gạo
b.Tìm khoảng tin cậy của β1, β2 với α =0,05
c Hãy xét xem nhu cầu của loại hàng trên có phụ thuộc vào đơn giá của nó không với α =0,05.
d Có thể nói rằng nếu giá gạo tăng 1.000đ/kg thì nhu cầu gạo trung bình giảm 2 tấn/tháng không? Cho với α =0,05
e Hãy kiểm định sự phù hợp của mô hình Cho α =0,05.
f Hãy dự báo nhu cầu trung bình và nhu cầu cá biệt của loại hàng trên khi đơn giá ở mức 6.000 đồng/kg với độ tin cậy 95%.
g Hãy viết lại hàm hồi quy nếu nhu cầu gạo được tính theo
VÍ DỤ 1
Trang 63a Mô hình hồi quy mẫu biễu diễn mối phụ thuộc về nhu
cầu vào đơn giá gạo
VÍ DỤ 1
63
Trang 64Giả sử mô hình hồi quy mẫu là:
i
Y ˆ = β ˆ1 + β ˆ2
4 6
1 )
4 (
6 120
6 4 6 111
) (
.
ˆ
2
1
2 2
X n
X
Y X n X
Y
β
VÍ DỤ 1
Trang 65Như vậy, mô hình hồi quy mẫu
=> X và Y có quan hệ nghịch biến
* = 11,5: nhu cầu tối đa là 11,5 tấn/tháng
* = -1,375: khi giá tăng 1000 đồng/kg thì nhu cầu trung bình sẽ giảm 1,375 tấn/tháng với điều kiện các yếu tố khác trên thị trường không đổi
Trang 66ˆ (
ˆ )
ˆ (
ˆ
1 )
2 / , 2 ( 1
1 1
) 2 / , 2 (
)
ˆ (
ˆ )
ˆ (
ˆ
2 )
2 / , 2 ( 2
2 2
) 2 / , 2 (
Ta có
9864 ,
0 46
24 ) 375 ,
1 (
ˆ
2
1
2 1
2
2 2
i
n i
iy
x R
β
Mà:
VÍ DỤ 1
46 ).
9864 ,
0 1
(
) 1
( ˆ
Trang 673609 ,
0 )
ˆ ( )
ˆ (
1303 ,
0 15625
,
0 24
6
120 ˆ
)
ˆ (
1 1
2 2
2 1
δ β
Var SE
x n
X Var
i i
0806 ,
0 )
ˆ ( )
ˆ (
0065 ,
0 24
15625 ,
0
ˆ )
ˆ (
2 2
2
2 2
δ β
Var SE
x
Var
i
VÍ DỤ 1
Trang 680019 ,
1 3609
, 0 776
, 2 )
ˆ ( 1)
2 / , 2 (
2237 ,
0 0806
, 0 776
, 2 )
ˆ ( 2
) 2 / , 2 (
5019 ,
12 4981
,
1513 ,
1 5987
776 ,
2
025 0 ,
t
Tra bảng ta có
Trang 69c Kiểm định giả thuyết β2 = 0 H 0 : β2 = 0
C1: Sử dụng khoảng tin cậy Theo kết quả ở câu a, với α
= 0,05, β2 không thuộc khoảng tin cậy => bác bỏ H0
C2:
=>
=> Bác bỏ H0, hay nhu cầu trung bình có phụ thuộc
vào đơn giá
0379 ,
17 0806
, 0
0 375
,
1 )
ˆ (
ˆ
2
* 2
776 ,
2 0379
Trang 7012 ,
290 )
9864 ,
0 1
(
9864 ,
0 ) 2 6
( )
1 (
) 2
C3: sử dụng kiểm định F đối với mô hình hai biến
Mà F0,05(1,4) = 7,71 < Ftt
=> Bác bỏ H0, hay nhu cầu trung bình có phụ thuộc vào đơn giá
VÍ DỤ 1
Trang 71)
ˆ (
ˆ )
6 /
( Y X Y0 t( 2, /2) SE Y0
E = ∈ ± n− α
052 ,
0
) 24
) 4 6
( 6
1 ( 1562 ,
0 )
) (
1 (
ˆ )
ˆ
(
2 2
2 0
Y
Var δ
2283 ,
0 )
ˆ ( )
ˆ ( Y0 = Var Y0 =
SE
) 8838 ,
3
; 6162 ,
2 ( )
6 /
( Y X = ∈
E
d Dự báo
-Dự báo điểm: (tấn/tháng)-Dự báo giá trị trung bình của YY ˆ0 = 11 , 5 − 1 , 375 x 6 = 3 , 25
VÍ DỤ 1
Trang 72- Dự báo giá trị cá biệt của Y
)
ˆ (
.
ˆ
0 0
) 2 / , 2 (
0
4565 ,
0 )
ˆ (
4
; 9828 ,
0
) 24
) 4 6
( 6
1 1 ( 1562 ,
0 )
) (
1 1 ( ˆ )
ˆ (
2 2
2 0
2 0
∑ x i
X
X n
Y Y
Trang 73Cho số liệu chi tiêu tiêu dùng Y (USD/tuần) và thu nhập
hàng tuần X (USD/tuần) của 10 hộ gia đình Giả sử X và Y
có quan hệ tuyến tính trong đó Y là biến phụ thuộc
Trang 74Chạy số liệu trên Eviews, ta có kết quả sau
VÍ DỤ 2
Trang 751 Viết hàm hồi quy Y theo X Ý nghĩa các hệ số
hồi quy
2 Tính khoảng tin cậy của B2 Ý nghĩa của khoảng
tin cậy này là gì? Cho độ tin cậy 95%
3 Nếu thu nhập của hộ gia đình tăng 1 USD/tuần
thì chi tiêu trung bình của hộ gia đình có tăng 0.7 USD/tuần không? Cho mức ý nghĩa 5%
4 Mô hình có phù hợp không? Cho mức ý nghĩa
1%
5 Dự báo chi tiêu và chi tiêu trung bình của hộ gia
đình khi thu nhập là 300 USD/tuần Cho mức ý nghĩa 5% và X trung bình là 170 USD/tuần
Trang 76VÍ DỤ 2
Trình bày kết quả phân tích hồi quy
) 000 ,
0 )(
005 ,
0 (
) 243 ,
14 )(
813 ,
3 (
) 0357 ,
0 )(
4138 ,
6 (
5091 ,
0 4545
, 24 ˆ
0 (
87 , 202 )
8 , 1 (
8
9621 ,
Lưu ý