Phân tích hồi quy là nghiên cứu phụ thuộc, vào một hay nhiều biến khác, các biến giải thích; Với ý tưởng ước lượng hay dự đoán giá trị bình quân hay trung bình tổng thể của biến phụ th
Trang 1MÔ HÌNH HỒI QUY HAI BIẾN
Thế nào là hồi quy?
Thế nào là tuyến tính?
Mô hình hồi quy tuyến tính là như thế nào?
Trang 2Hồi quy được Francis Galton đưa
ra lần đầu tiên và bài viết của Ông rất nổi tiến
Xu hướng bố mẹ cao đẻ con cao
Bố mẹ thấp đẻ con thấp
Chiều cao trung bình của trẻ em
do những ông bố bà mẹ cùng chiều cao sinh ra có xu hướng tiến tới hay “Hồi quy” ở chiều cao trung bình của dân số
Theo cách nói của Galton, đó là
“Hồi quy về trung bình”
(regression to mediocrity)
Trang 3Phân tích hồi quy là nghiên cứu
phụ thuộc, vào một hay nhiều
biến khác, các biến giải thích;
Với ý tưởng ước lượng hay dự đoán giá trị bình quân hay trung bình (tổng thể) của biến phụ thuộc trên cơ sở các giá trị biết trước hay cố định (trong mẫu lặp lại) của các biến giải tích.
Trang 6Hồi quy tuyến tính
Tuyến tính theo các biến số
Tuyến tính theo các tham số
Hồi quy tuyến tính là một hồi quy theo các thông số (các thông số chỉ có lũy thừa bằng 1 mà thôi); nó có thể có tuyến tính hoặc có thể không tuyến tính theo các biế giải thích (các giá trị X)
Trang 7Phân tích hồi quy giải quyết các
vấn đề
phụ thuộc với giá trị đã cho của biến độc lập.
chất của sự phụ thuộc.
phụ thuộc khi biết giá trị của biến độc lập.
Trang 8MỐI QUAN HỆ CỦA HỒI QUY
QUAN HỆ THỐNG KÊ VÀ QUAN HỆ
HÀM SỐ, QUAN HỆ TẤT ĐỊNH
HỒI QUY VỚI QUAN HỆ NHÂN QUẢ
HỒI QUY VỚI TƯƠNG QUAN
Phân tích tương quan là tính sức mạnh
hay mức độ liên kết tuyến tính giữa hai
biến
có sự phân biệt giữa các biến
Trang 9CÁC LOẠI SỐ LIỆU
Số liệu theo thời gian
Trang 10CÁC LOẠI SỐ LIỆU
Số liệu chéo
Là số liệu về một hoặc nhiều biến được thu thập tại cùng một thời điểm tại nhiều địa phương, đơn vị khác nhau
Trang 12Tính chính xác của số liệu
Mặc dù có nhiều số liệu phục vụ cho nghiên cứu kinh tế, chất lượng của số liệu thường không đủ tốt.
Các số liệu kinh tế thường ở mức rất tổng hợp
Ngoài ra còn có những số liệu bảo mật
Trang 13MÔ HÌNH HỒI QUY TỔNG THỂ
X : Thu nhập gia đình hàng tuần ($)
Trang 14Xác suất có điều kiện P(Y|Xi) của
- 1/6 - 1/7 1/6 1/6 - 1/7 1/6 1/7
- - - 1/7 - - - 1/7 - 1/7 E(Y/
Xi) 65 78 89 101 113 125 137 149 161 173
Trang 16ĐẶC TRƯNG NGẪU NHIÊN CỦA
PRF
i i
X Y
E ( | ) 1 2
1 2
55 )
| ( Y Xi
E
1 2
1 80 75
)
| ( Y X i
E
……….
)
| (
)
| (
)
| ( Y Xi E Y X i E 1 Xi
0 )
| ( 1 X i
E
Trang 17KN biến phụ thuộc và biến giải thích
Bi n gi i thích ến giải thích ải thích
Bi n đ c l p ến giải thích ộc lập ập gia đình hàng tuần ($)
Bi n h i quy ến giải thích ồi quy
Bi n tác nhân hay ến giải thích
bi n ki m soát ến giải thích ểm soát Ngo i sinh ại sinh
Bi n d báo ến giải thích ự báo
Bi n ph thu c ến giải thích ụ thuộc ộc lập
Bi n đ ến giải thích ược giải thích c gi i thích ải thích
Bi n đ ến giải thích ược giải thích c H.quy
Ph n ng ải thích ứng
N i sinh ộc lập
Bi n đ ến giải thích ược giải thích ự báo c d báo
Trang 18Biến phụ thuộc (Dependent Variable) Y; Biến
giải thích (Explanatory Variable) Xs
1 Y = Son’s Height; X = Father’s Height
2 Y = Height of boys; X = Age of boys
3 Y = Personal Consumption Expenditure
X = Personal Disposable Income
4 Y = Demand; X = Price
5 Y = Rate of Change of Wages
X = Unemployment Rate
6 Y = Money/Income; X = Inflation Rate
7 Y = % Change in Demand; X = % Change in
the advertising budget
8 Y = Crop yield; Xs = temperature, rainfall,
sunshine, fertilizer
Trang 19The Sample Regression Function (SRF)
Another random sample
from the population
Y X -
Trang 20SRF1 SRF2
Weekly Consumption
Expenditure (Y)
Trang 21The Sample Regression Function (SRF)
Estimate = A particular numerical value
obtained by the estimator in an application
or Yi= Y^i + ε^i
Trang 22
Phương trình hồi quy tổng thể
Trong đó:
Yi : Biến phụ thuộc, biến ngẫu nhiên
X i : Biến độc lập, biến không ngẫu nhiên
εi : Sai số
α,β: Hệ số hồi quy
i i
Trang 23Các giả thiết hồi quy
Trang 25ƯỚC LƯỢNG THAM SỐ HỒI
QUY
Thông số thử nghiệm hàm SRF (Sample
regression function)
4 5 7 12
1 4 5 6
2,929 7,00 8,357 9,714
1,071
-2 -1,357 2,286
1,147
4 1,841 5,226
4 7 8 9
0 -2 -1 3
0 4 1 9
Trang 26ˆ
Trang 28ƯỚC LƯỢNG THAM SỐ HỒI
QUY
Với các giả định i, ii, iiia và iiib, các ước lượng α(hat) và β(hat) là những ước lượng không chệch tốt nhất của α và β (và hiệu quả nhất) có nghĩa là chúng có phương sai nhỏ nhất trong số tất cả các ước lượng tuyến tính không chệch.
Trang 29Ước lượng
X
Y X
X n
Y X X
Y X
i i
i i i
i i
) (
2 2
2
2 2
) )(
( )
( ˆ
X n X
y
X X
n X
Y
x x
y x
X X
Y Y
X
X X
X n
Y X
Y X n
i
i i i
i i i
i i
i
i i
i i
i i
i i
Trang 30Y Y
y
X X
x
i i
i i
Trang 31Kiểm định và ước lượng
Trang 32ˆ ˆ
22
22
2
22
ˆ
i
x
s s
) 2 (
1
ˆ
2
2 2
Trang 33i
i
x N
X s
s
: S
Tính ˆ
Trang 35VD: Giả sử bạn phụ trách cơ quan tiền
tệ trung ương trong một quốc gia tưởng tượng Bạn được cho số liệu quá khứ sau đây về lượng tiền và thu nhập quốc dân (tính theo triệu dollar)
N L.tiền TNQD N L.tiền TNQD
81 82 83 84 85
2.0 2.5 3.2 3.6 3.3
5.0 5.5 6.0 7.0 7.2
86 87 88 89 90
4.0 4.2 4.6 4.8 5.0
7.7 8.4 9.0 9.7 10.0
Trang 36a Hãy chấm những điểm này trên đồ thị Sau
đó ước lượng hồi quy thu nhập quốc dân Y trên lượng tiền tệ X và vẽ đường này trên đồ thị.
b Bạn giải thích như thế nào về tung độ gốc và
độ dốc của đường hồi quy.
c Nếu bạn là người duy nhất kiểm soát sự cung ứng tiền tệ và mong đạt được mức thu nhập quốc dân là 12.0 trong năm 1991, thì bạn sẽ cung ứng tiền tệ ở mức nào Giải thích
Trang 37X
Y ˆ 1 , 17 1 , 72
Trang 38Y: Bushels per acre of cornX: Fertilizer
1 Hãy ước lượng các ược giải thích c l ng các tham s h i quy ố hồi quy ồi quy
2 Bi u di n các c p giá ểm soát ễn các cặp giá ặp giá
tr lên bi u đ ị lên biểu đồ ểm soát ồi quy
3 V đ ẽ đường hồi quy lên ường hồi quy lên ng h i quy lên ồi quy
bi u đ ểm soát ồi quy
Ví d : ụ thuộc
Trang 40
●
●
●
●
● (X,Y ) ●
●
●
X
Yˆ ˆ ˆ
) ˆ
(Y i Y
) ˆ
) (Y i Y
Y
X
PHÂN TÍCH PHƯƠNG
SAI
Trang 41
ESS
ˆ
ˆ
Y Y
Y
Trang 42Hệ số xác định:
TSS
RSS TSS
i
y
x y
y TSS
Trang 43) (
[
) )(
(
)(
(
2 2
2 2
2 2
i i
i i
i i
i i
i i
i i
Y Y
n X
X n
Y X
Y X n
y x
y x r
Trang 45Yêu cầu:
đồ
Hãy giải thích ngắn gọn.
tương quan của phương trình hồi quy.
lên tại X = 12.
Trang 46X Line Fit Plot
y = -0.65x + 8.45
R2 = 0.7922
0 5 10
0 1 2 3 4 5 6 7 8 9
X
Trang 471 Hãy hoàn chỉnh bảng phân tích phương sai hồi qui sau và cho biết ý nghĩa của kiểm định F Xác định giá trị t để kiểm định ý nghĩa thống kê của độ dốc đường hồi qui: