Bài giảng Nguyên lý thống kê - Chương 10: Tương quan, hồi quy tuyến tính cung cấp cho người học các kiến thức: Tương quan tuyến tính, hồi qui tuyến tính đơn giản, hồi qui tuyến tính bội, một số dạng hàm. Mời các bạn cùng tham khảo nội dung chi tiết.
Trang 1Chương 10
TƯƠNG QUAN,
HỒI QUI TUYẾN TÍNH
www.nguyenngoclam.com
Trang 2I.T ƯƠNG QUAN TUYẾN TÍNH
1 Khái niệm: được gọi là đại lượng đo lường mối tươngquan tuyến tính của 2 đại lượng ngẫu nhiên X và Y nếu:
-1 1
* < 0: X, Y có mối liên hệ nghịch
* > 0: X, Y có mối liên hệ thuận
* = 0: X, Y không có mối liên hệ
*: càng lớn thì X, Y có mối liên hệ càng chặt chẽ
Trang 3I.T ƯƠNG QUAN TUYẾN TÍNH
2 Hệ số tương quan mẫu:
Chọn ngẫu nhiên n cặp quan sát (xi, yi) từ hai tổng thể X,Y
Ta có hệ số tương quan Pearson:
n 1 i
2 i
2 i
n 1 i
i i
)yy
()
xx
(
)yy
)(
xx
(r
Trường hợp |r| ≥ 0,8 chúng ta có thể kết luận X, Y có mối tương quan tuyến tính chặt chẽ
Để đảm bảo tính chính xác này, chúng ta có thể thực hiện kiểm định giả thuyết
Trang 4I.T ƯƠNG QUAN TUYẾN TÍNH
Ví dụ, nghiên cứu mối quan hệ giữa số tiền chi tiêu và thu nhập của họ Ta có số liệu sau:
Trang 5I.T ƯƠNG QUAN TUYẾN TÍNH
Trang 6I.T ƯƠNG QUAN TUYẾN TÍNH
3 Kiểm định tương quan tuyến tính: X,Y ~ N:
0:
)1
n r
r t
• Bác bỏ giả thuyết H0: t t n2, /2
Trang 7I.H ỒI QUI TUYẾN TÍNH ĐƠN GIẢN
1 Khái niệm hồi qui: Ví dụ, Nghiên cứu mối liên hệ giữa chi tiêu Y và thu nhập X của hộ gia đình:
X Y
Trang 8I.H ỒI QUI TUYẾN TÍNH ĐƠN GIẢN
• E(Y/X) = f(X) : Phương trình hồi qui
• E(Y/X) = + X: Phương trình hồi qui tuyến tính
• : Tham số của biến
• U: Yếu tố ngẫu nhiên
• X,Y không có mối quan hệ hàm số mà có mối quan hệ nhân quả và thống kê
Trang 9I.H ỒI QUI TUYẾN TÍNH ĐƠN GIẢN
Trang 10I.H ỒI QUI TUYẾN TÍNH ĐƠN GIẢN
2 Xây dựng mô hình hồi qui mẫu: Ta cần ước lượng , , giả sử đó là a,b Chọn n cặp quan sát (xi,yi) từ X,Y:
i i
i i
i
bxa
yˆ
ebx
ay
Ta cần tìm a, b sao cho 02 giá trị trên càng gần càng tốt
Phương pháp bình phương bé nhất (OLS):
min)
bxa
y()
yˆy
(e
1 i
2 i i
n 1 i
2 i i
n 1 i
i i
)xx
(
)yy
)(
xx
(
Trang 11I.H ỒI QUI TUYẾN TÍNH ĐƠN GIẢN
Ví dụ, nghiên cứu mối quan hệ giữa số tiền chi tiêu và thu nhập của họ Ta có số liệu sau:
Trang 12I.H ỒI QUI TUYẾN TÍNH ĐƠN GIẢN
Trang 13I.H ỒI QUI TUYẾN TÍNH ĐƠN GIẢN
Trang 14II.H ỒI QUI TUYẾN TÍNH BỘI
E(Y/X1,X2,…, Xk) = + 1X1 + 2X2 + …+ kXk
Y = + 1X1 + 2X2 + …+ kXk + U
1 Xây dựng mô hình hồi qui mẫu: Mục tiêu là ta cần ước lượng , 1, 2,… k, giả sử đó là a,b1,b2,…bk, Chọn n cặp quan sát (x1i, x2i,… xki,yi) từ X và Y:
: Giá trị thực tế: Giá trị lý thuyết
ki k
i 2 2 i
1 1 i
i ki
k i
2 2 i
1 1 i
xb
xbx
ba
yˆ
ex
b
xbx
ba
2 ki k
i 1 1
y(
Trang 15II.H ỒI QUI TUYẾN TÍNH BỘI
nghiệp (X1), tốc độ tăng trưởng của kim ngạch xuất khẩu (X2) và tỷ lệ lạm phát (X3) được thu thập ở 48 nước:
Y(%) NN(%) XK(%) LP(%) Y(%) NN(%) XK(%) LP(%) Y(%) NN(%) XK(%) LP(%)
1,3 3,4 -2,7 13,0 8,0 3,1 10,9 37,3 5,6 3,9 6,4 13,9 1,0 1,4 -6,0 10,5 6,5 3,3 -0,6 8,9 6,9 1,3 11,6 6,4 0,4 0,1 -3,6 15,9 0,2 0,1 8,4 29,5 -4,6 0,8 -9,8 21,5 4,9 1,8 13,6 3,2 7,8 5,3 10,4 8,1 -2,6 1,7 -6,6 6,7 9,8 5,6 27,3 5,4 2,5 2,3 4,9 22,6 1,1 3,9 3,8 7,7 -2,1 2,2 2,6 5,2 -0,2 3,1 7,9 20,2 4,6 3,0 -3,5 8,6 2,0 2,3 -9,5 8,7 6,1 10,3 -19,0 -1,3 -0,6 2,5 2,0 11,5 5,8 3,0 4,4 1,4 2,9 -0,6 5,4 7,5 8,2 1,9 3,8 7,8 5,2 2,9 9,2 3,0 4,1 2,3 8,7 9,5 4,1 0,9 1,3 5,6 -1,1 -2,3 -6,3 14,9 -5,0 1,2 -2,0 1,1 12,6 7,9 11,7 3,8 0,2 0,3 12,0 20,3 2,1 2,7 5,6 11,2 4,1 2,8 -0,9 9,9 1,1 1,4 -7,2 19,8 7,7 3,0 2,0 8,9 0,6 2,8 -2,1 23,3 -12,0 4,8 -5,5 8,6 9,3 3,3 6,2 7,5 2,0 0,5 -3,1 33,5 -1,6 -0,4 -2,5 11,3 -1,7 2,0 -1,7 18,2 0,0 0,4 6,9 32,6 0,5 1,9 1,6 19,0 5,8 4,7 -0,2 2,1 -2,6 -1,3 3,4 7,7 2,2 -3,5 4,7 1,9 3,9 -3,9 -2,5 3,4 -3,4 7,9 -7,9 45,4
Trang 16II.H ỒI QUI TUYẾN TÍNH BỘI
Trang 17II.H ỒI QUI TUYẾN TÍNH BỘI
3 Ước lượng hệ số i :
Ước lượng sự ảnh hưởng của X i đến Y
)St
b( i n k 1, / 2 bi
2 Ý nghĩa các tham số của Hồi qui:
• Dấu của i: Cho biết mối quan hệ thuận nghịch giữa Y và Xi
• Độ lớn của i: Cho biết mức độ tác động mạnh, yếu của Xiđến Y
• : Có ý nghĩa tùy từng trường hợp cụ thể
Trang 18II.H ỒI QUI TUYẾN TÍNH BỘI
4 Kiểm định từng tham số hồi qui:
Kiểm định Y có phụ thuộc vào biến xi hay không:
H
0:
H
i 1
i
0
0 2
/ , 1 k
n bi
SST
SSRR
SSESSR
Trang 19II.H ỒI QUI TUYẾN TÍNH BỘI
6 Hệ số xác định đã điều chỉnh:
)1k
n
1
n)(
R1
(
1)
1n
/(
SST
)1k
n/(
1 k n ( , k
2 2
k 2
1 0
HBBF
F
R1
R
k
)1k
(n
)1k
(n
/SSE
k/SSRMSE
MSRF
0
:H
Trang 20II.H ỒI QUI TUYẾN TÍNH BỘI
Tốc độ tăng kinh tế - KT(%)
Biến độc lập ĐVT Hệ số P Tốc độ tăng nông nghiệp (NN) % 0,501 0,019 Tốc độ tăng xuất khẩu (XK) % 0,268 0,000 Lạm phát (LP) % -0,105 0,055
Hệ số tự do 2,033 0,047
R 2 =0,37; Sig.F=0,0001, n=48
Tóm tắt kết quả hồi qui
Trang 21II.H ỒI QUI TUYẾN TÍNH BỘI
Trình tự giải thích kết quả Hồi qui:
• Khẳng định mô hình có ý nghĩa Thông qua giá trị Sig.F
• Trình bày mức độ ảnh hưởng của các biến độc lập đến biến phụ thuộc
• Kiểm tra mức ý nghĩa thống kê của từng biến độc lập, giải thích sự ảnh hưởng của từng biến độc lập đến biến phục
thuộc Chú ý đến dấu, dấu kỳ vọng và độ lớn của hệ số hồi qui
Trang 22III.M ỘT SỐ DẠNG HÀM
Các trường hợp mở rộng:
• Biến độc lập là biến định tính: Mô hình hồi qui với biến giả
• Biến phụ thuộc là biến định tính: Phân tích nhân tố
• Trường hợp phương trình hồi qui phi tuyến tính đối với biến
Trang 23III.M ỘT SỐ DẠNG HÀM
1 Một biến độc lập định tính: Hồi qui với biến giả.
1.1.Biến giả có 2 phạm trù: Xây dựng mô hình so sánh tiền lương của công nhân làm việc trong khu vực tư nhân và
quốc doanh
E(Y/D) = + D
• Y: Tiền lương
• D = 1: Công nhân khu vực tư nhân
• D = 0: Công nhân khu vực quốc doanh
E(Y/D=0) = : Lương công nhân khu vực quốc doanh
E(Y/D=1) = +: Lương công nhân khu vực tư nhân
Trang 24,27
Trang 25III.M ỘT SỐ DẠNG HÀM
1.2.Biến giả có 3 phạm trù: Mô hình so sánh lương công nhân khu vực tư nhân, liên doanh và quốc doanh
E(Y/D1,D2) = + 1D1 +2D2
• D1 = 1: Công nhân khu vực tư nhân
D1 = 0: Công nhân khu vực khác
• D2 = 1: Công nhân khu vực liên doanh
D2 = 0: Công nhân khu vực khác
E(Y/D1=1,D2=0) = + 1: Lương CN khu vực TN
E(Y/D1=0,D2=1) = + 2: Lương CN khu vực LD
E(Y/D1=0,D2=0) = : Lương CN khu vực QD
Trang 26III.M ỘT SỐ DẠNG HÀM
1.3.Một biến giả và 1 biến định lượng:
E(Y/X,D) = + 1D1 +2X
• D = 1: Công nhân khu vực tư nhân
• D = 0: Công nhân khu vực quốc doanh
• X : Bậc thợ của công nhân
Lương trung bình công nhân khu vực tư nhân
E(Y/X,D=0) = + 2X:
Lương trung bình công nhân khu vực quốc doanh
E(Y/X,D=1) = (+1) + 2X:
Trang 27III.M ỘT SỐ DẠNG HÀM
2 Hàm log – log: Xét hàm Cobb – Douglas:
U
eL
K
Y 1 2
UL
lnK
lnln
• 1+2: Đo lường hiệu quả theo qui mô
• 1+2=1: Hiệu quả không đổi theo qui mô
• 1+2<1: Hiệu quả giảm theo qui mô
• 1+2=1: Hiệu quả tăng theo qui mô
Trang 28III.M ỘT SỐ DẠNG HÀM
Ý nghĩa của hệ số 1 , 2
• 1: Hệ số co giãn riêng phần của sản lượng theo vốn Đo lường % biến động của sản lượng nếu vốn tăng lên 1% đơn vị
• 2: Hệ số co giãn riêng phần của sản lượng theo lao động
Đo lường % biến động của sản lượng nếu lao động tăng lên 1% đơn vị
YL 2
YK 1
LdL
Y
dY
KdK
Trang 29• L: Ngày công lao động (triệu ngày)
Ví dụ: Hàm cầu lượng cà phê:
• lnQ = 0,78 - 0,25lnPcà phê + 0,38lnPtrà
• Q: Lượng cà phê sử dụng mỗi ngày (cân Anh)
• Pcà phê: Giá cà phê/cân Anh
• Ptrà: Giá trà/cân Anh
Trang 30Y
• : Đo lường 100% thay đổi của Y khi X tăng lên 1 đơn vị
Ví dụ: GDP đầu người giai đoạn 1969 – 1983
• ln(GDP) = 6,9636 + 0,0269t
• GDP tăng trưởng 2,69% mỗi năm
• t=0 (1969): GDP 1.057 tỷ USD
Trang 31III.M ỘT SỐ DẠNG HÀM
4 Mô hình lin - log:
XdX
dY
UX
ln
• : Đo lường 1% thay đổi của Y khi x tăng lên 1%
Ví dụ: Mô hình GNP và lượng cung tiền:
• Y = -16.329 + 2.584,8lnX
• Y: GNP (tỷ USD)
• X: Lượng cung tiền (tỷ USD)
• Nếu cung tiền tăng 1% thì GNP tăng 25,848 tỷ USD
Trang 32Đường cong phillips:
• Y: Tỷ lệ thay đổi của tiền lương
Trang 33www.nguyenngoclam.com