Bài giảng môn Nguyên lý thống kê kinh tế - PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI
Trang 1PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI
Trang 2I HỆ SỐ TƯƠNG QUAN (Correlation coefficient)
Hệ số tương quan đo lường mức độ quan
hệ tuyến tính giữa hai biến; chính xác hơn
là quan hệ tuyến tính giữa hai biến, không phân biệt biến này phụ thuộc vào biến kia
Trang 31 Hệ số tương quan mẫu (r): (Sample
correlation coefficient)
Gọi (x1, y1), (x2, y2), , (xn, yn) là n cặp quan sát của một mẫu ngẫu nhiên của hai biến ngẫu nhiên X & Y
Hệ số tương quan mẫu :
(7.1)
Trang 42 Ðặc tính của hệ số tương quan (r):
• r không có đơn vị
• r luôn luôn biến động trong [-1, 1], nếu hệ
số tương quan (r) dương cho biết X và Y biến động cùng chiều và âm thì ngược lại
• r = 1 hoặc r = - 1: X và Y có liên hệ hoàn toàn chặt chẽ
• r = 0: X và Y không có mối liên hệ
Trang 5Ví dụ:
Một quảng cáo giới thiệu du lịch được đăng trong 17 tờ báo hoặc tạp chí Liên quan đến chiến dịch quảng cáo này có hai biến liên hệ
X: chi phí quảng cáo (100.000 đồng) Y: tỉ suất lợi nhuận (chỉ tính trên 100.000đ chi phí quảng cáo)
Trang 6Ví dụ:
Trang 7Từ số liệu bảng trên ta tính trung bình mẫu:
r = -0.441 chỉ ra mối quan hệ giữa chi phí và tỷ suất lợi
nhuận là mối tương quan nghịch, có nghĩa rằng chi phí cao thì tỷ suất lợi nhuận thấp và giữa chúng mối liên hệ không chặt chẽ lắm
Trang 8 1 giả thiết:
2 Kiểm định
3 Quyết định:
) 2 (
) 1
n r
r t
Kiểm định hệ số tương quan
, 2
t t tn 2, t tn 2, / 2
0 :
0
: )
1
(
1
0
H
H
0 :
0
: )
2
(
1
0
H
H
0 :
0
: )
3
(
1
0
H H
Trang 9II TƯƠNG QUAN HẠNG: (RANK CORRELATION)
Tương quan hạng dùng để sử dụng cho kiểm định mối liên hệ giữa các biến khi phân phối của tổng thể được giả sử không phải
là phân phối chuẩn hoặc trong trường hợp hiện diện các giá trị bất thường của biến quan sát (lớn quá hoặc nhỏ quá)
Trang 10II TƯƠNG QUAN HẠNG: (RANK CORRELATION)
Nếu các hạng được xếp không trùng nhau thì sử dụng công thức của
Spearman như dưới đây để tính hệ
số tương quan hạng.
di : là chêch lệch giữa 2 hạng của xi và yi
n
2 i
i 1 2
6 d
r 1
n(n 1)
Trang 11 1 giả thiết:
2 Kiểm định
3 Quyết định:
0 :
0
: )
1
(
1
0
H H
Kiểm định hệ số tương quan
,
s
r
n
2 i
i 1 2
6 d
r 1
n(n 1)
,
s
r Tra bảng phân phối Spearman
0 :
0
: )
2
(
1
0
H
H
0 :
0
: )
3
(
1
0
H H
Trang 12III.Hồi qui tuyến tính một chiều (tuyến tính đơn)
Simple linear regression:
• Ðặt (x1,y1), (x2,y2) (xn,yn) là mẫu gồm n cặp quan sát trên đường hồi qui tổng thể.
• Theo phương pháp bình phương bé nhất thì ước
lượng các hệ số α và β là các giá trị a và b sao cho tổng bình phương sai số của phương trình sau đây là
bé nhất:
i i
Trang 131 Phương trình hồi qui tuyến tính một chiều:
Đường hồi qui tuyến tính mẫu của y trên x: y = a + bx
• Các hệ số a và b được tính như sau:
Trang 14Ví dụ:
Chúng ta có thể quan sát số tiền chi tiêu (yi)
và thu nhập (xi) của 22 hộ gia đình trong một tháng
có mối quan hệ với nhau như thế nào (1.000đ) Số
liệu thu thập được:
Trang 15
Ðường hồi qui quan sát: y = 1923 + 0,3815x
Nhận xét: Nếu thu nhập của hộ gia đình tăng lên 1.000đ thì trung bình chi tiêu tăng thêm là 381,5đ Còn 1923đ là phần chi tiêu do các nguồn khác
Trang 162 Khoảng tin cậy
Giả sử đường hồi qui tuyến tính có dạng
i i
y
Thống kê:
b
n 2
2 e i 1
i 1 i 1
b t
s
e / n 2 s
s
x n x x n x
b n
b
t
b 2, /2 2, /2
Khoảng ước lượng
Trang 17 1 giả thiết:
2 Kiểm định
3 Quyết định:
0 1
0 0
:
: )
1
(
H H
Kiểm định tham số hồi qui tổng thể
b
S
b
t 0
0 1
0 0
:
: )
2
(
H
H
0 1
0 0
:
: )
3
(
H H
, 2
2 / , 2
2 / , 2
n
n
t t
t t
Trang 183 Phân tích phương sai hồi qui
Ta có:
Nguồn
biến động Độ tự do (df) Tổng bình phương (SS) Phương sai (MS) Thống kê F Giá trị phân vị
Do hồi qui 1 SSR
Dư số n-2 SSE
Tổng cộng SST
2
~
y y
SSR
2
~
i
y SSE
2
~ 2
~ 2
y y
y y
y
:tổng bình phường hồi qui, là biến động của y được giải thích bằng đường hồi qui :dư số,là biến động của y do các nhân tố khác gây ra
Trang 19IV Hồi qui nhiều chiều:(Multiple egression)