Hai biến (đại lượng) được nói là có tương quan nếu chúng có quan hệ với nhau, chính xác hơn, sự thay đổi của biến này có ảnh hưởng đến thay đổi của biến còn lại.. Ký hiệu (x,y) là cặp gi[r]
Trang 1HỒI QUI VÀ
Trang 2TƯƠNG QUAN
Hai biến (đại lượng) được nói là có tương quan nếu chúng có quan hệ với nhau, chính xác hơn, sự thay đổi của biến này có ảnh hưởng đến thay đổi của biến còn lại
Ký hiệu (x,y) là cặp giá trị quan sát được của hai biến X, Y
Ta có thể vẽ đồ thị của các quan sát thông qua biểu đồ phân tán (scatter diagram)
Trang 3VÍ DỤ
Một công ty nghiên cứu ảnh hưởng của quảng cáo
tới doanh số bán hàng Dữ liệu quảng cáo và doanh thu từng tháng được thu thập như sau:
Hãy vẽ biểu đồ phân tán.
Tổng doanh số tháng
tới
Trang 4BIỂU ĐỒ PHÂN TÁN
Biến độc lập: chi
phí quảng cáo
Biến phụ thuộc:
doanh số bán
hàng
Trang 5HỆ SỐ TƯƠNG QUAN PEARSON
Ký hiệu: r hay rX,Y
Công thức:
Trong đó n là số lượng quan sát
1
, cov , ; cov ,
;
n
i
i
X Y
X
i Y
x y
n
x y r
1 ,
n
i
r
Trang 6HỆ SỐ TƯƠNG QUAN PEARSON
Ký hiệu: r hay rX,Y
Công thức:
Trong đó n là số lượng quan sát
,
X Y
r
1 ,
n
i
r
Trang 7TRUNG BÌNH; PHƯƠNG SAI VÀ HIỆP PHƯƠNG SAI
Đối với quan sát mẫu
Ta có:
;
;
n
i i
n n i
x y
x y x y
xy
Trang 8ĐÁNH GIÁ HỆ SỐ TƯƠNG QUAN
Miền giá trị: −1 ≤ ≤1
Nếu −1 ≤ ≤ 0 thì tương quan âm rXY càng gần -1 thì mối liên hệ tuyến tính nghịch giữa X, Y càng mạnh
Nếu 0 ≤ ≤ 1 thì tương quan dương rXY càng gần 1 thì mối liên hệ tuyến tính thuận giữa X, Y càng mạnh
rXY càng gần 0 thì quan hệ tuyến tính càng yếu
Trang 9ĐÁNH GIÁ HỆ SỐ TƯƠNG QUAN
Trang 10VÍ DỤ
Hãy tính hệ số tương quan Pearson giữa chi phí quảng cáo và doanh số trong ví dụ sau
Tổng doanh số tháng
tới
Trang 11VÍ DỤ
12, 40 150.552, 50 1365, 43
Trang 12VÍ DỤ
Ta có:
Hệ số tương quan:
Hoặc:
2
2
273, 086 1, 52.168, 44
2, 48 1, 52 30110, 5 168
0 , 44
, 993371434
XY
5.1365, 43 7, 6 *842, 2
0, 993371434 5.12, 4 7, 6 5.150552, 5 842, 2
.
.
XY
n x y x y r
Trang 13VÍ DỤ
Các giá trị trung bình
Độ lệch chuẩn:
Hệ số tương quan
0, 993371
r
Trang 14VÍ DỤ
Số liệu về thời gian quảng cáo trên truyền hình và lượng
sản phẩm tiêu thụ ở một công ty sản xuất đồ chơi trẻ em như sau:
Thời gian: phút/tuần
Lượng tiêu thụ: 1000sp/tuần
Hãy tính hệ số tương quan mẫu và cho kết luận
Thời gian 28 37 44 36 47 35 26 29 33 32 31 28
Lượng tiêu thụ 41 32 49 42 38 33 27 24 35 30 34 25
Trang 15HỆ SỐ TƯƠNG QUAN SPEARMAN
Hệ số tương quan hạng
Ký hiệu R
Công thức:
Trong đó n là cỡ mẫu và d là hiệu số của các hạng
2 2
6 1
1
d R
n n
-å
Trang 16HỆ SỐ TƯƠNG QUAN SPEARMAN
Khi tuyển dụng, một công ty đánh giá các ứng viên thông qua phỏng vấn và bài kiểm tra Khi phỏng vấn, các ứng
viên được đánh giá từ A (xuất sắc) đến E (không phù hợp)
và bài kiểm tra được tính theo thang điểm 100 Kết quả của 5 ứng viên như sau:
Tính hệ số tương quan hạng Spearman và cho nhận xét
Trang 17VÍ DỤ
Ta lập bảng sau:
phỏng vấn
Hạng kiểm tra
Hiệu số
Hiệu số bình phương
0 36,50
2 2
5 25 1 1
d R
n n
-å
Trang 18VÍ DỤ
Một chuyên gia được
yêu cầu nếm thử 8 loại
rượu có giá dưới 4 $
Hương vị các loại rượu
được xếp hạng từ 1 (dở
nhất) đến 8 (ngon
nhất) Bảng tổng hợp
xếp hạng và giá cả các
loại rượu như sau:
Loại
• Hãy tính hệ số tương quan hạng Spearman và cho
Trang 19VÍ DỤ
Ta lập bảng sau:
Loại rượu Hạng
hương vị
Hạng giá tiền
Hiệu số
Hiệu số bình phương
A
B
C
D
E F G
H
Trang 20PHÂN TÍCH HỒI QUY
Phân tích hồi quy được sử dụng để xác định mối liên hệ giữa:
Một biến phụ thuộc Y (biến được giải thích)
Một hay nhiều biến độc lập X1, X2, …,Xn (còn được gọi là biến giải thích)
Biến phụ thuộc Y phải là biến liên tục
Các biến độc lập X1, X2, …, Xn có thể là biến liên tục, rời rạc hay phân loại