Vấn đề đặt ra là có hay không mối quan hệ phụ thuộc giữa X và Y. Nếu X và Y phụ thuộc thì sự phụ thuộc và mức độ phụ thuộc là như thế nào.[r]
Trang 1Chương 8:
TƯƠNG QUAN và HỒI QUY
Th.S NGUYỄN PHƯƠNG
Khoa Giáo dục cơ bản
Trường Đại học Ngân hàng TPHCM
Blog: https://nguyenphuongblog.wordpress.com Email: nguyenphuong0122@gmail.com
Yahoo: nguyenphuong1504
Ngày 17 tháng 2 năm 2014
Trang 2NỘI DUNG
1 Phân tích hồi quy
Mở đầu
Hồi quy tuyến tính
2 Phân tích tương quan
Trang 3Giả sử có hai biến ngẫu nhiên X và Y Vấn đề đặt ra là có hay không mối quan hệ phụ thuộc giữa X và Y Nếu X và Y phụ thuộc thì sự phụ thuộc và mức độ phụ thuộc là như thế nào Ta coi X và Y có các loại phụ thuộc sau:
- Sự phụ thuộc hàm số: tồn tại hàm f(x) sao cho Y = f(X)
- Sự phụ thuộc thống kê: X thay đổi thì phân phối xác suất của Y cũng thay đổi
- Sự phụ thuộc tương quan: X thay đổi thì trung bình điều kiện E(Y|X) cũng thay đổi, nghĩa là E(Y|X) =ϕ(X) , hằng số Trong tất cả các hàm h(X) được dùng để ước lượng Y thìϕ(X) = E(Y|X) làm cho sai số bình phương trung bình E(Y − h(X))2 đạt cực tiểu
+ Phương trình E(Y|X) =ϕ(X) được gọi là phương trình hồi quy của Y theo
X + Phương trình E(Y|X) = AX + B được gọi là phương trình hồi quy tuyến tính củaY theo X
Trang 4Giả sử X là biến độc lập, Y là biến phụ thuộc và giữa chúng có mối tương quan tuyến tính: E(Y|X) = AX + B với A , 0
A, B được gọi là các hệ số hồi quy lí thuyết
- Vấn đề đặt ra là từ mẫu (x1, y1), (x2, y2), , (xn, yn), hãy ước lượng các hệ
số A, B sao cho sai lệch giữa các giá trị quan sát yi và giá trị tính từ phương trình hồi quy Axi+ B là nhỏ nhất
Đặt F(A, B) = Pn
i=1
(yi− Axi− B)2, hai số a, b được chọn làm ước lượng cho
A, B nếu F(a, b) = min
(A ,B)F(A, B) Từ điều kiện cực trị, ta tìm được:
a = n
n
P
i=1
xiyi−
n
P
i=1
xi
! Pn
i=1
yi
!
n
n
P
i=1
x2
i −
n
P
i=1
xi
!2
b =
n
P
i=1
yi− a.Pn
i=1
xi n
a, b được gọi là hệ số hồi quy mẫu của Y theo X, đường thẳng có phương trình
y = ax + b được gọi là đường thẳng hồi quy
Trang 5Ví dụ
Một công ti tiến hành phân tích hiệu quả quảng cáo của công ti và thu nhập
số liệu trong thời gian 5 tháng được kết quả:
X 5 8 10 15 22
Y 6 15 20 30 39 trong đó X là số tiền chi cho quảng cáo (đơn vị: triệu đồng), Y là tổng doanh thu (đơn vị: chục triệu đồng).Tìm các hệ số hồi quy a, b và phương trình hồi quy của Y theo X
Ví dụ
Một mẫu gồm 7 sinh viên được chọn để nghiên cứu mối quan hệ giữa điểm thi đại học (X) và điểm thi ở kì thi cuối năm thứ nhất (Y) (thang điểm 5)
Y 2,5 2 2 3 3,5 4 4 a) Tính hệ số tương quan mẫu
b) Tìm phương trình hồi quy tuyến tính mẫu của Y theo X
c) Nếu điểm thi vào đại học của sinh viên là 3,3 thì dự đoán điểm thi cuối năm thứ nhất của sinh viên này là bao nhiêu?
5
Trang 6Định nghĩa
Hệ số tương quan mẫu, kí hiệu là r, được xác định như sau:
r =
n
P
i=1
(xi− ¯x)(yi− ¯y)
r n
P
i=1
(xi− ¯x)2.Pn
i=1
(yi− ¯y)2
Để thuận tiện cho việc tính toán, ta thường sử dụng công thức:
r =
n
n
P
i=1
xiyi−
n
P
i=1
xi
! Pn
i=1
yi
!
s n
n
P
i=1
x2
i −
n
P
i=1
xi
!2
s n
n
P
i=1
y2
i −
n
P
i=1
yi
!2
Trang 7Ví dụ
Một công ti tiến hành phân tích hiệu quả quảng cáo của công ti và thu nhập
số liệu trong thời gian 5 tháng được kết quả:
X 5 8 10 15 22
Y 6 15 20 30 39 trong đó X là số tiền chi cho quảng cáo (đơn vị: triệu đồng), Y là tổng doanh thu (đơn vị: chục triệu đồng) Hãy xác định hệ số tương quan mẫu
Ví dụ
Cho mẫu điều tra về (X, Y) có bảng số liệu như sau:
H H H H H X
Y
0 − 0, 2 0, 2 − 0, 4 0, 4 − 0, 6
Tính hệ số tương quan mẫu r