Bài giảng Toán tài chính - Chương 5c: Hồi quy và tương quan cung cấp cho người học các kiến thức: Tương quan, biểu đồ phân tán, hệ số tương quan Pearson, đánh giá hệ số tương quan, hệ số tương quan Spearman,... Mời các bạn cùng tham khảo nội dung chi tiết.
Trang 1HỒI QUI VÀ CHƯƠNG
Trang 2TƯƠNG QUAN
Hai biến (đại lượng) được nói là có tương quan nếu chúng cóquan hệ với nhau, chính xác hơn, sự thay đổi của biến này cóảnh hưởng đến thay đổi của biến còn lại
Ký hiệu (x,y) là cặp giá trị quan sát được của hai biến X, Y
Ta có thể vẽ đồ thị của các quan sát thông qua biểu đồ phântán (scatter diagram)
Trang 3VÍ DỤ
Một công ty nghiên cứu ảnh hưởng của quảng cáo
tới doanh số bán hàng Dữ liệu quảng cáo và doanh thu từng tháng được thu thập như sau:
Hãy vẽ biểu đồ phân tán.
Tổng doanh số tháng
tới
Trang 5HỆ SỐ TƯƠNG QUAN PEARSON
Ký hiệu: r hay rX,Y
Trang 6HỆ SỐ TƯƠNG QUAN PEARSON
Ký hiệu: r hay rX,Y
Trang 7TRUNG BÌNH; PHƯƠNG SAI VÀ HIỆP PHƯƠNG SAI
Đối với quan sát mẫu
Trang 8ĐÁNH GIÁ HỆ SỐ TƯƠNG QUAN
Trang 9ĐÁNH GIÁ HỆ SỐ TƯƠNG QUAN
Trang 12n x y x y r
Trang 14VÍ DỤ
Số liệu về thời gian quảng cáo trên truyền hình và lượng
sản phẩm tiêu thụ ở một công ty sản xuất đồ chơi trẻ emnhư sau:
Thời gian: phút/tuần
Lượng tiêu thụ: 1000sp/tuần
Hãy tính hệ số tương quan mẫu và cho kết luận
Thời gian 28 37 44 36 47 35 26 29 33 32 31 28
Trang 15HỆ SỐ TƯƠNG QUAN SPEARMAN
6 1
1
d R
n n
å
Trang 16-HỆ SỐ TƯƠNG QUAN SPEARMAN
Khi tuyển dụng, một công ty đánh giá các ứng viên thôngqua phỏng vấn và bài kiểm tra Khi phỏng vấn, các ứng
viên được đánh giá từ A (xuất sắc) đến E (không phù hợp)
và bài kiểm tra được tính theo thang điểm 100 Kết quảcủa 5 ứng viên như sau:
Tính hệ số tương quan hạng Spearman và cho nhận xét
Trang 17Hiệu số
Hiệu số bình phương
Trang 18VÍ DỤ
Một chuyên gia được
yêu cầu nếm thử 8 loại
rượu có giá dưới 4 $
Hương vị các loại rượu
Trang 19Hiệu số
Hiệu số bình phương
H
Trang 20PHÂN TÍCH HỒI QUY
giữa:
Một biến phụ thuộc Y (biến được giải thích)
Một hay nhiều biến độc lập X1, X2, …,Xn (còn được gọi là biến giải thích)
Biến phụ thuộc Y phải là biến liên tục
Các biến độc lập X1, X2, …, Xn có thể là biến liên tục, rờirạc hay phân loại
Trang 21LIÊN HỆ HÀM SỐ VÀ LIÊN HỆ THỐNG KÊ
Liên hệ hàm số: Y=aX+b
Với một giá trị của X, có 1 giá trị duy nhất của Y
Liên hệ thống kê: Y=aX+b
Ví dụ: X: thời gian tự học; Y: điểm cuối kỳ
Một giá trị của X có thể có nhiều giá trị của Y
Dữ liệu X: dữ liệu mẫu
Dữ liệu mẫu tìm đường hồi quy mẫu dự đoán chođường hồi quy tổng thể
Trang 22VÍ DỤ
Một công ty muốn ước lượng hàm chi phí cho một sản phẩm Giá trị của hàm chi phí được xác định tại một vài mức sản xuất như sau.
Trang 23VÍ DỤ
Mặc dù những điểm quan sát
không cùng nằm trên một đường
thẳng nhưng tương quan tuyến
Trang 24THẶNG DƯ (RESIDUAL)
Ta cần xác định a, b sao cho tổng bình phương thặng dư nhỏnhất
Trang 25VÍ DỤ
Số liệu về doanh số và số lượng nhân viên kinh doanh trong các khu vực của công ty X như sau:
Hãy tìm mô hình tuyến tính dự đoán doanh số theo số
Khu vực Doanh số Số nhân viên kinh doanh
Trang 26=
Trang 27å
Trang 29ỨNG DỤNG KINH TẾ
Nhu cầu sử dụng dầu nhiên liệu để sưởi ấm nhà ở Hoa Kỳ đã giảm đều đặn trong nhiều thập kỷ Bảng sau liệt kê tỷ lệ hộ gia đình ở Hoa Kỳ sưởi ấm bằng dầu nhiên liệu từ 1960 đến 2009 Sử dụng hồi quy tuyến tính để ước lượng tỷ lệ hộ gia đình sử dụng dầu nhiên liệu vào năm 1995
Trang 30HỒI QUY TUYẾN TÍNH TỔNG QUÁT
Vấn đề: có hai biến quan sát X và Y
Ta cần tìm phương trình thể hiện mối liên hệ giá trị giữa Y
và X
Y: biến phụ thuộc; X: biến độc lập
Dùng mô hình hồi quy đơn giản nhất: hồi quy tuyến tính
Có thể sử dụng các mô hình khác: phi tuyến; bậc 2; bậc 3; mũ; logarit …
Trang 31HỒI QUY TUYẾN TÍNH
X và Y có tương quan tuyến tính mạnh
Ta giả sử X và Y có mối quan hệ tuyến tính với nhau
Mô hình như sau:
Trang 32HỒI QUY TUYẾN TÍNH
Với giá trị quan sát được ta có:
yi : giá trị quan sát được của Y khi X nhận giá trị là xi
xi: giá trị quan sát thứ i của X
ui: sai số ngẫu nhiên khi X nhận giá trị xi
Trang 33HÀM HỒI QUY TỔNG THỂ
Hàm hồi quy tổng thể
Đối với một quan sát cụ thể ta có:
Mô hình chỉ có một biến phụ thuộc Y và một biến giải
Trang 34HÀM HỒI QUY MẪU SRF
Ta ít khi có số liệu của cả tổng thể mà chỉ có số liệu của mẫu(số liệu quan sát được)
Ta dùng số liệu mẫu để ước lượng tổng thể
Hàm hồi quy mẫu:
Đối với quan sát thứ i:
Trang 36PRF VÀ SRF
Trong đó
là ước lượng cho b1
là ước lượng cho b2
là ước lượng cho Y hay E(Y|Xi)
Ta sử dụng phương pháp bình phương nhỏ nhất thôngthường (OLS) để tìm ;
Trang 37HỒI QUY TỔNG THỂ VÀ HỒI QUY MẪU
Trang 38CHÚ Ý
Tình trạng Biện pháp
Không xác định được chính xác giá trị
Ước lượng Kiểm định
Hệ số β
Phương sai sai số 2
Hệ số Biến ngẫu nhiên
Có thể tính được giá trị trên mẫu đã chọn
Dùng để ước lượng cho các tham số tổng thể
Hệ số
Phương sai thặng dư
mẫu 2
Trang 39ƯỚC LƯỢNG OLS
Tìm giá trị của β1; β2 sao cho:
Đạt giá trị nhỏ nhất (pp bình phương tối thiểu)
Dễ thấy:
2 2
-=
å
Trang 40HỆ SỐ HỒI QUY MẪU
Là các ước lượng của β1; β2
Trang 41MỘT SỐ TÍNH CHẤT
Giá trị trung bình các hệ số hồi quy mẫu:
Phương sai các hệ số hồi quy mẫu:
Ta dùng các kết quả trên để ước lượng giá trị của các hệ sốhồi quy tổng thể β1; β2
Trang 42MỘT VÀI TÍNH CHẤT
Trang 44KÝ HIỆU
Ta có:
Trang 45TÁCH NHÓM BIẾN THIÊN: KHÁI NIỆM
TSS = tổng của các mức độ khác biệt bình phương giữa
từng giá trị yi và trị số trung bình của y
ESS = tổng của các mức độ khác biệt bình phương giữa
các giá trị quan sát và giá trị dự đoán của y
RSS = tổng của các mức độ khác biệt bình phương giữa
giá trị dự đoán của y và trị số trung bình của y
Trang 46ĐO SỰ BIẾN THIÊN CỦA DỮ LIỆU
Tổng bình phương toàn phần (Total Sum of Squares)
Tổng bình phương hồi quy (Regression Sum of Squares)
Tổng bình phương sai số (Residual Sum of Squares)
( )2
1
n
i i
i
=
Trang 47RSS Tổng chênh lệch
ESS
SRF Y
Trang 48CÁC TỔNG BÌNH PHƯƠNG ĐỘ LỆCH
Khi điểm quan sát càng gần đường thẳng ước lượng thì “độ
thích hợp” càng cao, có nghĩa là ESS càng nhỏ và RSS càng
lớn
Tham số đo độ thích hợp:
R2 càng lớn càng tốt
ESS: biến thiên không giải thích được
RSS: biến thiên giải thích được
R2 nhỏ nghĩa là nhiều biến thiên của Y không giải thích đượcbằng X Cần phải thêm nhiều biến khác vào mô hình
2
0 £ R £ 1
=
Trang 49HỆ SỐ XÁC ĐỊNH
Coefficient of determination
Là tỷ lệ của tổng sự biến thiên trong biến phụ thuộc gây rabởi sự biến thiên của các biến độc lập (biến giải thích) so vớitổng sự biến thiên toàn phần
Tên gọi: R_bình phương (R squared)
Trang 50HỆ SỐ XÁC ĐỊNH
Đánh giá mô hình tìm được có giải thích tốt cho mối liên
hệ giữa biến phụ thuộc Y và biến độc lập X hay không
Là bình phương của hệ số tương quan mẫu
i i
X Y
R S S R
Trang 51Tính chất của hệ số xác định R 2
• 0≤ R2≤1
• Cho biết % sự biến động của Y được giải thích bởi
các biến số X trong mô hình.
• R2 =1: đường hồi quy phù hợp hoàn hảo
• R2 =0: X và Y không có quan hệ
• R2 càng lớn càng tốt
• Đối với dữ liệu chuỗi thời gian thì R2 thường lớn hơn
0,9 Nếu thấp hơn 0,6 hay 0,7 thì xem là thấp
• Với dữ liệu chéo thì R2 khoảng 0,6 hay 0,7 cũng
Trang 52ƯỚC LƯỢNG CHO PHƯƠNG SAI SAI SỐ 2
Trang 53ƯỚC LƯỢNG VÀ DỰ BÁO
1 Ước lượng hệ số góc
2 Ước lượng hệ số chặn
3 Ước lượng phương sai sai số
4 Dự báo giá trị trung bình
5 Dự báo điểm
Trang 54PHÂN PHỐI XÁC SUẤT CỦA 1
Trang 55ƯỚC LƯỢNG CHO 1
Tổng quát với độ tin cậy (1 − )
Trang 56
-CÔNG THỨC ƯỚC LƯỢNG 1
Kho ảng tin cậy (1 − ) của hệ số b1
Trang 57PHÂN PHỐI XÁC SUẤT CỦA
Trang 58CÔNG THỨC ƯỚC LƯỢNG
Kho ảng tin cậy (1 − ) của hệ số b2
Trang 59CÔNG THỨC ƯỚC LƯỢNG 2
• Khoảng tin cậy của phương sai sai số tổng thể:
Trang 60DỰ BÁO
Cho X nhận giá trị là x0 Ta tiến hành dự báo:
Trung bình của Y khi X = x0 Ký hiệu: E(Y0|X0)
Giá trị cụ thể của Y khi X = x0 Ký hiệu: 0
Công thức chung:
Giá trị ước lượng ± Sai số
Trang 61DỰ BÁO GIÁ TRỊ Y0
Trang 62DỰ BÁO GIÁ TRỊ E(Y/X0)
Trang 63BỔ SUNG KIẾN THỨC VỀ PHÂN PHỐI XÁC SUẤT
Phân phối chuẩn
Phân phối Student
Phân phối Khi bình phương
Trang 64GIÁ TRỊ TỚI HẠN 2 (n; α)
Giá trị tới hạn mức α (0 ≤ ≤ 1) là số thực ký hiệu
2(n; ) sao cho với Z~ 2(n) thì:
Trang 65BẢNG GIÁ TRỊ TỚI HẠN KHI BÌNH PHƯƠNG
Trang 66GIÁ TRỊ TỚI HẠN ( , )
Giá trị tới hạn mức α (0 ≤ ≤ 1) là số thực ký hiệu
( , ) sao cho với Z~ (n) thì:
Trang 67BẢNG GIÁ TRỊ TỚI HẠN STUDENT
Trang 68VÍ DỤ
Quan sát sự biến động của nhu cầu gạo Y (tấn/tháng) vàođơn giá X (ngàn đồng/kg) ta được các số liệu cho ở bảng Hãy lập mô hình hôi quy mẫu biễu diễn mối phụ thuộc vềnhu cầu vào đơn giá gạo
Trang 70i i i
n
i i
Trang 71Gi ải hồi quy bằng máy tính
1 Bật tần số: Shift+Mode+↓ +4+1 (Freq On
2 Chọn Mode Regression: Mode+3+2(chọn
A+Bx)
3 Nhập dữ liệu theo cột
4 Kiểm tra và nhấn AC thoát
5 Xem kết quả: Shift +1+ 3,4,5 (tùy theo Sum,
Var hay Reg)
Trang 72Bài t ập 1
Thu thập số liệu về điểm học tập của học sinh và mức thu nhập hàng năm của bố mẹ ta có bảng số liệu sau:
Hãy tìm hàm hồi quy mẫu và tính các đặc trưng của nó
Xi: thu nhập (triệu/năm)
Yi: điểm trung bình
Yi 8,75 7,5 6,25 8,75 7,5 5,0 9,5 6,5
Trang 73Bài t ập 1
b) Với độ tin cậy 95% hãy ước lượng hệ số chặn,
hệ số góc và phương sai sai số.
c) Với độ tin cậy 90%, dự đoán điểm và điểm
trung bình khi thu nhập là 80
Yi 8,75 7,5 6,25 8,75 7,5 5,0 9,5 6,5
Trang 74Bài t ập 2
Số liệu về tỷ lệ lạm phát và lãi suất trong năm
2011 của 6 quốc gia như sau:
a) Ước lượng và viết phương trình hồi quy tuyến
Trang 75Bài t ập 3
Cho bảng số liệu sau:
a) Tìm hệ số tương quan mẫu
b) Tìm phương trình hồi quy mẫu
c) Tính Sxx, Sxy, Syy
d) Tính TSS, RSS, ESS.
e) Tính các giá trị hồi quy và từ đó tìm ESS
f) Ước lượng cho 1; 2; 2 với độ tin cậy 90%