PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI Chương 2: 6tiết - Mục tiêu của chương này là nghiên cứu sự liên hệ giữa biến Y và X bằng sự phân tích tương quan và hồi qui.. - Trong phân tích hồi qui, n
Trang 1PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI
Chương 2: (6tiết)
NỘI DUNG
2.1 Phân tích tương quan
2.2 Phân tích hồi qui
Trang 2PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI
VD Để nghiên cứu về chiều cao và cân nặng của các em học sinh trong một trường, chúng ta lấy mẫu ngẫu nhiên gồm n học sinh và thu thập các số liệu về chiều cao và cân nặng của n học sinh Gọi X là biến ngẫu nhiên để đo chiều cao của học sinh và Y là biến ngẫu nhiên chỉ cân nặng của học sinh Với n học sinh ta có n cặp giá trị (Yi , Xi)
Trang 3PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI
Chương 2: (6tiết)
- Mục tiêu của chương này là nghiên cứu sự liên hệ giữa
biến Y và X bằng sự phân tích tương quan và hồi qui.
- Trong phân tích tương quan, người ta đề cập đến cường
độ của mối quan hệ giữa hai biến Y và X, đánh giá xem hai biến Y và X có quan hệ với nhau hay không
- Trong phân tích hồi qui, người ta lại xác định quan hệ giữa hai biến Y và X dưới dạng phương trình toán học, từ
đó ta có thể dự đoán được biến Y (biến phụ thuộc, dependent variable) dựa vào biến X (biến độc lập, independent variable)
=> Trong chương này, chúng ta cũng giới hạn chỉ nghiên
cứu tương quan và hồi qui đơn biến và tuyến tính,
nghĩa là chỉ nghiên cứu trường hợp biến Y chỉ phụ thuộc
vào 1 biến X và dạng phương trình hồi qui là phương trình đường thẳng (khác với các tương quan và hồi qui
bội và phi tuyến)
Trang 4PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI
Chương 2: (6tiết)
2.1 Phân tích tương quan
* Xét 2 đại lượng ngẫu nhiên X , Y trong n cặp kết quả quan sát (x1,y1)…(xn,yn) ta có:
Y = X + Ngẫu nhiên có điều kiện
- Như vậy: Y = f(x) tạo mối quan hệ hàm số:
Y = X + Ngẫu nhiên độc lập (không có điều kiện)
* Nếu: Y = X + Ngẫu nhiên có điều kiện + Ngẫu nhiên độc lập tạo nên hệ thức giữa chúng
- Ước lượng dưới dạng tổng quát thống kê và lập hệ số tương quan
- Theo lý thuyết thống kê
+ X và Y có mối liên hệ mômen tương quan:
Trang 5PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI
Chương 2: (6tiết)
Trang 6PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI
Chương 2: (6tiết)
Lưu ý: -1 ≤ r ≤ 1
- r được dùng để ước lượng hướng và
độ mạnh của mối quan hệ giữa X,Y.
- /r/ > 0,8 tương quan mạnh.
- /r/ = 0,4 - 0,8 tương quan trung bình.
- /r/ < 0,4 tương quan yếu.
- /r/ càng lớn thì tương quan giữa X và
Y càng chặt.
Trang 7PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI
Chương 2: (6tiết)
* Để kiểm tra độ tương thích 2 biến X,Y lập bảng tính và áp dụng công thức tính rX,Y:
Trang 8PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI
Chương 2: (6tiết)
* Để kiểm tra độ tương thích 2 biến X,Y lập bảng tính và áp dụng công thức tính rX,Y:
Trang 9PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI
Trang 10PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI
Chương 2: (6tiết)
=> R = - 0,1 ; KL: 2 biến X, Y tương quan yếu.
Trang 11PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI
Trang 12PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI
Chương 2: (6tiết)
2.2 Phân tích hồi qui
2.2.1 Khái niệm cơ bản
a Khái niệm: Phân tích hồi qui nghiên cứu mối liên hệ
phụ thuộc của một biến (gọi là biến phụ thuộc) với một hay nhiều biến khác (gọi là biến độc lập)
- Sự phụ thuộc các đại lượng ngẫu nhiên được xác định
bằng một hàm phân phối có điều kiện F(x,y)
- Phân tích hồi qui là tính các thông số của mô hình trên
cơ sở các số liệu thực nghiệm
- Mô hình mục tiêu nghiên cứu phải xác định rõ ràng, hàm
mục tiêu được gọi là hàm đáp ứng
b Phân biệt hồi qui và tương quan
=> khác nhau về mục đích và kỹ thuật
Trang 13PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI
Chương 2: (6tiết)
(1) Về mục đích:
biến VD: mức độ quan hệ giữa nghiện thuốc lá và ung thư phổi
biến trên cơ sở giá trị đã cho của các biến khác
(2) Về kỹ thuật:
xứng, biến phụ thuộc là biến ngẫu nhiên, các giá trị biến độc lập của chúng đã được xác định
các biến, chúng có tính chất đối xứng
Trang 14PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI
hệ số phương trình hồi qui sao cho gần đúng với
kỳ vọng toán học của thực nghiệm.
Trang 15PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI
Trang 16PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI
Chương 2: (6tiết)
- Nếu Ŷ = f (x0, bo, b1,…) là hàm khả vi thì điều kiện cực tiểu của φ là:
- Hoặc khai triển ra:
………
Trang 17PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI
- Bằng các phương pháp toán học ta xác định được các hệ số của phương trình chuẩn.
Trang 18PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI
Chương 2: (6tiết)
2.2.3 Một số dạng phương trình hồi qui
- Tối ưu hóa phụ thuộc 1 biến số Ŷ = f(x) theo dạng hồi qui thực nghiệm
- Phương trình hồi qui tuyến tính:
- Phương trình hồi qui Parabon:
Trang 19PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI
Chương 2: (6tiết)
- Phương trình hồi qui biểu diễn qua đa thức:
- Trong đó: Po (x), P1 (x), PK (x) là đa thức trực giao trên các tập điểm X1, …, Xn
- Phương trình hồi qui mũ và lũy thừa:
=> Các phương trình mũ và lũy thừa được tuyến tính hoá bằng lấy logarit
Trang 20PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI
Chương 2: (6tiết)
2.2.4 Phân tích hồi qui tuyến tính bội k.
- Nếu thông số tối ưu phụ thuộc vào k biến độc lập (x1, x2,
… xk)
- Mô hình được chọn là biểu thức tuyến tính
- Ta gọi là hồi qui tuyến tính bội k
Ví dụ: Giả sử có n thí nghiệm với k biến độc lập, (x1, x2, …, xK) không có thí nghiệm lặp lại
- Ta có bảng sau:
Trang 21PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI
Chương 2: (6tiết)
Giả thiết:
1 Mỗi kết hợp x1, …, xk đại lượng y có phân phối chuẩn.
2 Phương sai σy2 không đổi.
3 Sai số các phép đo biến độc lập không đáng kể so với sai số đo Y.
4 Các biến x1, …, xk độc lập tuyến tính.
x0: là biến giả (x0=1).
Trang 22PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI
Chương 2: (6tiết)
số liệu thực nghiệm bằng phương pháp bình phương nhỏ nhất:
- Đạo hàm biểu thức trên theo bo, b1…, bk ta nhận được hệ phương trình chuẩn và trình bày dưới dạng ma trận.
Trang 23PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI
Chương 2: (6tiết)
- Biểu diễn sơ đồ thí nghiệm được trình bày dưới dạng ma trận của x thu được là:
Trang 24PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI
Chương 2: (6tiết)
* Ma trận cột các giá trị Y:
•Ma trận của các hệ số hồi qui:
=> Từ ma trận thí nghiệm (x) ma trận của hệ số (B) và kết quả của thí nghiệm (Y), ta có dạng ma trận hệ phương trình: B.X = Y
Trang 25PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI
Chương 2: (6tiết)
- Nhân hai vế của ma trận hệ phương trình trên với với ma trận nghịch đảo của ma trận X là ma trận XT.
+ Ma trận XT là ma trận chuyển vị của ma trận X:
+ Dạng ma trận hệ phương trình chuẩn ta có:
XT X B = XT.Y
Trang 26PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI
Chương 2: (6tiết)
- Từ đó, ta suy ra: B = (XT.X)-1 XT.Y Với: (XT.X)-1 là ma trận nghịch đảo của XT.X
- Từ đó ta tính được:
-Trong đó:
Cjj: những phần tử của ma trận nghịch đảo.
Trang 27PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI
Chương 2: (6tiết)
- Ước lượng của phương sai σbj2 ta xác định được biên của các khoảng tin cậy với mỗi hệ số hồi qui như sau:
bj - Ước lượng của hệ số hồi quy βj
t - Chuẩn số Student (được tra trong bảng chuẩn)
sbj - Sai số trong việc xác định bj
- Sau khi xác định được các hệ số của phương trình hồi qui cần tiến hành kiểm định:
+ Ý nghĩa của hệ số hồi qui + Sự tương tích của phương trình hồi qui
Trang 28PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI
Chương 2: (6tiết)
* Kiểm định của các hệ số hồi qui
- Việc kiểm định ý nghĩa của các hệ số hồi qui được thực hiện theo tiêu chuẩn Student
-Trong đó:
+ bj : Hệ số thứ j trong phương trình hồi qui (βj).
+ sbj: sai số trong việc xác định hệ số thứ j (bj)
Trang 29PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI
Chương 2: (6tiết)
- Nếu tj > tp (f) ảnh hưởng của yếu tố thứ j
có ý nghĩa với thông số tối ưu yi, hệ số bjđược giữ lại.
- Nếu tj < tp (f) hệ số bj bị loại khỏi phương trình hồi qui (p: mức ý nghĩa, f : bậc tự do tái hiện).
=> Khi loại hết các hệ số không có nghĩa ta được phương trình hồi quy.
Trang 30PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI
Chương 2: (6tiết)
* Kiểm định sự tương thích của phương trình hồi qui
- Sự tương thích của phương trình hồi qui được kiểm định theo tiêu chuẩn Fisher:
- Trong đó: Stt2 phương sai tương thích
Sth2 phương sai tái hiện
- Với:
Trang 31PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI
Chương 2: (6tiết)
- Trong đó:
Với : ftt = fdư – fth = n - l + n là: số thí nghiệm
+ l : số hệ số có nghĩa trong phương trình hồi qui.
- Nếu F tính được < F1-p (f1, f2) tra bảng với mức ý nghĩa p, f1 = ftt, f2 = fth thì: phương trình tương
thích với thực nghiệm Và ngược lại.