Câu 9 Khảo sát hệ số tương quan giữa 2 biến cụ thể, dự đoán phương trình đường hồi quy tuyến tính giữa chúng (có hình vẽ minh họa) và nhận xét về mối tương quan giữa 2 biến Khảo sát hệ số tương quan g[.]
Trang 1Câu 9 Kh o sát h s t ả ệ ố ươ ng quan gi a 2 bi n c th , d ữ ế ụ ể ự đoán ph ươ ng trình đ ườ ng h i quy tuy n tính gi a chúng ồ ế ữ (có hình vẽ minh h a) và nh n xét v m i t ọ ậ ề ố ươ ng quan gi a ữ
2 bi n ế
Kh o sát h s t ng quan gi a 2 bi n đ tu i và ch s ả ệ ố ươ ữ ế ộ ổ ỉ ố
cholesterol, d đoán ph ng trình đ ng h i quy tuy n tính gi a chúng ự ươ ườ ồ ế ữ
và nh n xét v m i t ng quan gi a 2 l c nén và đ b n nén ậ ề ố ươ ữ ự ộ ề
Đ tu i ộ ổ Ch s Cholesterol ỉ ố (mg/dl)
Trang 246 177
Trang 354 214
Trang 443 303
Trang 5C s lý thuy t: ơ ở ế
H s t ệ ố ươ ng quan
Phân tích t ng quan: Hai bi n s ng u nhiên X,Y ươ ế ố ẫ
có th liên quan tuy n tính, có khuynh h ng tuy nể ế ướ ế tính, ho c không liên quan đ n nhau.ặ ế
H s t ngệ ố ươ quan:
R= ∑ x i y i −∑ x i ∑ y i
√ [n∑ x i2−(∑ x i)2] [n∑ y i2− (∑ y ) 2]
N u R > 0 thì X, Y t ng quan thu n ế ươ ậ
N u R < 0 thì X, Y t ng quan ngh ch ế ươ ị
N u R = 0 thì X, Y không t ng quan ế ươ
N u | R |= 1 thì X, Y có quan h hàm b c nh t ế ệ ậ ấ
N u | R |→ 1 thì X, Y có t ng quan ch t (t ng quan ế ươ ặ ươ
m nh) ạ
N u | R |→ 0 thì X, Y có t ng quan không ch t (t ng ế ươ ặ ươ
quan y u) ế
Quan h gi a X và Yệ ữ :
Chúng ta mu n ki m đ nh các gi thi t liên quan đ n giố ể ị ả ế ế ả thi t các giá tr khác nhau c a h s t ng quan t ng th , ký hi uế ị ủ ệ ố ươ ổ ể ệ
ρ, d a trên phân ph i m u c a h s t ng quan m u Rự ố ẫ ủ ệ ố ươ ẫ
H0: ρ=0đ i v i ố ớ H1: ρ ≠ 0 (ho cặ ρ > 0 ho c ặ ρ<0¿
Ng i ta ch ng minh đ c r ng v i gi thi t ườ ứ ượ ằ ớ ả ế H0, phân ph i ố
m u c a R đ i x ng; t đó, th ng kê ẫ ủ ố ứ ừ ố
T = R √ n−2
1−R2 Student (n−2)
Trang 6Ph ng trình h i quy tuy n tính: ươ ồ ế
y s = a + bx, a = rS y
S , b = y – ax
Ki m đ nh h s a, b: ể ị ệ ố
Gi thi t ả ế H0: H s h i quy không có ý nghĩa (=0).ệ ố ồ
Gi thi t ả ế H1: H s h i quy có ý nghĩa (≠0).ệ ố ồ
Ki m đ nh ph ng trình h i quy: ể ị ươ ồ
Gi thi t ả ế H0: “Ph ng trình h i quy tuy n tính không thích h p” ươ ồ ế ợ
Gi thi t ả ế H1: “Ph ng trình h i quy tuy n tính thích h pươ ồ ế ợ ”.
Dạng bài: Phân tích tương quan và hồi quy
1 Xác đ nh h s t ng quan: ị ệ ố ươ
Bước 1: Nhập bảng số liệu vào Excel
Trang 7Bước 2: Sử dụng công cụ “Correlation” trong Data/ Data Analysis
Trang 8Bước 3: Chọn các mục như hình
* Input: địa chỉ tuyệt đối chứa dữ liệu
* Output Range: vị trí xuất kết quả
* Labels in first row
Kết quả:
Kết luận: Dựa vào kết quả trên Excel ta có hệ số tương quan:
R= 0,004060987
Ch ng t gi a đ tu i và ch s Cholesterol có quan h không ch t ứ ỏ ữ ộ ổ ỉ ố ệ ặ chẽ và t ng quan ngh chươ ị
Trang 92 D đoán ph ng trình đ ng h i quy tuy n tính ự ươ ườ ồ ế :
B c 1: Nh p b ng s li uướ ậ ả ố ệ
B c 2: S d ng công c “Regression” trong Data/ Data Analysisướ ử ụ ụ
Bước 3: Chọn các mục như hình
* Input: địa chỉ tuyệt đối chứa dữ liệu
Trang 10* Output Range: vị trí xuất kết quả.
* Labels in first row
K t qu :ế ả
Trang 11B c 4: Bi n lu n:ướ ệ ậ
Ki m đ nh h s a, b có nghĩa th ng kê (a là h s t do, b là h s ể ị ệ ố ố ệ ố ự ệ ố góc)
* Gi thi t ả ế H0: a, b không có ý nghĩa th ng kê.ố
* Gi thi t ả ế H1: a, b có ý nghĩa th ng kê.ố
Trang 12*P- Value = 0.954731884 > 0.05 → Ch p nh n ấ ậ H0 V y h s t do ậ ệ ố ự
a không có ý nghĩa th ng kê.ố
* P – Value = 2.02586E-19 < 0.05 → Bác b ỏH0, ch p nh n ấ ậ H1 V y ậ
h s góc b có ý nghĩa th ng kêệ ố ố
Ki m đ nh đ ng h i quy tuy n tínhể ị ườ ồ ế :
* Gi thi t ả ế H0: Ph ng trình đ ng h i quy tuy n tính không thích ươ ườ ồ ế
h p.ợ
* Gi thi tả ế H1:Ph ng trình đ ng h i quy tuy n tính thích h pươ ườ ồ ế ợ
* Significance F = 0,990006384 > 0.05 → Chấp nhận H0
* Kết luận: Phương trình đường hồi quy tuyến tính không thích hợp.
3 Nhận xét về mối tương quan giữa độ tuổi và chỉ số Cholesterol:
Bước 1: Nhập bảng số liệu: