Giá trị theo ñường hồi quyy ñược dùng ñể ước tính khối lượng trung bình của bê ñối ˆi với một ngày tuổi cho trước.. trong ñó σ2 là phương sai của phương trình hồi quy... Bảng phân tích
Trang 1Do ñó, b1 = 1261 / 98 = 12,867 b0 = 77,286 – 12,867×5,00 = 12,949
Do ñó ñường hồi quy tuyến ntính bình phương be nhất là yˆ =12,95+12,87x
ðộ nhọn b1 : Cứ thêm mỗi tháng tuổi thì trọng lượng của bê tăng 12,87 kg
Phần dư và giá trị theo ñường hồi quy
Tuổi (x i) Khối lượng
(y i)
Gí trị hồi quy
i
yˆ = 12 95 + 12 87
Phần dư
i i
i y yˆ res = −
2
resi
Lưu ý rằng giá trị trung bình của phần dư bằng không
[Phân dư so với ñường hồi quy bình phương] res 737,70
7 1
2 =
=
i i
Nếu lựa chọn b0 và b1 là các giá trị khác sẽ làm tăng phần dư này
Giá trị theo ñường hồi quy(y ñược dùng ñể ước tính khối lượng trung bình của bê ñối ˆi) với một ngày tuổi cho trước
Có thể ước lượng khối lượng trung bình của bê 10 tháng tuổi như sau 12,95 + 12,87×10 = 141,62 kg
Ước lượng σσσσ2
Ta quay trở lại với giả thiết ñối với mô hình hồi quy:
y i ~ N(β0 + β1x i, σ2
) hoặc tương ñương với εi ~ N(0, σ2
)
trong ñó σ2
là phương sai của phương trình hồi quy
Nó ñược ước tính như sau s2 (s Y2 X)
) 2 ( SS Residual
1
2
2
−
−
=
−
=
∑
=
n y y
n s
n i
i i
Trang 25.5 Kiểm ñịnh giả thuyết
5.5.1 Hệ số hồi quy
Giả thuyết H0 : β0 = 0 vs H0 : β0 ≠ 0 (ñường hồi quy ñi qua gốc toạ ñộ)
Kiểm ñịnh thống kê:
) se( 0
0
b
b
t= df = n - 2 trong ñó
∑
∑
=
=
−
i i
n
i i
x x n
x s
b
1
2 1 2 0
) ( )
se(
ðối với ví dụ về khối lương của bê:
66 , 7 98 7
273 15
,
12
)
×
×
=
b
t = 12.95 / 7.66 = 1.69, với bậc tự do df = 7 – 2 = 5
P-value: P = 2×P(T5 > 1.69) = 0.15
Như vậy giả thuyết H0 ñược chấp nhận: kết luận rằng ñường hồi quy ñi qua gốc toạ ñộ
Chú ý: khi β0 = 0, thì mô hình ñược rút gọn như sau yi = β1 xi + εi có nghĩa là y ‘tỷ lệ’ với x
5.5.2 ðộ dốc
Giả thuyết H0 : β1 = 0 với H1 : β1 ≠ 0 (ñộ dốc bằng không: không có quan hệ tuyến tính)
Kiểm ñịnh thống kê:
) se( 1
1
b
b
t= df = n - 2 trong ñó
∑= −
=
n
i x i x
s b
1
2 1
) (
) se(
ðối với số liệu về khối lượng của bê:
23 1 98
15
12
)
se(b1 = =
t = 12.87 / 1.23 = 10.49, với bậc tự do df = 7 – 2 = 5
P-value: P = 2×P(T5 > 10.49) = 0.00
Như vậy giả thuyết H0 bịbác bỏ: Kết luận rằng khối lượng của bê tăng một cách có ý nghĩa với ñộ tuổi
5.5.3 Bảng phân tích phương sai (ANOVA) ñối với hồi quy
Cũng như trong phân tích phương sai (ANOVA), chúng ta cũng có thể chia sự biến
ñộng của số liệu (y) thành các thành phần ñược giải thích trong mô hìmh và thành phần
không giải thích ñược:
Tổng bình phương (SS):
Tổng SS = SS hồi quy + SS phần dư
bậc tự do: (n – 1) = 1 + (n – 2)
Giá trị SS trong ví dụ ñược tính toán như sau:
Trang 3Tổng SS = ∑n= −
i y i y
1
2
) ( = Σ(Quan sát − Trung bình)2 = (18 − 77.29)2 + (32 − 77.29)2 + … + (164 − 77.29)2
SS hồi quy = ∑n= −
i y i y
1
2
)
ˆ = Σ(Hồi quy − Trung bình)2 = (12.95 − 77.29)2 + (38.68 − 77.29)2 + … + (167.36 − 77.29)2
i y i y i
1
2
) ˆ ( = Σ(Quan sát − Hồi quy)2 = Σ(Phần dư)2 = (18 − 12.95)2 + (32 − 38.68)2 + … + (164 − 167.36)2
Chú ý rằng SS của hồi quy có thể xác ñịnh bằng sử dụng phương trình sau ñây,
SS hồi quy = ∑n= −
i x i x b
1
2 2
1 ( ) = 12.872 × 98 = 16,226 cũng như trên, apart from some round off error
Kết quả phân tích ñược trình bày ở bảng ANOVA
biến ñộng phương (SS) (df) phương (MS)
Phần dư Res SS n − 2 Res SS / (n − 2)
Với số liệu về bê, bảng ANOVA là
biến ñộng phương (SS) (df) phương (MS)
Chúng ta cungc có thể xác ñịnh ý nghĩa của ñộ dốc với phương pháp thử F
Kiểm ñịnh thống kê:
MS Residual
MS Regression
−
=
F
Trong ví dụ vè bê: F = 16,226 / 147.5 = 110.0 với df = 1, 5
So sánh với phân bố F1,5 , ta có P = 0.00
Như vậy ta có giá trị P tương tự như phần kiểm ñịnh t như trên
ðối với hồi quy tuyến tính ñơn giản, ta có mối quan hệ chặt trẽ giữa t-test và F-test:
t2 = F (10.492 = 110.0) Chú ý bậc tự do bằng nhau (bằng 5)
R2 - Phần biến ñộng ñược giải thích bằng mô hình Với số liệu về bê, R2 = 16,226 /
Trang 4Minitab example: Khối lượng (y) và tuổi (x) của 7 bê
MTB > NAME C1 'Tuoi' C2 'Khoi luong'
MTB > REGR C2 1 C1 Stat > Regression > Regression
Regression Analysis
The regression equation is
Khoi luong = 12.9 + 12.9 Tuoi
Predictor Coef StDev T P
Constant 12.949 7.663 1.69 0.152
Tuoi 12.867 1.227 10.49 0.000
S = 12.15 R-Sq = 95.7% R-Sq(adj) = 94.8%
Analysis of Variance
Source DF SS MS F P
Regression 1 16226 16226 109.97 0.000
Residual Error 5 738 148
Total 6 16963
Lưu ý:
Kiểm ñịnh, nếu trọng lượng có tương quan với ñộ tuổi, Chúng ta kiểm tra giả thuyết H0 : β1 = 0 vs H1 : β1≠ 0 Khi chỉ có một biến ước tính x, Thì chúng ta có thể dùng t-test hoặc F-test ñể thực hiện phép thử Cả 2 phương pháp ñều cho ta giá trị P như nhau
(bằng 0.000), và chú ý rằng
t2 = (10.49)2 = 109.97 = F
Biến ñộng của tăng trọng ñược tính toán theo lứa tuổi là
SS hồi quy / Tổng SS = 16226 / 16963 = 0.957
Gí trị R2 cho ta thấy giá trị hồi quy (R-sq=95.7%)
Trang 56 Tương quan
Chúng ta có thể sử dụng hệ số tương quan ñể xác ñịnh mức ñộ quan hệ tuyến tính giữa 2 biến Hệ số tương quan có giá trị từ -1 ñến +1 Nếu một biến có xu hướng tăng còn biến kia giảm thì hệ số tương quan là âm Còn nếu cả hai biến có xu hướng cùng tăng thì hệ
số tương quan là dương Hệ số tương quan của quần thể ñược ký hiệu bằng ρ và r với mẫu Mức ñộ tương quan có thể ñược kiểm ñịnh bằng phép thử từ 2 phía:
H0: ρ = 0 versus H1: ρ ≠ 0 trong ñó ρ là tương quan giữa 2 biến
ðối với 2 biến x và y,
n
i i i n
i i n
i i
n
i i i
s s n
y y x x y
y x
x
y y x x r
1
) )(
( )
( ) (
) )(
(
1
1
2 1
2
1
−
−
−
=
−
−
−
−
∑
∑
=
=
=
trong ñó x và s x là giá trị trung bình và ñộ lệch chuẩn của mẫu thứ nhất, y và s y là giá trị trung bình và ñộ lệch chuẩn của mẫu thứ 2 Chú ý rằng:
r = 0 ⇒ không có mối quan hệ tuyến tính;
r = +1 ⇒ quan hệ tuyến tính dương lý tưởng; và
r = –1 ⇒ quan hệ tuyến tính âm lý tưởng;
Chúng ta có thể sử dụng ví dụ về tăng trọng của bê ở ví dụ hồi quy tuyến tính ñơn giản
ñể tính toán Các số liệu về ñộ dốc (b1) ñã ñược tính toán trong trong phần hồi quy tuyến tính ñơn giản (xem bảng tính ở phần này)
Tuổi (x i ) Khối lượng (y i) X i =x i − Y i = y i −y X i Y i
00 ,
5
=
x y = 7,286 s x= 4,04 s y= 53,2 n = 7
Ta có: r = 1261/(6)(4,04)(53,2)
= 0,978 ðây là sự tương quan rất chặt trẽ (giá trị tối ña là 1)
Trang 66.3 Những ví dụ về sự tương quan
r = - 1
x
y
r = 1
x y
r = -0.9
x
y
r = 0.9
x y
r = 0.5
x
y
r = –0.5
x y
r = 0
x y