Theo dõi số khách hàng mua các loại giày này trong 5 ngày, người quản lí thu được bảng số liệu sau hãy so sánh lượng tiêu thụ trung bình của 3 loại giày nói trên... Bài 3Tính tỉ số tương
Trang 1MS – EXCEL TRONG
THỐNG KÊ
Trang 3nhau về cơ cấu sử dụng các phương tiện giao thông đi làm trong 2 nhóm công nhân nam và nữ hay không?
Trang 4• Ta muốn kiểm định giả thuyết sau
H0: π1 = π2 = … = πk ( các phân bố này là như nhau trên các tập hợp chính Hi )
Trang 5Chú ý rằng H0 tương đương với hệ đẳng thức sau:
CƠ SỞ LÝ THUYẾT
Trang 6Mẫu Tính
ij 0j
k
1 j
ij
n
Trang 7Nếu H0 đúng và các TSLT không nhỏ hơn 5 thì T sẽ có
phân bố xấp xỉ phân bố χ2 với (k-1)(r-1) bậc tự do
Miền bác bỏ có dạng T > c , ở đó c được tìm từ điều kiện P{T > c} = α
Vậy c là phân vị mức α của phân bố χ2 với (k-1)(r-1) bậc
) n
(n T
n : TSQS
n
.n
n p
n n
: TSLT
2 k
1 j
ij
i0 0j
* i 0j
* ij
CƠ SỞ LÝ THUYẾT
Trang 8Trong MS-EXCEL có hàm CHITEST:
c
1
2 ij ij
E
) E (O
O ij : tần số thực nghiệm của ô thuôc hàng i và cột j
E ij : tần số lý thuyết của ô thuộc hàng i với cột j, r: số hàng và c: số cột
• P(X > χ 2 ) ≥ α ⇒ chấp nhận giả thiết Ho
• P(X > χ 2 ) < α ⇒ loại bỏ giả thiết Ho
CƠ SỞ LÝ THUYẾT
Trang 9THUẬT TOÁN
Trang 11Cơ cấu sử dụng phương tiện giao thông
đi làm trong hai nhóm công nhân nam và
nữ là khác nhau
Trang 12Bài 2
Một cửa hàng lớn có bán 3 loại giày A, B và C Theo dõi số khách hàng mua các loại giày này trong 5 ngày, người quản lí thu được bảng số liệu sau
hãy so sánh lượng tiêu thụ trung bình của 3 loại giày nói trên
Trang 13Giả sử {x 11 ,x 21 ,…,x n11 } là một mẫu có kích thước n 1 rút ra từ tập hợp chính các giá trị của X 1 ; {x 12 ,x 22 ,…,x n22 } là một mẫu kích thước rút ra từ tập hợp chính các giá trị của X 2 ,…, {x 1k ,x 2k ,
…,xnkk} là một mẫu kích thước nk rút ra từ tập hợp các giá trị của Xk
i
n n
∑
=
= k
1 i k
T T
n
T
x =
CƠ SỞ LÝ THUYẾT
Trang 14Tổng
cộng
SSE = SST - SSF n-k
Sai số
k-1
Yếu tố
Giá trị thống kê
Bình phương trung bình Tổng số bình phương
2
i
2 i
n
T n
T SSF
n
1 j
2 2
n
n
T Y
SST
1 k
SSF MSF
−
=
k n
SSE MSE
Trang 15Nếu giả thiết H0 đúng thì tỷ số sẽ có phân bố Fisher với bậc tự do là (k – 1, n – k ).
Thành thử giả thiết Ho sẽ bị bác bỏ ở mức ý nghĩa α của phân bố Fisher với bậc tự do ( k – 1, n – k )
Phương pháp kiểm định trên được gọi là phân tích
phương sai một nhân tố
MSE
MSF
F =
CƠ SỞ LÝ THUYẾT
Trang 16THUẬT TOÁN
- Nhập bảng số liệu như hình vẽ
- Chọn Tools/ Data Analysis/ Anova: Single Factor
Trang 19H0 : “Lượng tiêu thụ trung bình của ba loại giày nói trên là như nhau”
Trang 20Bài 3
Tính tỉ số tương quan của Y đối với X và hệ số xác định của tập số liệu sau đây:
Có nhận xét gì về mối quan hệ giữa X và Y?
Trang 21CƠ SỞ LÝ THUYẾT
• Hai biến số ngẫu nhiên Y và X có thể liên quan tuyến tính,
có khuynh hướng tuyến tính hoặc không có liên quan
• Để đo mức độ phụ thuộc tuyến tính giữa 2 ĐLNN X và Y, người ta đưa ra khái niệm hệ số tương quan
• Hệ số tương quan lý thuyết của X và Y, ký hiệu ρ được
định nghĩa bởi công thức sau
là giá trị trung bình và độ lệch tiêu chuẩn của X
là giá trị trung bình và độ lệch tiêu chuẩn của Y
Y X
Y
Xσ σ
) μ )(Y
μ
E(X
Y Y
X X
σ , μ
σ , μ
Trang 221 i
2 i
2 i
n
1 i
i i
XY XX
XY
)y(y
)x(x
)y)(y
x(x
SS
Sr
• Chúng ta có bài toán ước lượng và kiểm định hệ số tương quan ρ căn cứ trên một mẫu quan sát (x1, y1) (x2, y2) , … , (xn,
• Đại lượng sau đây được sử dụng như một ước lượng cho ρ
r được gọi là hệ số tương quan
Để tính toán thuận lợi, r có thể viết dưới dạng
CƠ SỞ LÝ THUYẾT
2 ) y (
2 y n
2 ) x (
2 x n
y) x)(
( xy)
Trang 23• Tỉ số tương quan đuợc lý giải như là tỉ lệ biến động của Y do có sự phụ thuộc tuyến tính của Y vào X
• Hệ số xác định là bình phương của hệ số tương quan,
kí hiệu: r2
• Hệ số xác định r là tỉ lệ biến động của Y do có sự phụ thuộc tuyến tính của Y vào X
CƠ SỞ LÝ THUYẾT
Trang 24CƠ SỞ LÝ THUYẾT
Trang 25- Nhập bảng số liệu như hình vẽ
- Chọn Tools/ Data Analysis/ Correlation
THUẬT TOÁN
Trang 27Hệ số
tương quan r
Trang 28Tỷ số tương quan của Y đối với X
Trang 30Bài 4
Bảng sau đây cho ta một mẫu gồm 11 quan sát (xi, yi) từ tập hợp chính các giá trị của cặp đại lượng ngẫu nhiên (X,Y)
a Tìm đường hồi quy của Y đối với X
b Tính sai số tiêu chuẩn của đường hồi quy
c Tính tỉ số F để kiểm định sự đúng đắn của giả thiết:
Có hồi quy tuyến tính của Y theo X
Trang 31• X,Y là hai ĐLNN Nếu Y có quan hệ tuyến tính theo
X, ta nói Y có hồi quy tuyến tính theo X
• Đây là phương trình hồi quy tuyến tính của Y theo X
∀ β0 , β: Hệ số hồi quy lý thuyết
(trong đó X là biến độc lập, Y là biến phụ thuộc)
βx β
y = 0 +
CƠ SỞ LÝ THUYẾT
Trang 32Một mẫu kích thước n đồng thời về X, Y có dạng bảng số liệu sau đây, gọi là bảng tương quan mẫu
.y
n n
1 )
x /X
Y (
1 j
i ij i
Trang 33Phương trình hồi quy tuyến tính
• Bài toán đặt ra là ước lượng các hệ số hồi quy lý thuyết
β0 , β trên mẫu quan sát (x1, y1) ,…, (xn, yn)
• Dựa vào phương pháp bình phương cực tiểu, ta sẽ tìm được giá trị ước lượng tương ứng là B0 và B
• Đuờng hồi quy tuyến tính mẫu Y theo X có phương
trình y = B0 + Bx gần với đường hồi quy mẫu Y theo X nhất, sao cho (B, B0) là điểm cực tiểu của hàm:
• Ý nghĩa: Dự báo giá trị Y khi biết X = x0
n B
, (
CƠ SỞ LÝ THUYẾT
Trang 34Phương trình hồi quy mẫu Y theo X
Trong đó:
Bx B
x a y
B s
y x
xy B
(x )
i x Y , i
(x (x i+1 , Y x i+1 )
) 1 ,
1
(i = k −
CƠ SỞ LÝ THUYẾT
Trang 352 ) Y i
SSE MSE
−
=
CƠ SỞ LÝ THUYẾT
Trang 36Trắc nghiệm t
• Giả thuyết:
H0: β I = 0 “Hệ số hồi quy không có ý nghĩa”
“Hệ số hồi quy có ý nghĩa”
n 2
n
2 n
i i
) X (X
S S
S
B S
β
B t
0 β
:
CƠ SỞ LÝ THUYẾT
Trang 37Trắc nghiệm F
• Giả thuyết:
H 0 : β I = 0 “Phương trình hồi quy không thích hợp”
“Phương trình hồi quy thích hợp”
:
CƠ SỞ LÝ THUYẾT
Trang 38Ngoài việc ước lượng các hệ số hồi quy, ta còn quan tâm đến ước lượng σ 2 ,
σ 2 là một con số đo sự phân tán của Y xung quanh đường thẳng hồi quy
Ước lượng σ 2 đuợc cho theo công thức sau:
xung quanh đường thẳng hồi quy.
2 0 i
i
2 Y.X (y Bx B )
2n
1s
Dạng khác của công thức trên là:
2 n
y B
xy B
y
2 2
Trang 39THUẬT TOÁN
- Nhập bảng số liệu như hình vẽ
- Chọn Tools/ Data Analysis/ Regression
Trang 41Sai số tiêu chuẩn
B o B
Trang 42Nói một cách khác, phương trình hồi quy này thích hợp
⇒ Có hồi quy tuyến tính của Y theo X
Trang 4329 , 0 2895 ,
0 0838 ,
0
0838 ,
0 2
11
88 , 0
* 739 , 1 7193 ,
1
* 548 , 1 8856 ,
1 2
7193 ,
1
8856 ,
1
88 ,
0
739 , 1 548
, 1 11
.
0
2 2
xy B
y s
xy
y
y
B B
n
Thuật toán tính sai số tiêu
chuẩn
Trang 45 Đường hồi quy: y = 1,55x – 1,74
Sai số tiêu chuẩn của đường hồi quy: 0,29
F = 12,64
X và Y có mối quan hệ tuyến tính với nhau
KẾT LUẬN