Kiểm định giả thiết
Trang 1Bài 8.6 So sánh hai giá trị trung bình
Giả sử ta có hai mẫu ngẫu nhiên (X1,X2, ,X n1)rút ra từ biến ngẫu nhiên XF1(x), (Y1,Y2, ,Y n2) rút ra từ biến ngẫu nhiên YF2(y)
Bài toán đặt ra là: kiểm tra xem hai mẫu trên có phải được rút ra từ một phân phối hay không, tức là:
) ( ) ( )
( )
1 x F x hay F x F x
Trong mục này ta xét bài toán đơn giản hơn là so sánh hai giá trị EX và EY
Ký hiệu
DY DX
EY
1 , , ,
Giả thiết H0: 1=2, đối thiết H1: 12.
2
2
1 ,
Trong trường hợp này ta cần phải giả thiết hoặc X và
Y có phân phối chuẩn hoặc mẫu n1, n2 đủ lớn (n130,
n230) Lý luận tương tự ta được các miền tiêu chuẩn mức
ý nghĩa tương ứng như sau:
) 2 / (
|
|
; :
:
2 2 1 2
2 1 1 2 1
T S H
và H
n n
y x
; :
:
2 2 1 2
2 1 1 2 1
T S H
và H
n n
y x
; :
:
2 2 1 2
2 1 1 2 1
T S H
và H
n n
y x
Ví dụ 1 GS từ hai tập hợp chính có phân bố chuẩn X và Y
ta lấy hai mẫu độc lập với cỡ mẫu tương ứng là n1=40 và
n2=50 Trung bình mẫu tính được là x 130 ,y 140
GS E(X)=μ1(chưa biết), biết V(X)=σ12=80
GS E(Y)=μ (chưa biết), biết V(Y)=σ 2=100
Trang 2Với mức ý nghĩa α=1%, kiểm định bài toán :
- Giả thiết H0 : μ1=μ2
- Đối thiết H1 : μ1≠μ2
Giải
Ta có
5
50 100 40 80
140
130
T
Với α=1%, ta có uα/2=2.576
Vì |T|=5>2.576, nên ta bác bỏ giả thiết H0
Ví dụ 2 Với mức ý nghĩa α=5% hãy kiểm định giả thiết sau :
a) - Giả thiết H0 : μ1=μ2
- Đối thiết H1 : μ1>μ2
Với số liệu như sau :
256
; 105
; 98
; 105
; 32
;
2
2 1 2
n
b) - Giả thiết H0 : μ1=μ2
- Đối thiết H1 : μ1<μ2
Với số liệu như sau :
64
; 36
; 25
; 20
; 35
;
2
2 1 2
n
Giải
a)
203
2
32 256 50 105
98
105
T
Do T=2.203>uα=1.645, nên ta bác bỏ giả thiết H0
b)
25 35 2.77
25
20
T
Do T=-2.77<-uα=-1.645, nên ta bác bỏ giả thiết H0
2
2
1 ,
chưa biết nhưng mẫu lớn (n1>30, n2>30), trong trường hợp này ta vẫn vận dụng test thống kê như trong phần 1
Trang 3các phương sai mẫu: 2
2
2
1, S
đây là:
22
1 2
n S n S y x
T
Khi n1, n2>30 thì theo định lý giới hạn trung tâm, T có phân bố xấp xỉ phân bố chuẩn tắc cho dù X và Y không có phân bố chuẩn
Ví dụ 3 Người ta tiến hành một cuộc nghiên cứu về điểm trung bình của các vận động viên thể dục năm 1970 và năm 1995 Một mẫu gồm 35 VĐV của năm 1970 có số điểm trung bình là 267 với độ lệch tiêu chuẩn là 27 Một mẫu gồm 40 vận động viên của năm 1995 có số điểm trung bình là 255 với độ lệch tiêu chuẩn là 30 Kiểm định xem có sự khác nhau hay không giữa hai thế hệ vận động viên của năm 1970 và 1995? Mức ý nghĩa α=5%
Giải
Bài toán kiểm định là:
- Giả thiết H0 : μ1=μ2
- Đối thiết H1 : μ1≠μ2
2 30 35 2 27
255
267
T
Do T=1.823<uα/2=1.96, nên ta chấp nhận H0 Vậy không có cơ
sở để khẳng định có sự khác nhau giữa hai thế hệ vận động viên
2
2
1 ,
chưa biết mẫu nhỏ (n1<30, n2<30)
Trong trường hợp này ta phải giả thiết
( , ); ( , 2 ).
2 2
N
Các bước làm như sau:
- Xuất phát từ hai mẫu đã cho ta tính x,y,s x2 ,s2y
- Tính
Trang 42 2 1 2 2 1 2 ) 1 2 ( 2 ) 1 (
. n n n
n y s n x s n
y x
t
- Với đã cho, tra bảng phân phối Student tìm được
) 2 / (
2
2
1n
n
2
1n
n
( / 2 )
; :
0 và H S t t n1n2
H
; :
0 và H S tt n1n2
H
; :
0 và H S t t n1n2
H
Ví dụ 5 Cơ quan hàng không vụ trụ Mỹ (NASA) đã ký hợp đồng với 2 công ty A và B sản xuất thử pin dùng cho vệ tinh viễn thông
Dựa trên kết quả của các pin thử nghiệm, NASA sẽ quyết định chọn công ty nào làm nhà cung cấp pin cho vệ tinh viễn thông Công ty A đã sản xuất thử được 10 chiếc, có tuổi thọ trung bình là 4.8 năm và độ lệch tiêu chuẩn là 1.1 năm Công ty B sản xuất thử được 12 chiếc, với tuổi thọ trung bình 4.3 năm và độ lệch tiêu chuẩn là 0.9 năm
GS rằng tuổi thọ của pin do A và B cung cấp có phân bố chuẩn và phương sai như nhau Với mức ý nghĩa α=1%,
kiểm định xem có sự khác nhau về tuổi thọ trung bình của
2 loại pin hay không?
Giải
Bài toán kiểm định là:
- Giả thiết H0 : μ1=μ2
- Đối thiết H1 : μ1≠μ2
Các số liệu đã cho như sau:
Công ty A: n1 10 ;x 4 8 ;s1 1 1
Công ty B: n2 12 ;y 4 3 ;s2 0 9
Phương sai chung của ước lượng là:
Trang 5Vậy 0.499.8(4.3 ) 0 0426.5 1.174
121
101
T
Tra bảng phân phối Student 1-0.005 phân vị với 20 bậc tự
do ta được 2.845
Do |T|<2.845, nên ta không đủ cơ sở bác bỏ H0
4.Khoảng tin cậy cho hiệu số μ1-μ2:
Khi bài toán kiểm định dẫn tới bác bỏ H0, ta dẫn tới bài toán tìm khoảng tin cậy cho hiệu số μ1-μ2
2
2
1 ,
đã biết, có thể chứng minh được rằng BNN
2 2 1 2 2
(
n n
y x
T
Có phân bố chuẩn tắc N(0, 1) Khi đó, khoảng tin cậy γ cho hiệu
số μ1-μ2 là:
2
2 2 1
2 1
2 / n n u
y
2
2
1 ,
(n1, n2>30) ta thay 2
2
2
1 ,
2
2
1, S
xấp xỉ γ: / 2 12 n22
S n S
u y
x
Và không cần giả thiết 2 tập chính có phân bố chuẩn
5.Phương pháp so sánh từng cặp:
Giả sử (X, Y) là một cặp gồm hai đại lượng ngẫu nhiên (nói chung phụ thuộc nhau), với E(X)=μ1, E(Y)=μ2
Chúng ta cần so sánh μ1 và μ2
Xét D=X-Y, khi đó ta đưa BT so sánh về BT kiểm định về giá trị TB
Trang 6Bài 8.7 So sánh hai tỷ lệ
Xét hai tập hợp chính I và II và một đặc tính A nào đó mà mỗi
cá thể của hai tập chính đó thể có hay không Ta muốn so sánh
tỷ lệ cá thể có đặc tính A của tập chính I với tỷ lệ cá thể có đặc tính A của tập chính II
Giả sử ta có hai mẫu ngẫu nhiên (X1,X2, ,X n1) trong đó
1
1 1 1 1
1 , ( 0 ) 1 , )
1 (
n
i i i
X P
Và mẫu (Y1,Y2, ,Y n2)trong đó
2
1 2 2 2
2 , ( 0 ) 1 , )
1 (
n
j j j
Y P
Giả thiết H0: p1=p2 đối thiết H1: p1p2, p1>p2, p1<p2
Vì EXi=p1, EYj=p2, DXi=p1(1-p1), DYj=p2(1-p2) nên so sánh hai xác suất p1, p2 chính là so sánh hai giá trị trung bình với phương sai chưa biết Nếu H0 đúng thì DXi=DYj=2 Khi đó
).
( )
n n
Y X
Ước lượng của 2
) 1
.( 11 22 2
1 2 1
n n m m n
n m m
ĐK áp dụng: m1+m2 10 và n1+n2- m1-m210
Với n1, n2 đủ lớn ta xấp xỉ phân phối V(X Y)
Y X
T
xỉ chuẩn N(0, 1)
Từ đó ta nhận được các tiêu chuẩn mức tương ứng như sau:
Trang 7Nếu H0: p1=p2, H1: p1p2 thì S=|u|u(/2)
Nếu H0: p1=p2, H1: p1>p2 thì S=uu()
Nếu H0: p1=p2, H1: p1<p2 thì S=u-u()
Ví dụ 15 Công ty Coca-cola đang n/c cải tiến sản phẩm Với công thức cũ khi cho 500 người dùng thử thì có 120 người ưa thích Với công thức mới khi cho 1000 người khác dùng thử thì
có 300 người ưa thích
Với mức ý nghĩa =2%, kiểm định xem công thức mới đưa vào
có làm tăng tỷ lệ người ưa thích hay không?
Giải
H0: p1=p2, H1: p1>p2
4 2
500 1000 5000 1000 500
1000 120 300 500 1000 500 1000 120 300
500 120 1000 300
2 1 2 1 2 1 2 1 2 1
2
1
2
1
2 2 1 1
.
x n
n n n n m m n
n
n
n
m
m
n m n
m
Do u>u=2.054, nên ta bác bỏ H0
Giả sử X và Y là 2 BNN có phân bố chuẩn, ~ ( , 2 )
1
1
N
) ,
(
2
2
N
Chúng ta cần so sánh μ1 và μ2 dựa trên 2 mẫu quan sát độc lập của X và Y