CHƯƠNG 7: KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ Phần bổ sung 2 PHẦN II: KIỂM PHI THAM SỐ KIỂM ĐỊNH TÍNH ĐỘC LẬP Một phần tử của đám đông có thể có các dấu hiệu định lượng.. Một phần tử của đám
Trang 1CHƯƠNG 7:
KIỂM ĐỊNH GIẢ THIẾT
THỐNG KÊ Phần bổ sung
2
PHẦN II: KIỂM PHI THAM SỐ KIỂM ĐỊNH TÍNH ĐỘC LẬP Một phần tử của đám đông có thể có các dấu hiệu định lượng VD con người có: chiều cao, trọng lượng Một phần tử của đám đông còn có dấu hiệu định tính VD con người có: màu tóc, màu mắt
Ta khảo sát 3 trường hợp:
* Tính độc lập của 2 dấu hiệu định tính
* Tính độc lập của 1 dấu hiệu định tính và 1 dấu hiệu định lượng
* Tính độc lập của 2 dấu hiệu định lượng
3
I KIỂM ĐỊNH TÍNH ĐỘC LẬP CỦA 2 DẤU HIỆU ĐỊNH TÍNH
Ta có bảng liên hợp các dấu hiệu sau:
B
A B1 B2 …… Bk Tổng
A1 n11 n12 n1k n10
A2 n21 n22 n2k n20
…
Ar nr1 nr2 nrk nr0
Tổng n01 n02 … n0k n
k
j ijn
in0 1 , n0j ki ij1n , n ri1 in0j ojk1n : cỡ mẫu 4
Giả thiết H0: Hai dấu hiệu A và B độc lập
H1: Hai dấu hiệu A và B không độc lập
nij : tần số quan sát
i j ni ijn j
n
0
0
2 (
2
2 (k 1)(r 1) Quy tắc quyết định:
2 > 2 (k 1)(r : bác bỏ H1) 0
Trang 2H ÌNH MINH HỌA QUY TẮC QUYẾT ĐỊNH
VD5: Để nghiên cứu xem quy mô của một công ty có ảnh hưởng đến hiệu quả quảng cáo đối với khách hàng hay không, người ta tiến hành phỏng vấn 356 khách hàng và thu được kết quả sau:
Hiệu quả QC Quy mô CT Mạnh Vừa phải Yếu Tổng
Nhỏ 20 52 32 104
Vừa 53 47 28 128
Lớn 67 32 25 124 Tổng 140 131 85 356
Với mức ý nghĩa 5%, có thể cho rằng quy mô của công ty có ảnh hưởng đến hiệu quả của quảng cáo đối với khách hàng hay không?
7
Giải
H 0 : Quy mô không ảnh hưởng hiệu quả quảng cáo
H 1 : Quy mô có ảnh hưởng hiệu quả quảng cáo
1 124
*
85252 124
*
131322 124
*
140672 128
*
85282
128
*
131472 128
*
140532 104
*
85322 104
*
131522 104
*
140202 356 2
= 29,638
2 > 2 (3 1)(3 1) 2 (4) 9,4877
Tức quy mô công ty có ảnh hưởng đến hiệu quả của
II KIỂM ĐỊNH TÍNH ĐỘC LẬP CỦA 1 DẤU HIỆU ĐỊNH TÍNH VÀ 1 DẤU HIỆU ĐỊNH LƯỢNG
Tiêu chuẩn phù hợp 2 nói trên còn có thể áp dụng để kiểm định tính độc lập của 1 dấu hiệu định tính A và 1 dấu hiệu định lượng X Khi đó ta cần chia miền giá trị của X thành k khoảng B1, B2, Bk , và nếu cá thể có số đo xj rơi vào khoảng Bj thì ta xem cá thể đó có dấu hiệu Bj
Trang 3VD6: Một con cua biển có thể có màu vỏ là xanh, hoặc
hồng Số vạch trên vỏ của nó có thể là 0, 1, 2, 3, 4, 5 Ở đây
dấu hiệu A (màu vỏ) là dấu hiệu định tính, còn số vạch trên
vỏ X là dấu hiệu định lượng (hay X là ĐLNN rời rạc)
Xét ngẫu nhiên 169 con cua biển, ta thu được:
Số vạch Màu vỏ 0 1 hoặc 2 3 hoặc 4 5 Tổng
Hồng 14 14 16 10 54 Tổng 49 33 52 35 169
Giải
H0: hai dấu hiệu A và X độc lập
H1: hai dấu hiệu A và X không độc lập
* 2169(4935*1152 3319*1152 3510*254 )1 ,213
* = 0,05 , r=2 , k=4 20,05(2 1)(4 1) 0,052 (3) 7,8147
* Ta có 2 0,052 (3) : chấp nhận H0
11
III KIỂM ĐỊNH TÍNH ĐỘC LẬP CỦA 2 DẤU
HIỆU ĐỊNH LƯỢNG
Tương tự như vậy, ta có thể dùng tiêu chuẩn 2 nói
trên để kiểm tra tính độc lập của 2 ĐLNN X và Y
(lưu ý rằng nếu X và Y không tương quan: RXY = 0 thì
chưa chắc X,Y độc lập Ta phải kiểm tra mới khẳng
định được) Muốn vậy, ta chia miền giá trị của X
thành k khoảng B1 , B2, Bk còn miền giá trị của Y
thành r khoảng A1, A2, Ar Nếu cá thể có số đo (y,x)
VD7: Giả sử X và Y (pound) tương ứng là số đo huyết áp và trọng lượng của trẻ em 14 tuổi Lấy 1 mẫu ngẫu nhiên gồm 200 trẻ, ta có:
H áp
T lượng
X 99 99<X110 110<X120 X > 120 Tổng
Y >102 6 48 50 50 154
Với : 1 pound = 0,454 kg Với =1%, xét xem: X,Y có độc lập
Trang 4Giải
H 0 : hai dấu hiệu X và Y độc lập
H 1 : hai dấu hiệu X và Y không độc lập
= 0,01 , r= 2 , k= 4
20,01(2 1)(4 1) 0,012 (3) 11,345
53 , 22 ) 1 154
*
55502
46
*
68202 46
*
16102 ( 200
Ta có 2 0,0 12 (3) : bác bỏ H 0
Vậy giữa huyết áp và trọng lượng
có sự phụ thuộc lẫn nhau
14
PHẦN 2 KIỂM ĐỊNH PHI THAM SỐ KIỂM ĐỊNH QUY LUẬT PHÂN PHỐI TIÊU CHUẨN K.PEARSON ( TIÊU CHUẨN 2 )
Trong thực tế ta thường gặp vấn đề là ta phải kiểm tra xem một đại lượng ngẫu nhiên đang xét có một quy luật phân phối nào đó không Ví dụ như chiều cao của một loại cây có quy luật phân phối chuẩn không? Số sản phẩm tốt trong 1 hộp có quy luật phân phối nhị thức không? Số người đến siêu thị trong 1 ngày có quy luật phân phối Poisson không?
15
Cho bảng tần số quan sát của ĐLNN X
(rời rạc: dạng điểm, liên tục: dạng khoảng):
Tần số n1 n2 nk
n = n1 + n2 +…+ nk : cỡ mẫu
Lập giả thiết
1 X là ĐLNN rời rạc
pi = P(X= xi) : theo quy luật A
Ta xét X có quy luật phân phối nhị thức, hoặc Poisson
2 X là ĐLNN liên tục
pi = P(xi-1 < X < xi) hoặc pi = P(xi < X < xi+1)
Ta xét X có quy luật chuẩn
Trang 5i
np i np i
n
k i
2 1
2 k r 1
(tra bảng)
r = số tham số chưa xác định của quy luật X
k là số điểm (khoảng) chia các giá trị của X
Quy tắc quyết định:
H ÌNH MINH HỌA QUY TẮC QUYẾT ĐỊNH
18
19
CÁC QUY LUẬT PHÂN PHỐI
CƠ BẢN CẦN KIỂM ĐỊNH
1 Nhị thức
X ~ B(n,p)
n và p biết r = 0
n biết, p chưa biết r = 1
n và p chưa biết r = 2 Nếu p chưa biết, thay bằng f
2 Poisson
X ~ P( )
biết r = 0
chưa biết r = 1 Nếu chưa biết, thay bằng x
20
CÁC QUY LUẬT PHÂN PHỐI CƠ BẢN CẦN KIỂM ĐỊNH
3 Chuẩn
X ~ N( , 2)
và 2 biết r = 0
biết, 2 chưa biết r = 1
chưa biết, 2 biết r = 1
và 2 chưa biết r = 2 Nếu chưa biết, thay bằng x Nếu 2 chưa biết, thay bằng s2 (hoặc 2 ˆs )
Trang 6Lưu ý:
Điều kiện để áp dụng tiêu chuẩn phù hợp
2
theo K.Pearson là:
Các tần số quan sát ni 5
Nếu các ni quá nhỏ thì phải ghép các giá
trị hay các khoảng giá trị của mẫu lại để
tăng ni lên Cách ghép lớp không duy nhất,
nên ta phải trình bày ra cho người đọc biết
22
VD8:
Quan sát 1 đối tượng trong 100 ngày Gọi X là số lần xuất hiện của đối tượng trong 1 ngày, ta có:
Số ngày 5 10 19 29 21 6 9 0 0 1 0 Với = 5%, hãy xét xem X~B(10 ; 0,3) ?
23
Giải:
H0: X có quy luật phân phối nhị thức B(10; 0,3)
H1: X không có quy luật phân phối nhị thức B(10; 0,3) Trước hết, ta thu ngọn mẫu để cho thỏa ni không quá nhỏ: ni 5
X 0 1 2 3 4 5 6
Ta lập bảng sau:
i
np inp i
n 2
0
1
2
3
4
5
6
5
10
19
29
21
6
10
0,0282 0,1211 0,2335 0,2668 0,2001 0,1029 0,0474
2,82 12,11 23,35 26,68 20,01 10,29 4,74
1,6852 0,3676 0,8104 0,2017 0,0490 1,7885 5,8370 Tổng n=100 1 10,7394
Trang 7Nếu giả thiết H0 đúng, ta tính được các xs:
pi = P(X=xi) = Cxi ( 0 3, ) xi ( 0 7, ) 10 xi
xi= 0,1,2, ,6
p1 = P(X=0) = C 10 0 ( 0 3, ) 0 ( 0 , 7 ) 10 ,0 0282
Vậy 2 = 10,7394
k= 7, r= 0, = 0,05 0,05 2 (7 1) 12,5916
0,0 5
Lưu ý:
Để cho tổng các xác suất phải bằng 1 thì
pk cuối cùng tính bằng 1-(p1+ +pk-1)
VD:
Để
7 1
i pi = 1 thì p7 = 1–
6 1
i pi = 0,0474
27
VD9: Dân gian lưu truyền rằng: loại thức ăn AA
làm tăng khả năng sinh con trai Người ta cho 1
nhóm phụ nữ dùng thức ăn AA, rồi xem xét 80
trường hợp có 3 con trong thời gian dùng loại
thức ăn AA đó Kết quả cho trong bảng sau:
X: số bé trai 3 2 1 0
ni: số phụ nữ 14 36 24 6 Với = 5%, kiểm định xem liệu loại thức ăn AA
có tác dụng đến việc sinh con trai không? 28
Giải:
H0 : loại thức ăn AA không làm tăng khả năng sinh con trai
Nếu H0 đúng thì số bé trai trong gia đình có 3 con là 1 ĐLNN có qluật nhị thức với n= 3, p= ½
Gọi X là số con trai trong 1 gia đình có 3 con H0 : X~B(3, ½)
Đặt : Bk = bc trong 3 đứa trẻ có k đứa là con trai
Trang 8Ta lập bảng sau:
xi ni pi npi
i npi np
in 2
3
2
1
0
14
36
24
6
1/8 3/8 3/8 1/8
10
30
30
10
1,6 1,2 1,2 1,6
p1 = P(B0) =
8 3
3 2
1 1 3
) 1
( 2
, 8 1
3 2
1 0
C B P p C
8 1
3 2
1 3 3
) 3
( 4
,
83
3 2
1 2 3
) 2
(
C B p p C
B P p Vậy 2 = 5,6
= 0,05 , k= 4 , r= 0
2 (k r 1) 0,052 (3) 7,8147
2
0,05
: chấp nhận H0
Vậy thức ăn AA không ảnh hưởng đến giới tính
31
VD10: Sản phẩm được sản xuất ra trên một
dây chuyền tự động, được đóng gói một cách
ngẫu nhiên theo quy cách: 3 sản phẩm/hộp
Tiến hành kiểm tra 200 hộp ta được kết quả:
Số sp loại I có trong hộp 0 1 2 3
hộp là đại lượng ngẫu nhiên có quy luật phân
Giải:
Gọi X là số sp loại I có trong một hộp
XB(3, p)
Ta xấp xỉ p bằng:
74 , 0 200
*
3 * 110 3 * 70
2 14
*
f
H0: X B(3 ; 0,74)
2 = 18,8755 > 2 0,02 (4 1 1) = 7,8241 : bác bỏ H0
Trang 9Ta lập bảng sau:
i
np inp
in 2
0
1
2
3
6
14
110
70
0,017576 0,150072 0,427128 0,405224
3,5152 30,0144 85,4256 81,0448
1,75644 8,5446 7,06932 1,50519
34
VD11: Một nhà máy sản xuất máy in nói rằng:
số lỗi in trong 1 cuốn sách dày 300 trang của máy in là 1 ĐLNN có quy luật phân phối Poisson với tham số = 4,7 Kiểm tra 300 trang sách in của 50 máy in cùng loại, ta thu được:
Số lỗi 0 1 2 3 4 5 6 7 8 9 Số máy 1 1 8 6 13 10 5 5 1 0 Với mức ý nghĩa 1%, hỏi lời tuyên bố của nhà sản xuất có đúng không?
35
Giải:
Gọi X = số lỗi trong 300 trang in
H0: X ~ P(4,7)
P1 = P(X 2)
= e-4,7 ((407,!)0( ,47!1)1(427,!)2) ,01523
P2 = P(X=3) = e-4,7
!3(47,)3 = 0,1574
P3= P(X=4) = e-4,7
!4)4
7, 4
( = 0,1849
36
P4 = P(X=5) = e-4,7
!
57)5
, 4 ( = 0,1738
P5 = P(X=6) = e-4,7
!
67)6
, 4
P6 = P(X 7) = 1– 6 ( ) 0,1954
k
= 0,01 , k = 6, r = 0 0 ,0 12 ( 5 ) 1 5 , 0 8 6 3
2 = 4,8468 < 2 (5 )
0 ,0 1
: chấp nhận H0 Tin lời tuyên bố trên
Trang 10Ta lập bảng:
x i n i p i np i
i
np inp i
n 2
2
3
4
5
6
7
10
6
13
10
5
6
0,1523 0,1574 0,1849 0,1738 0,1362 0,1954
7,6150 7,8692 9,2463 8,6915 6,8083 9,7697
0,7470 0,4440 1,5239 0,1970 0,4803 1,4546
Lưu ý:
Nếu đề không cho = 4,7 thì ta làm như sau:
24 ,4 ) 6
* 7 5
* 6 10
* 5 13
* 4 6
* 3 10
* 2 (
50 1
6 1
1
i i n n x
Thay bằng x = 4,24 Xem X~P(4,24)
39
VD12: Quan sát chiều cao của 120 cây khuynh diệp ở
1 năm tuổi, ta được bảng số liệu:
Chiều cao 50-80 80-100 100-110 110-120 120-130 Số cây 10 9 13 14 21
Chiều cao (cm) 130-140 140-150 150-160 160-170
Với mức ý nghĩa 5%, hãy kiểm định giả thiết:
Giải:
X = chiều cao của cây khuynh diệp (cm)
H0 : X có phân phối chuẩn N( , 2)
ix in n
+115*14+125*21+135*15+145*12 +155*13 + 165*13] = 124,875
Trang 111
1
1 (1963675 120(124,875) )2
120 1 776,6649
s n n x n xi i
8687 , 27 6649
,
s
H0: X~N(124,875 ; (27,8687)2 )
= 0,05, k = 9, r = 2
i
np inp i
n 2
( – , 80) (80, 100) (100, 10) (110, 120) (120, 130) (130, 140) (140, 150) (150, 160) (160, + )
10
9
13
14
21
15
12
13
13
0,0537 0,1330 0,1114 0,1344 0,1389 0,1340 0,1105 0,0803 0,1038
6,444 15,96 13,368 16,128 16,668 16,08 13,26 9,636 12,456
12,6451 48,4416 0,1354 4,5284 18,7662 1,1664 1,5876 11,3165 0,2959
1,9623 3,0352 0,0101 0,2808 1,1259 0,0725 0,1197 1,1744 0,0238
43
p1 = P(X< 80) = 0,5+
8687 ,
27124 ,875
= 0,5 (1,61) = 0,5-0,4463 = 0,0537
p2 = P(80<X<100)
8687 ,
27 124 ,875
8687 ,
27124 ,875
80
= (0,89)+(1,61) = – 0,3133+0,4463
= 0,1330
p3 = P (100<X<110) = –(0,53)+(0,89)
= –0,0675 + 0,2019 = 0,1344
= 0,0714 + 0,0675 = 0,1389
= 0,2054 – 0,0714 = 0,1340
Trang 12p7 = P (140 < X < 150 ) = (0,90) - (0,54)
= 0,3159 – 0,2054 = 0,1105
p8 = P (150 < X < 160 ) = (1,26) - (0,90)
= 0,3962 – 0,3159 = 0,0803
p9 = P (X>160 ) = 0,5 - (1,26)
= 0,5 – 0,3962 = 0,1038
Lưu ý:
* Nếu đề cho trước = 25 thì r = 1 P(xi< X < xi+1)
= ( i x 1 25 124 , 875 ) ( ix 124 25 , 875 )
* Nếu đề cho trước = 120, = 25 thì r= 0 P( xi < X < xi+1)
= ( i x 1 25 120 ) ( x i 25 120 )
47
VD13: Gạo đủ tiêu chuẩn xuất khẩu nếu thỏa
mãn các yêu cầu sau:
Tỷ lệ hạt nguyên 90% , tỷ lệ hạt vỡ 6% ,
tỷ lệ tấm 4%
Kiểm tra 1000 hạt gạo của 1 lô gạo, người ta
thấy có: 870 hạt nguyên, 70 hạt vỡ, 60 hạt
tấm Hỏi lô gạo có đủ tiêu chuẩn xuất khẩu
Giải:
hạt vỡ, hạt tấm tương ứng là 90%, 6%, 4%
Lô gạo không đủ tiêu chuẩn xuất khẩu
Trang 13i i npi
hạt nguyên hạt vỡ hạt tấm
870
70
60
0,90 0,06 0,04
900
60
40
1 1,667
10
VD14:
Sản phẩm do một nhà máy sản xuất được đĩng thành từng hộp Mỗi hộp cĩ 12 sản phẩm gồm 2 loại: loại A và loại B
Theo báo cáo của nhà máy thì tỷ lệ hộp cĩ
12 sản phẩm loại A là 60% Tỷ lệ hộp cĩ
11 sản phẩm loại A là 25% Tỷ lệ hộp cĩ
10 sản phẩm loại A là 10% Tỷ lệ hộp cĩ
số sản phẩm loại A dưới 10 là 5%
51
VD14 (tt):
Chọn ngẫu nhiên 1000 hộp do nhà máy này
sản xuất thì thấy cĩ 585 hộp cĩ 12 sản phẩm
loại A; 256 hộp cĩ 11 sản phẩm loại A; 97
hộp cĩ 10 sản phẩm loại A ; 52 hộp cĩ 9 sản
phẩm loại A và 10 hộp cĩ 8 sản phẩm loại A
Cĩ thể chấp nhận báo cáo của nhà máy hay
Giải:
H0: Tỷ lệ hộp cĩ 12 sp loại A là 0,6 ;
Tỷ lệ hộp cĩ 11 sp loại A là 0,25 ;
Tỷ lệ hộp cĩ 10 sp loại A là 0,1 ;
Tỷ lệ hộp cĩ số sp loại A dưới 10 là 0,05
H1: Phủ định của Ho
2 < 2(0,05 ; 4-1) = 7,815 : chấp nhận H0
Trang 14Thành phần hộp
ni pi npi n np 2
npi
12 splA
11 splA
10 splA
< 10 splA
585
256
97
62
0,60 0,25 0,10 0,05 Tổng n= 1000 1 2 = 3,489
Mời ghé thăm trang web:
54
https://sites.google.com/a/ueh.edu.vn/phamtricao/
https://sites.google.com/site/phamtricao/