sơ sinh trai và tr.
Trang 11.1 Đ nh nghĩa M t gi thi t th ng kê là m t kh ng ñ nh v phân ph i
c a m t ho c nhi u bi n ng u nhiên N u gi thi t th ng kê xác ñ nh hoàn toàn
m t phân ph i, thì nó ñư c g i là m t gi thi t th ng kê ñơn; trư ng h p ngư c
l i, nó ñư c g i là m t gi thi t th ng kê h p
Trong quá trình ñi ñ n m t quy t ñ nh, chúng ta thư ng d a vào m t qui
lu t hay m t kinh nghi m nào ñó ñ ñ t ra m t gi thi t th ng kê; sau ñó, xây
d ng nh ng th t c, theo ñó, nh ng gi thi t ñã ñ t ra ñư c ch p nh n hay bác b
Nh ng th t c ñó ñư c g i là nh ng phép ki m ñ nh (tr c nghi m) gi thi t th ng
kê
Phép ki m ñ nh thư ng là phép so sánh gi a hai hay nhi u giá tr Gi thi t
ñư c ñ t ra ttư ng ñư c g i là Gi thi t không, ký hi u Ho Ch “không” ñây
có nghĩa là không có s khác bi t có ý nghĩa v m t th ng kê gi a các giá tr c n
so sánh Khi bác b Ho, chúng ta s! ch p nh n m t gi thi t H1 khác, ñư c g i là
gi thi t ñ i c a Ho
Thí d , ñ so sánh hi u qu ñi u tr c a hai lo i thu c A và B ñ i v i m t
b nh X, ñi u tra trên m u chúng ta có k t qu t" l kh i b nh p(A) > p(B) V i ý
mu n ch#ng minh hi u qu c a hai lo i thu c trên là khác nhau, chúng ta ñ t gi thi t Ho là “ không có s khác nhau v hi u qu ñi u tr c a hai lo i thu c A và B
Trang 2” hay “ s khác nhau v hi u qu ñi u tr c a hai lo i thu c A và B là không có
ý nghĩa ”
Phương pháp c a th t c là dùng k t qu c a m u ñ ch#ng minh m t gi thi t
Xét m u kích thư c n (X1, X2, …, Xn) ñư c thành l p t t ng th X Ngư i
ta chia Im(X1, X2, …, Xn) (còn g i là không gian m u ) thành hai t p con, l n
lư t ñư c ký hi u là W và W* = Im(X1, X2, …, Xn) −−−− W Khi m u c th (x1, x2,
…, xn) ñư c th c hi n, n u (x1, x2, …, xn) ∈ W thì gi thi t Ho b bác b (ch p
nh n H1); n u (x1, x2, …, xn) ∈ W* thì Ho ñư c ch p nh n (bác b H1) T p h p
W ñư c g i là mi n bác b (hay mi n t i h n) c a phép ki m ñ nh Như v y,
chúng ta có ñ nh nghĩa
1.2 Đ nh nghĩa M t phép ki m ñ nh (hay tr c nghi m) m t gi thi t
th ng kê là m t qui t c, theo ñó, d a vào m t m u c th ñư c th c hi n, chúng ta
có th quy t ñ nh ch p nh n hay bác b gi thi t ñang xét
1.3 Đ nh nghĩa N u chúng ta bác b gi thi t Ho khi, th c ra, nó ph i
ñư c ch p nh n thì chúng ta ñã m c ph i sai l m g i là Sai l m lo i I N u
chúng ta ch p nh n Ho trong khi, th c ra, nó ph i b bác b thì chúng ta ñã m c
ph i sai l m g i là Sai l m lo i II
Xác su t m c ph i sai l m lo i I, thư ng ký hi u là α, g i là M c ý nghĩa
c a tr c nghi m Như v y, xác su t ñ ch p nh n Ho khi nó ñúng là (1 − α)
N u ký hi u β là xác su t m c ph i sai l m lo i II, thì xác su t ñ bác b
Ho khi nó sai là (1 − β), ñư c g i là Năng l c c a phép ki m ñ nh
Như v y, m t báo cáo k t qu so sánh là “ s khác bi t có ý nghĩa v m t
th ng kê m#c ý nghĩa 5% ” có nghĩa là “gi thi t không” Ho ñã b bác b v i nguy cơ sai l m là 5% Các bư c cơ b n c a m t phép ki m ñ nh gi thi t th ng kê:
1 Đ t gi thi t không Ho và gi thi t ñ i H1,
2 Xác ñ nh m#c ý nghĩa α c a phép ki m ñ nh,
3 V i c p gi thi t và m#c ý nghĩa α ñã xác ñ nh, chúng ta thi t l p ñư c
m t Qui lu t quy t ñ nh dùng ñ quy t ñ nh ch p nh n hay bác b gi thi t Ho Qui lu t này bao g&m vi c ch n m t th ng kê thích h p ñ dùng cho phép ki m
ñ nh và ñưa ra m t giá tr t i h n ñ so sánh
• Khác v i phép ki m ñ nh m t gi thi t v i m#c ý nghĩa α cho trư c, các nhà nghiên c#u thư ng xác ñ nh m#c ý nghĩa nh nh t, t i ñó, “gi thi t không”
Ho b bác b T ñó, ngư i ta có ñ nh nghĩa
1.4 Đ nh nghĩa Trong m t phép ki m ñ nh, m#c ý nghĩa nh nh t, t i ñó,
“gi thi t không” Ho có th b bác b ñư c g i là giá tr xác su t hay p −−−− giá tr
(p – value) c a phép ki m ñ nh
Trang 3Trong ph m vi c a chương trình, giáo trình này ch" gi i thi u m t s phép
ki m ñ nh cơ b n
1.5 Đ nh nghĩa Gi s' chúng ta có "gi thi t không" liên quan ñ n m t
tham s θ là Ho: θ = θo Khi ñó,
(a) n u H1 là θ ≠ θo thì tr c nghi m ñư c g i là hai ñuôi
(b) n u H1 là θ < θo hay θ > θo thì tr c nghi m ñư c g i là m t ñuôi
2 KI M Đ NH GI THI T V TRUNG BÌNH T NG TH
Gi s' t ng th X có phân ph i chu(n, v i trung bình µ chưa bi t Chúng ta
c n ki m ñ nh gi thi t
Ho: µ = µo ñ i v i H1: µ ≠ µo,
v i m#c ý nghĩa α cho trư c
Phân bi t hai trư ng h p:
C = u −α
C ñư c g i là giá tr t i h n ( vi t t t là gtth) c a tr c nghi m
Như v y, trong trư ng h p này, gtth = u1−α αα α
1 1 2
V i m u c th , chúng ta tính ñư c giá tr u c a U
Trang 4* H o b bác b n u |||| t |||| > gtth
2.3 Chú ý Trong trư ng h p c) m u l n ( n > 30), không c n gi thi t
t ng th X có phân ph i chu(n (do Đ nh lý gi i h n trung tâm)
2.4 Thí d Công ty ABC mu n s n xu t lo i bóng ñèn có tu i th trung
bình µ = 1600 gi N u th i gian dùng ng n hơn 1600 gi thì công ty s! m t khách hàng; n u th i gian dùng dài hơn thì chi phí s n xu t tăng lên Đ bi t xem qui trình s n xu t có t t không, công ty ch n m t m u ng u nhiên g&m 64 bóng ñèn ñ t th' và th y tu i th trung bình c a chúng là 1570 gi v i ñ l ch chu(n là 121 gi Hãy cho k t lu n v qui trình s n xu t m#c ý nghĩa 5%
Trong phép ki m ñ nh trên, có hai mi n bác b n+m “hai ñuôi” c a phân
ph i nên còn ñư c g i là Tr c nghi m hai ñuôi Tuy nhiên, ñôi khi, chúng ta ch" quan tâm ñ n ñ l ch v m t phía so v i giá tr c a gi thi t Phép ki m ñ nh trong trư ng h p này ñư c g i là Tr c nghi m m t ñuôi Khi ñó,
Trang 52.6 Thí d Tr l i công ty ABC trong Thí d 5.2.4, Công ty tuyên b
r+ng tu i th trung bình c a bóng ñèn do h s n xu t là không dư i 1600 gi V i
m u trên, b n hãy cho k t lu n v l i tuyên b c a công ty, m#c ý nghĩa 4%
Trang 6( ) (1o ) ~ (0,1)
Thí d T i m t ñ a phương, b nh B có t" l 34% Sau m t ñ t ñi u tr ,
ki m tra l i trên 100 ngư i, th y có 24 ngư i b b nh B
H i ñ t ñi u tr có th c s làm gi m t" l b nh B ñ a phương trên không? ( k t lu n m#c α = 0,05 )
Gi i. G i p là t" l b nh B ñ a phương sau ñ t ñi u tr
Ki m ñ nh gi thi t:
Ho: p = po = 0,34 ñ i v i H1: p < poGiá tr t" l b nh B trên m u: p = 0,24
N u Ho ñúng thì BNN
( ) 100 (1 )
4 SO SÁNH HAI TRUNG BÌNH V"I HAI M!U Đ#C L$P
Xét hai m u (X1, X2, , Xn), ñ c tính X có phân ph i chu(n, v i kỳ v ng
µX, ñ l ch chu(n σX và m u (Y1, Y2, , Ym), ñ c tính Y có phân ph i chu(n,
v i kỳ v ng µY, ñ l ch chu(n σY Gi s' hai m u trên ñ c l p nhau Chúng ta
mu n ki m ñ nh xem gi a µX và µY, th hi n qua x và y, có khác nhau không? Phân bi t 2 trư ng h p:
4.1 Trư ng h p 1: Bi t σσσσX và σσσσ Y
Trang 7Tr c nghi m U s! ñư c dùng, v i
X Y
X Y U
−
− − µ − µ
=
σtrong ñó,
Chúng ta ñ t gi thi t không Ho là “s khác nhau gi a x và y, là không
có ý nghĩa v m t th ng kê”, hay hai m u trên ñư c rút t cùng m t t ng th , i.e
=
tuân theo lu t phân ph i chu(n N(0, 1)
Thí d Ngư i ta cho hai nhóm h c sinh, theo th# t , ñ i di n cho hai trư ng A và B, làm m t bài ki m tra Nhóm th# nh t g&m 40 h c sinh, có ñi m trung bình 7,4; nhóm th# hai g&m 50 h c sinh, có ñi m trung bình 7,8 D a vào
m u trên, có th k t lu n r+ng: Đi m trung bình c a trư ng B t t hơn ñi m trung bình c a trư ng A không? (k t lu n m#c ý nghĩa 4%) Bi t r+ng ñi m s c a m-i h c sinh c a hai trư ng A và B có phân ph i chu(n v i ñ l ch chu(n, theo th# t , là 0,8 và 0,7
Trang 8V i m#c ý nghĩa α = 0,04, gtth = − u0,96 = − 1,7507
V i m u c th , chúng ta có :
2 2 (0,8) (0, 7)
tuân theo lu t phân ph i Student v i (n + m − 2) b c t do
Tr c nghi m t ñư c s' d ng như trong trư ng h p ki m ñ nh gi thi t v
l ch chu(n 250 gi Bi t r+ng tu i th c a m-i bóng ñèn c a haơ phân xư ng A
và B, theo th# t , tuân theo lu t phân ph i chu(n có cùng phương sai Hãy cho k t
lu n v s khác nhau gi a tu i th trung bình c a hai lo i bóng ñèn trên m#c ý nghĩa 1%
S
−
=
+ ~ t(10 + 8 −−−− 2)
Trang 92 1 1
10 8
4000 430049843,75 0,225 2,8329
x y s
×+
Vì |t |< gtth nên không th bác b gi thi t Ho m#c 1%
V y, chúng ta k t lu n r+ng: V i m#c ý nghĩa 1%, s khác nhau v tu i th trung bình c a hai lo i bóng ñèn trên là không có ý nghĩa v m t th ng kê
5 SO SÁNH HAI TRUNG BÌNH V"I DÃY S% LI U T&NG C'P
Phép ki m ñ nh trên v hi u hai trung bình nêu trên d a trên cơ s hai m u
ñ c l p Tuy nhiên, trong nhi u trư ng h p, hai m u ñư c ch n như là các giá tr
ñư c quan sát t ng c p (xi,yi), không ñ c l p; e.g ño huy t áp c a m-i b nh nhân trư c và sau khi ñi u tr b+ng m t lo i thu c
Trong trư ng h p này, ñ t D = X − Y, chúng ta có dãy s li u trên m u tương #ng: di = xi− yi, (i = 1, 2, ., n) ( hi u gi a hai giá tr c a c p th# i) Chúng ta tr v trư ng h p m t m u (D1, D2, ., Dn), ñ c tính D và gi thi t không:
T = t n −
Thí d Ngư i ta mu n nghiên c#u v nh hư ng c a lo i thu c M
ñ n nh p tim M t m u ng u nhiên g&m 10 b nh nhân ñư c cho dùng thu c
M và ghi nh n nh p tim trư c và sau khi dùng thu c K t qu nh p tim như sau:
Trư c thu c 65 68 71 79 75 83 77 80 65 78
Thu c M có làm thay ñ i nh p tim không? ( m#c ý nghĩa 8%), bi t r+ng
nh p tim là bi n ng u nhiên tuân theo lu t phân ph i chu(n
Gi i
Trang 10G i X và Y, theo th# t , là bi n ng u nhiên ch" nh p tim c a m-i ngư i trư c và sau khi dùng thu c Đ t: D = X −−−− Y, chúng ta có dãy s li u trên m u
1
np ≥ 5, n(1 − p1) ≥ 5, mp2 ≥ 5 và m(1− p2) ≥ 5
Chúng ta ñ t gi thi t không Ho là “ s khác nhau gi a p1 và p2là không
có ý nghĩa v m t th ng kê ”, i.e hai m u trên ñư c rút t cùng m t t ng th có
Trang 11Dùng tr c nghi m U như trong phép ki m ñ nh gi thi t v hi u hai trung bình, v i
Thí d Đ so sánh v t" l m t lo i b nh B ñ i v i tr sơ sinh trai và tr sơ
sinh gái, ngư i ta quan sát 100 bé trai th y có 20 cháu m c b nh B; quan sát 120
bé gái th y có 30 cháu m c b nh B, H i t" l nhi/m b nh B ñ i v i bé trai và gái
có như nhau không? ( k t lu n v i m#c ý nghĩa α = 0,01 )
+
V y m#c ý nghĩa 1%, Ho không th b bác b , i.e t" l nhi/m lo i b nh B
ñ i v i bé trai và bé gái là như nhau
7 KI M Đ NH GI THI T V PHƯƠNG SAI
Gi s' t ng th X có phân ph i N(µ, σ2), trong ñó σ chưa bi t D a vào m u
c) n, chúng ta ki m ñ nh gi thi t H0: σ2 = σ m#c ý nghĩa α cho trư c
N u H0 ñúng thì bi n ng u nhiên
Trang 12Tr c nghi m d a trên phân ph i c a Y có th là tr c nghi m 1 ñuôi hay 2 ñuôi Chúng ta d/ dàng tìm ñư c giá tr t i h n trong m-i trư ng h p
(a) Trư ng h p gi thi t ñ i là H1: σ 2 < σ :
gtth = χ2α( n − 1) và H0 b bác b n u y < gtth (b) Trư ng h p gi thi t ñ i là H1: σ 2 > σ :
Thí d B+ng phương pháp cũ, ngư i ta tìm ñư c hàm lư ng ñ m trong
m t lo i h t ñ t m#c trung bình là 4,2% v i ñ l ch chu(n 0,45% Ngư i ta làm
v i phương pháp m i l p l i 5 l n v i k t qu như sau: 2,3%; 2,4%; 4,0%; 5,5%; 5,8% Hãy cho k t lu n v hi u qu c a hai phương pháp trên m#c ý nghĩa 1%
Gi i.
G i X là BNN ch" hàm lư ng ñ m trong lo i h t ñang kh o sát
Giá tr trung bình m u: x = 4,0%, ñ l ch chu(n chu(n m u: s = 1,654%
N u ch" so sánh giá tr trung bình thì hi u qu c a hai phương pháp không khác nhau m y Đ ñánh giá hi u qu c a hai phương pháp, chúng ta hãy ki m
ñ nh v phương sai c a hai phương pháp G i σ2 là phương sai c a phương pháp
m i, chúng ta ki m ñ nh gi thi t:
Ho: σ2 = σ = (0,45)2 ñ i v i H1: σ2 > (0,45)2
Trang 13N u Ho ñúng thì bi n ng u nhiên
22
4
o
S
Y = σtuân theo lu t phân ph i χ 2 (4)
8 TR*C NGHI M χχχχ2
Trong nhi u trư ng h p, các k t qu thu th p ñư c trên m u thư ng không hoàn toàn phù h p v i nh ng k t qu tương #ng trên lý thuy t Thí d , m c dù theo lý thuy t, khi chúng ta gieo m t ñ&ng ti n vô tư 100 l n thì s! xu t hi n 50
l n m t s p và 50 l n m t ng'a, nhưng th t hi m khi chúng ta quan sát ñư c ñúng
k t qu trên
Gi s' v i m t t ng th nh t ñ nh, d a trên m t s tiêu chu(n nào ñó, ngư i
ta chia t ng th ñó thành nhi u l p (bi n c ) r i nhau: B1, B2, , Bk, v i các xác su t, theo th# t , là p1, p2, , pk, v i p1+ p2 + + pk = 1
M t m u c) n ñư c thành l p t t ng th trên Ký hi u oi là t n s quan sát ñư c trên m u c a bi n c Bi, i = 1, 2, , k
Trang 14e1 = np1, e2 = np2, , ek = npkNhư v y, chúng ta có b ng:
Đ ñánh giá s khác bi t trên, th ng kê sau ñây ñã ñư c s' d ng:
2 2 2
Trong th c hành, các t n s lý thuy t ñư c tính trên cơ s c a gi thi t H0
N u v i gi thi t này và v i m#c ý nghĩa α cho trư c, giá tr c a Q2 l n hơn
2
1− α( )
χ ν thì chúng ta k t lu n r+ng s khác nhau gi a t n s quan sát và lý thuy t là có ý nghĩa.và gi thi t H0 b bác b H0 ñư c ch p nh n trong trư ng h p
ngư c l i Th t c này ñư c g i là Tr c nghi m χχχχ 2
• Tr c nghi m χ thư ng ñư c dùng trong vi c ki m ñ nh các gi thi t liên quan ñ n tính phù h p gi a phân ph i th c nghi m v i phân ph i lý thuy t, tính
ñ c l p gi a hai bi n ng u nhiên và s khác nhau gi a nhi u t" l
D li u dùng trong tr c nghi m χ thư ng ñư c trình bày dư i d ng b ng Thí d như b ng nêu trên g i là b ng m t chi u, b ng 1 × c M r ng, chúng ta có
Trang 15b ng hai chi u d ng h × c, trong ñó, các t n s quan sát ñư c vi t trong h hàng và
c c t Các báng như th ñư c g i là các B ng ng u nhiên
Tương #ng v i m-i t n s quan sát trong b ng ng u nhiên h × c, có m t t n
s lý thuy t ñư c tính d a trên gi thi t không Nh ng t n s trong nh ng ô c a
m t b ng ng u nhiên ñư c g i là nh ng T n s ô T ng các t n s theo hàng
8.2 Thí d Quan sát kh i lư ng X (kg) c a m t nhóm ngư i cùng l#a
tu i, k t qu ñư c ghi l i như sau:
Xi (30, 40] (40, 45] (45, 50] (50, 55] (55, 60] (60, 70]
Có tài li u cho r+ng kh i lư ng c a nh ng ngư i cùng l#a tu i trên tuân theo lu t phân ph i chu(n Tài li u trên có phù h p v i k t qu quan sát trên m u không? ( k t lu n m#c α = 0,05 )
Trang 16Vì Q2 < 7,82 nên, m#c 5%, chúng ta không th bác b H0, i.e chúng ta
ch p nh n r+ng X tuân theo lu t phân ph i chu(n
8.3 Thí d Gieo m t con xúc x c 120 l n, t n s quan sát c a các m t
ñư c cho trong b ng sau:
Hãy ki m ñ nh gi thi t cho r+ng con xúc x c là vô tư m#c ý nghĩa 5%
Gi i.
Gi thi t Ho: Con xúc x c là vô tư
Gi thi t H1: Con xúc x c là không vô tư
V i gi thi t H0, chúng ta có các t n s lý thuy t ñư c cho trong b ng sau:
Trang 172 6
2 1
i i
8.4 Thí d Trong m t trư ng ñ i h c, s các sinh viên ñ u và r t b i
môn h c c a 3 Th y A, B và C ñư c cho trong b ng dư i ñây Hãy ki m ñ nh gi thi t cho r+ng t" l sinh viên b r t b i môn h c c a 3 Th y là như nhau m#c ý nghĩa α = 5%
Th y A Th y B Th y C T ng
Gi i. V i gi thi t H0, cho r+ng t" l sinh viên b r t b i môn h c c a 3
Th y là như nhau, chúng ta d/ dàng tính ñư c các t n s lý thuy t, ñư c vi t trong ngo c ñơn, phía dư i t n s quan sát tương #ng
Th y A Th y B Th y C T ng
( 46,75 )
47 ( 51,85 )
56 ( 54,40 )
153
( 8,25 )
14 ( 9,15 )
8 ( 9,60 )