Giải quyết vấn đề: Cần kiểm tra để đưa ra kết luận chấp nhận hay bác bỏ giả thuyết lời tuyên bố trên.. --Chấp nhận sai số α mức ý nghĩa α để từ đó xác định giá trị Z tới hạn :Zα hay Zα/2
Trang 1Chương 6 KIỂM ĐỊNH GIẢ THUYẾT
Đặt vấn đề: Một nhà SX túi chườm nóng dùng cho mùa đông
tuyên bố rằng túi chườm nóng của công ty ông có tuổi thọ là 1000 lần sử dụng
Giải quyết vấn đề: Cần kiểm tra để đưa ra kết luận chấp nhận
hay bác bỏ giả thuyết (lời tuyên bố trên)
Các bước tiến hành:
Chọn mẫu n SP để tính tuổi thọ trung bình của số mẫu trên (x )
So sánh x với tuổi thọ của SP theo lời tuyên bố ( tính giá trị kiểm định Z, t, )
Chấp nhận sai số α (mức ý nghĩa α) để từ đó xác định giá trị Z tới hạn :Zα hay Zα/2 (critical valuecritical value)
So sánh giá trị kiểm định Z với Zα hay Zα/2 để kết luận chấp nhận hay bác bỏ giả thuyết trên (xác định Miền bác bỏ H0)
1 KHÁI NIỆM: Kiểm định giả thiết ( giả thuyết ) là việc đưa ra
kết luận chấp nhận hay bác bỏ 1 giả thiết cho trước
1.1 Các loại kiểm định:
Giả thiết H0 và giả thiết đối H1 (The Null and
Alternative Hypothesis)
giả thiết ( H0 ) : tuổi thọ của SP (µ ) = 1000 lần SD
giả thiết đối ( H1, HA ) : tuổi thọ của SP (µ ) ≠ 1000 lần SD
Các loại kiểm định:
1000 lần SD.
Trang 2(Two -tail test) H1 : µ ≠
1000 lần SD.
* Kiểm định 1 bên : + Bên trái : H0 : µ = 1000 lần SD. (critical valueµ ≥
1000 lần SD)
(critical valueOne-tail test) H1 : µ < 1000 lần SD
+Bên phải : H0 : µ = 1000 lần SD. (critical valueµ ≤
1000 lần SD)
H1 : µ > 1000 lần SD.
Kiểm định bên trái kiểm định bên phải kiểm định hai bên
gọi là kiểm định một bên vì Miền bác bỏ nằm về một phía của miền chấp nhận
1.2 Sai lầm trong phương pháp kiểm định giả thiết :
(critical value Risks in decision Making Using
Hypothesis-Testing methodology)
Điểm hạn chế trong thực hành kiểm định là chỉ quan sát trên một mẫu cụ thể, từ đĩ khả năng mắc sai lầm trong quyết định là dễ xảy ra Người ta qui ước phân biệt 2 loại sai lầm sau:
- Sai lầm loại I (critical valuetype I error): bác bỏ H O khi giả thuyết này đúng Khả
năng (xác suất) mắc sai lầm loại 1 là , đây cũng là mức ý nghĩa của phép kiểm định Như vậy, xác suất chấp nhận giả thuyết là ( 1 - ).
- Sai lầm loại II (critical valuetype II error): chấp nhận H O khi giả thuyết này sai.
Xác suất mắc sai lầm loại 2 là Như vậy, xác suất bác bỏ giả thuyết là (
1 - ).
Bảng tóm tắt những quyết định trên H O :
z
z
Trang 3Giả thuyết Ho đúng Giả thuyết Ho sai Bác bỏ H o Sai lầm loại 1:
Xác suất
Xác suất quyết định đúng:
( 1 - ) Chấp nhận Ho Xác suất quyết định đúng:
(1 - )
Sai lầm loại 2:
Xác suất
1.3.Các ký hiệu :
chung Tổng thểmẫu Giả thiết
1.Số đơn vị tổng thể
2.Các tham số của
tổng thể:
a.Số trung bình
b.Tỉ lệ
(prortion)
c.Phương sai
Phương sai của
STB
Phương sai của
tỉ lệ
N θ
µ p
σ2 2 x
σ
2
p
2
p
= p (1-p)
n θ’
x
pˆ
S2 2 x
S
2
p S
2
p
S = pˆ (1- pˆ )
θ0
µ0
p0
2 0
2 x
σ
2 p
σ
2 p
σ = p0 (1-
p0)
2 KIỂM ĐỊNH GIẢ THUYẾT VỀ SỐ TRUNG BÌNH, TỈ LỆ, PHƯƠNG SAI CỦA TỔNG THỂ
2.1 Giá trị kiểm định: (critical value The value of the test statistic)
2.1.1 Kiểm định số trung bình, tỉ lệ.
a Trường hợp tổng thể cĩ phân phối chuẩn, bi ế t σ 2 (tính Z))
(Z test of hypothesis)
Trang 4Cụ thể: ++ Khi kiểm định STB :
(Z test of hypothesis for the mean)
n x Z 2 x 0 σ
++Khi kiểm định tỉ lệ:
(Z test of hypothesis for the proportion)
n Z 2 0p 0 σ p pˆ = n p p0 0) 0 1 ( p pˆ Ghi chú: 1.Kiểm định Z cũng áp dụng cho trường hợp tổng thể có phân phối chuẩn, n ≥ 30 + chưa biết σ2 2.Khi khơng cĩ tài liệu về phương sai của tổng thể chung, dùng phương sai mẫu (S2) b Trường hợp tổng thể cĩ phân phối chuẩn , n < 30 + chưa biết σ 2
( tính t)( t test of hypothesis for the mean (critical value σ unknow) ) n t 2 0 s θ θ 2.1.2 Kiểm định phương sai * Giả thuyết: Ho : 2 = 0 H1 : 2 ≠ 0 * Giá trị kiểm định: 2 ( 12) 2 o s n n Z 2 0 σ θ θ =
n
0
θ
θ
Trang 52.2 Miền bác bỏ và miền chấp nhận H 0
(critical value Regions of Rejection and NonRejection)
Bước 1: Chấp nhận Mức ý nghĩa ( α ) (critical value The Level of Singificance (critical valueα ) )
Bước 2: Tra bảng tìm giá trị tới hạn Z, t, 2(Z, t, 2critical)
a Kiểm định Z : tra bảng phân phối chuẩn :
- Kiểm định 2 bên: tìm Zα/2
- Kiểm định 1 bên: tìm Zα.
b Ki ể m định t : tra bảng T-Student
- Kiểm định 2 bên: tìm t n-1, α/2
- Kiểm định 1 bên: tìm t n-1, α
c Kiểm định phương sai : tra bảng phân phối 2
: tìm 2
2 / ,
1
n hay 2
2 / 1
,
1
n
Bước 3: Xác định miền bác bỏ và miền chấp nhận H0 :
a Kiểm định Z & ki ểm đ ịnh t :
Trang 6c Kieåm ñònh Ph ư ơ ng sai :
2 / 1
,
1
2
n hay 2
2 / , 1 2
2 / , 1 2 2
2 / 1 ,
Loại kiểm định Bác bỏ H0 khi : Chấp nhận H0 khi :
1.K Đ 2 b ê n :
a.kieåm ñònh Z
b.kiểm định t
│Z │ ≥ Zα
│t │ ≥ t n-1, α
* nếu x <
µ 0
→ <
µ 0
│Z │ < Zα
│t│ < t n-1, α
1.K Đ 1 b ê n :
a.kieåm ñònh Z
b.kiểm định t
│Z │ < Zα /2
│t │ < t n-1, α/2
│Z │ < Zα /2
│t │ < t n-1, α/2
Trang 7Bác bỏ H 0.
→ Chấp nhận H1.
Chấp nhận H 0.
+ nếu 2 2
o
s → 2 > 0 2
+ nếu 2 2
o
s → 2 < 0 2
Á
p d ụ ng : Cơng ty Mai Hịa chuyên sản xuất bơng gịn, để kiểm tra
xem máy cĩ làm việc bình thường hay khơng người ta tiến hành cân thử một số thành phẩm là bao bông gòn y tế loại 50gr và thu được
kết quả như sau: (critical valueđơn vị: gram)
50; 51; 52; 54; 49; 38; 50; 51; 55; 37;
49; 52; 56; 52; 49; 36; 49; 38; 49; 53;
51; 50; 50; 52; 35; 46; 48; 49; 53; 47;
51; 53; 48; 53; 55; 49
Trọng lượng thiết kế của sản phẩm là 50 gr Vậy với mức ý nghĩa 5%, cĩ thể kết luận hệ thống máy sản xuất ổn định khơng ?
Giải:
**Giả thuyết: H0 : µ = 50gr
H1 : µ ≠ 50gr
**Gi á trị kiểm đ ịnh : Z =
n
x
0
=
36
43 , 5
50 89 ,
= - 0,034
Với: +x = 48,89gr
+S x = 5,43gr
+ µ0 = 50gr
+ n = 36
**X á c đ ịnh mi ề n bácb ỏ hay ch ấ p nh ậ n H 0 : │Z│ = 0,034 < Zα/2 =
Z0,025=1,96
→ Chấp nhận H0 (µ = 50gr)
**Kết luận: Với mức ý nghĩa 5%, có thể kết luận rằng trọng lượng trung bình 1 bao bông gòn trên là 50gr, đúng trọng lượng thiết kế của SP Như vậy, hệ thống máy sản xuất ổn định
Trang 82.3 Giá trị P (critical valueThe p – Value Approch ) (critical value The Probability value)
2.3.1 Khái niệm: Giá trị p là mức ý nghĩa α nhỏ nhất mà tại đó giả thuyết H0
bắt đầu bị bác bỏ
2.3.2.Phương pháp xác định:
a Kiểm định 1 bên: TD: nếu kiểm định 1 bên, Z = 2 , Bác bỏ H0 khi :
│Z │ = 2 ≥ Zα
Zα ≤ 2 , mà p-value là α nhỏ nhất:
Zα = 2
Tra Bảng , ta cĩ: 1- α = 0,9772
→ α = p- value = 1 – 0,9772 = 0,0228 = 2,28%
p- value = 2,28%
KL: Như vậy, với tình hình trên, khi kiểm định 1 bên ta bác bỏ H0với mọi mức ý nghĩa α ≥ 2,28%
b Kiểm định 2 bên: TD: nếu kiểm định 2 bên, Z = 2 , Bác bỏ H0 khi :
│Z │ = 2 ≥ Zα /2
→ Zα/2 ≤ 2 , mà p-value là α nhỏ nhất:
Zα /2 = 2
Tra Bảng , ta cĩ: 1- α/2 = 0,9772
→ α/2 = 1 – 0,9772 = 0,0228 = 2,28%
p- value = α = 4,56%
KL: Như vậy, với tình hình trên, khi kiểm định 2 bên ta bác bỏ H 0 tại mọi mức ý nghĩa α ≥ 4,56%.
2.3.3 K ế t lu ậ n k i ể m đ ị nh b ằ ng p-value đ đ
Như vậy, khi kiểm định với mức ý nghĩa α đ ≥ p - value.
Trang 9Bác bỏ H0
Ngược lại, khi kiểm định với mức ý nghĩa α đ < p - value.
Chấp nhận H0
3 KIỂM Đ ỊNH GIẢ THUYẾT VỀ SỰ KH Á C NHAU GIỮA 2 SỐ TRUNG B
Ì NH CỦA 2 TỔNG THỂ.
3.1 Ki ểm đ ịnh giả thuyết trong tr ư ờng hợp mẫu phối hợp từng cặp.
Giả sử ta cĩ mẫu gồm n cặp quan sát ngẫu nhiên từ hai tổng thể X và Y: (x1,y1), (x2,y2),… , (xn,yn)
Gọi : + µx, µy : trung bình của từng tổng thể
+ d : trung bình của n khác biệt (xi – yi)
+ sd : độ lệch tiêu chuẩn của n khác biệt (xi – yi)
Giả sử rằng các khác biệt giữa x và y trong tổng thể cĩ phân phối chuẩn
**Giả thuyết: +KĐ 2 bên : H0: µx - µy = D0 (D0 là giá trị cho trước)
H1: µx - µy ≠ D0
+KĐ 1 bên : H0: µx - µy = D0 (hoặc µx - µy ≥ D0)
H1: µx - µy < D0
+KĐ 1 bên : H0: µx - µy = D0 (hoặc µx - µy ≤ D0)
H1: µx - µy > D0
**Giá trị kiểm định:
n s
D d t
d o
**Chấp nhận mức ý nghĩa α → tra bảng T-Student tìm t n-1,α/2 hoặc t n-1, α
Trang 10**X á c đ ịnh Mi ền b á c bỏ hay miền chấp nhận H 0
Loại kiểm định Bác bỏ H0 khi:
Kiểm định 2 bên │t │ ≥ t n-1, α/2
Kiểm định 1 bên │t │ ≥ t n-1, α
Á
p dụng : Một công ty thực hiện các biện pháp tăng NSLĐ Số liệu về năng suất lao động của 10 công nhân được thu thập trước và sau khi thực hiện các biện pháp tăng NSLĐ
STT của công
nhân
NSLĐ trước và sau khi thực hiện các
biện pháp tăng NSLĐ Trước khi Sau khi 1
2
3
4
5
6
7
8
9
10
50 48 45 60 70 62 55 62 58 53
52 46 50 65 78 61 58 70 67 65
Quản đốc phân xưởng cho rằng không có sự khác nhau về NSLĐ trung bình trước
và sau khi áp dụng biện pháp tăng NSLĐ.Với mức ý nghĩa 5% có thể kết luận gì
về lời tuyên bố của quản đốc?
Giải:
**Gọi µx, µy là NSLĐ trung bình sau khi và trước khi thực hiện các biện pháp tăng NSLĐ
**Giả thuyết : H0 : µx - µy = D0
H1 : µx - µy ≠ D0
Trang 11**Gi á trị kiểm đ ịnh :
Từ bảng trên ta tính được: + di = 2, -2, 5, 5, 8, -1, 3, 8, 9, 12
+ = 4,9 ; sd=4,4833; D0=0
→ t = = 3,456
**X á c đ ịnh miền b á c bỏ v à miền chấp nhận H 0
Ta có: │t │ = 3,456 > tn-1,α/2 = t9,0,025 = 2,262
→ Bác bỏ H0
Chấp nhận H1 (µx - µy ≠ D0 )
Mà = 4,9 > D 0 = 0
µ x - µ y > 0
**K ết luận: Với mức ý nghĩa 5%, ta có thể kết luận rằngNSLĐ sau cải tiến cao hơn trước khi cải tiến Như vậy,lời tuyên bố của quản đốc phân xưởng là sai
3.2 Kiểm định trong trường hợp mẫu độc lập:
Gọi : nx , ny là các đơn vị mẫu được chọn ngẫu nhiên độc lập từ hai tổng thể có phân phối chuẩn X và Y, có trung bình là µx, µy, phương sai là x2, y2, trung bình mẫu là x, y
**Giả thuyết : H0: µx - µy = D0
H1: µx - µy ≠ D0
**G iá trị kiểm định :
a Tổng thể c ó ph â n phối chuẩn, bi ết x2, y2 : (kiểm định Z) )
Trang 12z =
Ghi chú: 1.Kiểm định Z cũng áp dụng cho trường hợp tổng thể có phân
phối chuẩn, nx, ny ≥ 30 + chưa biết σ2
2.Khi khơng cĩ tài liệu về phương sai của 2 tổng thể chung,
dùng phương sai mẫu (S2): x2 → , x2 →
b
Trường hợp mẫu nhỏ ( nx, ny hoặc cả hai < 30 ): (kiểm định t)
t
Với: s2=
**Chấp nhận mức ý nghĩa α → tra bảng tìm z α/2 , t + - 2, α/2
**X á c đ ịnh Mi ền b á c bỏ hay miền chấp nhận H 0
Loại kiểm định Bác bỏ H0 khi:
1 K Đ 2 b ê n :
a Kiểm định Z:
b.Kiểm định t :
│Z │ ≥ Z α/2
│t │ ≥ t + - 2 , α/2
Trang 131 K Đ 1 b ê n :
a Kiểm định Z:
b.Kiểm định t :
│Z│ ≥ Z α
│t │ ≥ t + - 2, α
4 KIỂM Đ ỊNH GIẢ THUYẾT VỀ SỰ BẰNG NHAU GIỮA 2 PH ƯƠ NG SAI CỦA 2 TỔNG THỂ.
Giả sử ta có 2 tổng thể phân phối chuẩn:
** Giả thuyết: + KĐ 2 bên: HO: =
H1:
+ KĐ 1 bên: HO: = ( hoặc: ≤ )
H1: >
+ KĐ 1 bên: HO: = ( hoặc: ≥ )
H1: <
**Gi á trị kiểm đ ịnh : F = với:
nếu không ta đặt ngược lại
**Tra bảng Fisher – Snedecor tìm hay
Trang 14**X á c đ ịnh miền b á c bỏ v à miền chấp nhận H O
Nếu →
F <
5 KIỂM Đ ỊNH GIẢ THUYẾT VỀ SỰ BẰNG NHAU GIỮA 2 TỈ LỆ CỦA 2 TỔNG THỂ
Gọi: + 2 tổng thể: X, Y
+ px , pˆ x : tỉ lệ các đơn vị tổng thể có biểu hiện nghiên cứu của tổng thể chung X, tổng thể mẫu
+ py , pˆy : tỉ lệ các đơn vị tổng thể có biểu hiện nghiên cứu của tổng thể chung Y, tổng thể mẫu
+ với nx, ny ≥ 40
**Giả thuyết: +KĐ 2 bên: H0 : px - py = 0
H1 : px - py ≠ 0
+KĐ 1 bên: H0 : px - py = 0 (hoặc px - py ≥ 0)
H1 : px - py < 0
+KĐ 1 bên: H0 : px - py = 0 (hoặc px - py ≤ 0)
H1 : px - py > 0
**Gi á trị ki ểm đ ịnh : Z = 1 1 )
)(
0 ˆ 1 ( 0 ˆ ˆ
y x
y
n n p p
p p
Trang 15Với: ˆp0 =
y x
y y x x n n
p n p n
ˆ
ˆ
**X á c đ ịnh mi ền b á c bỏ v à miề n ch ấ p nh ậ n H 0 :
KĐ 2 bên Z ≥ Z α/2
Nếu x pˆ > pˆy
→ px > py
KĐ 1 bên
Z < Z α
BÀI TẬP
06.1:Giám đốc XN Bình Minh báo cáo rằng lương trung bình của 1 công nhân trong XN là
công nhân và thấy lương trung bình là
cáo của giám đốc có tin cậy được hay không ?
Trang 1606.2: Nhóm nghiên cứu thuộc Nhà xuất bản BT đưa thông tin rằng 70% học
sinh cấp II vẫn thích đọc truyện tranh hơn truyện đọc văn học không hình vẽ Để kiểm định giả thuyết trên, người ta phỏng vấn 225 học sinh cấp II thu được tỉ lệ mẫu là 90% Với mức ý nghĩa 5%, cĩ thể kết luận tỉ
lệ này trong thực tế cao hơn thơng tin của nhà xuất bản khơng?
thời gian trả kết quả xét nghiệm là 120 phút sau khi trung tâm nhận mẫu xét nghiệm của khách hàng Để kiểm định, người ta chọn ngẫu nhiên 30 lượt bệnh nhân đến xét nghiệm, thời gian khách hàng nhận kết quả sau khi được
lấy máu là (với điều kiện máy mĩc, nhân sự hoạt động bình thường):
STT bệnh nhân 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Phút 103 104 102 100 91 10 22 97 91 88 106 98 98 99 97
STT BN 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
Phút 94 87 35 55 70 89 89 88 103 86 82 83 36 42 81
a Cho rằng thời gian trả kết quả xét nghiệm cĩ phân phối chuẩn, với mức ý nghĩa 1% cĩ đủ cơ sở kết luận thơng báo trên phiếu hẹn với khách hàng của Trung tâm là đáng tin cậy khơng ?
b Ước lượng thời gian trung bình trả kết quả xét nghiệm của trung tâm trên với độ tin cậy 95%
06.3: Để ra quyết đinh cĩ nên đặt một máy fax trong văn phịng hay khơng, người phụ trách muốn ước lượng nhu cầu số trang chuyển fax bình quân mỗi ngày Ơng cho ghi nhận lại nhu cầu này trong 15 ngày , tính được trung bình mẫu là
thì độ lệch chuẩn là 32 trang Giả định rằng số lượng tài liệu cần chuyển trong ngày là biến ngẫu nhiên cĩ phân phối chuẩn
a Hãy ước lượng nhu cầu số trang tài liệu chuyển fax bình quân mỗi ngày của công ty với độ tin cậy 99%