Bài giảng Nghiên cứu thống kê: Chương 7 Kiểm định giả thuyết gồm các nội dung chính như: Khái niệm giả thuyết, các loại giả thuyết,...Mời các bạn cùng tham khảo!
Trang 1CHÖÔNG 7
KIỂM ĐỊNH GIẢ THUYẾT
1
2
• Khái niệm
• Các loại giả thuyết trong thống kê
• Kiểm định tham số
• Kiểm định giả thuyết về tỷ lệ tổng thể
• Kiểm định giả thuyết về trung bình tổng thể
• Kiểm định giả thuyết về sự khác biệt giữa hai số trung bình tổng thể
• Kiểm định giả thuyết về sự bằng nhau giữa hai tỷ lệ tổng thể
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
3
7.1 KHÁI NIỆM:
Việc tìm ra kết luận để bác bỏ hay chấp nhận một
giả thuyết gọi là kiểm định giả thuyết.
Ví dụ 1: Một nhà sx cho rằng trọng lượng trung
bình của 1 gói mì là 80g.Để kiểm tra điều này đúng
hay sai, chọn ngẫu nhiên một số gói mì ra để kiểm
tra, đánh giá.
Ví dụ 2: Một công ty cho rằng tỷ lệ phế phẩm là
5% Để kiểm tra điều này đúng hay sai, chọn ngẫu
nhiên một số sản phẩm ra để kiểm tra, đánh giá.
7.2 CÁC LOẠI GIẢ THUYẾT TRONG THỐNG KÊ
7.2.1 GIẢ THUYẾT H 0 Gỉa sử tổng thể chung có đặc trưng chưa biết (như trung bình , tỷ lệ, phương sai) Với giá trị cụ thể cho trước nào đó, ta cần kiểm định giả thuyết(kiểm định hai bên)
Hoặc giả thuyết là một dãy giá trị, lúc đó kiểm định một bên.
8.2.2 GIẢ THUYẾT H 1 Gỉa thuyết H 1 là kết quả ngược lại của giả thuyết
H 0 , nếu giả thuyết H 0 đúng thì giả thuyết H 1 sai và ngược lại.Giả thuyết H 1 còn được gọi là giả thuyết đối.
4
Trang 2Thủ tục kiểm định giả thuyết
Trung bình
Tổng thể
( H 0 :μ =18,5 ngàn km)
x =17,2 Gần vớiμ=18,5 ?
Gần với μ =18,5
Bác bỏ
x =17,2
6
Một khách hàng quan tâm đến tỷ lệ sản phẩm kém chất lượng trong một lô hàng mua của một nhà cung cấp Giả
sử tỷ lệ sản phấm kém tối đa được phép là 5% Khách hàng cần quan tâm đến giả thuyết nào?
H0 : p ≥ 0.05 Tỷ lệ sản phẩm kém cao hơn mức cho phép
H1 : p < 0.05 Tỷ lệ sản phẩm kém ở mức chấp nhận được
VÍ DỤ
7
7.2.3 SAI LẦM LOẠI 1 VÀ SAI LẦM LOẠI 2:
- Sai lầm loại 1 là sai lầm do việc bác bỏ giả thuyết
H 0 khi giả thuyết này đúng, người ta định trước
khả năng mực sai lầm loại 1 là mức ý nghĩa kiểm
định.
- Sai lầm loại 2 là sai lầm do việc chấp nhận giả
thuyết H 0 khi giả thuyết này.
0
H
0
H
8
CÁC LOẠI SAI LẦM VÀ KHẢ NĂNG MẮC PHẢI KHI KIỂM ĐỊNH ĐƯỢC TÓM TẮT NHƯ SAU :
Giả thuyết đúng Giả thuyết sai
1 Không bác bỏ giả thuyết
Xác suất quyết định đúng là
Xác suất mắc sai lầm loại 2 là
2.Bác bỏ giả thuyết
Xác suất mắc sai lầm loại
1 là
Xác suất quyết định đúng là
0
0
H
0
H
Trang 37.2.4 Miền bác bỏ và miền chấp nhận
Tất cả các giá trị có thể có của các đại lượng thống
kê trong kiểm định có thể chia làm 2 miền: miền bác
bỏ và miền chấp nhận
Miền bác bỏ là miền chứa các giá trị làm cho giả
thuyết Ho bị bác bỏ
Miền chấp nhận là miền chứa các giá trị giúp cho
giả thuyết Ho không bị bác bỏ
Trong thực tế khi Ho không bị bác bỏ cùng nghĩa là
nó được chấp nhận
Giá trị chia đôi hai miền được gọi là giá trị tới hạn
(Critical value)
9
Mưc ý nghĩa và vùng bác bỏ Ho
H0: μ ≥ 18,5
H1: μ < 18,5
H0: μ ≤ 18,5
H1: μ > 18,5
H0: μ = 18,5
H1: μ ≠ 18,5
Rejection 0 Regions
0
0
α Giá trị tới hạn
(critical Value(s))
α
α/2
10
11
Các bước thực hiện trong một bài toán kiểm định
Bước 1: Đặt giả thuyết và giả thuyết Tùy theo
nhận định bước 1 mà ta đặt giả thuyết một bên hoặc
hai bên
Bước 2: Tính giá trị của tiêu chuẩn kiểm định dựa
trên mức ý nghĩa
Bước 3 : Xem xét bác bỏ hay không bác bỏ giả
thuyết
Bước 4: Kết luận nội dung bài toán Kết luận này
nhằm trả lời câu hỏi mà bài toán đặt ra
0
0
H
12
7.3 KIỂM ĐỊNH GIẢ THUYẾT VỀ TỶ LỆ TỔNG THỂ:
BƯỚC 1 : Đặt giả thuyết BƯỚC 2 : Tính giá trị kiểm định :
BƯỚC 3 : Từ mức ý nghĩa ta quyết định chấp nhận hoặc bác bỏ H 0 dựa vào bảng tóm tắt
BƯỚC 4: Kết luận
0
ˆ
z
n
Giả thuyết Miền bác bỏ
: :
H p p
H p p
z z/ 2
:
H p p p p
H p p
:
H p p p p
H p p
Trang 4MỘT NHÀ MÁY SẢN XUẤT SẢN PHẨM
VỚI TỶ LỆ SẢN PHẨM LOẠI 1 LÚC ĐẦU LÀ
0,20 SAU KHI ÁP DỤNG PHƯƠNG PHÁP SẢN
XUẤT MỚI, KIỂM TRA 500 SẢN PHẨM THẤY
SỐ SẢN PHẨM LOẠI 1 LÀ 150 SẢN PHẨM
CHO KẾT LUẬN VỀ PHƯƠNG PHÁP SẢN
XUẤT MỚI NÀY VỚI MỨC Ý NGHĨA =1%.
Ví dụ
14
Trong kỳ nghỉ giáng sinh và đầu năm mới, Cục An toàn giao thông đã thống kê được rằng có 500 người chết và 25000 người bị thương do các vụ tại nạn giao thông trên toàn quốc Theo thông cáo của Cục ATGT thì khoảng 50% số vụ tai nạn có liên quan đến rượu bia Khảo sát ngẫu nhiên 120 vụ tai nạn thấy có 67 vụ do ảnh hưởng của rượu bia Sử dụng số liệu trên để kiểm định lời khẳng định của Cục An toàn giao thông với mức ý nghĩa α = 5%.
Ví dụ
15
Gọi p là tỷ lệ số vụ tai nạn giao thông có liên quan đến
rượu bia
1 Phát biểu giả thuyết:
2 Xác định mức ý nghĩa: α = 0.05
3 Tính giá trị kiểm định
4 Xác định miền bác bỏ: bác bỏ H0 khi |z0| > z0.975 =
1.96
5 Kết luận: do z0 = 1.28 < 1.96 nên kết luận chưa đủ cơ
sở để bác bỏ giả thuyết
0 1
H p
H p
0
1.28 (1 ) 0.5(1 0.5)
120
p p
z
p p
n
16
7.4 KIỂM ĐỊNH GIẢ THUYẾT VỀ TRUNG BÌNH TỔNG THỂ CHUNG :
Giả sử tổng thể có trung bình chưa biết.Ta cần kiểm tra giả thuyết:
Căn cứ vào mẫu n ta đưa ra quy tắc bác bỏ hay không bác bỏ giả thuyết trên với mức ý nghĩa
: :
H H
Trang 57.4 KIỂM ĐỊNH GIẢ THUYẾT VỀ TRUNG
BÌNH TỔNG THỂ CHUNG :
TA CHIA THÀNH HAI TRƯỜNG HỢP :
n >=30 :
A1) đã biết, ta tính giá trị kiểm định:
Dựa vào ta tìm
A2) chưa biết, ta thay = S 2 (phương sai mẫu hiệu
chỉnh)
0
x Z
n
z/ 2
/ 2
z z
0
H
0
H
/ 2
zz
2
2
18
B1) X có phân phổi chuẩn, đã biết, ta làm giống như trường hợp A1
B2) X có phân phổi chuẩn, chưa biết , ta tính giá trị kiểm định:
-Nếu ta bác bỏ giả thuyết
- Nếu ta chấp nhận giả thuyết Chú ý: Trong TH trên nếu giả thuyết bị bác bỏ , tức là khi đó :
Nếu thì ta kết luận Nếu thì ta kết luận
2
2
0
x t s n
1, / 2
n
tt
1, /2
n
tt
0
H
0
H
0
0
0
19
Giả thuyết So sánh giá trị
kiểm định Z ta bác bỏ
So sánh giá trị kiểm định t ta bác bỏ
:
:
H
H
z z/ 2 t tn1, /2
:
H
H
:
H
H
1,
n
t t
z z
0
Bảng tóm tắt các trường hợp kiểm định
20
MỘT MÁY ĐÓNG MÌ GÓI TỰ ĐỘNG QUY ĐỊNH TRỌNG LƯỢNG TRUNG BÌNH LÀ=75g, ĐỘ LỆCH CHUẨN LÀ =15g SAU MỘT THỜI GIAN SẢN XUẤT KIỂM TRA
80 GÓI TA CÓ TRỌNG LƯỢNG TRUNG BÌNH MỖI GÓI LÀ 72g CHO KẾT LUẬN
VỀ TÌNH HÌNH SẢN XUẤT VỚI MỨC Ý NGHĨA =5%.
VÍ DỤ
Trang 6Một nhà sản xuất dụng cụ thể thao đưa ra một
loại dây câu mới, họ khẳng định trọng lượng
trung bình dây có thể chịu là 8 kg, với độ lệch
chuẩn là 0,5 kg Để kiểm định giả thuyết µ=8 kg
với đối thuyết µ≠8 kg, 50 dây ngẫu nhiên được
kiểm tra và trọng lượng trung bình dây có thể
chịu là 7,8 kg Hãy kiểm định khẳng định của
nhà sản xuất với mức ý nghĩa 0,01
VÍ DỤ
22
Dây chuyền sản xuất kem đánh răng P/S được thiết
kế để đóng hộp những tuýt kem có trọng lượng trung bình là 6 oz (1 oz= 28g) Một mẫu gồm 30 tuýt kem được chọn ngẫu nhiên để kiểm tra định
kỳ Bộ phận điều khiển dây chuyền phải đảm bảo
để trọng lượng trung bình mỗi tuýt kem là 6 oz;
nếu nhiều hơn hoặc ít hơn, dây chuyền phải được điều chỉnh lại Giả sử trung bình mẫu của 30 tuýt kem là 6.1 oz và độ lệch tiêu chuẩn của tổng thể σ = 0.2 oz Thực hiện kiểm định giả thuyết với mức ý nghĩa 3% để xác định xem dâychuyền sản xuất có vận hành tốt hay không?
Ví dụ (Kiểm định 2 phía)
23
Gọi X là trọng lượng của một tuýt kem đánh răng;
Các bước kiểm định như sau:
1 Phát biểu giả thuyết:
2 Xác định mức ý nghĩa: α = 0.03
3 Tính giá trị kiểm định
4 Xác định miền bác bỏ: Bác bỏ H0 khi |z0| > z1−α/2 Vì
Vậy bác bỏ nếu
5 Kết luận: do z0 = 2.74 > 2.17 nên bác bỏ H0 Ta kết luận
với độ tin cậy 97% trọng lượng trung bình mỗi tuýt kem
không bằng 6.
1 / 2 0.985 2.17
z z
0 2.17 or 0 2.17
z z
0
H
0 1
H H
0 6.1 6
2.74 0.2 30
x Z n
24
7.6 KIỂM ĐỊNH GIẢ THUYẾT VỀ SỰ KHÁC NHAU GIỮA 2 SỐ TB CỦA HAI TỔNG THỂ :
7.6.1 TRƯỜNG HỢP MẪU PHỐI HỢP TỪNG CẶP : BƯỚC 1 : ĐẶT GIẢ THUYẾT :(D 0 LÀ giá trị cho trước, khi muốn kiểm định giả thuyết ta đặt D 0 = 0)
BƯỚC 2 : TÍNH GIÁ TRỊ KIỂM ĐỊNH : BƯỚC 3 : Xác định
BƯỚC 4: Xác định miền bác bỏ theo bảng
0
d
t S n
/2,n1
t
Giả thuyết Miền bác bỏ
1, / 2
n
t t
1,
n
t t
1,
n
: :
X y
X y
:
X y X y
X y
:
X y X y
X y
Trang 7TĂNG NSLĐ SỐ LIỆU VỀ NSLĐ CỦA 10 CÔNG NHÂN
ĐƯỢC THU THẬP TRƯỚC VÀ SAU KHI THỰC HIỆN CÁC
BIỆN PHÁP TĂNG NSLĐ.
CÔNG
NHÂN NSLĐ TRƯỚC VÀ SAU KHI THỰC HIỆN CÁC BIỆN PHÁP TĂNG NSLĐ (Kg/NGÀY)
TRƯỚC KHI SAU KHI
A
B
C
D
E
F
G
H
I
K
50 48 45 60 70 68 55 68 58 53
52 46 50 65 78 67 58 70 67 65
26
QUẢN ĐỐC PHÂN XƯỞNG CHO RẰNG KHÔNG CÓ SỰ KHÁC NHAU VỀ NSLĐ TRUNG BÌNH TRƯỚC VÀ SAU KHI ÁP DỤNG CÁC BIỆN PHÁP TĂNG NSLĐ VỚI MỨC Ý NGHĨA 5% CÓ THỂ KẾT LUẬN
GÌ VỀ LỜI TUYÊN BỐ CỦA QUẢN ĐỐC?
27
7.6 KIỂM ĐỊNH GIẢ THUYẾT VỀ SỰ KHÁC BIỆT
GIỮA 2 SỐ TB CỦA HAI TỔNG THỂ :
7.6.2 TRƯỜNG HỢP MẪU ĐỘC LẬP:
BƯỚC 1 : ĐẶT GIẢ THUYẾT :(D 0 LÀ giá trị cho trước,
khi muốn kiểm định giả thuyết ta đặt D 0 = 0)
BƯỚC 2 : TÍNH GIÁ TRỊ KIỂM ĐỊNH :
BƯỚC 3 : Xác định
BƯỚC 4: Xác định miền bác bỏ theo bảng
Giả thuyết Miền bác bỏ
:
:
X y
X y
:
X y X y
X y
:
X y X y
0 2 2
y x
x y
z
/ 2
z
/ 2
z z
z z
MỘT TRẠI CHĂN NUƠI CHỌN MỘT GIỐNG GÀ ĐỂ TIẾN HÀNH NGHIÊN CỨU HIỆU QUẢ CỦA HAI LOẠI THỨC ĂN MỚI A VÀ B SAU MỘT THỜI GIAN NUƠI THỬ NGHIỆM 50 CON GÀ BẰNG THỨC ĂN A VÀ THẤY TRỌNG LƯƠNG TRUNG BÌNH 1 CON LÀ 2,2 Kg.ĐỘ LỆCH CHUẨN LÀ 1,25 Kg VÀ 40 CON GÀ NUƠI BẰNG THỨC ĂN B, TRỌNG LƯỢNG TRUNG BÌNH 1 CON LÀ 1,2 Kg.ĐỘ LỆCH CHUẨN LÀ 1,02 Kg GIẢ SỬ
TA MUỐN KIỂM ĐỊNH GIẢ TRUNG BÌNH H 0 CHO RẰNG TRỌNG LƯỢNG TRUNG BÌNH CỦA 1 CON GÀ SAU MỘT THỜI GIAN NUƠI TRONG HAI TRƯỜNG HỢP LÀ NHƯ NHAU VỚI MỨC Ý NGHĨA =0,05.
VÍ DỤ
Trang 87.7 KIỂM ĐỊNH GIẢ THUYẾT VỀ SỰ BẰNG
NHAU GIỮA 2 TỶ LỆ
B1: Đặt giả thuyết
B2:Tính giá trị kiểm định
Trong đó là tỷ lệ phần tử có tính chất nào đó chung trong hai mẫu
z
0
x y
p
30
B3: Xác định miền bác bỏ theo bảng
B4: Kết luận
Giả thuyết Miền bác bỏ
0 1
X y
X y
H p p
H p p
0 1
X y X y
X y
0 1
X y X y
X y
z z
/ 2
z z
31
Một cuộc bỏ phiếu được đưa ra để xác định vị trí
xây dựng một nhà máy hóa chất trong thị trấn hay ngoại vi
thị trấn Có 120 trên 200 cử tri tr`ong thị trấn đồng ý xây
dựng nhà máy trong thị trấn và 240 trên 500 cử tri ngoại vi
đồng ý với đề xuất này Liệu có thể cho rằng tỉ lệ cử tri
trong thị trấn đồng ý với đề xuất lớn hơn tỉ lệ cử tri ngoại
vi đồng ý hay không? Sử dụng mức ý nghĩa 0,025
Ví dụ