mẫu ta có thể đưa ra những bằng chứng để chấp n hận hoặc bác bỏ giả thuyết thống kê được gọi là ki ểm định giả thuyết (kiểm định thống kê)... Giả thuyết thống kê.[r]
Trang 1KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
CHƯƠNG 8
Trang 2Kiểm định giả thuyết
• Dựa vào mẫu cụ thể và các quy tắc hay thủ tục quy
ết định để chấp nhận hay bác bỏ một giả thuyết về tổng thể.
Trang 3Giả thuyết thống kê
• Định nghĩa 1 Một giả thuyết thống kê là một sự xá
c nhận hay phỏng đoán liên quan đến một hay nhi
ều tổng thể.
•
• Định nghĩa 2 Thủ tục mà qua những thông tin về
mẫu ta có thể đưa ra những bằng chứng để chấp n hận hoặc bác bỏ giả thuyết thống kê được gọi là ki
ểm định giả thuyết (kiểm định thống kê)
Trang 4Giả thuyết thống kê
• Giả thuyết không: giả thuyết đưa ra kiểm định, ký
hiệu là H0
• Đây là giả thuyết ta muốn bác bỏ hay chấp nhận
• Giả thuyết đối: giả thuyết cạnh tranh với giả thuyế
t H0 Kí hiệu là H1.
• H1 được chấp nhận khi H0 bị bác bỏ và ngược lại.
• H1 không nhất thiết là phủ định của H0.
Trang 6Kiểm định hai phía
• H0 có dạng: = 0
• H1 có dạng: ≠ 0
Trang 8Tiêu chuẩn kiểm định
• Gi s c n nghiên c u tham s ả ử ầ ứ ố
• Ta l p m u ng u nhiên c nậ ẫ ẫ ỡ
• Đặt gi thuy t H0 v tham s ả ế ề ố
• Tiêu chu n ki m đ nh là m t th ng kê m u ẩ ể ị ộ ố ẫ
có phân ph i xác su t hoàn toàn xác đ nh kố ấ ị
hi H0 đúng
Trang 10Bài toán mở đầuMột hãng buôn muốn xem xét sự ổn định về lượng hàng bán được trung bình trên mỗi nhân viên bán hàng so với những năm trước (lượng đó bằng 7,4)
Mẫu ngẫu nhiên gồm 40 nhân viên bán hàng được lựa chọn và thấy lượng hàng trung bình của
họ là 6,1 với độ lệch chuẩn đã hiệu chỉnh s=2,5
Có thể nói rằng lượng hàng bán trung bình trên
mỗi đầu người có sự thay đổi không?
Bài toán mở đầu
Trang 11Bài toán mở đầu
• Gọi là lượng hàng bán trung bình trên mỗi nhân viên năm nay
• Ta đặt giả thuyết như sau:
H0: không đổi (so với năm ngoái)H1: thay đổi (so với năm ngoái)
• Viết dưới dạng toán học:
Trang 12Bước 1 Theo định lý giới hạn trung tâm
Bước 2 Giả sử H0 đúng, nghĩa là =7,4
Bài toán mở đầu
Trang 13Bước 3 Chuẩn hóa:
Bước 4 Ta có xác suất sau:
Có nghĩa là nếu H0 đúng thì khả năng |Z|1,96
Bài toán mở đầu
Trang 14Bước 5 Với mẫu đã chọn ta có:
Bước 6 Theo nguyên lý biến cố hiếm ta bác bỏ
giả thuyết H0 (chấp nhận giả thuyết H1) ở mức ý
qs
Z
Trang 15• Mi n |Z| ề 1,96 g i là mi n bác b gi thuy t Th n ọ ề ỏ ả ế ườ
g ký hi u: W ệ
• Zqs: giá tr quan sát trên m u còn g i là giá tr ki m ị ẫ ọ ị ể
đ nh ị
Trang 16Giả thuyết-Đối thuyết
Giả thuyết: một mệnh đề (một câu khẳng định) về
một vấn đề chưa biết nào đó
Ký hiệu: H0 Giả thuyết là một mệnh đề nên có thể đúng hoặc không đúng
Đối thuyết: một mệnh đề trái (xung khắc) với giả
thuyết Ký hiệu: H1
Giả thuyết – Đối thuyết
Trang 17Kiểm định giả thuyết
Dựa vào 2 nguyên lý:
Nguyên lý xác suất nhỏ
Nguyên lý chứng minh phản chứng
Để kiểm định H0 ta làm như sau:
1 Giả sử rằng H0 đúng
2 Xây dựng một biến cố A có xác suất bé khi H0
đúng (gọi là mức ý nghĩa của phép kiểm
định)
Kiểm định giả thuyết
Trang 18Kiểm định giả thuyết
3 Theo nguyên lý xác suất nhỏ thì trong một lần
thử biến cố A sẽ không xảy ra
4 Vì vậy nếu với một mẫu cụ thể nào đó mà:
A xảy ra thì giả thiết H0 đúng là vô lý và ta
bác bỏ giả thiết H0
A không xảy ra thì ta chưa có cơ sở để bác
bỏ H0
Biến cố A được chọn theo H1 và được xây
dựng theo tiêu chuẩn kiểm định.
Trang 19Tiêu chuẩn kiểm định (test thống kê)
Là một biến ngẫu nhiên
Được xây dựng trên mẫu ngẫu nhiên và tham
số cần kiểm định Còn gọi là thống kê mẫu
Ký hiệu: Z, T, (tùy bài toán)
Tuy nhiên ta ký hiệu chung là Z cho tiện.
Trang 20Tiêu chuẩn kiểm định
Chọn mẫu ngẫu nhiên kích thước n:
(X1,X2,…,Xn)
Xây dựng thống kê Z=Z (X1,X2,…,Xn,θ) , trong
đó θ là tham số liên quan đến giả thuyết cần
kiểm định
Nếu H0 đúng thì thống kê Z có qui luật phân
bố xác suất hoàn toàn xác định.
Trang 21Miền bác bỏ giả thiết
Là miền giá trị của thống kê Z Ký hiệu: Wα
Với điều kiện H0 đúng, Z nhận giá trị trong miền
Trang 22Sai lầm loại 1 và sai lầm loại 2
Sai lầm loại 1: bác bỏ H0 khi H0 đúng Sai lầm
loại 1 sinh ra do kích thước mẫu quá nhỏ, do
cách lấy mẫu…
Sai lầm loại 2: chấp nhận H0 khi H0 sai Vậy xác
suất sai lầm loại 2 xác định như sau:
Z W |H 1
P
Z W |H 0
P
Trang 23Sai lầm loại 1 và sai lầm loại 2
• Giảm sai lầm loại 1 thì sẽ làm tăng sai lầm loại 2.
• Giảm sai lầm loại 2 thì sẽ làm tăng sai lầm loại 1.
Nếu muốn cả 2 sai lầm này cùng giảm thì chỉ còn cách tăng cỡ mẫu.
Trang 24Sai lầm loại 1 và sai lầm loại 2
Giả thiết H0 là quan trọng do đó sai lầm về nó càng nhỏ càng tốt
Cố định xác suất sai lầm loại 1 ở mức ý nghĩa α
Với mẫu kích thước n xác định, ta chọn miền bác bỏ Wα sao cho xác suất sai lầm loại 2 nhỏ nhất hoặc chấp nhận được
Việc chọn miền bác bỏ tùy thuộc vào từng bài toán cụ thể
Trang 25Giá trị quan sát
• Ký hiệu: Zqs; Tqs; qs
• Là giá trị của Z tính trên mẫu cụ thể
Zqs=Z(x1,x2,…,xn,θ)
• Với (x1,x2,…,xn) là giá trị cụ thể của mẫu ngẫu
nhiên (X1,X2,…,Xn) hay mẫu ngẫu nhiên cụ thể
Trang 26Qui tắc kiểm định giả thuyết
So sánh Zqs với Wα:
Zqs Wα thì bác bỏ H0; thừa nhận H1
Zqs Wα chưa có cơ sở để bác bỏ H0 (trên
thực tế là thừa nhận H0)
Chú ý: không kết luận đúng – sai mà chỉ kết luận
bác bỏ – chấp nhận khi kiểm định giả thuyết
Đồng thời phải nêu rõ bác bỏ – chấp nhận ở
mức ý nghĩa nào
Trang 27Tóm tắt các bước
1 Phát biểu H0 và H1.
2 Lập mẫu ngẫu nhiên kích thước n.
3 Xác định tiêu chuẩn kiểm định Z và phân phối xác
suất của Z với điều kiện H0 đúng.
4 Với mức ý nghĩa α, xác định miền bác bỏ tốt nhất
tùy theo đối thiết H1.
5 Tính giá trị quan sát của Z từ mẫu cụ thể.
6 So sánh giá trị quan sát với miền bác bỏ và kết luận.
Trang 28Ppxs của thống kê TB mẫu
Trang 29Tiêu chuẩn kiểm định
Trang 30 Giả thuyết thống kê.
Lấy mẫu ngẫu nhiên cỡ n (X1,X2,…,Xn)
Trang 31Bác bỏ Bác bỏ
1 2
t
1 2
t
Kiểm định hai phía_TH1,2,3
Bài toán kđ: Miền bác bỏ của Z~N(0;1)
Mức ý nghĩa: α
0 0
0 1
H BT
Trang 320 1
H BT
Trang 330 1
H BT
H
1 2 2
t
Bác bỏ
Trang 35Ví dụ 1
Một hãng buôn muốn biết xem phải chăng có sự không ổn định về lượng hàng bán được trung
bình trên mỗi nhân viên bán hàng so với những
năm trước (lượng đó bằng 7,4) Mẫu ngẫu nhiên gồm 40 nhân viên bán hàng được lựa chọn và
thấy lượng hàng trung bình của họ là 6,1 với độ
lệch chuẩn đã hiệu chỉnh s=2,5 Với mức ý nghĩa
α=1% có thể nói rằng lượng hàng bán trung
bình trên mỗi đầu người có sự thay đổi không?
Trang 36Ví dụ 1
Gọi μ là lượng hàng bán được trung bình trên mỗi nhân viên bán hàng.
Bài toán kiểm định:
Tiêu chuẩn kiểm định:
Trang 41Ví dụ 2
Một công ty có một hệ thống máy tính có thể xử lý
1200 hóa đơn một giờ Công ty mới nhập về một hệ
thống máy tính mới Hệ thống mới này khi chạy kiểm tra trong 40 giờ cho thấy số hóa đơn được xử lý trung bình trong một giờ là 1260 với độ lệch chuẩn hiệu
chỉnh 215 Với mức ý nghĩa 5% hãy nhận định xem hệ
thống mới có tốt hơn hệ thống cũ hay không?
Giải:
Gọi μ là số hóa đơn trung bình mà hệ thống máy tính mới xử lý trong một giờ.
Trang 42Ví dụ 2
Ta lập bài toán kiểm định:
Tiêu chuẩn kiểm định:
H H
S
1 2 0 45 2
Trang 44Kiểm định hai phía_TH4
Bài toán kđ: Miền bác bỏ của Z~t(n-1)
Mức ý nghĩa: α
0 0
0 1
H BT
Trang 450 : 2
1:
H BT
Trang 460 : 3:
1:
H BT
Trang 47Ví dụ 3
Một công ty sản xuất hạt giống tuyên bố rằng một loại
giống mới của họ có năng suất trung bình 21,5 tạ/ha
Gieo thử giống này tại 16 vườn thí nghiệm thì thu được
kết quả:
Dựa vào kết quả này hãy nhận xét xem quảng cáo của
công ty có đúng không với mức ý nghĩa 5% Biết rằng
năng suất giống cây trồng là một biến ngẫu nhiên có
Trang 48Ví dụ 3.
Gọi μ là năng suất trung bình của loại giống mới
Ta cần kiểm định giả thiết:
Tiêu chuẩn kiểm định:
Trang 49Ví dụ 3.
Miền bác bỏ:
Từ mẫu trên ta tính được:
Vậy chưa có cơ sở để bác bỏ H0 Có nghĩa là với số liệu này thì có thể chấp nhận lời quảng cáo của
Trang 50Ví dụ TH
Điều tra doanh thu của các hộ kinh doanh mặt
hàng M trong một vùng (chục triệu/tháng) cho
kết quả như sau:
Giả sử doanh thu có phân phối chuẩn
Xi 0-1 1-2 2-3 3-4 4-5 5-6 6-7
Trang 51Ví dụ TH
a) Những hộ kinh doanh mặt hàng M có doanh
thu hơn 40 triệu/tháng là những hộ có doanh
thu cao Có thể cho rằng tỉ lệ những hộ có
doanh thu cao ở mức 35% hay không? Hãy kết luận ở mức ý nghĩa 3%
b) Có ý kiến cho rằng trước đây doanh thu trung
bình của các hộ kinh doanh mặt hàng M là 37
triệu/tháng Nhưng nay do tác động của lạm
phát nên mức doanh thu này giảm Cho nhận
xét về ý kiến đó với mức ý nghĩa 2%
Trang 52Ví dụ TH
c) Có thể cho rằng phương sai của doanh thu
của những hộ có doanh thu cao lớn hơn 2 hay không Kết luận ở mức ý nghĩa 2%
Trang 53Ví dụ 5
Một nghiên cứu được thực hiện để xác định mức độ hài lòng của khách hàng sau khi công ty điện thoại thay đổi, cải tiến một số dịch vụ khách hàng Trước khi thay đổi, mức độ hài lòng của khách hàng tính trung bình là 77, theo thang điểm từ 0 đến 100 350 khách hàng được chọn ngẫu nhiên để gửi bảng điều tra xin ý kiến sau khi các thay đổi được thực hiện, mức độ hài lòng trung bình tính được là 84, với độ lệch chuẩn hiệu chỉnh là 8 Có thể kết luận khách hàng đã được làm hài lòng ở mức độ cao hơn được không? Kết luận với mức ý nghĩa 0,05?
Trang 54Ví dụ 6
Một loại đèn chiếu được nhà sản xuất cho biết có tuổi thọ trung bình thấp nhất 65 giờ Kết quả kiểm tra từ mẫu ngẫu nhiên 21 đèn cho thấy tuổi thọ trung bình là 62,5 giờ, với độ lệch chuẩn hiệu chỉnh là 3 Với mức ý nghĩa 0,01, có thể kết luận gì
về lời tuyên bố của nhà sản xuất? Biết tuổi thọ của đèn có pp chuẩn
Trang 55Tranh vui
Trang 57Tiêu chuẩn kiểm định
Trang 58Kiểm định hai phía
Bài toán kđ: Miền bác bỏ của Z~N(0;1)
Mức ý nghĩa: α
0 0
0 1
H p p BT
t
1 2
t
Trang 590 2
H p p BT
Trang 600 3
H p p BT
t
Bác bỏ
Trang 61Ví dụ 1
Một đảng chính trị trong một cuộc bầu cử tổng thống ở
nước nọ tuyên bố rằng ít nhất 45% cử tri sẽ bỏ phiếu
cho ứng viên A của họ Chọn ngẫu nhiên 2000 cử tri để
cho ý kiến thì thấy 862 cử tri tuyên bố sẽ bỏ phiếu cho
A Với mức ý nghĩa 5% hãy kiểm định xem dự đoán của
đảng trên có đúng không?
Giải:
Gọi p là tỉ lệ cử tri sẽ bỏ phiếu cho ứng viên A.
Ta có bài toán kiểm định:
Trang 63Ví dụ 2
Dự đoán tỉ lệ phế phẩm trong kho lớn hơn 11%
Kiểm tra ngẫu nhiên 100 sản phẩm thì thấy có
13 phế phẩm Với mức ý nghĩa 5% thì báo cáo
trên có đáng tin hay không?
Trang 64KIỂM ĐỊNH PHƯƠNG SAI
Điều kiện: hoặc cỡ mẫu n>30 hoặc tổng thể có phân
phối chuẩn
Xét bài toán này trong 2 trường hợp:
1 Đã biết trung bình tổng thể .
2 Chưa biết trung bình tổng thể .
Ta xét 3 bài toán như sau:
Trang 65Phân phối của hàm PS mẫu
~
n
i i
X
nS Z
2
1 2
1
n
i i
Trang 66Tiêu chuẩn kiểm định
Trang 67Kiểm định hai phía_TH2
Bài toán kđ: Miền bác bỏ của Z~χ2(n-1)
H BT
H
0
1 2
Trang 68H BT
Trang 69H BT
Trang 70Ví dụ 1.
Để kiểm tra độ chính xác của một máy người ta
đo ngẫu nhiên kích thước của 15 chi tiết do máy sản xuất và tính được s2=14,6 Với mức ý nghĩa 1% hãy kết luận về hoạt động của máy biết rằng kích thước chi tiết do máy sản xuất ra là biến ngẫu nhiên có phân phối chuẩn và phương sai theo thiết kế là σ02=12
Trang 71Bài 1
Giám đốc một xí nghiệp cho biết lương trung
bình của 1 công nhân thuộc xí nghiệp là 2 triệu đồng một tháng
Chọn ngẫu nhiên 40 công nhân thấy lương trung bình là 1,8 triệu một tháng và độ lệch chuẩn h/c
là 500 ngàn Lời báo cáo của giám đốc có tin
cậy được không với mức ý nghĩa là 5%?
Trang 73Bài 3
Một máy sản xuất tự động lúc đầu tỉ lệ sản phẩm loại
A là 50% Sau khi áp dụng một phương pháp sản xuất mới, người ta lấy 40 mẫu, mỗi mẫu gồm 10 sản phẩm
để kiểm tra Kết quả kiểm tra cho ở bảng sau :
Với mức ý nghĩa 5% Hãy cho kết luận về phương
pháp sản xuất này?
Trang 74a) Hãy cho kết luận về biện pháp kĩ thuật mới
này? B) Nếu nhà máy báo cáo tỉ lệ phế phẩm sau khi áp dụng biện pháp kĩ thuật mới này là 2% thì
có chấp nhận được không? (với α = 0,05)
Trang 75Bài 5
Một cửa hàng tạp hoá nhận thấy thời gian vừa qua trung bình một khách hàng mua 25 ngàn thuốc lá trong ngày Nay cửa hàng chọn ngẫu nhiên 15
khách hàng thấy trung bình một khách hàng mua
Trang 76Bài 6
Nếu máy móc hoạt động bình thường thì kích thước của một loại sản phẩm tính theo cm là một đại lượng ngẫu nhiên phân phối theo qui luật chuẩn với phương sai 25 Nghi ngờ máy
hoạt động không bình thường , người ta đo thử
20 sản phẩm và tính được phương sai hiệu
chỉnh là 27,5 Với α = 0,02 hãy kết luận về điều nghi ngờ này
Trang 78Bài 8
Chiều cao một loại cây là biến ngẫu nhiên có phân
phối chuẩn Trong điều kiện phát triển bình thường
thì phương sai của chiều cao loại cây đó là (0,5m)2
Để điều tra người ta tiến hành đo thử 26 cây thì
thấy phương sai mẫu hiệu chỉnh là (0,54m)2
Nếu phương sai cây thay đổi thì do cây phát triển
không đều và cần cải tiến kĩ thuật Với mẫu trên có
cần phải cải tiến lại kĩ thuật hay không ở mức ý
nghĩa 5%.
Trang 79Thi cuối kỳ
• Tr c nghi m: 4đắ ệ
• T lu n 6đự ậ
– Xác su t: 2 đ ấ – Th ng kê 4 đ ố
Trang 81Kiểm tra 15’
• A) V i m c ý ngh a 5% Xác đ nh mi n bác b c a ớ ứ ĩ ị ề ỏ ủ bài toán ki m đ nh: ể ị
• B) Nhìn chung khi t ng m c ý ngh a lên thì gi thuy ă ứ ĩ ả