Bài giảng Xác suất Thống kê 2014 Nguyễn Văn TiếnBài toán mở đầu Một hãng buôn muốn xem xét sự ổn định về lượng hàng bán được trung bình trên mỗi nhân viên bán hàng so với những năm trước
Trang 1KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
CHƯƠNG 8
Trang 2Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến
Bài toán mở đầu
Một hãng buôn muốn xem xét sự ổn định về lượng hàng bán được trung bình trên mỗi nhân viên bán hàng so với những năm trước (lượng đó bằng 7,4)
Mẫu ngẫu nhiên gồm 40 nhân viên bán hàng được lựa chọn và thấy lượng hàng trung bình của
họ là 6,1 với độ lệch chuẩn đã hiệu chỉnh s=2,5
Có thể nói rằng lượng hàng bán trung bình trên
mỗi đầu người có sự thay đổi không?
2Bài toán mở đầu
Trang 3Bài toán mở đầu
• Gọi là lượng hàng bán trung bình trên mỗi nhân viên năm nay
• Ta đặt giả thuyết như sau:
H0: không đổi (so với năm ngoái)H1: thay đổi (so với năm ngoái)
• Viết dưới dạng toán học:
Trang 4Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến
Giải
Bước 1 Theo định lý giới hạn trung tâm
Bước 2 Giả sử H0 đúng, nghĩa là =7,4
Trang 5Bước 3 Chuẩn hóa:
Bước 4 Ta có xác suất sau:
Có nghĩa là nếu H0 đúng thì khả năng |Z|1,96
Trang 6Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến
Giải
Bước 5 Với mẫu đã chọn ta có:
Bước 6 Theo nguyên lý biến cố hiếm ta bác bỏ
giả thuyết H0 (chấp nhận giả thuyết H1) ở mức ý
qs
Z
Trang 7Giải thích nhanh
• Đây là bài toán kiểm định giả thuyết tham s ố.
• Tham số cần kiểm định: trung bình tổng thể
• H0: giả thuyết ; H1: đối thuyết
• Z: tiêu chuẩn kiểm định
• 5%: mức ý nghĩa, ký hiệu: là mức độ ít xảy
Trang 8Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến
Giả thuyết-Đối thuyết
Giả thuyết: một mệnh đề (một câu khẳng định) về
một vấn đề chưa biết nào đó
Ký hiệu: H0 Giả thuyết là một mệnh đề nên có thể đúng hoặc không đúng
Đối thuyết: một mệnh đề trái (xung khắc) với giả
thuyết Ký hiệu: H1
8
Giả thuyết – Đối thuyết
Trang 9Kiểm định giả thuyết
Dựa vào 2 nguyên lý:
Nguyên lý xác suất nhỏ
Nguyên lý chứng minh phản chứng
Để kiểm định H0 ta làm như sau:
1 Giả sử rằng H0 đúng
2 Xây dựng một biến cố A có xác suất bé khi H0
đúng (gọi là mức ý nghĩa của phép kiểm
định)
Kiểm định giả thuyết
Trang 10Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến
Kiểm định giả thuyết
3 Theo nguyên lý xác suất nhỏ thì trong một lần
thử biến cố A sẽ không xảy ra
4 Vì vậy nếu với một mẫu cụ thể nào đó mà:
A xảy ra thì giả thiết H0 đúng là vô lý và ta
bác bỏ giả thiết H0
A không xảy ra thì ta chưa có cơ sở để bác
bỏ H0
Biến cố A được chọn theo H1 và được xây
dựng theo tiêu chuẩn kiểm định.
10
Trang 11Tiêu chuẩn kiểm định (test thống kê)
Là một biến ngẫu nhiên
Được xây dựng trên mẫu ngẫu nhiên và tham
số cần kiểm định Còn gọi là thống kê mẫu
Ký hiệu: Z, T, (tùy bài toán)
Trang 12Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến
Tiêu chuẩn kiểm định
Chọn mẫu ngẫu nhiên kích thước n:
(X1,X2,…,Xn)
Xây dựng thống kê Z=Z (X1,X2,…,Xn,θ) , trong ) , trong
đó θ) , trong là tham số liên quan đến giả thuyết cần
kiểm định
bố xác suất hoàn toàn xác định.
12
Trang 13Miền bác bỏ giả thiết
Là miền giá trị của thống kê Z Ký hiệu: Wα
Với điều kiện H0 đúng, Z nhận giá trị trong miền
Trang 14Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến
Sai lầm loại 1 và sai lầm loại 2
loại 1 sinh ra do kích thước mẫu quá nhỏ, do
cách lấy mẫu…
Sai lầm loại 2: chấp nhận H0 khi H0 sai Vậy xác
suất sai lầm loại 2 xác định như sau:
Trang 15Sai lầm loại 1 và sai lầm loại 2
H0 đúng H0 saiBác bỏ H0 Sai lầm loại 1
Xác suất =αChấp nhận H0 Sai lầm loại 2
Xác suất=β
Với cỡ mẫu cố định thì:
• Giảm sai lầm loại 1 thì sẽ làm tăng sai lầm loại 2.
• Giảm sai lầm loại 2 thì sẽ làm tăng sai lầm loại 1.
Nếu muốn cả 2 sai lầm này cùng giảm thì chỉ còn cách tăng cỡ mẫu.
Trang 16Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến
Sai lầm loại 1 và sai lầm loại 2
Giả thiết H0 là quan trọng do đó sai lầm về nó càng nhỏ càng tốt
Cố định xác suất sai lầm loại 1 ở mức ý nghĩa α
Với mẫu kích thước n xác định, ta chọn miền
nhất hoặc chấp nhận được
Việc chọn miền bác bỏ tùy thuộc vào từng bài toán cụ thể
16
Trang 17Giá trị quan sát
• Ký hiệu: Zqs; Tqs; qs
• Là giá trị của Z tính trên mẫu cụ thể
Zqs=Z(x1,x2,…,xn,θ) , trong )
• Với (x1,x2,…,xn) là giá trị cụ thể của mẫu ngẫu
nhiên (X1,X2,…,Xn) hay mẫu ngẫu nhiên cụ thể
Trang 18Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến
Qui tắc kiểm định giả thuyết
So sánh Zqs với Wα:
Zqs Wα thì bác bỏ H0; thừa nhận H1
Zqs Wα chưa có cơ sở để bác bỏ H0 (trên
thực tế là thừa nhận H0)
Chú ý: không kết luận đúng – sai mà chỉ kết luận
Đồng thời phải nêu rõ bác bỏ – chấp nhận ở
mức ý nghĩa nào
18
Trang 19Tóm tắt các bước
1 Phát biểu H0 và H1.
2 Lập mẫu ngẫu nhiên kích thước n.
3 Xác định tiêu chuẩn kiểm định Z và phân phối xác
suất của Z với điều kiện H0 đúng.
4 Với mức ý nghĩa α, xác định miền bác bỏ tốt nhất
tùy theo đối thiết H1.
5 Tính giá trị quan sát của Z từ mẫu cụ thể.
6 So sánh giá trị quan sát với miền bác bỏ và kết luận.
Trang 20Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến
KIỂM ĐỊNH TRUNG BÌNH
20
Trang 21Ppxs của thống kê TB mẫu
Trang 22Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến
Tiêu chuẩn kiểm định
Trang 23 Giả thuyết thống kê.
Lấy mẫu ngẫu nhiên cỡ n (X1,X2,…,Xn)
Trang 24Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến
Bác bỏ Bác bỏ
1 2
t
1 2
t
Kiểm định hai phía_TH1,2,3
Bài toán kđ: Miền bác bỏ của Z~N(0;1)
Mức ý nghĩa: α
24
0 0
0 1
H BT
Trang 250 1
H BT
Trang 26Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến
0 1
H BT
t
Bác bỏ
Trang 28Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến
Ví dụ 1
Một hãng buôn muốn biết xem phải chăng có sự không ổn định về lượng hàng bán được trung
bình trên mỗi nhân viên bán hàng so với những
năm trước (lượng đó bằng 7,4) Mẫu ngẫu nhiên gồm 40 nhân viên bán hàng được lựa chọn và
thấy lượng hàng trung bình của họ là 6,1 với độ
lệch chuẩn đã hiệu chỉnh s=2,5 Với mức ý nghĩa
α=1% có thể nói rằng lượng hàng bán trung
bình trên mỗi đầu người có sự thay đổi không?
28
Trang 29Ví dụ 1
Gọi μ là lượng hàng bán được trung bình trên mỗi nhân viên bán hàng.
Bài toán kiểm định:
Tiêu chuẩn kiểm định:
Miền bác bỏ:
0 : 7, 4
0,05 1: 7, 4
H H
Trang 30Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến
Trang 32Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến
Trang 34Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến
Ví dụ 2
Một công ty có một hệ thống máy tính có thể xử lý
1200 hóa đơn một giờ Công ty mới nhập về một hệ
thống máy tính mới Hệ thống mới này khi chạy kiểm tra trong 40 giờ cho thấy số hóa đơn được xử lý trung bình trong một giờ là 1260 với độ lệch chuẩn hiệu
chỉnh 215 Với mức ý nghĩa 5% hãy nhận định xem hệ
thống mới có tốt hơn hệ thống cũ hay không?
Giải:
Gọi μ là số hóa đơn trung bình mà hệ thống máy tính mới xử lý trong một giờ.
34
Trang 35Ví dụ 2
Ta lập bài toán kiểm định:
Tiêu chuẩn kiểm định:
H H
S
1 2 0 45 2
Trang 36Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến
Trang 37Kiểm định hai phía_TH4
Bài toán kđ: Miền bác bỏ của Z~t(n-1)
Mức ý nghĩa: α
0 0
0 1
H BT
Trang 38Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến
0
0 : 2
1:
H BT
Trang 390 : 3:
1:
H BT
Trang 40Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến
Ví dụ 3
Một công ty sản xuất hạt giống tuyên bố rằng một loại
giống mới của họ có năng suất trung bình 21,5 tạ/ha
Gieo thử giống này tại 16 vườn thí nghiệm thì thu được
kết quả:
Dựa vào kết quả này hãy nhận xét xem quảng cáo của
công ty có đúng không với mức ý nghĩa 5% Biết rằng
năng suất giống cây trồng là một biến ngẫu nhiên có
phân phối chuẩn.
Trang 41Ví dụ 3.
Gọi μ là năng suất trung bình của loại giống mới
Ta cần kiểm định giả thiết:
Tiêu chuẩn kiểm định:
Trang 42Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến
Ví dụ 3.
Miền bác bỏ:
Từ mẫu trên ta tính được:
Vậy chưa có cơ sở để bác bỏ H0 Có nghĩa là với số liệu này thì có thể chấp nhận lời quảng cáo của
Trang 43Ví dụ 4
Khối lượng một bao gạo của nhà máy là biến
ngẫu nhiên có độ lệch tiêu chuẩn là 0,3 kg Ban
giám đốc tuyên bố khối lượng trung bình mỗi
bao gạo của nhà máy là 50kg Cân thử 50 bao thì thấy khối lượng trung bình là 49,97 kg Với mức ý nghĩa 1% hãy kiểm tra lời tuyên bố trên
Trang 44Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến
Ví dụ 5
Một nghiên cứu được thực hiện để xác định mức độ hài lòng của khách hàng sau khi công ty điện thoại thay đổi, cải tiến một số dịch vụ khách hàng Trước khi thay đổi, mức độ hài lòng của khách hàng tính trung bình là 77, theo thang điểm từ 0 đến 100 350 khách hàng được chọn ngẫu nhiên để gửi bảng điều tra xin ý kiến sau khi các thay đổi được thực hiện, mức độ hài lòng trung bình tính được là 84, với độ lệch chuẩn hiệu chỉnh là 8 Có thể kết luận khách hàng đã được làm hài lòng ở mức độ cao hơn được không?
44
Trang 45Ví dụ 6
Một loại đèn chiếu được nhà sản xuất cho biết có tuổi thọ trung bình thấp nhất 65 giờ Kết quả kiểm tra từ mẫu ngẫu nhiên 21 đèn cho thấy tuổi thọ trung bình là 62,5 giờ, với độ lệch chuẩn hiệu chỉnh là 3 Với mức ý nghĩa 0,01, có thể kết luận gì
về lời tuyên bố của nhà sản xuất? Biết tuổi thọ của đèn có pp chuẩn
Trang 46Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến
Tranh vui
Trang 48Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến
Tiêu chuẩn kiểm định
Trang 49Kiểm định hai phía
Bài toán kđ: Miền bác bỏ của Z~N(0;1)
Mức ý nghĩa: α
0 0
0 1
H p p BT
t
1 2
t
Trang 50Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến
0 2
H p p BT
Trang 510 3
H p p BT
t
Bác bỏ
Trang 52Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến
Ví dụ 1
Một đảng chính trị trong một cuộc bầu cử tổng thống ở
nước nọ tuyên bố rằng ít nhất 45% cử tri sẽ bỏ phiếu
cho ứng viên A của họ Chọn ngẫu nhiên 2000 cử tri để
cho ý kiến thì thấy 862 cử tri tuyên bố sẽ bỏ phiếu cho
A Với mức ý nghĩa 5% hãy kiểm định xem dự đoán của
đảng trên có đúng không?
Giải:
Gọi p là tỉ lệ cử tri sẽ bỏ phiếu cho ứng viên A.
Ta có bài toán kiểm định:
Trang 54Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến
Ví dụ 2
Dự đoán tỉ lệ phế phẩm trong kho lớn hơn 11%
Kiểm tra ngẫu nhiên 100 sản phẩm thì thấy có
13 phế phẩm Với mức ý nghĩa 5% thì báo cáo
trên có đáng tin hay không?
54
Trang 55KIỂM ĐỊNH PHƯƠNG SAI
Điều kiện: hoặc cỡ mẫu n>30 hoặc tổng thể có phân
phối chuẩn
Xét bài toán này trong 2 trường hợp:
1 Đã biết trung bình tổng thể .
2 Chưa biết trung bình tổng thể .
Ta xét 3 bài toán như sau:
Trang 56Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến
Phân phối của hàm PS mẫu
~
n
i i
X
nS Z
2
1 2
1
~ 1
n
i i
Trang 57Tiêu chuẩn kiểm định
Kiểm định phương sai tổng thể:
Trang 58Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến
Kiểm định hai phía_TH1
Bài toán kđ: Miền bác bỏ của Z~χ2(n)n))
H BT
Trang 59H BT
Trang 60Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến
H BT
Trang 61Kiểm định hai phía_TH2
Bài toán kđ: Miền bác bỏ của Z~χ2(n)n)-1)
H BT
Trang 62Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến
H BT
n
Trang 63H BT
Trang 64Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến
Ví dụ 1.
Để kiểm tra độ chính xác của một máy người ta
đo ngẫu nhiên kích thước của 15 chi tiết do máy sản xuất và tính được s2=14,6 Với mức ý nghĩa 1% hãy kết luận về hoạt động của máy biết rằng kích thước chi tiết do máy sản xuất ra là biến ngẫu nhiên có phân phối chuẩn và phương sai theo thiết kế là σ”bằng “s”02=12
64
Trang 65Bài 1
Giám đốc một xí nghiệp cho biết lương trung
bình của 1 công nhân thuộc xí nghiệp là 2 triệu đồng một tháng
Chọn ngẫu nhiên 40 công nhân thấy lương trung bình là 1,8 triệu một tháng và độ lệch chuẩn h/c
là 500 ngàn Lời báo cáo của giám đốc có tin
cậy được không với mức ý nghĩa là 5%?
Trang 66Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến
Trang 67Bài 3
Một máy sản xuất tự động lúc đầu tỉ lệ sản phẩm loại
A là 50% Sau khi áp dụng một phương pháp sản xuất mới, người ta lấy 40 mẫu, mỗi mẫu gồm 10 sản phẩm
để kiểm tra Kết quả kiểm tra cho ở bảng sau :
Với mức ý nghĩa 5% Hãy cho kết luận về phương
pháp sản xuất này?
Số ta csp ta cloại ta cA ta c tron)g ta cmẫu ta c 1 ta c 2 ta c 3 ta c 4 ta c 5 ta c 6 ta c 7 ta c 8 ta c 9 ta c 10 ta c
Số ta cmẫu ta c 2 ta c 0 ta c 4 ta c 6 ta c 8 ta c 10 ta c 4 ta c 5 ta c 1 ta c 0 ta c
ta c
Trang 68Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến
Hãy cho kết luận về biện pháp kĩ thuật mới này? Nếu nhà máy báo cáo tỉ lệ phế phẩm sau khi áp dụng biện pháp kĩ thuật mới này là 2% thì có
chấp nhận được không? (với α = 0,05)
Trang 69Bài 5
Một cửa hàng tạp hoá nhận thấy thời gian vừa qua trung bình một khách hàng mua 25 ngàn thuốc lá trong ngày Nay cửa hàng chọn ngẫu nhiên 15
khách hàng thấy trung bình một khách hàng mua
Trang 70Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến
Bài 6
Nếu máy móc hoạt động bình thường thì kích thước của một loại sản phẩm tính theo cm là một đại lượng ngẫu nhiên phân phối theo qui luật chuẩn với phương sai 25 Nghi ngờ máy
hoạt động không bình thường , người ta đo thử
20 sản phẩm và tính được phương sai hiệu
chỉnh là 27,5 Với α = 0,02 hãy kết luận về điều nghi ngờ này
Trang 72Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến
Trang 73Câu 3 (3đ) Đề ML 158 _9/2012
a) Với độ tin cậy 95%, ước lượng trọng lượng trung
bình của các sản phẩm do xưởng 1 sản xuất?
b) Với mức ý nghĩa 2,5%, hãy kiểm định giả thiết “Độ
lệch chuẩn của xưởng 2 lớn hơn 4,5”.
c) Kiểm định giả thiết
với mức ý nghĩa 2% Trong đó là trọng lượng
trung bình các sản phẩm do xưởng 1, xưởng 2 sản xuất.
0 1
: :
;
X Y
Trang 74Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến
Câu 4 (2đ) ML158_9/2012
Điều tra mức chi tiêu hàng năm (triệu đồng) của
100 công nhân ta có mẫu:
74
Số tiền 15,6 16 16,4 16,8 17,2 17,6 18
Trang 75Câu 4 (2đ) ML158_9/2012
a) Với độ tin cậy 95% hãy ước lượng số công
nhân của công ty có mức chi tiêu hàng năm dưới 16 triệu đồng, biết công ty có 1000 công nhân
b) Nếu năm trước mức chi tiêu trung bình mỗi
công nhân là 16 triệu đồng/ năm thì với mức
ý nghĩa 5% có thể cho rằng mức chi tiêu của mỗi công nhân năm nay cao hơn năm trước không? Giả thiết mức chi tiêu nói trên có
phân phối chuẩn
Trang 76Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến
a) Những cây có chiều cao trên 135 cm gọi là
những cây cao Hãy ước lượng tỷ lệ những
cây cao với độ tin cậy 95%
76
Chiều cao (cm) 100 110 120 130 140 150 160
Số cây 10 10 15 30 10 10 15
Trang 77b) Người ta áp dụng phương pháp mới trong việc
trồng và chăm sóc cây Sau một thời gian khảo
sát 100 cây trồng theo phương pháp mới ta có:
Với mức ý nghĩa 5%, hãy so sánh chiều cao trung bình của cây trước và sau khi áp dụng
phương pháp mới.
Chiều cao (cm) 100 110 120 130 140 150 160
Số cây 6 10 20 34 12 7 11
Câu 4 (3đ) ML157_9/2012
Trang 78Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến
Câu 3 (2đ) ML157_9/2012
Lượng xăng tiêu thụ của một loại xe máy (100km) là biến ngẫu
nhiên có phân phối chuẩn Khảo sát trên 12 xe ta có mẫu
sau:
Gọi m là lượng xăng tiêu thụ trung bình trên 100km của loại xe
này.
a) Với mẫu trên, ước lượng m với độ tin cậy 95%.
b) Với mẫu trên, hãy kiểm định với mức ý nghĩa 3% giả thiết sau
78
Xăng (lít)
0 1
: 1,9 : 1,9
Trang 79Câu 4.(2đ)_Hè 2011
Trong một nhà máy, nếu máy móc hoạt động bình
thường thì sản phẩm sẽ tuân theo qui luật phân phối chuẩn với σ”bằng “s”=0,25 Nghi ngờ máy móc làm việc không bình thường người ta tiến hành đo thử 28 sản phẩm thì thấy độ lệch chuẩn mẫu hiệu chỉnh là s=0,324
a) Với mức ý nghĩa 2% hãy kiểm định điều nghi ngờ
nói trên?
b) Nếu độ lệch chuẩn của sản phẩm lớn hơn 0,278 thì
phải bảo trì lại máy Đối với mẫu trên, với mức ý nghĩa như thế nào thì phải bảo trì lại máy?
Trang 80Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến
Câu 3.(3đ) Hè 2011
Điều tra thời gian giao hàng tận nhà cho khách
ở cửa hàng KFC Q3 cho bảng kết quả sau:
Trang 81Câu 3.(3đ) Hè 2011
a) Với độ tin cậy 95% thì dựa vào kết quả điều tra, thời
gian giao hàng ở hệ thống này trung bình vào khoảng
bao nhiêu?
b) Với độ tin cậy 99% , dựa vào kết quả điều tra, hãy
ước lượng tỷ lệ khách hàng có thời gian chờ phục vụ
không dưới 25 phút.
c) Chủ cửa hàng khẳng định rằng: “Thời gian giao hàng
tận nhà trung bình của cửa hàng tối đa là 22 phút”
Với mức ý nghĩa 5% hãy kiểm định lời tuyên bố của
chủ cửa hàng.