Tìm khoảng tin cậy 90% cho µA − µB , giả định rằng các tổng thể có phân phối xấp xỉ chuẩn với phương sai bằng nhau... BÀI TOÁN KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ + Các khái niệm + Kiểm
Trang 11
§6: BÀI TOÁN ƯỚC LƯỢNG TRUNG BÌNH
Các nội dung chính:
• Ước lượng điểm và
ước lượng khoảng
• Ước lượng khoảng
cho một kỳ vọng
Trang 22
ĐẶT VẤN ĐỀ X là chiều cao trung bình của nam thanh niên Việt Nam từ độ tuổi 22-26 Hãy ước lượng giá trị của 𝜇
+) Thực hành:
- Lấy mẫu
- Tính: *) trung bình mẫu x → ước lượng điểm
của 𝜇 *) khoảng (a,b) chứa 𝜇 → ước lượng
khoảng của 𝜇
Trang 33
Trang 44
1.1 ƯỚC LƯỢNG ĐIỂM:
ĐỊNH NGHĨA 1.1 Ước lượng điểm của một tham
số tổng thể θ nào đó là một giá trị đơn θ ˆ của một
Trang 55
Cùng một mẫu ngẫu nhiên cùng cỡ, có thể xây dựng nhiều thống kê ˆΘ khác nhau để ước lượng tham số tổng thể θ Để đưa ra kết luận về chất lượng θ ˆ ta dựa vào các tiêu chuẩn:
- Ước lượng không chệch
- Ước lượng hiệu quả:
Trang 6
6
a) Ước lượng không chệch:
ĐỊNH NGHĨA 1.2 Thống kê ˆΘ được gọi là ước lượng không chệch của tham số θ nếu thỏa mãn:
( )
ˆ E ˆ
µΘ = Θ = θ
Nhận xét:
x là ước lượng không chệch của µ
s2 là ước lượng không chệch của σ 2
Trang 77
b) Ước lượng hiệu quả:
ĐỊNH NGHĨA 1.2 Xét tất cả các ước lượng không chệch của tham số θ , ước lượng có phương sai nhỏ nhất được gọi là ước lượng hiệu quả của θ
Trang 99
1.2 ƯỚC LƯỢNG KHOẢNG:
Ước lượng khoảng của tham số tổng thể θ là một khoảng có dạng θ ˆL < < θ θ ˆU sao cho:
P( θ < < θ θ ) = − 1 α
*) (θ θ ˆ ˆL , U ) gọi là khoảng tin cậy ( 1 − α ). 100 %
*) 1 − α gọi là độ tin cậy của ước lượng
*) θ ˆU − θ ˆL gọi là độ dài khoảng tin cậy
Trang 1010
a Ước lượng cho một trung bình:
TH1 Khoảng tin cậy cho µ , khi σ đã biết:
Nếu X là trung bình của một mẫu ngẫu nhiên cỡ n từ
Trang 1111
Tra bảng A3: P(Z < zα /2) =1 - P(Z > zα / 2) = 1 - α
2
Trang 1212 Sai số ước lượng: |x - µ| < zα/2 σ
n : = e
Trang 1313
VD 1.2: Hàm lượng kẽm trung bình thu được khi
đo ở 36 địa điểm khác nhau trên một dòng sông là 2,6 gam/ml Biết rằng độ lệch chuẩn của tổng thể là 0,3
Hãy tìm khoảng tin cậy 95% cho hàm lượng kẽm trung bình trong dòng sông đó
Trang 1414
ĐỊNH LÝ 1.1: Để |x - µ| < zα/2 σ
n : = e với khoảng tin
cậy (1 –α )100% , thì cỡ mẫu tối thiểu cần dùng là:
/
z n
( làm tròn đến số nguyên tiếp theo)
VD 1.2: ( tiếp) Nếu ta muốn với khoảng tin cậy 95% , sai số của ước lượng x cho µ không vượt quá 0,05, thì cỡ mẫu tối thiểu phải là bao nhiêu?
Trang 1515
TH2 Khoảng tin cậy cho µ khi σ chưa biết( cỡ mẫu nhỏ n < 30)
Nếu x, s là trung bình và độ lệch chuẩn mẫu từ tổng
thể có phân phối chuẩn với σ chưa biết, khoảng tin
Trang 1616
Chú ý: Tra bảng
Trang 1717
VD 1.3: Số lít axit sunfuric trong các bình đựng được xác định thông qua 7 thùng là
9,8 10,2 10,4 9,8 10,0 10,2 và 9,6 Tìm khoảng tin cậy 95% cho lượng axit sunfuric
trung bình trong các bình chứa, giả thiết các giá trị đo
có phân phối chuẩn
Trang 18
18
TH3 Khoảng tin cậy cho µ khi σ chưa biết( cỡ mẫu lớn n ≥ 30)
Nếu x, s là trung bình và độ lệch chuẩn mẫu từ tổng
thể có phân phối chuẩn với σ chưa biết, khoảng tin
Trang 1919
VD 1.4: Tại một trại nuôi gà, người ta tiến hành cân thử trọng lượng X(kg) của 100 con
gà, thu được số liệu:
Trang 2020
BÀI TẬP VỀ NHÀ:
Buổi 3: Ước lượng trung bình mẫu
Trang 221 ƯỚC LƯỢNG HIỆU HAI TRUNG BÌNH:
Trang 23?
đã biết
chưa biết nhưng biết
chưa biết nhưng biết
Trang 24a) Khoảng tin cậy cho µ µ1 − 2 khi σ σ2 , 2
1 2 đã biết:
Nếu x1 và x2 là trung bình mẫu của các mẫu ngẫu
nhiên độc lập cỡ lần lượt là n1 và n2 lấy từ những
tổng thể với phương sai đã biết là σ σ2 , 2
Trang 25VD 1.1: Thí nghiệm được thực hiện đối với hai loại đông cơ A và B bằng cách đo nhiên liệu tiêu thụ theo lít/km Với 50 thí nghiệm được thực hiện cho
động cơ A, 75 thí nghiệm thực hiện cho đông cơ B
thì thấy rằng lượng nhiên liệu tiêu thụ trung bình cho động cơ A là 36 lít, cho máy B là 75 lít Giả thiết
độ lệch chuẩn tổng thể của A và B lần lượt là 6 và
8 Tìm khoảng tin cậy 96% cho µB − µA
Trang 26
b.Khoảng tin cậy cho µ µ1 − 2 khi chưa biết σ σ1; 2
nhưng giả thuyết σ 2 = σ 2
Nếu x1 và x2 là trung bình mẫu của các mẫu ngẫu nhiên độc lập cỡ lần lượt là n1 và n2 từ những tổng thể có phân phối xấp xỉ chuẩn với σ 2 = σ 2
nhưng chưa biết, thì khoảng tin cậy (1 – α)100% cho µ µ1 − 2 là :
( x1 − x ) e2 − < µ µ1 − 2 < ( x1 − x ) e2 +
Trang 28VD 1.2: Hai trạm lấy mẫu độc lập được chọn( một nằm ở
hạ lưu, một nằm ở thượng nguồn) để nghiên cứu lượng axit xả trên một dòng sông có ảnh hưởng tới các sinh vật phù du Trong một tháng , thu thập 12 mẫu tại trạm hạ lưu, các chỉ số sinh vật phù du có giá trị trung bình 3,11 và độ lệch chuẩn, s1 = 0 771 , , trong khi 10 mẫu thu thập tại trạm thượng nguồn các chỉ số sinh vật phù
du có giá trị trung bình 2.04 và độ lệch chuẩn
s2 = 0 448 , . Tìm khoảng tin cậy 90% cho µA − µB , giả định rằng các tổng thể có phân phối xấp xỉ chuẩn với
phương sai bằng nhau.
Trang 29c Khoảng tin cậy cho µ µ1 − 2 ; chưa biết σ σ2 , 2
nhưng biết σ 2 ≠ σ 2
1 2 ( tự đọc)
Trang 31a) Ước lượng một tỷ lệ
loại phần tử.Tỉ lệ phần tử có dấu hiệu mà ta quan tâm (tỉ lệ các thành công) là p chưa biết Ước lượng tỷ lệ là chỉ ra khoảng ( , p p1 2) chứa p sao cho:
Trang 32Khoảng tin cậy cho p khi cỡ mẫu lớn ( n lớn):
Nếu ˆp là tỷ lệ của các thành công trong một mẫu
ngẫu nhiên cỡ n, thì khoảng tin cậy (1- α)100%
Trang 33VD 2.2: Gieo thử 500 hạt giống thì thấy có 20 hạt không nảy mầm Tìm khoảng tin cậy 95% cho tỷ lệ hạt giống không nảy mầm.
Trang 34ĐỊNH LÝ 2.1: Nếu dùng ˆp làm ước lượng điểm cho
p, thì với khoảng tin cậy ( 1– α ) 100%, để sai số không vượt quá e thì cỡ mẫu tối thiểu cần dùng là:
2 /2 2
ˆ ˆ
z pq n
e
α
=
Chú ý: Do p q ˆ ˆ 1 + = , nên:
Trang 35ĐỊNH LÝ 2.2 Nếu dùng để làm ước lượng điểm
cho p, thì với độ tin cậy ( 1– α ) 100%,, muốn sai số của ước lượng không vượt quá e cho trước thì cỡ mẫu tối thiểu cần dùng là:
2 /2 2
4
z n
Trang 36VD 2.3 A Gieo thử 400 hạt giống thì thấy có 20 hạt không nảy mầm Để sai số của ước lượng là thấp hơn 0,05 với độ tin cậy là 95% thì số lượng hạt gieo thử ít nhất là bao nhiêu.
Trang 37VD 2.3 A Cần gieo thử một số hạt giống để kiểm
định tỷ lệ những hạt không nảy mầm Để sai số của ước lượng thấp hơn 0,05 với độ tin cậy 95% thì số lượng hạt gieo thử ít nhất là bao nhiêu
Trang 38
VD 2.4: Để ước lượng số cá trong hồ, người ta bắt
2000 con, đánh dấu rồi thả xuống Vài ngày sau người ta lại bắt lên 400 con thì thấy có 80 con đánh dấu Với độ tin cậy
95%, có thể nói số
cá trong hồ là
khoảng bao nhiêu
con
Trang 39b Ước lượng sự sai khác giữa hai tỉ lệ:
ĐỊNH LÝ 2.3: Nếu p p ˆ ˆ1 , 2 là tỷ lệ các thành công
trong các mẫu ngẫu nhiên cỡ n1, n2 từ hai tổng thể t
Ω1 và Ω2 , thì khoảng tin cậy ( 1– α ) 100% cho hiệu
Trang 40VD 2.5: Người ta đang xem xét xem có nên thay đổi quy trình sản xuất không bằng cách nghiên cứu quy trình cũ và mới nhằm xem quá trình mới có hiệu quả không Trong 1500 sản phẩm được sản xuất theo quy trình cũ người ta thấy có 75 phế phẩm,
sử dụng quy trình mới thì trong 2000 sản phẩm
người ta đếm được 80 phế phẩm Tìm khoảng tin
cậy 90% cho hiệu tỷ lệ phế phẩm của 2 quy trình
cũ và mới, từ đó cho biết việc cải tiến có đem lại chất lượng tốt hơn cho dây chuyền sản xuất không?
Trang 41VD 2.6: Vào năm 2000, phỏng vấn ngẫu nhiêu 1500 nam giới thì tỷ lệ hút thuốc lá là 47% Sau 5 năm
vận động, phỏng vấn 1000 người thì thấy tỉ lệ hút thuốc là 42% Với độ tin cậy 95%, ước lượng tỷ
lệ người hút thuốc
lá đã giảm trong 5 năm vận động
Trang 42BÀI TẬP VỀ NHÀ:
Buổi 4: - Ước lượng trung bình( tiếp)
- Ước lượng tỷ lệ
Trang 43§8 BÀI TOÁN KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
+) Các khái niệm
+) Kiểm định giả thuyết về một trung bình
Trang 44I CÁC KHÁI NIỆM:
Định nghĩa 1: Một giả thuyết thống kê là một sự xác nhận hay phỏng đoán liên quan tới một hay nhiều tổng thể
Trang 45GIẢ THUYẾT( kí hiệu H 0 ): Phỏng đoán chi phí trung bình trong một tháng của một sinh viên là 2 triệu đồng
ĐỐI THUYẾT ( kí hiệu H 1 ):
- Phỏng đoán chi phí trung bình trong một tháng của một sinh viên khác 2 triệu đồng
- Phỏng đoán chi phí trung bình trong một tháng của một sinh viên lớn hơn 2 triệu đồng
- Phỏng đoán chi phí trung bình trong một tháng của một sinh viên nhỏ hơn 2 triệu đồng
Trang 46CHÚ Ý:
- H0 luôn được phát biểu với DẤU BẰNG(=)
- H1 luôn được biểu diễn với DẤU BẤT ĐẲNG THỨC( > hoặc <) nếu trong yêu cầu có chứa từ “lớn
hơn, bé hơn, tốt hơn, kém hơn ” Nếu yêu cầu không chứa hướng nào thì H1 được phát biểu qua
Trang 47VD2: Một nhà quản lý khẳng định rằng hơn 20% quỹ đất trong các dự án nhà ở thương mại để phát triển nhà ở xã hội
Khi đó: H0 : p = 0,2, H1 : p > 0,2
VD3: Giám đốc Viện Băng quyển Trái Đất cho rằng
mỗi năm, trung bình lãnh thổ của Nga mất đi 450km2 vì biến đổi khí hậu
Khi đó: H0 : µ = 450 , H1 : µ ≠ 450
Trang 48BÁC BỎ GIẢ THUYẾT CHẤP NHẬN GIẢ THUYẾT
LẤY MẪU GIẢ THUYẾT
Trang 49BÀI TOÁN Cần kiểm định một giả thuyết H0 nào đó
Giả sử H0 đúng Dựa vào mẫu ngẫu nhiên tổng quát
và một số dương α rất bé cho trước để tìm một biến
cố A sao cho
𝑃 𝐴/H!đúng = α
Theo Nguyên lý xác suất nhỏ, A có thể xem như
không xảy ra trong một phép thử
Trang 50• Vì vậy, với một mẫu cụ thể nếu A xảy ra thì ta
xem như việc giả sử H0 đúng là không hợp lý, và bác bỏ nó (thừa nhận H1)
• Còn nếu A không xảy ra thì ta chưa có đủ cơ sở
để bác bỏ H0 (bởi vì biết đâu với một mẫu cụ thể
khác, A lại xảy ra), nên ta tạm chấp nhận H0 đúng (bác bỏ H1)
Trang 51Chọn biến cố A như thế nào?
Từ giả thiết H0 đúng, ta xây dựng
hàm Θ∧ 𝑋!, 𝑋!, … , 𝑋! Sau đó tìm miền 𝑊! ⊂ ℝ sao cho
𝑃 Θ∧ 𝑋!, 𝑋!, … , 𝑋! ∈ 𝑊!|𝐻!đúng = α
Ta chọn 𝐴 ∶= "Θ∧ 𝑋!, 𝑋!, … , 𝑋! ∈ 𝑊!"
Trang 52Với mẫu cụ thể (x1, x2, …, x n), nếu
Trang 53Sai lầm loại 1 Quyết định đúng
Muốn đưa ra một cách kiểm định làm giảm thiểu cả hai loại sai lầm này, nhưng không bao giờ tồn tại một cách như vậy Sai lầm loại 1 thường nghiêm trọng hơn sai lầm hoại 2
Trang 54VD4: ( xem lai sach) Khi định đầu tư vào một lĩnh vực nào đó, ta có thể đưa ra cặp nhận định sau:
L Đầu tư bị lỗ J Đầu tư có lãi
Sai lầm khi bác bỏ “Đầu tư bị lỗ” sẽ rất nghiêm trọng
vì nó có thể dẫn ta đến sự phá sản Vì vậy, để kiểm soát ta chọn nó là sai lầm loại 1 và H0 là “Đầu tư bị
lỗ”
Trang 56Các bước của bài toán kiểm định giả thuyết
1 Đặt giả thuyết H0, chọn đối thuyết H1 phù hợp
2 Chọn thống kê tiêu chuẩn hợp lý (chỉ tiêu kiểm định) Tính giá trị thống kê thông qua số liệu mẫu
Trang 57II KIỂM ĐỊNH GIẢ THUYẾT VỀ MỘT TRUNG BÌNH:
1 Kiểm định về một trung bình, khi σ đã biết
1 Đặt giả thuyết và đối thuyết : H :
−
=
3. Với mức ý nghĩa α, tra bảng A.3, ta được các
Trang 58giá trị tới hạn zα /2 sao cho P(Z < zα / 2) =1 - α
2
Miền bác bỏ :
Wα = −∞ − ( , zα 2 ] ∪ [ zα 2 , +∞ )
4 Kiểm tra: z W ∈ α hay z W ∉ α?
5 Kết luận: Bác bỏ hoặc chấp nhận giả thuyết
CHÚ Ý: Tổng thể phải có:
+) phân phối chuẩn +) nếu không có phân phối chuẩn thì cỡ mẫu phải đủ lớn (n>30)
Trang 59VD5: Một nhà sản xuất khẳng định rằng khối lượng trung bình cá mà dây câu có thể chịu là 8 kg, với
độ lệch chuẩn là 0,5 kg Để kiểm định giả thuyết µ
= 8 kg với đối thuyết µ ≠ 8 kg, 50 dây ngẫu nhiên được kiểm tra và khối
lượng trung bình mà dây
có thể chịu là 7,8 kg Hãy
kiểm định khẳng định của
nhà sản xuất với mức ý
nghĩa 0,01
Trang 60CHÚ Ý : Đối với kiểm định một phía
Trang 61VD6: Một mẫu ngẫu nhiên gồm 100 giấy báo tử ở
Mỹ cho thấy tuổi thọ trung bình là 71,8 năm Giả
sử độ lệch chuẩn là 8,9 năm Có thể cho rằng tuổi thọ trung bình hiện nay ở Mỹ là hơn 70 năm không? Cho mức ý nghĩa là 0,05
Trang 622 Kiểm định về một trung bình, khi σ chưa biết,
Trang 634 Kiểm tra: t ∈Wα hay t ∉Wα ?
5 Kết luận: Bác bỏ hoặc chấp nhận giả thuyết
Trang 64CHÚ Ý: Đối với kiểm định một phía
Trang 65VD7: Để kiểm định xem liệu điểm trung bình của các thí sinh có trên 5 hay không, thanh tra đã rút từ túi bài thi ra 10 bài và thu được điểm tương ứng là 6, 9, 3, 5,
7, 10, 4, 7, 2 và 6 Với độ tin cậy 98%, hãy kiểm định điều nghi ngờ trên Giả thiết điểm thi có phân phối xấp
xỉ chuẩn
Trang 663 Kiểm định về một trung bình, khi σ chưa biết,
Coi s ≈ σ và đưa về như trường hợp σ đã biết
1 Đặt giả thuyết và đối thuyết : H :
Trang 67Tính giá trị quan sát : z = x − µ0
s / n
3. Với mức ý nghĩa α, tra bảng A.3, ta được các
giá trị tới hạn zα /2 sao cho P(Z < zα / 2) =1 - α
2
Miền bác bỏ :
Wα = −∞ − ( , zα 2 ] ∪ [ zα 2 , +∞ )
4 Kiểm tra: z W ∈ α hay z W ∉ α?
5 Kết luận: Bác bỏ hoặc chấp nhận giả thuyết
Trang 68CHÚ Ý : Đối với kiểm định một phía
Trang 69VD8: Một giám đốc cho biết lương trung bình của
một công nhân ở xí nghiệp của ông là 3,8 triệu
đ/tháng Chọn ngẫu nhiên 36 công nhân của xí nghiệp này thấy lương trung bình là 3,5 triệu
đ/tháng, với độ lệch chuẩn là 400000
Với mức ý nghĩa α = 0,05, hãy xét
xem giám đốc có nói quá lên không
Trang 70BÀI TẬP VỀ NHÀ:
BÀI TẬP BUỔI 4: Kiểm định một trung bình
Trang 71
§9.BÀI TOÁN KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ (tiếp)
+) Kiểm định về hiệu hai trung bình
+) Kiểm định tỷ lệ
Trang 72I KIỂM ĐỊNH VỀ HIỆU HAI TRUNG BÌNH:
?
đã biết
chưa biết nhưng biết
Trang 731 Kiểm định về hiệu hai trung bình, σ σ2 , 2
Trang 744 Kiểm tra: z W ∈ α hay z W ∉ α
5 Kết luận: Bác bỏ hoặc chấp nhận giả thuyết
Trang 75VD6: Hai tổng thể có phân phối chuẩn được lấy lần lượt ra hai mẫu ngẫu nhiên Mẫu thứ nhất có cỡ mẫu n1 = 25, độ lệch chuẩn tổng thể σ1 = 5 , giá trị
trung bình x1 = 80 Một mẫu thứ hai có cỡ mẫu
n2 = 6 , độ lệch chuẩn tổng thể σ 2 = 3, giá trị trung
bình x2 = 75 Kiểm định giả thuyết rằng không có
sự sai khác về chất lượng giữa hai tổng thể, với mức ý nghĩa 0,05
Trang 76CHÚ Ý: Đối với kiểm định một phía
Trang 772 Kiểm định về hiệu hai giá trị trung bình, khi
Trang 78sao cho
P(T > tα / 2) = α
2Miền bác bỏ: Wα = −∞,−t ( α / 2 ⎤⎦ ∪ t ⎡⎣ α/ 2 , ∞ )
4 Kiểm tra: t ∈Wα hay t ∉Wα
5 Kết luận: Bác bỏ hoặc chấp nhận giả thuyết
Trang 79VD7: Thống kê sản lượng hàng tháng của một nhà máy sản xuất đồ chơi trong 16 tháng sử dụng máy cũ và 11 tháng sử dụng máy mới cho thấy (đơn vị: nghìn sản phẩm):
Máy cũ: 99,2 94,5 93,8 102,7 89,2
98,3 101,4 125,8 96,6 89,9
97,2 94 87,3 101,6 89,7 89,7
Máy mới : 96,5 105,4 91,2 85 79,6 91,1 87,7 90,2 95,6 90 93,8
có làm thay đổi sản lượng hàng tháng của nhà máy hay không? Giả sử các phân phối đều chuẩn, với phương sai bằng nhau
Trang 81VD8: Thử nghiệm đối với 12 ô tô Volkswagen và 10 xe
ô tô Toyata cùng chạy với vận tốc là 90km/h Với cùng một mức tiêu thụ nhiên liệu 1 lít xăng, thì 12 xe Volkswagen đi được quãng đường trung bình 16km với
độ lệch chuẩn 1km, còn 10 xe ô tô Toyata đi được quãng đường trung bình 11km với độ lệch chuẩn
quãng đường trung bình khi tiêu thụ 1 lít xăng mà xe Volkswagen đi được lớn hơn 4km so với xe Toyata Giả sử số km của mỗi mẫu xe có phân phối xấp xỉ chuẩn với phương sai bằng nhau