Bài giảng Xác suất thống kê - Chương 4: Lý thuyết mẫu và ước lượng tham số cung cấp cho người học các kiến thức: Tổng thể và mẫu, các đặc trưng của tổng thể, các đặc trưng của mẫu, lý thuyết ước lượng, ước lượng điểm,... Mời các bạn cùng tham khảo
Trang 1LOG O
Chương 4:
LÝ THUYẾT MẪU
&
ƯỚC LƯỢNG THAM SỐ
Giảng viên: Phan Trung Hiếu
2
I Tổng thể và mẫu:
Tổng thể
- Là tập hợp tất cả cácphần tử cần khảo sát
- Gọi n: số phần tử
của mẫu (cỡ mẫu)
3
Ví dụ 1: Tính chiều cao trung bình của người
Việt Nam ở độ tuổi 18
Đo chiều cao của tất cả người Việt Nam ở
độ tuổi 18! Tốn thời gian, tiền bạc, công sức.
Không xác định được chính xác tổng thể.
Ví dụ 3: Tính tỉ lệ hộp sữa kém chất lượng trong
kho gồm 1 triệu hộp
Kiểm tra từng hộp! Phá vỡ tổng thể.
Ví dụ 2: Tính tỉ lệ người nhiễm HIV bằng con
đường tiêm chích ma tuý trong số những người
nhiễm HIV ở Việt Nam
Xác định tất cả những người nhiễm HIV!
4
Tổng thể (N)
Không hoàn lại
II Các đặc trưng của tổng thể:
Tỉ lệ (xác suất) phần tử có tính chất A:
Trung bình của tổng thể:E(X)
Phương sai của tổng thể:2Var(X)
Gọi là những kết quả quan sát.x x1, 2, ,x k
Dạng liệt kê: x1,x2,…, x k trong đó mỗi x i có thể lặp lại.
Dạng bảng tần số:
(Bảng pp thực nghiệm)
Dạng khoảng:
x i x1 x2 x k Tần số (n i ) n1 n2 n k
Trang 23.2 Các đặc trưng mẫu: Cho bảng tần số
x i x1 x2 x k Tần số (n i ) n1 n2 n k
Trang 3Ước lượng (dự đoán)
V Ước lượng điểm:
16
-Kết quả được cho bởi một con số cụ thể
Ví dụ: Ta lấy mẫu và ước lượng chiều cao
trung bình của người Việt Nam Nếu kết luậnchiều cao trung bình của người Việt Nam là170cm thì 170cm là một ước lượng điểm
-Khi đó:
VI Ước lượng khoảng:
-Kết quả cần ước lượng được cho bởi một
khoảng (a,b).
Ví dụ: Ta lấy mẫu và ước lượng chiều cao
trung bình của người Việt Nam Nếu kết luận
chiều cao trung bình của người Việt Nam
Trang 4VII Ước lượng trung bình của tổng thể:
19
:
trung bình của tổng thể
-Giả thiết: Cho cỡ mẫu n Biết
Cho độ tin cậy
-Phương pháp: Tùy vào n và
: Khoảng tin cậy đối xứng.
KHOẢNG TIN CẬY TỐI ĐA,
TỐI THIỂU (1 PHÍA)
(Xem Phương pháp dạng sơ đồ trang 18)
22
Ví dụ 1: Mẫu điều tra về chỉ tiêu X của một loại sản
phẩm được kết quả cho trong bảng:
x i (%) 2,5 7,5 12,5 17,5 22,5 27,5 32,5 37,5
n i (số sp) 7 12 20 25 18 12 5 1
a) Hãy ước lượng khoảng cho trung bình chỉ tiêu X với độ
tin cậy 95%.
b) Hãy ước lượng khoảng cho trung bình tối đa của chỉ
tiêu X với độ tin cậy 95%.
c) Hãy ước lượng trung bình tối thiểu của chỉ tiêu X với
độ tin cậy 95%.
d) Những sản phẩm có chỉ tiêu X không quá 10% là sản
phẩm loại 2 Hãy ước lượng khoảng cho trung bình chỉ
tiêu X các sản phẩm loại 2 với độ tin cậy 95%, biết rằng chỉ tiêu X các sản phẩm loại 2 có phân phối chuẩn.
23
Giải a) n
1, 65 8, 0691 1,3314.
100
Trang 5Ví dụ 2: Chủ một kho cung cấp sơn muốn ước
lượng lượng sơn chứa trong một thùng được sản
xuất từ một dây chuyền công nghệ quốc gia Biết
rằng theo tiêu chuẩn của dây chuyền công nghệ đó,
độ lệch tiêu chuẩn của lượng sơn là 0,08 thùng.
Điều tra một mẫu 50 thùng được lượng sơn trung
bình là 0,97 thùng Với độ tin cậy 99%, hãy ước
lượng khoảng cho lượng sơn trung bình chứa trong
-Giả thiết: Cho cỡ mẫu n.
Biết tỉ lệ mẫu , m: số phần tử có tính chất A nào đó
Cho độ tin cậy γ
-Mục tiêu: Cần tìm (sai số ước lượng, độ chính xác) sao cho
với độ tin cậy
Trang 6-Sai số ước lượng khoảng tin cậy đối xứng:
(Xem Phương pháp dạng sơ đồ trang 22)
Ví dụ 1: Kiểm tra 100 sản phẩm trong một lô hàng lớn
gồm 50000 sản phẩm thấy có 20 phế phẩm Hãy ước
lượng khoảng cho tỉ lệ phế phẩm với độ tin cậy 99%?
Số phế phẩm của lô hàng đó nằm trong khoảng nào?
n
f ; f (0, 0968 ; 0,3032)
Ví dụ 2: Cân ngẫu nhiên 45 con heo 3 tháng
tuổi trong một trại chăn nuôi, ta được kết quả
sau x
i 35 37 39 41 43 45 47
n i 2 6 10 11 8 5 3
Heo có khối lượng trên 38kg là heo đạt tiêu
chuẩn Giả sử khối lượng tuân theo quy luật
phân phối chuẩn
a) Hãy tìm khoảng ước lượng cho tỉ lệ heo đạt
tiêu chuẩn trong trại trên với độ tin cậy 90%
b) Hãy ước lượng tối đa cho tỉ lệ heo đạt tiêu
chuẩn trong trại trên với độ tin cậy 90% 36
tỉ lệ heo đạt tiêu chuẩn
tỉ lệ heo đạt tiêu chuẩn trong 45 conheo được cân
Giải
Trang 7XI Các bài toán liên quan đến ước lượng tỉ lệ:
Xem trang 23
Ví dụ 1: Một khách hàng nhận được lô hàng từ
một nhà máy sản xuất bút bi rẻ tiền Để ướclượng tỉ lệ bút hỏng, khách hàng lấy ngẫunhiên 300 bút từ lô hàng kiểm tra và thấy có 30bút hỏng
a) Nếu sử dụng mẫu điều tra, để ước lượng tỉ
lệ bút bi hỏng đạt độ chính xác là 2,5% thì đảmbảo độ tin cậy là bao nhiêu?
b) Nếu muốn ước lượng tỉ lệ bút bi hỏng đạt
độ tin cậy 96% và độ chính xác 3% thì cầnkiểm tra thêm bao nhiêu bút bi nữa?
Trang 8Giải a)
Gọi n là số bút bi cần kiểm tra
Vậy cần kiểm tra thêm
C f f n
45
Ví dụ 2: Đo đường kính của 100 chi tiết do
một máy sản xuất được số liệu
x i(cm) 9,75 9,80 9,85 9,90
n i (số sản phẩm) 5 37 42 16
a) Nếu sử dụng mẫu này và muốn ước lượng
đường kính trung bình với độ chính xác 0,006
cm thì đảm bảo độ tin cậy bao nhiêu?
b) Nếu muốn ước lượng đường kính trung bình
với độ chính xác là 0,003 cm và độ tin cậy là
95% thì cần kiểm tra thêm bao nhiêu chi tiết?
46
Giải a) n 100 30 s 0, 04.
Vậy cần kiểm tra thêm:
Gọi n là số chi tiết cần kiểm tra
Giảng viên: Phan Trung Hiếu
Việc kiểm tra lại thông tin mà ta nhận đượcxem có đáng tin cậy không chính là bài toánkiểm định
Trang 9I Các khái niệm:
Giả thuyết thống kê: là các giả thuyết nói về
-Các tham số của tổng thể;
-Quy luật phân phối xác suất hoặc tính độc lập
của các biến ngẫu nhiên
Kiểm định giả thuyết thống kê: là công việc
tìm ra kết luận để bác bỏ hay chấp nhận một
giả thuyết thống kê từ các thông tin thu được
trên mẫu điều tra
Ký hiệu: H: giả thuyết không.
: giả thuyết đối (đối thuyết) của H.
H
50
-Dựa vào mẫu lấy ra để đưa ra kết luận:
"chấp nhận H (bác bỏ ) hay chấp nhận (bác bỏ H)"
H H
Ví dụ 1: Một tổ chức cho rằng chiều cao trung
bình hiện nay của thanh niên Việt Nam là
1,65m Hãy lập giả thuyết để kiểm chứng kết
quả này?
51
Giải
Gọi : chiều cao trung bình của thanh niên
hiện nay (theo thực tế).
Giả thuyết
: 1, 65
: 1, 65
H H
52
Ví dụ 2: Một ý kiến cho rằng tỉ lệ sinh viên thi
đạt môn XSTK là thấp hơn 50% Hãy lập giảthuyết để kiểm chứng điều này?
Tiêu chuẩn kiểm định giả thuyết: là một thống kê
T=T(X1, X2,…,X n) có thể phụ thuộc vào tham số đã
biết trong giả thuyết H Thống kê T được chọn sao
cho thỏa điều kiện:Khi H đúng thì luật phân phối
xác suất của T hoàn toàn được xác định.
Miền bác bỏ: Với số bé cho trước, ta có thể
tìm được tập hợp thỏa
0
W P{TW H đúng}
Tiến hành quan trắc dựa trên mẫu ngẫu nhiên
(X1, X2,…, X n ) ta thu được mẫu cụ thể (x1, x2,…,
Trang 10II Các loại sai lầm trong kiểm định:
: mức ý nghĩa
Thực tế Kết luận
Sai lầm nào nghiêm trọng hơn?
Cách làm giảm khả năng mắc sai lầm?
Sai lầm loại I: Bác sĩ cho tôi về trong khi tôi
-Ta không thể làm giảm P(sai lầm I) và P(sai
lầm II) xuống cùng một lúc được vì khi P(sai
lầm I) giảm thì P(sai lầm II) sẽtăng và ngược
lại
-Ta sẽ ấn định trước P(Sai lầm I) = , và
trong điều kiện đó P(Sai lầm II) được hạn
là giá trị đã biết theo 1 ý kiến nào đó
Kiểm định phía phải
0 0
::
H H
: :
H H
: :
H H
Các bước kiểm định tổng quát:
-Bước 1: Đặt cặp giả thuyết thống kê
-Bước 2: Kiểm định giả thuyết thống kê
-Bước 3: Kết luận (chấp nhận hay bác bỏ H).
IV So sánh trung bình với một số:
: trung bình của tổng thể (thực tế, chua biết)
0
: cho trước.
Cho trước mức ý nghĩa
Nhắc lại: 1
Trang 11Các bước làm: xem trang 20
62
Ví dụ 1: Mẫu điều tra về năng suất của một
giống lúa ở một vùng, kết quả cho trong bảng:
x i (tạ/ha) 25 26 27 28 29 30 31
n i (Số ha) 3 5 8 10 7 6 2Với mức ý nghĩa 2%, có thể cho rằng năngsuất trung bình của giống lúa này là 29tạ/hađược không?
Ví dụ 2: Trọng lượng của một gói chè do một
máy tự động đóng theo thiết kế là 500
gam/gói Người ta lấy ngẫu nhiên 30 gói cân
thử được trọng lượng trung bình là 495 gam và
độ lệch tiêu chuẩn là 10 gam Một ý kiến cho
rằng máy đóng gói chè làm việc không bình
thường làm cho trọng lượng trung bình của gói
chè giảm sút Với mức ý nghĩa 5%, ý kiến này
có đáng tin hay không
H H
Trang 12IV So sánh trung bình với một số:
Ví dụ 3: Trong năm trước trọng lượng trung bình
khi xuất chuồng của một trại heo là 100 kg/con
Năm nay, người ta cho heo ăn một loại thức ănmới với hy vọng sẽ làm tăng trọng nhiều hơn Sauthời gian thử nghiệm, người ta cân ngẫu nhiên 50con và tính được trọng lượng trung bình là 110kg/con Giả thiết trọng lượng của heo trong trại làbiến ngẫu nhiên có độ lệch chuẩn là 50kg
a) Với mức ý nghĩa 5%, hãy xét xem loại thức ăn
mới có làm tăng trọng lượng trung bình của heolên hay không?
b) Giải lại câu a) với mức ý nghĩa 10%.
69
Giải
Gọi là trọng lượng trung bình của heo
sau khi cho dùng loại thức ăn mới
H H
: tỉ lệ mẫu.
Trang 13Các bước làm: xem trang 24
74
Ví dụ 1: Điều tra doanh số bán hàng của các
hộ kinh doanh một loại hàng năm nay cho sốliệu:
x i (triệu đồng/tháng) 11 11,5 12 12,5 13 13,5
n i (Số hộ) 10 15 20 30 15 10Những hộ có doanh số trên 12,5 triệu
đồng/tháng là những hộ có doanh số cao Theo
một báo cáo, tỉ lệ hộ có doanh số cao là 35%
Với mức ý nghĩa 5%, số liệu trong báo cáo cóđáng tin hay không
75
Giải
Gọi p: tỉ lệ hộ có doanh số cao.
f : tỉ lệ hộ có doanh số cao trong 100 hộ
khách hàng ưa thích sản phẩm của công ty
Điều tra 400 khách hàng có 230 người ưa thích
sản phẩm của công ty này Với mức ý nghĩa
5%, số liệu trong tuyên bố trên có cao hơn so
với thực tế hay không?
H H
Giả thuyết:
n =
f
Trang 14Ví dụ: Người ta muốn so sánh chất lượng đào tạo
tại hai cơ sở A, B căn cứ trên điểm trung bình ở kìthi quốc gia Một mẫu 100 thí sinh được đào tạotại cơ sở A có điểm trung bình 9,25, độ lệchchuẩn 0,8, và một mẫu 80 thí sinh được đào tạotại cơ sở B có điểm trung bình 9, độ lệch chuẩn 1
a) Với mức ý nghĩa 5%, hãy cho biết chất lượngđào tạo của cơ sở A và B có khác nhau haykhông?
b) Nếu biết cơ sở A có đội ngũ giáo viên tốt hơn
cơ sở B Với mức ý nghĩa 5%, hãy cho biết chấtlượng đào tạo của cơ sở A có tốt hơn cơ sở Bkhông?
IV So sánh trung bình với một số:
Giải
Gọi là điểm trung bình của các thí sinh
được đào tạo tại cơ sở A, B.
H H
Trang 15IV So sánh trung bình với một số:
85
Giả thuyết:
: :
H H
Ví dụ 1: Có 2 lô hạt giống Từ lô thứ nhất gieo
thử ngẫu nhiên 850 hạt thấy có 680 hạt nảymầm Từ lô thứ hai gieo thử 1200 hạt thấy có
1020 hạt nảy mầm Với mức ý nghĩa 5%, cóthể coi tỉ lệ hạt giống nảy mầm của 2 lô là khácbiệt nhau hay không?
IV So sánh trung bình với một số:
Trang 16IV So sánh trung bình với một số:
Vậy, với mức ý nghĩa 5%, có thể coi tỉ lệ hạt
giống nảy mầm của 2 lô là khác biệt nhau
Ví dụ 2: Kiểm tra chất lượng sản phẩm cùng
loại do hai nhà máy A và B sản xuất, kết quảcho trong bảng:
IV So sánh trung bình với một số:
H H
Trang 26thành phố và thu được bảng số liệu sau:
(kg/năm) 0 1 2 3 4 5 6 7 8 (số hộ) 48 16 22 33 24 25 15 10 7
a) Với độ tin cậy 99%, hãy ước lượng khoảng cho mức tiêu thụ sản phẩm trung
bình của mỗi hộ
b) Với độ tin cậy 90%, hãy ước lượng khoảng cho tỉ lệ hộ có sử dụng sản phẩm
Từ đó hãy ước lượng khoảng số hộ trong toàn thành phố có sử dụng sản phẩm nếu biết thành phố này có 2 triệu hộ
c) Theo một báo cáo của công ty, mức tiêu thụ sản phẩm trung bình của mỗi hộ là
3,3 kg/năm Với mức ý nghĩa 5%, số liệu trong báo cáo có cao hơn so với thực tế hay không?
d) Một cuộc khảo sát tương tự của công ty vào năm 2010 đối với 180 hộ thu được
mức tiêu thụ trung bình của mỗi hộ là 2,68 kg/năm, độ lệch chuẩn là 2,29 kg/năm Với mức ý nghĩa 5%, hãy cho biết mức tiêu thụ sản phẩm trung bình của mỗi hộ trong hai năm 2010 và 2011 có khác nhau hay không?
Cho biết:
(1,64) = 0,45; (1,96) = 0,475; (2) = 0,4772; (2,33) = 0,49; (2,58) = 0,495
Bài 2 (A-ĐH-HK2-2012-2013): Năm 2012, người ta lấy mẫu về sản lượng sữa của
một giống bò tại một nông trường trong một ngày và thu được bảng số liệu sau:
(kg/ngày) 1,5 4,5 7,5 10,5 13,5 (số con bò) 10 24 42 16 8
a) Với độ tin cậy 95%, hãy ước lượng khoảng cho sản lượng sữa trung bình của
một con bò trong một ngày
b) Nếu muốn bài toán ước lượng khoảng sản lượng sữa trung bình của một con bò
trong một ngày đạt độ chính xác là 600g và độ tin cậy là 95% thì cần điều tra thêm bao nhiêu con bò nữa?
c) Bò có sản lượng sữa trên 10 kg/ngày là bò đạt tiêu chuẩn Một ý kiến cho rằng tỉ
lệ bò đạt tiêu chuẩn là 34% Với mức ý nghĩa 5%, tỉ lệ trong ý kiến trên có cao hơn
so với thực tế hay không?
d) Một cuộc điều tra tương tự vào năm 2011 đối với 80 con bò thì thấy có 20 con
bò đạt tiêu chuẩn Với mức ý nghĩa 5%, có thể coi tỉ lệ bò đạt tiêu chuẩn trong hai
năm 2011 và 2012 là khác biệt nhau hay không?
Cho biết: (0,56) = 0,2123; (1,96) = 0,475; (1,65) = 0,45
Trang 27(số gói) 2 10 12 20 28 16 8 4
a) Tính trung bình và phương sai của mẫu trên
b) Với độ tin cậy 99%, hãy ước lượng khoảng cho khối lượng trung bình của mỗi
gói đường
c) Những gói được gọi là gói đóng thiếu nếu khối lượng của nó nhỏ hơn 1000 gam
Với độ tin cậy 90%, hãy ước lượng khoảng cho tỉ lệ gói đóng thiếu
d) Theo một báo cáo, khối lượng trung bình của mỗi gói đường được đóng gói tại
phân xưởng là 1000 gam Với mức ý nghĩa là 5%, báo cáo này có đáng tin hay không?
Cho biết: (1,64) = 0,45; (1,96) = 0,475; (2,33) = 0,49; (2,58) = 0,495
Bài 4 (B-CĐ-HK2-2013-2014): Để đánh giá mức độ tăng trưởng của heo (heo sau
3 tháng tuổi) tại một trang trại, người ta đã cân ngẫu nhiên một số con heo và thu được kết quả sau
(trọng lượng: kg) 35 37 39 41 43 45 47
(số con) 2 6 10 11 8 5 3
a) Tính trung bình và phương sai của mẫu nói trên
b) Với độ tin cậy 95%, hãy ước lượng khoảng cho trọng lượng trung bình của mỗi
con heo
c) Giả sử heo có trọng lượng trên 38kg là heo đạt tiêu chuẩn Với độ tin cậy 99%,
hãy ước lượng khoảng cho tỉ lệ heo đạt tiêu chuẩn Từ đó, hãy ước lượng khoảng cho số heo đạt tiêu chuẩn nếu trang trại trên có 1000 con heo
d) Một cuộc thống kê tương tự được thực hiện tại một trang trại khác đối với 50
con heo thì thấy có 40 con đạt tiêu chuẩn Với mức ý nghĩa 5%, tỉ lệ heo đạt tiêu chuẩn của hai trang trại có giống nhau hay không?
Cho biết: (1,64) = 0,45; (1,96) = 0,475; (2,33) = 0,49; (2,58) = 0,495;
t(19; 0,025) = 2,093
Bài 5 (A-ĐH-HK3-2013-2014): Người ta kiểm tra ngẫu nhiên về đường kính của
một loại chi tiết tại phân xưởng A và thu được bảng số liệu như sau:
(cm) 19,7 19,8 19,9 20 20,1 20,2 20,3 (số chi tiết) 15 16 26 33 24 25 11
a) Với độ tin cậy 99%, hãy ước lượng khoảng cho đường kính trung bình của một
chi tiết
b) Nếu muốn bài toán ước lượng khoảng cho đường kính trung bình của một chi
tiết đạt độ chính xác là 0,03 cm và có độ tin cậy 99% thì cần kiểm tra thêm bao nhiêu chi tiết nữa?
Trang 28tiết đạt tiêu chuẩn Với mức ý nghĩa 5%, tỉ lệ chi tiết đạt tiêu chuẩn của phân
xưởng A có cao hơn tỉ lệ chi tiết đạt tiêu chuẩn của phân xưởng B hay không?
Cho biết: (1,64) = 0,45; (1,96) = 0,475; (2,33) = 0,49; (2,58) = 0,495
Bài 6 (B-ĐH-HK3-2013-2014): Tại một địa phương, người ta lấy số liệu ngẫu
nhiên về cân nặng của một số bé trai (khi mới sinh) và có kết quả như sau:
(cân nặng: kg) 2,8 – 3 3 – 3,2 3,2 – 3,4 3,4 – 3,6 3,6 – 3,8 (số bé) 3 10 18 15 4
a) Với độ tin cậy 90%, hãy ước lượng khoảng cho cân nặng trung bình của mỗi bé
trai
b) Với độ tin cậy 99%, hãy ước lượng khoảng cho tỉ lệ bé có cân nặng trên 3,4kg
(đối với bé trai)
c) Với mức ý nghĩa 5%, nêu đánh giá về nhận định: Tỉ lệ bé trai có cân nặng từ 3kg
đến 3,6kg chiếm 90% số bé trai được sinh ra
d) Một cuộc thống kê tương tự được thực hiện đối với 50 bé gái thu được trung
bình mẫu là 3,1kg và độ lệch chuẩn mẫu là 0,3kg Với mức ý nghĩa 1%, khối lượng
trung bình của bé trai và của bé gái có khác nhau hay không?
Cho biết: (1,64) = 0,45; (1,96) = 0,475; (2,33) = 0,49; (2,58) = 0,495;
t(19; 0,025) = 2,093
Bài 7 (A-ĐH-HK3-2014-2015): Gọi X (đơn vị: kg) là khối lượng của một loại sản
phẩm thuộc xí nghiệp A Điều tra một số sản phẩm của xí nghiệp này có kết quả sau
50 – 55 55 – 60 60 – 65 65 – 70 70 – 75 75 – 80
a) Hãy ước lượng khoảng cho giá trị trung bình của X với độ tin cậy 92%,
b) Nếu muốn bài toán ước lượng khoảng cho giá trị trung bình của X có độ tin cậy
là 95% và đạt độ chính xác không quá 1 kg thì cần điều tra thêm bao nhiêu sản phẩm nữa?
c) Với mức ý nghĩa 5%, có thể kết luận khối lượng trung bình của loại sản phẩm
trên là lớn hơn 65kg hay không?
d) Giả thuyết cho rằng tỉ lệ sản phẩm có khối lượng lớn hơn 70kg là 40% Hãy kiểm định giả thuyết trên với độ tin cậy 95%
Cho biết: (1,64) = 0,45; (1,96) = 0,475; (1,75) = 0,46; (2,182) = 0,4854;
(2,2913) = 0,489; (2,4) = 0,4918