XÁC SUT THNG KÊ XÁC SUẤT THỐNG KÊ KHOA CÔNG NGHỆ THÔNG TIN BỘ MÔN KHOA HỌC CƠ BẢN GV Lê Thị Mai Thanh Ngày 13 tháng 1 năm 2022 Chương 4 Ước lượng cho một tham số thống kê Giả sử đại lượng ngẫu nhiên X.
Trang 1XÁC SUẤT THỐNG KÊ
KHOA CÔNG NGHỆ THÔNG TIN
BỘ MÔN KHOA HỌC CƠ BẢN
GV Lê Thị Mai Thanh
Ngày 13 tháng 1 năm 2022
Trang 2Giả sử đại lượng ngẫu nhiên X có tham số θ chưa biết Ước lượng tham
số θ là dựa vào mẫu ngẫu nhiên Wx= (X1, X2, , Xn) ta đưa ra
thống kê g = G (X1, X2, , Xn) để ước lượng (dự đoán) θ
Có 2 phương pháp ước lượng:
i Ước lượng điểm: chỉ ra θ = θ0 nào đó để uớc lượng θ
ii Ước lượng khoảng: chỉ ra một khoảng (θ1, θ2) chứa θ sao cho
P (θ1< θ < θ2) = 1 − α cho trước
Trang 34.1 Ước lượng điểm
Giả sử cần ước lượng tham số θ của đại lượng ngẫu nhiên X
Từ X ta lập mẫu ngẫu nhiên (X1, X2, Xn)
Chọn thống kê G(X2, Xn) - là hàm ước lượng cho θ của tổngthể
Thực hiện phép thử ta được mẫu cụ thể (x1, x2, xn)
Khi đó ước lượng điểm của θ = G(x1, x2, xn)
Trang 4Cho X là biến ngẫu nhiên có phân phối chuẩn N µ; σ2 Giả sử
(X1, X2, , Xn) là mẫu ngẫu nhiên
- Để ước lượng cho trung bình tổng thể µ ta dùng hàm ước lượng làtrung bình mẫu ngẫu nhiên ¯X = 1
n(X1+ X2+ + Xn) thì trungbình mẫu cụ thể ¯x là 1 ước lượng điểm của µ
- Để ước lượng cho phương sai tổng thể σ2 ta dùng hàm ước lượng làphương sai mẫu hiệu chỉnh S2 = 1
Trang 54.2 Ước lượng khoảng
4.2.1 Ước lượng khoảng tin cậy
Ước lượng khoảng tin cậy nhằm chỉ ra một khoảng ngẫu nhiên (θ1, θ2)
mà giá trị θ thuộc vào với xác suất đủ lớn (đủ gần 1) Ta gọi xác suấtnày là độ tin cậy của ước lượng và thường ký hiệu là 1 − α (với α gần0)
P (θ1 < θ < θ2) = 1 − αKhi đó, khoảng (θ1, θ2) gọi là khoảng tin cậy cho θ
Trang 6Giả sử trung bình của tổng thể E(X) = µ chưa biết Ta cần tìm
khoảng (µ1, µ2) chứa µ sao cho P (µ1 < µ < µ2) = 1 − α cho trước.Ước lượng chia làm 3 trường hợp
Trường hợp đã biết σ2
Trường hợp chưa biết σ2 và kích thước mẫu n ≥ 30
Trường hợp chưa biết σ2 và kích thước mẫu n < 30
Trang 74.2 Ước lượng khoảng
4.2.2 Ước lượng khoảng cho trung bình tổng thể
Giá trị tới hạn chuẩn mức α
Giá trị tới hạn chuẩn mức α , ký hiệu là zα, là giá trị của biến ngẫunhiên Z ∼ N (0, 1), thỏa điều kiện: P (Z > zα) = α tức là
0.5 − ϕ(zα) = α
zα là 1 điểm trên trục hoành sao cho diện tích miền tô đen bằng α
Ví dụ : z0.025= 1, 96; z0.01= 2.33
Trang 8Trường hợp đã biết σ2
Nếu X có phân phối chuẩn thì thống kê G = ( ¯X − µ)
√n
Trang 94.2.2 Ước lượng khoảng cho trung bình tổng thể
Vậy với độ tin cậy 1 − α, khoảng tin cậy của µ là
¯
X − zα 2
Trang 10Quy trình thực hiện
Tính ¯x (nếu chưa cho)
Với độ tin cậy 1 − α, ta có ϕ(zα
Trang 114.2 Ước lượng khoảng
4.2.2 Ước lượng khoảng cho trung bình tổng thể
Hãy ước lượng mức thu nhập trung bình trong vùng với độ tin cậy
95%, biết rằng thu nhập là biến ngẫu nhiên có phân phối chuẩn với độlệch chuẩn σ = 0.2
Trang 134.2 Ước lượng khoảng
4.2.2 Ước lượng khoảng cho trung bình tổng thể
Trường hợp chưa biết σ2 và kích thước mẫu n ≥ 30
Vì kích thước mẫu lớn nên ta dùng phương sai mẫu hiệu chỉnh s2 đểước lượng cho σ2 chưa biết
Khi đó khoảng tin cậy 1 − α cho µ là(¯x − , ¯x + ), với = zα
2
s
√n
Ví dụ
Điều tra đường huyết 100 người, có kết quả sau:
Trung bình mẫu: 100mg
Độ lệch chuẩn mẫu hiệu chỉnh: 10, 08mg
Tìm khoảng tin cậy 95% cho đường huyết trung bình của dân số
Trang 154.2 Ước lượng khoảng
4.2.2 Ước lượng khoảng cho trung bình tổng thể
Trường hợp chưa biết σ2 và kích thước mẫu n < 30
• Thống kê G = ( ¯X − µ)
√n
σ có phân phối Student với n-1 bậc tự do.
• Khoảng tin cậy của µ với độ tin cậy 1 − α có dạng (¯x − , ¯x + ).trong đó, độ chính xác: = tα
2(n − 1)√s
nvới tα
2(n − 1) là giá trị tới hạn mức α
2 của phân phối Student n-1 bậc
tự do
Trang 16Ví dụ
Giá bán của một loại thiết bị (đv: USD) trên thị trường là biến ngẫunhiên có phân phối chuẩn Một người định mua một thiết bị loại này,khảo sát ngẫu nhiên tại 8 cửa hàng nhận thấy giá bán trung bình là137.75 USD và độ lệch chuẩn hiệu chỉnh của mẫu là 7.98 USD Với độtin cậy 90%, hãy ước lượng giá bán trung bình của thiết bị loại nàytrên thị trường
Trang 174.2 Ước lượng khoảng
4.2.2 Ước lượng khoảng cho trung bình tổng thể
Giải
Gọi X là giá bán (USD) của một thiết bị loại này trên thị trường
µ là giá bán trung bình của thiết bị loại này trên thị trường
Với độ tin cậy 1 − α = 0.9 ⇒ α
2 = 0.05 và n − 1 = 7
Student
−→ t α
2(n − 1) = t0.05(7) = 1.895
Độ chính xác cuả ước lượng = tα
2(n − 1)√s
n = 5.3465Khoảng tin cậy cho 90% cho µ là
(¯x − , ¯x + ) = (132.3035; 143.0965) (U SD)
Trang 18Độ chính xác càng nhỏ thì khoảng ước lượng càng hẹp, kết quả càng ýnghĩa
⇒ để giảm độ chính xác ta tăng kích thước mẫu
Tuy nhiên, không thể muốn tăng n lớn bao nhiêu cũng được tức là
không thể giảm độ chính xác nhỏ bao nhiêu cũng được, vì vậy người tathường yêu cầu độ chính xác nhỏ ở một giới hạn 0 nào đó
Để đảm bảo yêu cầu này thì kích thước mẫu phải không nhỏ hơn mộtgiá trị nmin gọi là kích thước mẫu tối thiểu
Để tìm nmin (kích thước mẫu tối thiểu) ta biến đổi
Trang 194.2 Ước lượng khoảng
4.2.2 Ước lượng khoảng cho trung bình tổng thể
Ví dụ
Lượng xăng hao phí của một ô tô đi từ A đến B sau 150 lần chạy đượckhảo sát có giá trị trung bình là 10.56 lít và độ lệch chuẩn hiệu chỉnh là0.587 lít Để ước lượng lượng xăng hao phí trung bình của ô tô này khi
đi từ A đến B đảm bảo độ chính xác 0.08 lít với độ tin cậy 95% thì cầnkhảo sát ít nhất bao nhiêu lần chạy từ A đến B của ô tô này?
0.08
2
= 206.8 ⇒ nmin = 207Vậy cần khảo sát ít nhất 207 lần chạy từ A đến B của ô tô này
Trang 20Độ tin cậy đối với ước lượng trung bình
s ⇒ 1 − α = 2ϕ(zα2)
Trang 214.2 Ước lượng khoảng
4.2.2 Ước lượng khoảng cho trung bình tổng thể
Ví dụ
Lượng xăng hao phí của một ô tô đi từ A đến B sau 150 lần chạy đượckhảo sát có giá trị trung bình là 10,56 lít và độ lệch chuẩn hiệu chỉnh là0,587 lít Biết rằng phép ước lượng lượng xăng hao phí trung bình của
ô tô này khi đi từ A đến B đạt độ chính xác là 0,1 lít, hỏi độ tin cậycủa phép ước lượng đó là bao nhiêu?
0, 1√150
0, 587 = 2, 09Tra bảng Laplace ta có ϕ(zα
2) = ϕ(2, 09) = 0, 4817
⇒ 1 − α = 2ϕ(zα
2) = 0, 9634Vậy độ tin cậy của phép ước lượng trên là 96, 34%
Trang 22Khoảng tin cậy cho tỉ lệ tổng thể
Cho biến cố A với xác suất (tỉ lệ) xảy ra là p chưa biết Ước lượng tỷ lệ
là chỉ ra khoảng (f1, f2) chứa p sao cho P (f1 < p < f2) = 1 − α
Thực hiện n lần phép thử thì có m lần xuất hiện biến cố A
Ta có tần suất xuất hiện biến cố A là f = m
n Theo lý thuyết xác suất,thì thống kê:
(f − p)√npf(1 − f) ' N (0, 1)khi cỡ mẫu n đủ lớn
Trang 234.2 Ước lượng khoảng
4.2.3 Ước lượng khoảng cho tỉ lệ
Từ đó suy ra
P −zα
2 < (f − p)
√npf(1 − f) < zα2
Trang 24Quy tắc thực hành tìm khoảng tin cậy 1 − α cho tỷ lệ p
Trang 25Ví dụ
Quan sát ngẫu nhiên 200 lọ thuốc trong một lô hàng rất nhiều lọ thuốcthì thấy có 17 lọ không đạt tiêu chuẩn Với độ tin cậy 95%, hãy ướclượng tỉ lệ thuốc không đạt tiêu chuẩn?
zα 2
Trang 262
⇒ nmin
Trang 29Ví dụ
Khảo sát ngẫu nhiên 300 sản phẩm của một loại mặt hàng, ta thấy có
24 phế phẩm Cho biết độ chính xác của phép ước lượng tỉ lệ phế phẩmcủa mặt hàng đó là 4%, hỏi độ tin cậy của phép ước lượng trên là baonhiêu?
0, 04√300p0, 08(1 − 0, 08) = 2, 55
zα
2 = 2, 55 Laplace−→ ϕ
zα 2
= 0, 98922 = 98, 922%
Vậy độ tin cậy của ước lượng trên là 98, 9222%