Phân phối xác suất của ? được xác định nếu ta tìm được hay ước lượng được giá trị của ?.. Ngay cả trong trường hợp ta chưa biết gì về phân phối của ?, khi đó biết được các tham số đặc tr
Trang 1Chương 5 Ước lượng tham số
khoảng tin cậy
Trang 2Giả sử 𝑋 là biến ngẫu nhiên có dạng phân phối xác suất
𝑃𝑋(𝜃) đã biết, nhưng phụ thuộc vào một hay một vài tham
số 𝜃 chưa biết, chẳng hạn 𝑋 ∼ 𝑃 𝜆 , 𝜃 = 𝜆; 𝑋 ∼ 𝑁 𝜇; 𝜎2 ,
𝜃 = 𝜇; 𝜎2 Phân phối xác suất của 𝑋 được xác định nếu ta tìm được hay ước lượng được giá trị của 𝜃
Ngay cả trong trường hợp ta chưa biết gì về phân phối của
𝑋, khi đó biết được các tham số đặc trưng của 𝑋 là rất giá trị Vì vậy bài toán đi tìm các ước lượng cho các tham ẩn của phân phối hoặc ước lượng các tham số đặc trưng của biến ngẫu nhiên là bài toán rất cần thiết
Trang 3§1 Phương pháp ước lượng điểm
(sinh viên tự nghiên cứu)
Bài toán tìm một thống kê 𝜃 (𝑋1, 𝑋2, … , 𝑋𝑛) để thay thế (ước lượng) tham số 𝜃 chưa biết được gọi là bài toán ước lượng điểm của 𝜃
Do giá trị đúng của 𝜃 chưa biết nên không thể so sánh 𝜃 với 𝜃 để đánh giá chất lượng của 𝜃 , vì vậy người ta đưa
ra các tiêu chuẩn sau
Trang 41 Ước lượng không chệch
Định nghĩa: Thống kê 𝜃 được gọi là ước lượng không chệch của 𝜃 nếu 𝑬 𝜽 = 𝜽
Ví dụ 1:
• 𝑋 là ước lượng không chệch của 𝑚
• 𝑆2 và 𝑆∗2 là các ước lượng không chệch của 𝜎2
• 𝑓 là ước lượng không chệch của 𝑝
Trang 5
Ý nghĩa: Từ định nghĩa trên ta có 𝐸 𝜃 − 𝜃 = 0 (trung bình của độ lệch (sai số) giữa ước lượng với giá trị thật bằng 0) Sai
số trung bình bằng 0 được gọi là sai số ngẫu nhiên, ngược lại gọi là sai số hệ thống Như vậy 𝜃 là ước lượng không chệch
của 𝜃 khi sai số ước lượng là sai số ngẫu nhiên
Chú ý rằng 𝜃 là ước lượng không chệch của 𝜃 không có nghĩa là mọi giá trị của 𝜃 đều trùng khít với 𝜃 mà chỉ có nghĩa rằng trung bình các giá trị của 𝜃 bằng 𝜃 Từng giá trị của 𝜃 có thể sai lệch rất lớn so với 𝜃
Trang 6
2 Ước lượng vững
Định nghĩa: Thống kê 𝜃 được gọi là ước lượng vững của
𝜃 nếu 𝜃 hội tụ theo xác suất đến 𝜃 khi 𝑛 → ∞ Tức là, với
∀ɛ > 0 bé tùy ý ta luôn có:
lim𝑛→∞ 𝑃 𝜃 − 𝜃 < ɛ = 1
Ví dụ 2: Theo luật số lớn của Trêbưsép và luật số lớn của
Becnulli ta có trung bình mẫu 𝑋 là ước lượng vững của trung bình tổng thể 𝑚 và tần suất mẫu là ước lượng vững của tần suất tổng thể 𝑝
Trang 7
Chú ý: Trong trường hợp 𝜃 là ước lượng không chệch của 𝜃
thì để tìm ước lượng vững có thể sử dụng kết quả sau:
Nếu 𝜃 là ước lượng không chệch của 𝜃 và lim
𝑛→∞ 𝑉 𝜃 = 0
thì 𝜃 là ước lượng vững của 𝜃
Trang 83 Ước lượng hiệu quả
Định nghĩa: Thống kê 𝜃 được gọi là ước lượng hiệu quả của 𝜃 nếu nó là ước lượng không chệch và có phương sai
bé nhất trong các ước lượng không chệch của 𝜃
Nếu hàm mật độ xác suất của 𝑋 thỏa mãn một số điều
Trang 9§2 Phương pháp ước lượng bằng khoảng tin cậy
1 Bài toán ước lượng khoảng
Cho xác suất 1 − 𝛼, từ mẫu ngẫu nhiên 𝑋1, 𝑋2, … , 𝑋𝑛 tìm các thống kê 𝐺1 𝑋1, 𝑋2, … , 𝑋𝑛 , 𝐺2 𝑋1, 𝑋2, … , 𝑋𝑛sao cho:
𝑷 𝑮𝟏 < 𝜽 < 𝑮𝟐 = 𝟏 − 𝜶
Ta gọi:
𝟏 − 𝜶: độ tin cậy của ước lượng,
(𝑮𝟏; 𝑮𝟐): khoảng tin cậy của ước lượng,
𝑮𝟐 − 𝑮𝟏: độ dài khoảng tin cậy
Trang 102 Khoảng tin cậy cho kỳ vọng toán của biến ngẫu
nhiên có phân phối chuẩn
Trang 11từ đó: 𝑃 𝑢1−𝛼1 < 𝑈 < 𝑢𝛼2 = 1 − 𝛼
⟺ 𝑃 −𝑢𝛼1 < 𝑿 −𝝁 𝒏
𝝈 < 𝑢𝛼2 = 1 − 𝛼 ⟺ 𝑃 𝑋 − 𝜎𝑛 𝑢𝛼2 < 𝜇 < 𝑋 + 𝜎
Trang 12Trong thực hành người ta thường sử dụng các dạng khoảng tin cậy sau:
Khoảng tin cậy đối xứng (𝜶𝟏 = 𝜶𝟐 = 𝜶
Trang 13Chú ý:
+) Ở khoảng tin cậy đối xứng, ta gọi ɛ = 𝝈
𝒏 𝒖𝜶
𝟐 là độ chính xác của ước lượng, khi đó độ dài của khoảng
tin cậy đối xứng là 𝑰 = 𝟐ɛ = 𝟐 𝝈
𝟐
ɛ𝟐 + 𝟏
(kí hiệu 𝑥 : phần nguyên của 𝑥, là số nguyên lớn nhất không vượt quá 𝑥; [2,45] = 2)
Trang 14Ví dụ 1: Trọng lượng một loại sản phẩm là biến ngẫu nhiên phân phối theo quy luật chuẩn với độ lệch chuẩn là 1 gam Cân thử 25 sản phẩm loại này thu được kết quả sau:
Với độ tin cậy 0,95 hãy:
a) Tìm khoảng tin cậy đối xứng của trọng lượng trung bình của loại sản phẩm nói trên
b) Ước lượng trọng lượng trung bình tối đa của loại sản phẩm nói trên
c) Nếu yêu cầu độ chính xác của ước lượng không vượt quá 0,1 thì phải điều tra một mẫu kích thước bằng bao nhiêu?
Trang 15b) Trường hợp chưa biết phương sai 𝝈𝟐
Ta thường dùng các khoảng tin cậy sau:
Trang 16Chú ý: Với cỡ mẫu 𝑛 > 30, khi đó do phân phối Student xấp
xỉ với phân phối Chuẩn hóa nên có thể dùng các giá trị phân phối chuẩn hóa để thay thế cho các giá trị của phân phối
Student trong các khoảng tin cậy ở trên
Khoảng tin cậy đối xứng:
Trang 17Bài toán: Biết 1 − 𝛼, 𝜀0 tìm kích thước mẫu cần điều tra 𝑛, sao cho 𝜀 ≤ 𝜀0
Giải.
Giả sử hiện có một mẫu cỡ 𝑛0 Khi đó, ta có:
𝒏 = 𝑺.𝒕𝜶 𝟐
(𝒏𝟎−𝟏) 𝜺
Trang 18Ví dụ 2: Lượng xăng hao phí của một ôtô đi từ A đến B sau
30 lần chạy, kết quả cho trong bảng:
Giả sử lượng xăng hao phí này là biến ngẫu nhiên phân phối chuẩn Với độ tin cậy 95%
a) Ước lượng lượng xăng hao phí trung bình của ôtô đi từ A đến B
b) Ước lượng lượng xăng hao phí trung bình tối thiểu của
Trang 193 Khoảng tin cậy cho phương sai của bnn phân phối chuẩn
Trang 20b) Trường hợp chưa biết 𝝁
Ta thường dùng các khoảng tin cậy sau:
Khoảng tin cậy:
Trang 21Ví dụ 3: Mức hao phí nguyên liệu cho một đơn vị sản phẩm là biến ngẫu nhiên phân phối chuẩn Để ước lượng mức độ phân tán của mức hao phí này người ta cân thử
25 sản phẩm và thu được kết quả sau:
Với độ tin cậy 90% hãy tìm khoảng tin cậy cho độ phân tán của mức hao phí nguyên liệu cho một đơn vị sản phẩm trong hai trường hợp sau:
a) Biết μ = 20
b) Chưa biết μ
Hao phí nguyên liệu (gam) 19,5 20 20,5
Trang 224 Khoảng tin cậy cho tỉ lệ
Giả sử tỉ lệ 𝑝 của tổng thể chưa biết, với độ tin cậy
1 − 𝛼 tìm khoảng tin cậy cho 𝑝
Với cỡ mẫu 𝑛, tần suất mẫu 𝑓 thỏa mãn 𝑛𝑓 ≥ 10 và 𝑛(1 − 𝑓) ≥ 10, ta có:
(với 𝛼1 + 𝛼2 = 𝛼)
Trang 23Ta thường dùng các khoảng tin cậy sau:
Khoảng tin cậy đối xứng:
Trang 24Bài toán: Biết 1 − 𝛼, ɛ0, tìm cỡ mẫu tối thiểu 𝑛 sao cho
Trang 25Ví dụ 4: Kiểm tra ngẫu nhiên 400 sản phẩm do một máy sản xuất thấy có 20 phế phẩm Với độ tin cậy 0,95 hãy ước lượng:
a) Tỷ lệ phế phẩm của máy bằng khoảng tin cậy đối xứng
b) Tỷ lệ phế phẩm tối đa của máy
Trang 26
Ví dụ 5: Một vùng có 2000 gia đình Để điều tra nhu cầu tiêu dùng một loại hàng hóa tại vùng đó người ta nghiên cứu ngẫu nhiên 100 gia đình và thấy có 60 gia đình có nhu cầu về loại hàng hóa trên Với độ tin cậy 0,95 hãy ước lượng bằng khoảng tin cậy đối xứng số gia đình trong vùng có nhu cầu về loại hàng hóa đó