BÀI 5: ƯỚC LƯỢNG CÁC THAM CỦA BIẾN NGẪU NHIÊN Mục tiêu - Hiểu rõ các phương pháp ước lượng điểm và ước lượng bằng khoảng tin cậy, cơ sở của các phương pháp này là xuất phát từ một suy
Trang 1BÀI 5:
ƯỚC LƯỢNG CÁC THAM CỦA BIẾN NGẪU NHIÊN Mục tiêu
- Hiểu rõ các phương pháp ước lượng điểm và ước lượng bằng khoảng tin cậy, cơ
sở của các phương pháp này là xuất phát từ một suy luận hợp lý nào đó và từ thực nghiệm,
- Nắm được thủ tục và các bước tiến hành bài toán ước lượng giá trị tham số dựa trên các tiêu chuẩn của hàm ước lượng và thông tin từ mẫu điều tra, cụ thể là: chọn đúng tham số và công thức cần sử dụng tìm khoảng tin cậy cho tham số tương ứng, biết phân tích và giải thích ý nghĩa lý thuyết và thực tế của các khoảng tin cậy,
Nội dung
I PHƯƠNG PHÁP ƯỚC LƯỢNG ĐIỂM
I.1 Phương pháp hàm ước lượng
I.1.1 Khái niệm
Giả sử biến ngẫu nhiên X tuân theo quy luật phân phối xác suất đã biết dạng, nhưng giá trị của tham số chưa biết Ta phải ước lượng thông qua các kết quả thực nghiệm
Muốn vậy ta thực hiện n phép thử độc lập về X Khi đó ta có mẫu ngẫu nhiên kích thước n
W = (X1; X2; ;Xi; ; Xn)
Từ mẫu này ta lập thống kê G fX1,X2, ,Xn,
Vì G là hàm của các biến ngẫu nhiên nên nó được gọi là hàm ước lượng của
Trang 2I.1.2 Các tiêu chuẩn lựa chọn hàm ước lượng
I.1.2.1 Ước lượng không chệch
Định nghĩa: Thống kê G được gọi là ước lượng không chệch của tham số của biến ngẫu nhiên X nếu E (G)
Ngược lại nếu E (G) thì G được gọi là ước lượng chệch của
Như vậy theo §4 chương 6, ta có thể rút ra 1 số kết luận sau:
* Trung bình mẫu X là ước lượng không chệch của kỳ vọng toán của biến ngẫu nhiên X
* Tần suất mẫu f là ước lượng không chệch của xác suất p trong trường hợp biến ngẫu nhiên gốc phân phối A(p)
* Phương sai mẫu S2 và phương sai S* 2 là ước lượng không chệch của phương sai 2
Thí dụ: Để ước lượng trung bình (m) của một phân phối gốc Người ta lập mẫu
ngẫu nhiên kích thước n = 2 và xây dựng các hàm ước lượng sau:
a 1 2
2
1 2
1
X X
b 1 1 2
3
2 3
1
X X
c 2 1 2
5
2 5
3
X X
Hãy chứng tỏ rằng các ước lượng này là không chệch của m
Giải
Từ biến ngẫu nhiên gốc X trong tổng thể, ta lập mẫu ngẫu nhiên kích
thước n = 2 Ta có: W = (X1; X2)
Khi đó ta có: E(X ) = E(X ) = E(X) = m
Trang 3V(X1) = V(X2) = V(X) = 2
Vậy:
m m m X
E
X E X
E X
E X E X X
E
X
E
2
1 2
1
)
(
2
1 2
1 2
1 2
1 2
1 2
1 )
X là ước lượng không chệch của m
Tương tự như X, ta dễ dàng thấy rằng G1 và G2 cũng là ước lượng không chệch của m
I.1.2.2 Ước lượng hiệu quả
Định nghĩa: Thống kê G được gọi là ước lượng hiệu quả nhất của tham số của biến ngẫu nhiên gốc X nếu nó là ước lượng không chệch và có phương sai nhỏ nhất so với mọi ước lượng không chệch khác được xây dựng trên cùng mẫu đó
Để xét xem G có phải là ước lượng hiệu quả nhất của tham số của biến ngẫu nhiên gốc X hay không ta cần phải tìm được giá trị nhỏ nhất có thể có của phương sai các hàm ước lượng
Người ta chứng minh được rằng:
+ Trung bình mẫu X là ước lượng hiệu quả nhất của kỳ vọng toán của biến ngẫu nhiên 2
;
+ Tần suất mẫu f là ước lượng hiệu quả nhất của xác suất P của biến ngẫu nhiên X~A(P)
Khi 2 ước lượng nào đó đều là các ước lượng không chệch của , song không phải
là ước lượng hiệu quả nhất thì có thể so sánh phương sai của chúng để tìm ra ước lượng hiệu quả hơn.Ước lượng nào có phương sai nhỏ hơn là ước lượng hiệu quả hơn
Trang 4Thí du: Trở lại thí dụ trong mục 1.2.1 Ta có các ước lượng X , G1 và G2 đều là các ước lượng không chệch của m Ta xét xem trong các ước lượng X , G1 và G2, ước lượng nào hiệu quả hơn
Ta có:
2 2
2 2
2
2 1
2 1
2 1
5 , 0 2 4
2 4
1 4
1
)
(
4
1 4
1 2
1 2
1 2
1 2
1 )
(
X
V
X V X
V X
V X V X X
V
X
V
2 2 2
52 , 0 25
13 ) (
; 56 , 0 9
Như vậy: V(X ) < V(G2) < V(G1), nên X hiệu quả hơn 2 ước lượng
G1 và G2
I.1.2.3 Ước lượng vững
Khi xét mẫu có kích thước n thì ta thấy mẫu càng lớn thống kê G của mẫu càng gần tham số cần ước lượng
Định nghĩa: Thống kê G được gọi là ước lượng vững của biến ngẫu nhiên X nếu G
hội tụ theo xác suất đến khi n
+ Trung bình mẫu là ước lượng vững của kỳ vọng toán của biên ngẫu nhiên gốc X tuân theo quy luật phân phối chuẩn, vì:
lim 1
P X
n
+ Tần suất mẫu f là ước lượng vững của biến ngẫu nhiên gốc X tuân theo quy luật A(P), vì: lim 1
P f P
n
Trang 5I.2 Phương pháp ước lượng hợp lý tối đa
Giả sử biết quy luật phân phối xác suất tổng quát của biến ngẫu nhiên gốc X dưới dạng hàm mật độ xác suất cần phải ước lượng của X Lập mẫu ngẫu nhiên kích thước n :
WX1,X2, ,Xn
Xây dựng hàm của đối số tại 1 giá trị cụ thể của mẫu
Lx1, x2, , xn, fx1, f x2, f x n,
Hàm L được gọi là hàm hợp lý của tham số Giá trị của hàm hợp lý chính là xác suất hay mật độ xác suất tại điểm x1,x2, ,xn Còn giá trị của thống kê G tại điểm đó:
g fx1,x2, ,xn
được gọi là ước lượng hợp lý tối đa của nếu ứng với giá trị này của , hàm hợp
lý đạt cực đại
* Các bước tìm giá trị của để hàm L đạt cực đại:
a Tìm đạo hàm bậc nhất của lnL theo
( vì L và lnL đạt cực đại tại cùng giá trị )
b Giải phương trình
lnL
= 0
Giả sử ta tìm được nghiệm: fx1;x2, x n
^
c Tìm đạo hàm bậc 2: 2ln2
Nếu tại ^ mà ln2 0
2
L
thì tại đó lnL đạt cực đại
Trang 6Khi đó 1 2 n
^
x , , x , x
f
là ước lượng hợp lý tối đa cần tìm của
I.3 Phương pháp ước lượng điểm
Sau khi xác định được hàm ước lượng G dùng để ước lượng tham số (G phải có các tính chất nêu trên, tối thiểu là tính không chệch) dựa vào mẫu tính được giá trị g của G và có thể lấy g làm giá trị xấp xỉ cho Cách ước lượng giá trị như vậy gọi là phương pháp ước lượng điểm
II PHƯƠNG PHÁP ƯỚC LƯỢNG BẰNG KHOẢNG TIN CẬY
II.1 Nội dung của phương pháp
Để ước lượng tham số của biến ngẫu nhiên gốc X trong tổng thể, người ta chọn thống kê G nào đó của mẫu, xây dựng 1 khoảng giá trị [T1;T2] sao cho với xác suất bằng 1 cho trước, khoảng trên thỏa mãn:
PT1 T21 (1)
Khi đó T1,T2 thỏa mãn (1) được gọi là khoảng tin cậy của ước lượng
Còn xác suất 1 được gọi là độ tin cậy (hệ số tin cậy) của ước lượng Để tìm khoảng tin cậy, ta xuất phát từ thống kê G của mẫu Xây dựng hàm hh,G, sao cho quy luật phân phối xác suất của nó đã biết và không phụ thuộc vào
II.2 Đường lối chung để tìm khoảng tin cậy
Bước 1: Từ tập hợp tổng quát ta rút ra 1 mẫu ngẫu nhiên kích thước n
Từ đó xác định thống kê G của mẫu để ước lượng
Bước 2: Chọn hàm hh,G sao cho quy luật phân phối xác suất của h đã biết
và không phụ thuộc vào tham số
Bước 3: Với độ tin cậy 1 cho trước, tìm cặp giá trị 1&2 thỏa mãn:
1 2
Trang 7Từ đó xác định cặp giá trị h1& h2 tương ứng sao cho:
Ph1hh21
Bước 4: Suy ra biểu thức tương đương:
PT1 T21
III ƯỚC LƯỢNG KỲ VỌNG TOÁN CỦA BIẾN NGẪU NHIÊN PHÂN PHỐI CHUẨN
Giả sử trong tổng thể biến ngẫu nhiên gốc X phân phối chuẩn 2
,
chưa biết tham số = E(X) của nó
Để xác định , từ tập hợp tổng quát ( từ tổng thể ) ta rút ra 1 mẫu ngẫu nhiên kích thước n:
WX1,X2, ,Xn
Từ mẫu ta xác định được trung bình mẫu X và độ lệch tiêu chuẩn mẫu S
Để chọn hàm h thích hợp ta xét 2 trường hợp sau:
III.1 Trường hợp đã biết phương sai của biến ngẫu nhiên X
Hàm h được chọn là:
n X
U
h Biến ngẫu nhiên U ~ N( 0 , 1 )
Với độ tin cậy 1 cho trước ta có thể tìm được cặp giá trị 1&2 sao cho
1 2
Từ đó ta tìm được 2 giá trị :
1
1
1 U
2
2 U
h
Với độ tin cậy 1 tham số của biến ngẫu nhiên gốc X sẽ nằm trong khoảng:
Trang 8 2; 1
U n X U n
Đây là khoảng tin cậy tổng quát Ta có các khoảng tin cậy đặc biệt là:
1 Khoảng tin cậy đối xứng:
2
2 1
2 2
U n X U
n X
2 Nếu 1 ;2 0 ta có khoảng tin cậy bên trái của (ước lượng tối đa)
1
U n X
3 Nếu 1 0;2 ta có khoảng tin cậy bên phải của (ước lượng tối thiểu)
1
U n X
P (5)
Minh họa hình học
- Khoảng tin cậy đối xứng (hình 1)
(hình 1)
- Khoảng tin cậy bên phải (hình 2), bên trái (hình 3)
2
T
2
2
2
1
1
T
Trang 91
1
T
( hình 2) (hình 3)
* Với cùng 1 độ tin cậy 1 hiển nhiên khoảng tin cậy nào ngắn hơn sẽ tốt hơn
Độ dài khoảng tin cậy ký hiệu là I, ta thấy I sẽ ngắn nhất khi khoảng tin cậy là đối xứng và I được xác định bằng công thức :
2
2
U n
I (6)
Từ (6) có thể tìm được kích thước mẫu tối thiểu n sao cho với độ tin cậy 1 cho trước, độ dài khoảng tin cậy không vượt quá giá trị I0 cho trước,
Khi đó: 2
2 2 0
2
4
U I
n (7)
Chú ý: Trong công thức (3) nếu ta ký hiệu:
2
n
(8)
thì được gọi là độ chính xác của ước lượng Nó phản ánh mức độ sai lệch của trung bình mẫu so với trung bình tổng thể với xác suất 1 cho trước
Thí dụ: Trọng lượng của 1 con sợi là 1 biến ngẫu nhiên phân phối chuẩn với độ
lệch chuẩn là 1 gam Cân thử 25 con sợi loại này ta thu được bảng số liệu:
2
T
2
Trang 10Trọng lượng (gam) 20 21 22 23
Với độ tin cậy 0,95, hãy tìm khoảng tin cậy đối xứng của trọng lượng trung bình
của các con sợi nói trên
Giải
Gọi X là:” Trọng lượng các con sợi”
Theo giả thiết 2
,
X , trong đó = E(X) là trọng lượng trung bình của các con sợi, μ chưa biết cần ước lượng
Đây là bài toán ước lượng bằng khoảng tin cậy đối xứng giá trị của tham số của biến ngẫu nhiên tuân theo quy luật phân phối chuẩn 2
,
N trong trường hợp đã biết
1
,
2
Khoảng tin cậy đối xứng của là :
2 2
U n X U
n X
Lấy từ tổng thể ra 1 mẫu ngẫu nhiên kích thước n = 25 Gọi Xi là trọng lượng của con sợi thứ i , i1,25 Ta có mẫu:
W X 1 , X 2 , , X 25
i i i i
X X
1 25
1
72 , 21 25
1 25
1
Với độ tin cậy (1 ) 0,95 0,025 1,96
2
Vậy khoảng tin cậy đối xứng của là
Trang 11 1,96
25
1 72 , 21
; 96 , 1 25
1 72 , 21
21,720,392;21,720,392
21,328;22,122 gam
Vậy với độ tin cậy 0,95, qua mẫu cụ thể, khoảng tin cậy đối xứng của trọng lượng trung bình của các con sợi là : 21,32822,122 gam
III.2 Trường hợp chưa biết phương sai của biến ngẫu nhiên gốc X trong tổng thể và kích thước mẫu n < 30
Ta chọn hàm h:
S
n X
T
h
trong đó X là trung bình mẫu; S là độ lệch tiêu chuẩn mẫu
Ta đã biết 1
~T n
T Với độ tin cậy 1 cho trước ta tìm được cặp giá trị
2
1&
sao cho: 12
Từ đó tìm được 2 giá trị tới hạn Student tương ứng là :
1
1
n t
h & 2
n t
h
Hoàn toàn tương tự mục (2.1) ở trên ta có khoảng tin cậy của với độ tin cậy
1 là :
1
2 ; n
n
t n
S X t n
S
Từ đó ta có khoảng tin cậy trong những trường hợp đặc biệt sau:
a Khoảng tin cậy đối xứng:
2
2 1
Trang 12
1
1 2 1
2
n n
t n
S X t
n
S X
b Khoảng tin cậy bên phải khi 1 ;2 0
1
1
n t n
S X
c Khoảng tin cậy bên trái khi1 0;2
1
1
n t n
S X
* Độ dài khoảng tin cậy ngắn nhất cũng bằng 2 lần độ chính xác và được xác định bằng biểu thức:
1
2
2
t n
S
I (12)
* Việc xác định kích thước mẫu tối thiểu n sao cho với độ tin cậy bằng 1 cho trước, độ dài khoảng tin cậy không vượt quá giá trị I0 cho trước được giải quyết bằng phương pháp mẫu kép dưới đây
Trước hết điều tra 1 mẫu sơ bộ m 2
W1X1,X2, ,Xm
Từ đó xác định phương sai mẫu của mẫu sơ bộ đó:
m
i
X m
S
1
2 2
1 1
Với :
m
i i
X m
X
1
1
Sau đó lập mẫu thứ 2 kích thước( n – m ): W2 Xm1,Xm2, ,Xn Người ta chứng minh được rằng:
Trang 131 1
~
1
m n
i i
T S
n X
n T
Khi đó ta có thể tìm được 1
2
m
t sao cho:
2 1
1 2 1
m n
i i m
n
i
n
S X n
t n
S X n P
Do đó: 1
2
t n
S
Từ đây ta suy ra kích thước mẫu cần tìm:
2 1 2 0
2
4
t I
S
n (13)
Như vậy, dựa vào mẫu sơ bộ đã có ta tìm được kích thước mẫu chính thức đáp ứng yêu cầu về chất lượng của ước lượng Trên thực tế chỉ cần điều tra tiếp mẫu thứ 2 có kích thước ( n – m ) là đủ
Chú ý: Trong trường hợp chưa biết 2của biến ngẫu nhiên gốc X và kích thước mẫu n > 30 thì trong các công thức (9, 10, 11, 12, 13 ) ta dùng U thay cho n 1
t
Thí dụ: Phỏng vấn 5 gia đình có 3 người về chi phí hàng tháng cho nhu yếu phẩm
thu được các số liệu sau: 150 ngàn đồng; 180 ngàn đồng; 200 ngàn đông; 250 ngàn đồng; 300 ngàn đồng
Vậy phải phỏng vấn bao nhiêu gia đình cùng loại để với độ tin cậy 95% sai số của việc ước lượng chi phí trung bình hàng tháng cho nhu yếu phẩm không vượt quá 30 ngàn đồng Giả thiết chi phí hàng tháng cho nhu yếu phẩm là biến ngẫu nhiên phân
phối chuẩn
Giải
Gọi X là chi phí hàng tháng cho nhu yếu phẩm 2
,
X
Trang 14 = E(X) chính là chi phí nhu yếu phẩm trung bình chưa biết cần ước lượng Đây
là bài toán xác định kích thước mẫu tối thiểu cho việc ước lượng tham số của phân phối 2
,
N khi chưa biết rõ 2
Theo phương pháp mẫu kép, từ mẫu sơ bộ kích thước n = 5 Ta có:
X 216 ngàn ; S2 3530; t04,9752,776
I0 2 2 30 60 ngàn
Theo công thức (12) ta có :
60 2,776 31
3530
Như vậy cần phỏng vấn thêm 31 – 5 = 26 gia đình nữa
IV ƢỚC LƢỢNG KỲ VỌNG TOÁN CỦA BIẾN NGẪU NHIÊN PHÂN PHỐI A(P)
Giả sử trong tổng thể biến ngẫu nhiên X phân phối A(P), với E(X) = p và
V(X) = P.(1-P), trong đó P chưa biết cần phải xác định
Để xác định P, từ tập hợp tổng quát ta rút ra mẫu ngẫu nhiên kích thước n:
WX1,X2, ,Xn
Với n khá lớn ta chọn:
) 1 , 0 (
~ ) 1
f
n P f U h
Tiến hành hoàn toàn tương tự bài 4 Ta có:
a Nếu
2
2 1
, khoảng tin cậy đối xứng của P là :
Trang 15
2 2
U n
f f f P U n
f f f
b Nếu 1 ;2 0, khoảng tin cậy bên trái (ULTĐ) của P:
n
f f f P
c Nếu 1 0;2 , khoảng tin cậy bên phải (ULTT) của P:
n
f f f
* Độ dài khoảng tin cậy ngắn nhất :
2
) 1 ( 2
n
f f
(17)
* Kích thước mẫu tối thiểu đảm bảo độ tin cậy bằng 1 cho trước và độ dài khoảng tin cậy không vượt quá giá trị I0 cho trước
2 2
0
) 1 ( 4
U I
f f
n (18)
Trong đó f là tần suất của mẫu sơ bộ kích thước m 2
Thí dụ: Kiểm tra ngẫu nhiên 400 sản phẩm của nhà máy A Ta thấy có 160 sản
phẩm loại I Hãy ước lượng tỷ lệ sản phẩm loại I tối đa của nhà máy với độ tin cậy 0,95
Giải
Gọi P là tỷ lệ sản phẩm loại I của nhà máy
Bài toán yêu cầu ước lượng tham số P của một biến ngẫu nhiên phân phối theo quy luật A(P) bằng khoảng tin cậy tối đa