BÀI 5: ƯỚC LƯỢNG CÁC THAM CỦA BIẾN NGẪU NHIÊN

BÀI 5: ƯỚC LƯỢNG CÁC THAM CỦA BIẾN NGẪU NHIÊN Mục tiêu - Hiểu rõ các phương pháp ước lượng điểm và ước lượng bằng khoảng tin cậy, cơ sở của các phương pháp này là xuất phát từ một suy

Trang 1

BÀI 5:

ƯỚC LƯỢNG CÁC THAM CỦA BIẾN NGẪU NHIÊN Mục tiêu

- Hiểu rõ các phương pháp ước lượng điểm và ước lượng bằng khoảng tin cậy, cơ

sở của các phương pháp này là xuất phát từ một suy luận hợp lý nào đó và từ thực nghiệm,

- Nắm được thủ tục và các bước tiến hành bài toán ước lượng giá trị tham số dựa trên các tiêu chuẩn của hàm ước lượng và thông tin từ mẫu điều tra, cụ thể là: chọn đúng tham số và công thức cần sử dụng tìm khoảng tin cậy cho tham số tương ứng, biết phân tích và giải thích ý nghĩa lý thuyết và thực tế của các khoảng tin cậy,

Nội dung

I PHƯƠNG PHÁP ƯỚC LƯỢNG ĐIỂM

I.1 Phương pháp hàm ước lượng

I.1.1 Khái niệm

Giả sử biến ngẫu nhiên X tuân theo quy luật phân phối xác suất đã biết dạng, nhưng giá trị của tham số  chưa biết Ta phải ước lượng  thông qua các kết quả thực nghiệm

Muốn vậy ta thực hiện n phép thử độc lập về X Khi đó ta có mẫu ngẫu nhiên kích thước n

W = (X1; X2; ;Xi; ; Xn)

Từ mẫu này ta lập thống kê G fX1,X2, ,Xn,

Vì G là hàm của các biến ngẫu nhiên nên nó được gọi là hàm ước lượng của 

Trang 2

I.1.2 Các tiêu chuẩn lựa chọn hàm ước lượng

I.1.2.1 Ước lượng không chệch

Định nghĩa: Thống kê G được gọi là ước lượng không chệch của tham số  của biến ngẫu nhiên X nếu E (G) 

Ngược lại nếu E (G)  thì G được gọi là ước lượng chệch của 

Như vậy theo §4 chương 6, ta có thể rút ra 1 số kết luận sau:

* Trung bình mẫu X là ước lượng không chệch của kỳ vọng toán của biến ngẫu nhiên X

* Tần suất mẫu f là ước lượng không chệch của xác suất p trong trường hợp biến ngẫu nhiên gốc phân phối A(p)

* Phương sai mẫu S2 và phương sai S* 2 là ước lượng không chệch của phương sai 2



Thí dụ: Để ước lượng trung bình (m) của một phân phối gốc Người ta lập mẫu

ngẫu nhiên kích thước n = 2 và xây dựng các hàm ước lượng sau:

a 1 2

2

1 2

1

X X

b 1 1 2

3

2 3

1

X X

c 2 1 2

5

2 5

3

X X

Hãy chứng tỏ rằng các ước lượng này là không chệch của m

Giải

Từ biến ngẫu nhiên gốc X trong tổng thể, ta lập mẫu ngẫu nhiên kích

thước n = 2 Ta có: W = (X1; X2)

Khi đó ta có: E(X ) = E(X ) = E(X) = m

Trang 3

V(X1) = V(X2) = V(X) = 2

Vậy:

m m m X

E

X E X

E X

E X E X X

E

X

E



















































2

1 2

1

)

(

2

1 2

1 )

 X là ước lượng không chệch của m

Tương tự như X, ta dễ dàng thấy rằng G1 và G2 cũng là ước lượng không chệch của m

I.1.2.2 Ước lượng hiệu quả

Định nghĩa: Thống kê G được gọi là ước lượng hiệu quả nhất của tham số  của biến ngẫu nhiên gốc X nếu nó là ước lượng không chệch và có phương sai nhỏ nhất so với mọi ước lượng không chệch khác được xây dựng trên cùng mẫu đó

Để xét xem G có phải là ước lượng hiệu quả nhất của tham số  của biến ngẫu nhiên gốc X hay không ta cần phải tìm được giá trị nhỏ nhất có thể có của phương sai các hàm ước lượng

Người ta chứng minh được rằng:

+ Trung bình mẫu X là ước lượng hiệu quả nhất của kỳ vọng toán  của biến ngẫu nhiên  2

;

+ Tần suất mẫu f là ước lượng hiệu quả nhất của xác suất P của biến ngẫu nhiên X~A(P)

Khi 2 ước lượng nào đó đều là các ước lượng không chệch của , song không phải

là ước lượng hiệu quả nhất thì có thể so sánh phương sai của chúng để tìm ra ước lượng hiệu quả hơn.Ước lượng nào có phương sai nhỏ hơn là ước lượng hiệu quả hơn

Trang 4

Thí du: Trở lại thí dụ trong mục 1.2.1 Ta có các ước lượng X , G1 và G2 đều là các ước lượng không chệch của m Ta xét xem trong các ước lượng X , G1 và G2, ước lượng nào hiệu quả hơn

Ta có:

2 2

2

2 1

5 , 0 2 4

2 4

1 4

1

)

(

4

1 4

1 2

1 )

(

















































X

V

X V X

V X

V X V X X

V

X

V

2 2 2

52 , 0 25

13 ) (

; 56 , 0 9

Như vậy: V(X ) < V(G2) < V(G1), nên X hiệu quả hơn 2 ước lượng

G1 và G2

I.1.2.3 Ước lượng vững

Khi xét mẫu có kích thước n thì ta thấy mẫu càng lớn thống kê G của mẫu càng gần tham số  cần ước lượng

Định nghĩa: Thống kê G được gọi là ước lượng vững của biến ngẫu nhiên X nếu G

hội tụ theo xác suất đến  khi n

+ Trung bình mẫu là ước lượng vững của kỳ vọng toán của biên ngẫu nhiên gốc X tuân theo quy luật phân phối chuẩn, vì:

lim    1



 P X  

n

+ Tần suất mẫu f là ước lượng vững của biến ngẫu nhiên gốc X tuân theo quy luật A(P), vì: lim    1



 P f P 

n

Trang 5

I.2 Phương pháp ước lượng hợp lý tối đa

Giả sử biết quy luật phân phối xác suất tổng quát của biến ngẫu nhiên gốc X dưới dạng hàm mật độ xác suất  cần phải ước lượng  của X Lập mẫu ngẫu nhiên kích thước n :

WX1,X2, ,Xn

Xây dựng hàm của đối số  tại 1 giá trị cụ thể của mẫu

Lx1, x2, , xn, fx1, f x2,  f x n,

Hàm L được gọi là hàm hợp lý của tham số  Giá trị của hàm hợp lý chính là xác suất hay mật độ xác suất tại điểm x1,x2, ,xn Còn giá trị của thống kê G tại điểm đó:

g fx1,x2, ,xn

được gọi là ước lượng hợp lý tối đa của  nếu ứng với giá trị này của , hàm hợp

lý đạt cực đại

* Các bước tìm giá trị của  để hàm L đạt cực đại:

a Tìm đạo hàm bậc nhất của lnL theo 

( vì L và lnL đạt cực đại tại cùng giá trị  )

b Giải phương trình





lnL

= 0

Giả sử ta tìm được nghiệm: fx1;x2, x n

^







c Tìm đạo hàm bậc 2: 2ln2





Nếu tại  ^ mà ln2 0

2







L

thì tại đó lnL đạt cực đại

Trang 6

Khi đó  1 2 n

^

x , , x , x

f



 là ước lượng hợp lý tối đa cần tìm của 

I.3 Phương pháp ước lượng điểm

Sau khi xác định được hàm ước lượng G dùng để ước lượng tham số  (G phải có các tính chất nêu trên, tối thiểu là tính không chệch) dựa vào mẫu tính được giá trị g của G và có thể lấy g làm giá trị xấp xỉ cho  Cách ước lượng giá trị  như vậy gọi là phương pháp ước lượng điểm

II PHƯƠNG PHÁP ƯỚC LƯỢNG BẰNG KHOẢNG TIN CẬY

II.1 Nội dung của phương pháp

Để ước lượng tham số  của biến ngẫu nhiên gốc X trong tổng thể, người ta chọn thống kê G nào đó của mẫu, xây dựng 1 khoảng giá trị [T1;T2] sao cho với xác suất bằng 1 cho trước, khoảng trên thỏa mãn:

PT1 T21 (1)

Khi đó T1,T2 thỏa mãn (1) được gọi là khoảng tin cậy của ước lượng

Còn xác suất 1 được gọi là độ tin cậy (hệ số tin cậy) của ước lượng Để tìm khoảng tin cậy, ta xuất phát từ thống kê G của mẫu Xây dựng hàm hh,G, sao cho quy luật phân phối xác suất của nó đã biết và không phụ thuộc vào 

II.2 Đường lối chung để tìm khoảng tin cậy

Bước 1: Từ tập hợp tổng quát ta rút ra 1 mẫu ngẫu nhiên kích thước n

Từ đó xác định thống kê G của mẫu để ước lượng 

Bước 2: Chọn hàm hh,G sao cho quy luật phân phối xác suất của h đã biết

và không phụ thuộc vào tham số 

Bước 3: Với độ tin cậy 1 cho trước, tìm cặp giá trị 1&2 thỏa mãn:



1 2 

Trang 7

Từ đó xác định cặp giá trị h1& h2 tương ứng sao cho:

Ph1hh21

Bước 4: Suy ra biểu thức tương đương:

PT1 T21

III ƯỚC LƯỢNG KỲ VỌNG TOÁN CỦA BIẾN NGẪU NHIÊN PHÂN PHỐI CHUẨN

Giả sử trong tổng thể biến ngẫu nhiên gốc X phân phối chuẩn  2

,

chưa biết tham số  = E(X) của nó

Để xác định , từ tập hợp tổng quát ( từ tổng thể ) ta rút ra 1 mẫu ngẫu nhiên kích thước n:

WX1,X2, ,Xn

Từ mẫu ta xác định được trung bình mẫu  X và độ lệch tiêu chuẩn mẫu  S

Để chọn hàm h thích hợp ta xét 2 trường hợp sau:

III.1 Trường hợp đã biết phương sai của biến ngẫu nhiên X

Hàm h được chọn là:

 



 n X

U

h   Biến ngẫu nhiên U ~ N( 0 , 1 )

Với độ tin cậy 1 cho trước ta có thể tìm được cặp giá trị 1&2 sao cho



1 2 

Từ đó ta tìm được 2 giá trị :

1

1 U  

2

2 U

h 

Với độ tin cậy 1 tham số  của biến ngẫu nhiên gốc X sẽ nằm trong khoảng:

Trang 8

   2;   1

U n X U n

Đây là khoảng tin cậy tổng quát Ta có các khoảng tin cậy đặc biệt là:

1 Khoảng tin cậy đối xứng:

2

2 1



      















2 2

U n X U

n X

2 Nếu 1 ;2 0 ta có khoảng tin cậy bên trái của  (ước lượng tối đa)

   









  

1

U n X

3 Nếu 1 0;2  ta có khoảng tin cậy bên phải của  (ước lượng tối thiểu)

    









1

U n X

P (5)

Minh họa hình học

- Khoảng tin cậy đối xứng (hình 1)

(hình 1)

- Khoảng tin cậy bên phải (hình 2), bên trái (hình 3)

2

T

2



  2

1



 

1

T

Trang 9

1 

1

T

( hình 2) (hình 3)

* Với cùng 1 độ tin cậy 1 hiển nhiên khoảng tin cậy nào ngắn hơn sẽ tốt hơn

Độ dài khoảng tin cậy ký hiệu là I, ta thấy I sẽ ngắn nhất khi khoảng tin cậy là đối xứng và I được xác định bằng công thức :

2





U n

I  (6)

Từ (6) có thể tìm được kích thước mẫu tối thiểu n sao cho với độ tin cậy 1 cho trước, độ dài khoảng tin cậy không vượt quá giá trị I0 cho trước,

Khi đó: 2

2 2 0

2

4





U I

n (7)

Chú ý: Trong công thức (3) nếu ta ký hiệu:

2





n

 (8)

thì  được gọi là độ chính xác của ước lượng Nó phản ánh mức độ sai lệch của trung bình mẫu so với trung bình tổng thể với xác suất 1 cho trước

Thí dụ: Trọng lượng của 1 con sợi là 1 biến ngẫu nhiên phân phối chuẩn với độ

lệch chuẩn là 1 gam Cân thử 25 con sợi loại này ta thu được bảng số liệu:

2

T



2 

Trang 10

Trọng lượng (gam) 20 21 22 23

Với độ tin cậy 0,95, hãy tìm khoảng tin cậy đối xứng của trọng lượng trung bình

của các con sợi nói trên

Giải

Gọi X là:” Trọng lượng các con sợi”

Theo giả thiết  2

,

X , trong đó  = E(X) là trọng lượng trung bình của các con sợi, μ chưa biết cần ước lượng

Đây là bài toán ước lượng bằng khoảng tin cậy đối xứng giá trị của tham số  của biến ngẫu nhiên tuân theo quy luật phân phối chuẩn  2

,



N trong trường hợp đã biết

 1

,

2  

Khoảng tin cậy đối xứng của  là :

     















2 2

U n X U

n X

Lấy từ tổng thể ra 1 mẫu ngẫu nhiên kích thước n = 25 Gọi Xi là trọng lượng của con sợi thứ i , i1,25 Ta có mẫu:

W X 1 , X 2 , , X 25





i i i i

X X

1 25

1

72 , 21 25

1 25

1

Với độ tin cậy (1 ) 0,95 0,025 1,96

2







Vậy khoảng tin cậy đối xứng của  là

Trang 11

   1,96

25

1 72 , 21

; 96 , 1 25

1 72 , 21

21,720,392;21,720,392

21,328;22,122 gam

Vậy với độ tin cậy 0,95, qua mẫu cụ thể, khoảng tin cậy đối xứng của trọng lượng trung bình của các con sợi là : 21,32822,122 gam

III.2 Trường hợp chưa biết phương sai của biến ngẫu nhiên gốc X trong tổng thể và kích thước mẫu n < 30

Ta chọn hàm h:

 

S

n X

T

h  

trong đó X là trung bình mẫu; S là độ lệch tiêu chuẩn mẫu

Ta đã biết  1

~T n

T Với độ tin cậy 1 cho trước ta tìm được cặp giá trị

2

1&

 sao cho: 12 

Từ đó tìm được 2 giá trị tới hạn Student tương ứng là :

 1

1



 n t

h  &  2



 n t

h 

Hoàn toàn tương tự mục (2.1) ở trên ta có khoảng tin cậy của  với độ tin cậy

1 là :

   









1

2 ; n

n

t n

S X t n

S

Từ đó ta có khoảng tin cậy trong những trường hợp đặc biệt sau:

a Khoảng tin cậy đối xứng:

2

2 1



Trang 12

     















1

1 2 1

2

n n

t n

S X t

n

S X

b Khoảng tin cậy bên phải khi 1 ;2 0

   

















1

n t n

S X

c Khoảng tin cậy bên trái khi1 0;2 

    















1

n t n

S X

* Độ dài khoảng tin cậy ngắn nhất cũng bằng 2 lần độ chính xác và được xác định bằng biểu thức:

 1

2

t n

S

I   (12)

* Việc xác định kích thước mẫu tối thiểu n sao cho với độ tin cậy bằng 1 cho trước, độ dài khoảng tin cậy không vượt quá giá trị I0 cho trước được giải quyết bằng phương pháp mẫu kép dưới đây

Trước hết điều tra 1 mẫu sơ bộ m 2

W1X1,X2, ,Xm

Từ đó xác định phương sai mẫu của mẫu sơ bộ đó:

  





 m

i

X m

S

1

2 2

1 1

Với : 



 m

i i

X m

X

1

Sau đó lập mẫu thứ 2 kích thước( n – m ): W2 Xm1,Xm2, ,Xn Người ta chứng minh được rằng:

Trang 13

1  1

~

1















m n

i i

T S

n X

n T



Khi đó ta có thể tìm được  1

2



m

t sao cho:

     



















2 1

1 2 1

m n

i i m

n

i

n

S X n

t n

S X n P

Do đó:  1

2

t n

S

Từ đây ta suy ra kích thước mẫu cần tìm:

 

2 1 2 0

2

4













t I

S

n  (13)

Như vậy, dựa vào mẫu sơ bộ đã có ta tìm được kích thước mẫu chính thức đáp ứng yêu cầu về chất lượng của ước lượng Trên thực tế chỉ cần điều tra tiếp mẫu thứ 2 có kích thước ( n – m ) là đủ

Chú ý: Trong trường hợp chưa biết 2của biến ngẫu nhiên gốc X và kích thước mẫu n > 30 thì trong các công thức (9, 10, 11, 12, 13 ) ta dùng U thay cho n 1

t

Thí dụ: Phỏng vấn 5 gia đình có 3 người về chi phí hàng tháng cho nhu yếu phẩm

thu được các số liệu sau: 150 ngàn đồng; 180 ngàn đồng; 200 ngàn đông; 250 ngàn đồng; 300 ngàn đồng

Vậy phải phỏng vấn bao nhiêu gia đình cùng loại để với độ tin cậy 95% sai số của việc ước lượng chi phí trung bình hàng tháng cho nhu yếu phẩm không vượt quá 30 ngàn đồng Giả thiết chi phí hàng tháng cho nhu yếu phẩm là biến ngẫu nhiên phân

phối chuẩn

Giải

Gọi X là chi phí hàng tháng cho nhu yếu phẩm  2

,

X

Trang 14

 = E(X) chính là chi phí nhu yếu phẩm trung bình chưa biết cần ước lượng Đây

là bài toán xác định kích thước mẫu tối thiểu cho việc ước lượng tham số  của phân phối  2

,



N khi chưa biết rõ 2

Theo phương pháp mẫu kép, từ mẫu sơ bộ kích thước n = 5 Ta có:

X 216 ngàn ; S2 3530; t04,9752,776

I0  2  2 30  60 ngàn

Theo công thức (12) ta có :

 60 2,776 31

3530













Như vậy cần phỏng vấn thêm 31 – 5 = 26 gia đình nữa

IV ƢỚC LƢỢNG KỲ VỌNG TOÁN CỦA BIẾN NGẪU NHIÊN PHÂN PHỐI A(P)

Giả sử trong tổng thể biến ngẫu nhiên X phân phối A(P), với E(X) = p và

V(X) = P.(1-P), trong đó P chưa biết cần phải xác định

Để xác định P, từ tập hợp tổng quát ta rút ra mẫu ngẫu nhiên kích thước n:

WX1,X2, ,Xn

Với n khá lớn ta chọn:

 

) 1 , 0 (

~ ) 1

f

n P f U h





 Tiến hành hoàn toàn tương tự bài 4 Ta có:

a Nếu

2

2 1



   , khoảng tin cậy đối xứng của P là :

Trang 15

  















2 2

U n

f f f P U n

f f f

b Nếu 1 ;2 0, khoảng tin cậy bên trái (ULTĐ) của P:

 















n

f f f P

c Nếu 1 0;2 , khoảng tin cậy bên phải (ULTT) của P:

















n

f f f

* Độ dài khoảng tin cậy ngắn nhất :

2

) 1 ( 2

n

f f



 (17)

* Kích thước mẫu tối thiểu đảm bảo độ tin cậy bằng 1 cho trước và độ dài khoảng tin cậy không vượt quá giá trị I0 cho trước











 

2 2

0

) 1 ( 4



U I

f f

n (18)

Trong đó f là tần suất của mẫu sơ bộ kích thước m 2

Thí dụ: Kiểm tra ngẫu nhiên 400 sản phẩm của nhà máy A Ta thấy có 160 sản

phẩm loại I Hãy ước lượng tỷ lệ sản phẩm loại I tối đa của nhà máy với độ tin cậy 0,95

Giải

Gọi P là tỷ lệ sản phẩm loại I của nhà máy

Bài toán yêu cầu ước lượng tham số P của một biến ngẫu nhiên phân phối theo quy luật A(P) bằng khoảng tin cậy tối đa

Định dạng
Số trang	20
Dung lượng	490,55 KB