Một trong những phương pháp chọn hợp lý là phương pháp mômen, theo phương pháp này một số đặc trưng bằng số quan trọng nhất các mômen của phân bố lý thuyết được cho bằng các đặc trưng t
Trang 1OPEN (1, FILE = ‘bang1_1.tke’)
Giả sử cần nghiên cứu đại lượng ngẫu nhiên X nào đó mà luật
phân bố của nó chưa biết trước đích xác, phải xác định quy luật đó từ thí nghiệm hay kiểm tra bằng thực nghiệm giả thuyết về một quy luật nào
đó Khi đó, người ta làm một loạt thí nghiệm với đại lượng ngẫu nhiên
X và trong mỗi thí nghiệm (quan trắc), đại lượng X nhận một giá trị nhất định Tập hợp các số liệu quan trắc của đại lượng được gọi là tập
hợp thống kê đơn giản hay chuỗi thống kê đơn giản Thông thường, tập
hợp thống kê đơn giản được trình bày dưới dạng bảng
2.1 Hàm phân bố thống kê
Hàm phân bố thống kê của đại lượng ngẫu nhiên X là tần suất của
sự kiện X < x trong chuỗi thống kê đó
( ) x P ( X x )
F∗ = ∗ < (2.1)
Để tìm giá trị của hàm phân bố thống kê ứng với x cho trước chỉ
cần đếm số quan trắc mà trong đó đại lượng X nhận giá trị nhỏ hơn x
và chia cho tổng số quan trắc đã thực hiện n
Hàm phân bố thống kê của đại lượng ngẫu nhiên bất kỳ - rời rạc hay liên tục - sẽ là một hàm bậc thang gián đoạn (hình 2.1) Khi tăng số quan
Trang 2trắc n , theo định lý Becnuli, với x bất kỳ tần suất sự kiện X <x tiến
dần tới xác suất (hội tụ về xác suất) của sự kiện đó Do đó, khi tăng n
hàm phân bố thống kê F∗( x) sẽ tiến tới hàm phân bố thực thụ F ( x) của
đại lượng ngẫu nhiên X
x
F*(x)
1
Hình 2.1 Biểu diễn hàm phân bố thống kê
Nếu số quan trắc lớn (cỡ vài trăm quan trắc) tập hợp thống kê đơn
giản sẽ cồng kềnh và ít trực quan, người ta phải sơ lược xử lý nó và xây
dựng “chuỗi thống kê” dưới dạng bảng như sau:
và dựa vào bảng này mà xây dựng tổ chức đồ (histogram) (hình 2.2) Khi
tăng số quan trắc tổ chức đồ sẽ là đồ thị của hàm mật độ phân bố đại
lượng ngẫu nhiên X
Từ chuỗi thống kê hay tổ chức đồ, có thể nhận được đồ thị gần đúng
của hàm phân bố thống kê (hình 2.3)
x p
Hình 2.2 Tổ chức đồ thống kê
x
F*(x)
1
Hình 2.3 Đồ thị gần đúng của hàm phân bố thống kê
Đối với các phân bố thống kê người ta cũng tính được các đặc trưng bằng số tương tự như với các đặc trưng bằng số của các đại lượng ngẫu nhiên:
- Trung bình số học (hay trung bình thống kê) của các giá trị quan
trắc của đại lượng ngẫu nhiên:
[ ]
n
x X
m
n i i x
∑
=
∗
∗ = M = 1 (2.2)
Trang 3- Phương sai thống kê:
n
m x X
D
n i
x i x
Khi đã xác định được phân bố thống kê, có thể giải quyết bài toán là
trơn, tức chọn đường cong phân bố lý thuyết đều đặn về phương diện nào
đó mô tả tốt nhất phân bố thống kê đó Biểu thức giải tích của đường
cong phân bố được chọn phụ thuộc vào một số tham số, do đó, nhiệm vụ
là trơn là chọn hợp lý các tham số đó Một trong những phương pháp
chọn hợp lý là phương pháp mômen, theo phương pháp này một số đặc
trưng bằng số quan trọng nhất (các mômen) của phân bố lý thuyết được
cho bằng các đặc trưng thống kê tương ứng Thí dụ, nếu muốn mô tả
phân bố của đại lượng ngẫu nhiên X bằng phân bố chuẩn
2 2 22
πσ
m x
e x
f
−
−
=)(thì người ta chọn
∗
=m x
2.2 Sự phù hợp của phân bố lý thuyết và phân bố thống kê
Giả sử phân bố thống kê đã được là trơn bằng một đường cong lý
thuyết f (x ) nào đó Dù đường cong lý thuyết này được chọn tốt thế nào
chăng nữa cũng không tránh khỏi những sai khác nào đó Vậy xuất hiện
câu hỏi: những sai khác này là ngẫu nhiên liên quan tới số lượng quan
trắc hạn chế hay những sai khác này là đáng kể và liên quan tới việc chọn
sai đường cong lý thuyết Để trả lời câu hỏi này cần “những tiêu chuẩn
phù hợp” Tư tưởng của việc sử dụng các tiêu chuẩn phù hợp như sau:
Trên cơ sở dữ liệu thống kê đã có, cần kiểm tra một giả thuyết H rằng đại lượng ngẫu nhiên X có hàm phân bố F ( x) Để chấp nhận hoặc
bác bỏ giả thuyết H , người ta xét đại lượng U đặc trưng cho mức độ bất phù hợp của phân bố lý thuyết và phân bố thống kê Đại lượng U có
thể được chọn theo những cách khác nhau, thí dụ, đó có thể là tổng các bình phương của độ lệch giữa xác suất lý thuyết pi và tần suất tương ứng pi∗ hay tổng của những bình phương độ lệch đó nhưng với những hệ
số tỷ trọng nào đó, hay độ lệch cực đại của hàm phân bố thống kê F∗( x)
và hàm lý thuyết F ( x)
Giả sử đại lượng U đã chọn được theo một cách nào đó Rõ ràng
U sẽ là một đại lượng ngẫu nhiên Quy luật phân bố của nó phụ thuộc
vào quy luật phân bố của đại lượng ngẫu nhiên X và vào số lượng quan trắc n Giả sử quy luật phân bố này đã được biết Nhờ dữ liệu thống kê thấy rằng đại lượng đặc trưng mức độ sai khác U nhận giá trị u Sai
khác này là do những nguyên nhân ngẫu nhiên hay do có sự khác nhau
đáng kể giữa phân bố lý thuyết và thống kê, tức do giả thuyết H sai? Muốn giải đáp câu hỏi này người ta giả thiết rằng giả thuyết H đúng và
tính xác suất mà do những nguyên nhân ngẫu nhiên liên quan tới số
lượng quan trắc còn thiếu mà đại lượng U không nhỏ hơn giá trị u đã
thấy qua quan trắc, tức tính xác suất của sự kiện
u
Nếu xác suất này rất nhỏ, thì phải bác bỏ giả thuyết H ; nếu xác
suất này đáng kể thì người ta công nhận rằng các số liệu quan trắc không
mâu thuẫn với giả thuyết H
2.2.1 Tiêu chuẩn χ2
Trong một số phương pháp chọn U , quy luật phân bố của U có
Trang 4những tính chất rất đơn giản và khi n đủ lớn thực tế nó không phụ thuộc
vào hàm F (x ) Tiêu chuẩn χ2 của Pierson là một trong những tiêu
chuẩn phù hợp được ứng dụng nhiều nhất
Giả sử thực hiện n quan trắc độc lập Kết quả quan trắc được dẫn
tới k khoảng giá trị và cho dưới dạng chuỗi thống kê (bảng phân bố tần
suất) Đòi hỏi kiểm tra xem những dữ liệu quan trắc này có phù hợp với
giả thiết rằng đại lượng ngẫu nhiên X có quy luật phân bố F (x ) đã cho
không
Biết quy luật phân bố lý thuyết F ( x), có thể tính những xác suất lý
thuyết của sự kiện X rơi vào từng khoảng giá trị:
k
p p
p1, 2, ., Bây giờ ta chọn làm mức độ sai khác giữa phân bố lý thuyết và
thống kê một tổng như sau
C U
1
2 (2.4) Các hệ số tỷ trọng Ci (tỷ trọng của các khoảng giá trị) có ý nghĩa là
những độ lệch ứng với những khoảng giá trị khác nhau không nên xem là
ngang hàng nhau về mức ý nghĩa, cùng một độ lệch pi∗ − pi có thể ít
đáng kể khi bản thân xác suất pi lớn nhưng rất đáng kể khi pi nhỏ
Pierson đã chứng minh rằng nếu lấy
i i
p
n
thì với n lớn, luật phân bố của U có những tính chất rất đơn giản: nó
thực tế không phụ thuộc vào hàm F (x ) và số quan trắc n , mà chỉ phụ
thuộc vào số những khoảng giá trị k , cụ thể khi n tăng quy luật này sẽ
dần tới phân bố χ2 1 Vậy
p
p p n U
1
2 2
np
np m U
1
2 2
χ (2.5)
Phân bố χ2 phụ thuộc vào tham số r, gọi là số bậc tự do
Số bậc tự do r bằng số các khoảng giá trị k trừ đi số các điều kiện liên hệ mà p i∗ phải tuân theo (số các điều kiện ràng buộc) Thí dụ về các điều kiện ấy có thể là:
1) ∑
=
∗ =
k i i
0 2
2
2 2
u
u u
r u
k
u r r
r
e
khi
khi
) (
Trang 5
1
~ nếu ta chọn phân bố lý thuyết sao cho các giá trị
trung bình lý thuyết và thống kê phải trùng nhau;
x
1
2
~ nếu ngoài ra phương sai lý thuyết và
phương sai thống kê cũng phải trùng nhau
Người ta đã lập sẵn các bảng phân bố χ2 (bảng 2.1 là một trong số
các bảng đó) Dùng các bảng này có thể đối với từng giá trị χ2 và số bậc
tự do r tìm được xác suất p của sự kiện: đại lượng phân bố theo quy
luật χ2 vượt quá giá trị này
Phân bố χ2 cho phép đánh giá mức độ phù hợp của phân bố lý
thuyết và thống kê Giả thiết đại lượng X đúng là phân bố theo quy luật
)
(x
F Khi đó xác suất p xác định từ bảng này sẽ là xác suất của sự
kiện: do những nguyên nhân ngẫu nhiên đơn thuần, sai khác của phân bố
lý thuyết và thống kê tính theo biểu thức (2.5) sẽ không nhỏ hơn giá trị
2
χ mà ta thực thấy trong chuỗi quan trắc Nếu xác suất này rất nhỏ (nhỏ
đến mức sự kiện với xác suất như vậy có thể xem như thực tế không khả
dĩ), thì phải xem kết quả quan trắc mâu thuẫn với giả thuyết H rằng quy
luật phân bố của đại lượng X là F ( x) Cần phải bác bỏ giả thuyết như
là một giả thuyết không hiện thực Nếu xác suất p khá lớn, ta có thể
công nhận những khác biệt giữa phân bố lý thuyết và thống kê là không
đáng kể, ngẫu nhiên Giả thuyết H có thể xem là hiện thực hoặc ít ra là
không mâu thuẫn với dữ liệu quan trắc
Bảng 2.1 Những giá trị χ phụ thuộc vào r và p
Trang 62.2.2 Sơ đồ ứng dụng tiêu chuẩn χ2 để đánh giá sự phù hợp
1) Xác định độ sai khác χ2 theo công thức (2.5)
2) Xác định số bậc tự do r như là số khoảng giá trị k trừ đi số liên
hệ s : r = k−s
3) Theo r và χ2 nhờ bảng 2.1 tìm xác suất p của sự kiện: đại
lượng có phân bố χ2 với r bậc tự do vượt quá giá trị χ2 đã tính được
Nếu p rất nhỏ, giả thuyết bị bác bỏ (trong thực tế nếu p nhỏ hơn 0,1 thì
nên kiểm tra lại thí nghiệm); nếu p khá lớn, có thể xem giả thuyết không
mâu thuẫn với thực đo
Khi sử dụng tiêu chuẩn χ2, không những chỉ tổng số quan trắc n
đủ lớn mà cả số quan trắc m i trong từng khoảng giá trị cũng phải đủ lớn
Trong thực tế tính toán, nên có trong mỗi khoảng giá trị không ít hơn 5 −
10 quan trắc, khi số đó ít hơn thì nên nhóm một số khoảng giá trị lại với
nhau
Thí dụ: 1) Cho chuỗi thống kê gồm 500 quan trắc đã được nhóm
thành các khoảng giá trị và được ghi vào bảng như sau:
2
1 )
π σ
m x
e x
bố chuẩn sẽ là:
) 448 , 1 ( 2 ) 168 , 0 ( 2 2
2 448 , 1
1 )
Trang 7Theo công thức (2.5), tính ( )
9438
np
np m
Tính số bậc tự do k=8, s (số liên hệ) = 3 (ở đây dùng quy luật
chuẩn, lấy cả 3 điều kiện) Vậy r =8−3=5 Theo bảng 2.1 tìm được:
với r =5, χ2 =3,94 thì p=0,56
Xác suất 56p=0, không nhỏ Vậy giả thuyết rằng đại lượng quan
trắc có phân bố chuẩn với m=0,168 và σ =1,448 có thể xem là hiện
thực
2.2.3 Tiêu chuẩn phù hợp của Kolmogorov
Kolmogorov A N đã dùng giá trị cực đại của mô đun hiệu giữa
hàm phân bố thống kê F∗( x) và hàm phân bố lý thuyết
)()(max F x F x
làm mức độ bất phù hợp giữa chúng Chọn như vậy có lợi là rất dễ tính
D và D có quy luật phân bố khá đơn giản Kolmogorov đã chứng minh
được rằng dù đại lượng ngẫu nhiên X có hàm phân bố như thế nào thì
khi tăng không ngừng số quan trắc độc lập n , xác suất của bất đẳng thức
e
P(λ) 1 ( 1) 2 2λ2 (2.6) Những giá trị của xác suất P(λ) tính theo công thức (2.6) dẫn
trong bảng 2.2
Bảng 2.2 Những giá trị của xác suất P(λ) phụ thuộc vào λ
λ P( λ ) λ P( λ ) λ P( λ ) 0,0 1,000 0,7 0,711 1,4 0,040 0,1 1,000 0,8 0,544 1,5 0,022 0,2 1,000 0,9 0,393 1,6 0,012 0,3 1,000 1,0 0,270 1,7 0,006 0,4 0,997 1,1 0,178 1,8 0,003 0,5 0,964 1,2 0,112 1,9 0,002 0,6 0,864 1,3 0,068 2,0 0,001
Sơ đồ sử dụng tiêu chuẩn Kolmogorov: Dựng hàm phân bố thống kê )
( x
F∗ và hàm phân bố lý thuyết F x( ), xác định D cực đại Sau đó xác
định đại lượng λ = D n và theo bảng 2.2 tìm xác suất P(λ) Nếu xác suất P(λ) rất nhỏ thì phải bác bỏ giả thuyết, nếu xác suất P(λ) khá lớn thì có thể xem giả thuyết phù hợp với số liệu quan trắc
Tiêu chuẩn Kolmogorov đơn giản hơn so với tiêu chuẩn χ2 nên người ta ưa dùng Nhược điểm: chỉ dùng trong trường hợp hàm F x( )hoàn toàn biết trước từ những lập luận lý thuyết, tức biết trước cả dạng và những tham số trong nó Trường hợp này ít gặp trong thực tế Thường từ suy luận lý thuyết ta chỉ biết trước dạng tổng quát của hàm F x( ), còn những tham số bằng số của nó được xác định theo tài liệu thống kê Trong khi dùng tiêu chuẩn Pierson, điểm này đã được tính đến bằng cách giảm số bậc tự do của phân bố χ2 Tiêu chuẩn Kolmogorov không tính đến điều đó Nếu cứ dùng tiêu chuẩn Kolmogorov trong những trường hợp mà các tham số của phân bố lý thuyết được ước lượng theo số liệu thống kê, thì tiêu chuẩn này sẽ cho những giá trị xác suất P(λ) rõ ràng lớn hơn; vì vậy chúng ta sẽ có thể chấp nhận nhầm giả thuyết
Trang 82.3 Khái niệm về ước lượng tham số của phân bố
Để xác định quy luật phân bố, cần có tài liệu thống kê đủ rộng rãi cỡ
vài trăm quan trắc Nhưng trong thực tế nhiều khi chúng ta chỉ có những
tài liệu quan trắc khá hạn chế, cỡ vài chục số đo Khối lượng tài liệu này
không đủ để tìm ra quy luật thống kê, nhưng có thể sử dụng để nhận một
vài thông tin về đại lượng ngẫu nhiên, thí dụ, tính một số đặc trưng bằng
số quan trọng nhất như kỳ vọng toán học, phương sai, một vài mômen
bậc cao hơn
Ta sẽ xét những bài toán về xác định các đặc trưng mà quy luật phân
bố phụ thuộc vào chúng, theo một lượng quan trắc hạn chế Một tham số
bất kỳ tính được theo chuỗi quan trắc hạn chế sẽ chứa yếu tố ngẫu nhiên
Giá trị ngẫu nhiên gần đúng này được gọi là ước lượng của tham số Thí
dụ về ước lượng của kỳ vọng toán học là trung bình số học các giá trị
quan trắc Sai số (chênh lệch giữa ước lượng và tham số) sẽ càng lớn nếu
số quan trắc càng ít Cần phải chọn ước lượng sao cho các sai số có thể
cực tiểu
Có những đòi hỏi để đảm bảo cho ước lượng, với một ý nghĩa nào
đó, có chất lượng Thí dụ, nếu ta đòi hỏi sao cho ước lượng a~ khi tăng
số quan trắc phải tiến dần tới tham số a thì ước lượng a~ đó có tính chất
vững chắc; nếu ước lượng a~ không có xu hướng vượt quá a hay nhỏ
hơn a một cách hệ thống, thì ước lượng a ~ có tính chất không chệch;
nếu ước lượng không chệch a~ có phương sai so với các ước lượng khác
là nhỏ nhất thì ước lượng a ~ có tính chất hữu hiệu
2.4 Ước lượng của kỳ vọng toán học và phương sai
Người ta chứng minh được rằng ước lượng của kỳ vọng toán học mà
chúng ta dùng là trung bình số học các giá trị quan trắc *
m tính theo
công thức (2.2)
n
x m
là ước lượng vững chắc, không chệch và trong trường hợp đại lượng X
phân bố chuẩn là hữu hiệu
Ước lượng của phương sai D là phương sai thống kê *
D tính theo công thức (2.3)
n
m x D
thay cho D ta sẽ phạm một sai số hệ thống nào đó về phía nhỏ hơn D
Người ta loại trừ độ chệch này bằng cách nhân *
n i
i ~)(
~
(2.8) hay
1
2 1
x D
n i
i
~
~ (2.9)
2.5 Khoảng tin cậy và xác suất tin cậy
Kiểu ước lượng như trong mục 2.4 gọi là ước lượng điểm Nhiều khi
Trang 9đòi hỏi không chỉ tìm giá trị bằng số phù hợp của tham số a , mà phải
đánh giá độ chính xác và độ tin cậy của nó, phải biết nếu thay tham số a
bằng ước lượng điểm a~ thì có thể dẫn tới những sai số nào và có thể hy
vọng rằng những sai số ấy không vượt quá một giới hạn cho trước với
mức độ chắc chắn nào
Những bài toán kiểu như vậy đặc biệt cần thiết khi số lượng quan
trắc nhỏ, ước lượng điểm a~ ở mức độ lớn sẽ là ngẫu nhiên và phép thay
thế gần đúng a bằng a~ có thể dẫn tới những sai số nghiêm trọng
Để có khái niệm về độ chính xác và độ tin cậy của ước lượng a~ ,
trong toán học thống kê dùng khoảng tin cậy và xác suất tin cậy
Giả sử đối với tham số a đã nhận được ước lượng không chệch a~
Bây giờ cần đánh giá sai số có thể có khi dùng ước lượng đó Ta đặt ra
một xác suất đủ lớn β nào đó (thí dụ, β =0,9 0,95 0,99) sao cho sự
kiện với xác suất β có thể xem là thực tế đáng tin, và tìm một giá trị ε
sao cho
( a~− a <ε )=β
P (2.10)
Khi đó phạm vi của các giá trị sai số khả dĩ xuất hiện khi thay a bằng a~
sẽ chỉ là ± ; những sai số lớn hơn về giá trị tuyệt đối sẽ chỉ xuất hiện ε
với xác suất nhỏ α = 1−β Viết lại (2.10) thành
(a−ε <a<a +ε )=β
P ~ ~ , (2.11) đẳng thức (2.11) có nghĩa là: với xác suất β , giá trị chưa biết của tham
số a nằm trong khoảng
)
~
Ở đây cần chú ý rằng đại lượng a không ngẫu nhiên, mà chính
khoảng Iβ ngẫu nhiên (a~ ngẫu nhiên, và 2ε ngẫu nhiên vì ε được tính
theo các số liệu quan trắc) Vì vậy trong trường hợp này nên giải thích
đại lượng β là xác suất của sự kiện: khoảng ngẫu nhiên Iβ phủ lên
điểm a trên trục số (hình 2.4)
β
I
Hình 2.4 Biểu diễn khoảng tin cậy
Xác suất β gọi là xác suất tin cậy, còn khoảng Iβ gọi là khoảng tin cậy Những ranh giới của khoảng Iβ: a1 = a~−ε và a2 = a~+ε gọi là những ranh giới tin cậy
Ta xét vấn đề tìm các ranh giới tin cậy a1 và a2:
Giả sử đối với tham số a có ước lượng không chệch a~ Nếu như ta
biết trước luật phân bố của đại lượng a~ , thì bài toán tìm khoảng tin cậy
sẽ đơn giản: chỉ cần tìm một giá trị ε sao cho
( ~a− a <ε)=β
Khó khăn là ở chỗ luật phân bố của ước lượng a~ phụ thuộc vào luật
phân bố của đại lượng X và do đó, phụ thuộc vào những tham số chưa biết của nó (cụ thể vào chính tham số a )
Để khắc phục khó khăn này, có thể sử dụng một phương pháp gần đúng thô thiển như sau: thay những tham số chưa biết trong biểu thức của
ε bằng những ước lượng điểm Khi số lượng quan trắc khá lớn (khoảng 30
20÷ ), thì phương pháp này thường cho những kết quả tạm thoả mãn
Trang 102.5.1 Khoảng tin cậy đối với kỳ vọng toán học
Giả sử thực hiện n thí nghiệm độc lập với đại lượng ngẫu nhiên
X , các đặc trưng của nó - kỳ vọng toán học m và phương sai D chưa
biết Đối với những tham số này đã nhận được những ước lượng:
11
2 1
n
X
i n
i
~
;
Phải dựng khoảng tin cậy Iβ ứng với xác suất tin cậy β cho kỳ vọng
toán học m của đại lượng X
Khi giải bài toán này ta nhớ lại rằng đại lượng m ~ là tổng của n đại
lượng ngẫu nhiên X i độc lập và phân bố như nhau, và do đó, theo định
lý tới hạn trung tâm, khi n đủ lớn luật phân bố của nó gần trùng với luật
phân bố chuẩn Trong thực tế, thậm chí với số lượng các số hạng không
lớn lắm (khoảng 10÷20), luật phân bố của tổng có thể xem gần đúng là
chuẩn Vậy ta sẽ xuất phát từ chỗ đại lượng m~ phân bố theo luật chuẩn
Các đặc trưng của luật này - kỳ vọng toán học và phương sai tuần tự bằng
m và D / n Giả sử đại lượng D đã biết, và ta tìm đại lượng εβ sao cho
m
m m
m m
m m
m m
m m m
P m
m P
σ
εσ
εσ
ε
σ
εσ
εσ
εσ
ε
εε
ε
β β
β
β β
β β
β β
β
Vậy
β σ
2
1 arg
σ
εβ m , (2.13) trong đó arg Φ∗( ) x − hàm ngược của hàm Φ∗( ) x , tức giá trị của đối số
mà ứng với nó hàm phân bố chuẩn bằng x
Bảng 2.3 Những trị số tβ tương ứng với xác suất tin cậy β
0,80 1,282 0,86 1,475 0,91 1,694 0,97 2,169 0,81 1,310 0,87 1,513 0,92 1,750 0,98 2,325 0,82 1,340 0,88 1,554 0,93 1,810 0,99 2,576
0,84 1,404 0,90 1,643 0,95 1,960 0,999 3,290
Trang 11Phương sai D mà qua nó ta biểu diễn σm~ chưa được biết trước Ta
có thể dùng ước lượng D~ thay cho nó, vậy ta có
n D
m~ = ~ /
σ (2.14) Như vậy, bài toán dựng khoảng tin cậy đã được giải một cách gần
đúng
)
~
Để tránh nội suy ngược trong bảng hàm Φ∗( x) khi tính εβ, người
ta lập một bảng chuyên dụng giúp tính các trị số của đại lượng
diễn dưới dạng
)
~
;
~
Iβ = − βσ + βσ (2.17) Như vậy đại lượng tβ chính là số lần độ lệch bình phương trung
bình cần phải đặt về phía bên trái và bên phải kể từ tâm tản mạn để cho
xác suất rơi vào khoảng đó bằng β
Thí dụ 2.1: Có 20 quan trắc về đại lượng X viết thành bảng như
Hãy tìm ước lượng m ~ của kỳ vọng toán học m của đại lượng X
và dựng khoảng tin cậy ứng với xác suất tin cậy β =0,8
Giải:
0564 , 0 /
~
064 , 0
~
78 , 10
~
;,,
~
85100720
711007202
1
=+
m m
Vậy khoảng tin cậy: Iβ = ( 10 , 71 ; 10 , 85 ).
2.5.2 Khoảng tin cậy đối với phương sai
Bài toán về khoảng tin cậy đối vơi phương sai cũng được giải tương
tự Giả sử thực hiện n thí nghiệm độc lập về đại lượng ngẫu nhiên X với các tham số m và D chưa biết, đối với phương sai D ta tính được
ước lượng không chệch:
11
n i
i ~)(
~
, (2.18) trong đó
n
X m
n i i
∑
=
= 1
Trang 12Yêu cầu dựng gần đúng khoảng tin cậy cho phương sai
Từ công thức (2.18) thấy rằng đại lượng D~ là tổng n đại lượng
Những đại lượng ấy không phải là độc lập,
vì trong mỗi đại lượng đều có mặt m~ phụ thuộc vào tất cả X i Tuy
nhiên, người ta có thể chỉ ra rằng khi tăng n luật phân bố của tổng chúng
cũng dần tới luật chuẩn Thực tế với n=20÷30 đã có thể xem là chuẩn
Ta cũng giả thiết như vậy và tìm các đặc trưng của luật phân bố này:
kỳ vọng toán học và phương sai Vì ước lượng D~ không chệch, nên
D D
M[~] = Việc tính D D[~] rất phức tạp nên ở đây chỉ dẫn ra biểu thức cuối cùng:
2 4
1
31
D n n
n n
D D
)(]
~[
−
−
−
= μ , (2.19) trong đó μ4 − mô men tâm bậc bốn của đại lượng X
Để dùng biểu thức này, cần phải đưa vào đó những trị số của μ4 và
D (dù là những trị số gần đúng) Thay cho D có thể sử dụng ước lượng
của nó D~ Về nguyên tắc mô men tâm bậc bốn μ4 cũng có thể thay thế
bằng ước lượng của nó, thí dụ, bằng đại lượng sau:
n
m X
n i i
μ , (2.20) nhưng thay thế như vậy sẽ cho độ chính xác không cao, vì nhìn chung với
số lượng thí nghiệm hạn chế, các mô men bậc cao xác định với sai số lớn
Tuy nhiên, trong thực tế thường là dạng của luật phân bố của đại lượng
X được biết trước, chỉ không biết trước các tham số của phân bố đó mà
thôi Khi đó có thể biểu diễn μ4 qua D
Thí dụ, trường hợp thường gặp nhất - đại lượng X phân bố theo
luật chuẩn; khi đó mô men tâm bậc bốn được biểu diễn qua phương sai như sau
1
33
D n n
n D n D D
)(]
~[
2
D n D D
−
=]
~[ (2.21)
Trong (2.21) thay D chưa biết bằng ước lượng của nó, ta được
21
2
D n
[D
−
từ đó
D n
X chưa biết, nếu không có cơ sở đặc biệt nào để khẳng định là nó khác
rõ rệt so với luật chuẩn (có độ nhọn dương hoặc âm đáng kể), thì vẫn cứ nên sử dụng công thức (2.22) để nhận định về σD~
Tóm lại, nếu giá trị định hướng
D~
σ đã tìm được bằng cách nào đó, thì có thể dựng khoảng tin cậy cho phương sai tương tự như cho kỳ vọng toán học Ta viết
( D~− D <εβ)= β
P