1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Chương 2NHỮNG KHÁI NIỆM CƠ BẢN CỦA LÝ THUYẾT XỬ LÝ SỐ LIỆU QUAN TRẮCGiả pdf

25 357 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 25
Dung lượng 713,26 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Một trong những phương pháp chọn hợp lý là phương pháp mômen, theo phương pháp này một số đặc trưng bằng số quan trọng nhất các mômen của phân bố lý thuyết được cho bằng các đặc trưng t

Trang 1

OPEN (1, FILE = ‘bang1_1.tke’)

Giả sử cần nghiên cứu đại lượng ngẫu nhiên X nào đó mà luật

phân bố của nó chưa biết trước đích xác, phải xác định quy luật đó từ thí nghiệm hay kiểm tra bằng thực nghiệm giả thuyết về một quy luật nào

đó Khi đó, người ta làm một loạt thí nghiệm với đại lượng ngẫu nhiên

X và trong mỗi thí nghiệm (quan trắc), đại lượng X nhận một giá trị nhất định Tập hợp các số liệu quan trắc của đại lượng được gọi là tập

hợp thống kê đơn giản hay chuỗi thống kê đơn giản Thông thường, tập

hợp thống kê đơn giản được trình bày dưới dạng bảng

2.1 Hàm phân bố thống kê

Hàm phân bố thống kê của đại lượng ngẫu nhiên X là tần suất của

sự kiện X < x trong chuỗi thống kê đó

( ) x P ( X x )

F∗ = ∗ < (2.1)

Để tìm giá trị của hàm phân bố thống kê ứng với x cho trước chỉ

cần đếm số quan trắc mà trong đó đại lượng X nhận giá trị nhỏ hơn x

và chia cho tổng số quan trắc đã thực hiện n

Hàm phân bố thống kê của đại lượng ngẫu nhiên bất kỳ - rời rạc hay liên tục - sẽ là một hàm bậc thang gián đoạn (hình 2.1) Khi tăng số quan

Trang 2

trắc n , theo định lý Becnuli, với x bất kỳ tần suất sự kiện X <x tiến

dần tới xác suất (hội tụ về xác suất) của sự kiện đó Do đó, khi tăng n

hàm phân bố thống kê F( x) sẽ tiến tới hàm phân bố thực thụ F ( x) của

đại lượng ngẫu nhiên X

x

F*(x)

1

Hình 2.1 Biểu diễn hàm phân bố thống kê

Nếu số quan trắc lớn (cỡ vài trăm quan trắc) tập hợp thống kê đơn

giản sẽ cồng kềnh và ít trực quan, người ta phải sơ lược xử lý nó và xây

dựng “chuỗi thống kê” dưới dạng bảng như sau:

và dựa vào bảng này mà xây dựng tổ chức đồ (histogram) (hình 2.2) Khi

tăng số quan trắc tổ chức đồ sẽ là đồ thị của hàm mật độ phân bố đại

lượng ngẫu nhiên X

Từ chuỗi thống kê hay tổ chức đồ, có thể nhận được đồ thị gần đúng

của hàm phân bố thống kê (hình 2.3)

x p

Hình 2.2 Tổ chức đồ thống kê

x

F*(x)

1

Hình 2.3 Đồ thị gần đúng của hàm phân bố thống kê

Đối với các phân bố thống kê người ta cũng tính được các đặc trưng bằng số tương tự như với các đặc trưng bằng số của các đại lượng ngẫu nhiên:

- Trung bình số học (hay trung bình thống kê) của các giá trị quan

trắc của đại lượng ngẫu nhiên:

[ ]

n

x X

m

n i i x

=

∗ = M = 1 (2.2)

Trang 3

- Phương sai thống kê:

n

m x X

D

n i

x i x

Khi đã xác định được phân bố thống kê, có thể giải quyết bài toán là

trơn, tức chọn đường cong phân bố lý thuyết đều đặn về phương diện nào

đó mô tả tốt nhất phân bố thống kê đó Biểu thức giải tích của đường

cong phân bố được chọn phụ thuộc vào một số tham số, do đó, nhiệm vụ

là trơn là chọn hợp lý các tham số đó Một trong những phương pháp

chọn hợp lý là phương pháp mômen, theo phương pháp này một số đặc

trưng bằng số quan trọng nhất (các mômen) của phân bố lý thuyết được

cho bằng các đặc trưng thống kê tương ứng Thí dụ, nếu muốn mô tả

phân bố của đại lượng ngẫu nhiên X bằng phân bố chuẩn

2 2 22

πσ

m x

e x

f

=)(thì người ta chọn

=m x

2.2 Sự phù hợp của phân bố lý thuyết và phân bố thống kê

Giả sử phân bố thống kê đã được là trơn bằng một đường cong lý

thuyết f (x ) nào đó Dù đường cong lý thuyết này được chọn tốt thế nào

chăng nữa cũng không tránh khỏi những sai khác nào đó Vậy xuất hiện

câu hỏi: những sai khác này là ngẫu nhiên liên quan tới số lượng quan

trắc hạn chế hay những sai khác này là đáng kể và liên quan tới việc chọn

sai đường cong lý thuyết Để trả lời câu hỏi này cần “những tiêu chuẩn

phù hợp” Tư tưởng của việc sử dụng các tiêu chuẩn phù hợp như sau:

Trên cơ sở dữ liệu thống kê đã có, cần kiểm tra một giả thuyết H rằng đại lượng ngẫu nhiên X có hàm phân bố F ( x) Để chấp nhận hoặc

bác bỏ giả thuyết H , người ta xét đại lượng U đặc trưng cho mức độ bất phù hợp của phân bố lý thuyết và phân bố thống kê Đại lượng U có

thể được chọn theo những cách khác nhau, thí dụ, đó có thể là tổng các bình phương của độ lệch giữa xác suất lý thuyết pi và tần suất tương ứng pi∗ hay tổng của những bình phương độ lệch đó nhưng với những hệ

số tỷ trọng nào đó, hay độ lệch cực đại của hàm phân bố thống kê F( x)

và hàm lý thuyết F ( x)

Giả sử đại lượng U đã chọn được theo một cách nào đó Rõ ràng

U sẽ là một đại lượng ngẫu nhiên Quy luật phân bố của nó phụ thuộc

vào quy luật phân bố của đại lượng ngẫu nhiên X và vào số lượng quan trắc n Giả sử quy luật phân bố này đã được biết Nhờ dữ liệu thống kê thấy rằng đại lượng đặc trưng mức độ sai khác U nhận giá trị u Sai

khác này là do những nguyên nhân ngẫu nhiên hay do có sự khác nhau

đáng kể giữa phân bố lý thuyết và thống kê, tức do giả thuyết H sai? Muốn giải đáp câu hỏi này người ta giả thiết rằng giả thuyết H đúng và

tính xác suất mà do những nguyên nhân ngẫu nhiên liên quan tới số

lượng quan trắc còn thiếu mà đại lượng U không nhỏ hơn giá trị u đã

thấy qua quan trắc, tức tính xác suất của sự kiện

u

Nếu xác suất này rất nhỏ, thì phải bác bỏ giả thuyết H ; nếu xác

suất này đáng kể thì người ta công nhận rằng các số liệu quan trắc không

mâu thuẫn với giả thuyết H

2.2.1 Tiêu chuẩn χ2

Trong một số phương pháp chọn U , quy luật phân bố của U có

Trang 4

những tính chất rất đơn giản và khi n đủ lớn thực tế nó không phụ thuộc

vào hàm F (x ) Tiêu chuẩn χ2 của Pierson là một trong những tiêu

chuẩn phù hợp được ứng dụng nhiều nhất

Giả sử thực hiện n quan trắc độc lập Kết quả quan trắc được dẫn

tới k khoảng giá trị và cho dưới dạng chuỗi thống kê (bảng phân bố tần

suất) Đòi hỏi kiểm tra xem những dữ liệu quan trắc này có phù hợp với

giả thiết rằng đại lượng ngẫu nhiên X có quy luật phân bố F (x ) đã cho

không

Biết quy luật phân bố lý thuyết F ( x), có thể tính những xác suất lý

thuyết của sự kiện X rơi vào từng khoảng giá trị:

k

p p

p1, 2, ., Bây giờ ta chọn làm mức độ sai khác giữa phân bố lý thuyết và

thống kê một tổng như sau

C U

1

2 (2.4) Các hệ số tỷ trọng Ci (tỷ trọng của các khoảng giá trị) có ý nghĩa là

những độ lệch ứng với những khoảng giá trị khác nhau không nên xem là

ngang hàng nhau về mức ý nghĩa, cùng một độ lệch pi∗ − pi có thể ít

đáng kể khi bản thân xác suất pi lớn nhưng rất đáng kể khi pi nhỏ

Pierson đã chứng minh rằng nếu lấy

i i

p

n

thì với n lớn, luật phân bố của U có những tính chất rất đơn giản: nó

thực tế không phụ thuộc vào hàm F (x ) và số quan trắc n , mà chỉ phụ

thuộc vào số những khoảng giá trị k , cụ thể khi n tăng quy luật này sẽ

dần tới phân bố χ2 1 Vậy

p

p p n U

1

2 2

np

np m U

1

2 2

χ (2.5)

Phân bố χ2 phụ thuộc vào tham số r, gọi là số bậc tự do

Số bậc tự do r bằng số các khoảng giá trị k trừ đi số các điều kiện liên hệ mà p i∗ phải tuân theo (số các điều kiện ràng buộc) Thí dụ về các điều kiện ấy có thể là:

1) ∑

=

∗ =

k i i

0 2

2

2 2

u

u u

r u

k

u r r

r

e

khi

khi

) (

Trang 5

1

~ nếu ta chọn phân bố lý thuyết sao cho các giá trị

trung bình lý thuyết và thống kê phải trùng nhau;

x

1

2

~ nếu ngoài ra phương sai lý thuyết và

phương sai thống kê cũng phải trùng nhau

Người ta đã lập sẵn các bảng phân bố χ2 (bảng 2.1 là một trong số

các bảng đó) Dùng các bảng này có thể đối với từng giá trị χ2 và số bậc

tự do r tìm được xác suất p của sự kiện: đại lượng phân bố theo quy

luật χ2 vượt quá giá trị này

Phân bố χ2 cho phép đánh giá mức độ phù hợp của phân bố lý

thuyết và thống kê Giả thiết đại lượng X đúng là phân bố theo quy luật

)

(x

F Khi đó xác suất p xác định từ bảng này sẽ là xác suất của sự

kiện: do những nguyên nhân ngẫu nhiên đơn thuần, sai khác của phân bố

lý thuyết và thống kê tính theo biểu thức (2.5) sẽ không nhỏ hơn giá trị

2

χ mà ta thực thấy trong chuỗi quan trắc Nếu xác suất này rất nhỏ (nhỏ

đến mức sự kiện với xác suất như vậy có thể xem như thực tế không khả

dĩ), thì phải xem kết quả quan trắc mâu thuẫn với giả thuyết H rằng quy

luật phân bố của đại lượng X là F ( x) Cần phải bác bỏ giả thuyết như

là một giả thuyết không hiện thực Nếu xác suất p khá lớn, ta có thể

công nhận những khác biệt giữa phân bố lý thuyết và thống kê là không

đáng kể, ngẫu nhiên Giả thuyết H có thể xem là hiện thực hoặc ít ra là

không mâu thuẫn với dữ liệu quan trắc

Bảng 2.1 Những giá trị χ phụ thuộc vào rp

Trang 6

2.2.2 Sơ đồ ứng dụng tiêu chuẩn χ2 để đánh giá sự phù hợp

1) Xác định độ sai khác χ2 theo công thức (2.5)

2) Xác định số bậc tự do r như là số khoảng giá trị k trừ đi số liên

hệ s : r = ks

3) Theo r và χ2 nhờ bảng 2.1 tìm xác suất p của sự kiện: đại

lượng có phân bố χ2 với r bậc tự do vượt quá giá trị χ2 đã tính được

Nếu p rất nhỏ, giả thuyết bị bác bỏ (trong thực tế nếu p nhỏ hơn 0,1 thì

nên kiểm tra lại thí nghiệm); nếu p khá lớn, có thể xem giả thuyết không

mâu thuẫn với thực đo

Khi sử dụng tiêu chuẩn χ2, không những chỉ tổng số quan trắc n

đủ lớn mà cả số quan trắc m i trong từng khoảng giá trị cũng phải đủ lớn

Trong thực tế tính toán, nên có trong mỗi khoảng giá trị không ít hơn 5 −

10 quan trắc, khi số đó ít hơn thì nên nhóm một số khoảng giá trị lại với

nhau

Thí dụ: 1) Cho chuỗi thống kê gồm 500 quan trắc đã được nhóm

thành các khoảng giá trị và được ghi vào bảng như sau:

2

1 )

π σ

m x

e x

bố chuẩn sẽ là:

) 448 , 1 ( 2 ) 168 , 0 ( 2 2

2 448 , 1

1 )

Trang 7

Theo công thức (2.5), tính ( )

9438

np

np m

Tính số bậc tự do k=8, s (số liên hệ) = 3 (ở đây dùng quy luật

chuẩn, lấy cả 3 điều kiện) Vậy r =8−3=5 Theo bảng 2.1 tìm được:

với r =5, χ2 =3,94 thì p=0,56

Xác suất 56p=0, không nhỏ Vậy giả thuyết rằng đại lượng quan

trắc có phân bố chuẩn với m=0,168 và σ =1,448 có thể xem là hiện

thực

2.2.3 Tiêu chuẩn phù hợp của Kolmogorov

Kolmogorov A N đã dùng giá trị cực đại của mô đun hiệu giữa

hàm phân bố thống kê F( x) và hàm phân bố lý thuyết

)()(max F x F x

làm mức độ bất phù hợp giữa chúng Chọn như vậy có lợi là rất dễ tính

D và D có quy luật phân bố khá đơn giản Kolmogorov đã chứng minh

được rằng dù đại lượng ngẫu nhiên X có hàm phân bố như thế nào thì

khi tăng không ngừng số quan trắc độc lập n , xác suất của bất đẳng thức

e

P(λ) 1 ( 1) 2 2λ2 (2.6) Những giá trị của xác suất P(λ) tính theo công thức (2.6) dẫn

trong bảng 2.2

Bảng 2.2 Những giá trị của xác suất P(λ) phụ thuộc vào λ

λ P( λ ) λ P( λ ) λ P( λ ) 0,0 1,000 0,7 0,711 1,4 0,040 0,1 1,000 0,8 0,544 1,5 0,022 0,2 1,000 0,9 0,393 1,6 0,012 0,3 1,000 1,0 0,270 1,7 0,006 0,4 0,997 1,1 0,178 1,8 0,003 0,5 0,964 1,2 0,112 1,9 0,002 0,6 0,864 1,3 0,068 2,0 0,001

Sơ đồ sử dụng tiêu chuẩn Kolmogorov: Dựng hàm phân bố thống kê )

( x

F∗ và hàm phân bố lý thuyết F x( ), xác định D cực đại Sau đó xác

định đại lượng λ = D n và theo bảng 2.2 tìm xác suất P(λ) Nếu xác suất P(λ) rất nhỏ thì phải bác bỏ giả thuyết, nếu xác suất P(λ) khá lớn thì có thể xem giả thuyết phù hợp với số liệu quan trắc

Tiêu chuẩn Kolmogorov đơn giản hơn so với tiêu chuẩn χ2 nên người ta ưa dùng Nhược điểm: chỉ dùng trong trường hợp hàm F x( )hoàn toàn biết trước từ những lập luận lý thuyết, tức biết trước cả dạng và những tham số trong nó Trường hợp này ít gặp trong thực tế Thường từ suy luận lý thuyết ta chỉ biết trước dạng tổng quát của hàm F x( ), còn những tham số bằng số của nó được xác định theo tài liệu thống kê Trong khi dùng tiêu chuẩn Pierson, điểm này đã được tính đến bằng cách giảm số bậc tự do của phân bố χ2 Tiêu chuẩn Kolmogorov không tính đến điều đó Nếu cứ dùng tiêu chuẩn Kolmogorov trong những trường hợp mà các tham số của phân bố lý thuyết được ước lượng theo số liệu thống kê, thì tiêu chuẩn này sẽ cho những giá trị xác suất P(λ) rõ ràng lớn hơn; vì vậy chúng ta sẽ có thể chấp nhận nhầm giả thuyết

Trang 8

2.3 Khái niệm về ước lượng tham số của phân bố

Để xác định quy luật phân bố, cần có tài liệu thống kê đủ rộng rãi cỡ

vài trăm quan trắc Nhưng trong thực tế nhiều khi chúng ta chỉ có những

tài liệu quan trắc khá hạn chế, cỡ vài chục số đo Khối lượng tài liệu này

không đủ để tìm ra quy luật thống kê, nhưng có thể sử dụng để nhận một

vài thông tin về đại lượng ngẫu nhiên, thí dụ, tính một số đặc trưng bằng

số quan trọng nhất như kỳ vọng toán học, phương sai, một vài mômen

bậc cao hơn

Ta sẽ xét những bài toán về xác định các đặc trưng mà quy luật phân

bố phụ thuộc vào chúng, theo một lượng quan trắc hạn chế Một tham số

bất kỳ tính được theo chuỗi quan trắc hạn chế sẽ chứa yếu tố ngẫu nhiên

Giá trị ngẫu nhiên gần đúng này được gọi là ước lượng của tham số Thí

dụ về ước lượng của kỳ vọng toán học là trung bình số học các giá trị

quan trắc Sai số (chênh lệch giữa ước lượng và tham số) sẽ càng lớn nếu

số quan trắc càng ít Cần phải chọn ước lượng sao cho các sai số có thể

cực tiểu

Có những đòi hỏi để đảm bảo cho ước lượng, với một ý nghĩa nào

đó, có chất lượng Thí dụ, nếu ta đòi hỏi sao cho ước lượng a~ khi tăng

số quan trắc phải tiến dần tới tham số a thì ước lượng a~ đó có tính chất

vững chắc; nếu ước lượng a~ không có xu hướng vượt quá a hay nhỏ

hơn a một cách hệ thống, thì ước lượng a ~ có tính chất không chệch;

nếu ước lượng không chệch a~ có phương sai so với các ước lượng khác

là nhỏ nhất thì ước lượng a ~ có tính chất hữu hiệu

2.4 Ước lượng của kỳ vọng toán học và phương sai

Người ta chứng minh được rằng ước lượng của kỳ vọng toán học mà

chúng ta dùng là trung bình số học các giá trị quan trắc *

m tính theo

công thức (2.2)

n

x m

là ước lượng vững chắc, không chệch và trong trường hợp đại lượng X

phân bố chuẩn là hữu hiệu

Ước lượng của phương sai D là phương sai thống kê *

D tính theo công thức (2.3)

n

m x D

thay cho D ta sẽ phạm một sai số hệ thống nào đó về phía nhỏ hơn D

Người ta loại trừ độ chệch này bằng cách nhân *

n i

i ~)(

~

(2.8) hay

1

2 1

x D

n i

i

~

~ (2.9)

2.5 Khoảng tin cậy và xác suất tin cậy

Kiểu ước lượng như trong mục 2.4 gọi là ước lượng điểm Nhiều khi

Trang 9

đòi hỏi không chỉ tìm giá trị bằng số phù hợp của tham số a , mà phải

đánh giá độ chính xác và độ tin cậy của nó, phải biết nếu thay tham số a

bằng ước lượng điểm a~ thì có thể dẫn tới những sai số nào và có thể hy

vọng rằng những sai số ấy không vượt quá một giới hạn cho trước với

mức độ chắc chắn nào

Những bài toán kiểu như vậy đặc biệt cần thiết khi số lượng quan

trắc nhỏ, ước lượng điểm a~ ở mức độ lớn sẽ là ngẫu nhiên và phép thay

thế gần đúng a bằng a~ có thể dẫn tới những sai số nghiêm trọng

Để có khái niệm về độ chính xác và độ tin cậy của ước lượng a~ ,

trong toán học thống kê dùng khoảng tin cậy và xác suất tin cậy

Giả sử đối với tham số a đã nhận được ước lượng không chệch a~

Bây giờ cần đánh giá sai số có thể có khi dùng ước lượng đó Ta đặt ra

một xác suất đủ lớn β nào đó (thí dụ, β =0,9 0,95 0,99) sao cho sự

kiện với xác suất β có thể xem là thực tế đáng tin, và tìm một giá trị ε

sao cho

( a~− a <ε )=β

P (2.10)

Khi đó phạm vi của các giá trị sai số khả dĩ xuất hiện khi thay a bằng a~

sẽ chỉ là ± ; những sai số lớn hơn về giá trị tuyệt đối sẽ chỉ xuất hiện ε

với xác suất nhỏ α = 1−β Viết lại (2.10) thành

(a−ε <a<a +ε )=β

P ~ ~ , (2.11) đẳng thức (2.11) có nghĩa là: với xác suất β , giá trị chưa biết của tham

số a nằm trong khoảng

)

~

Ở đây cần chú ý rằng đại lượng a không ngẫu nhiên, mà chính

khoảng Iβ ngẫu nhiên (a~ ngẫu nhiên, và 2ε ngẫu nhiên vì ε được tính

theo các số liệu quan trắc) Vì vậy trong trường hợp này nên giải thích

đại lượng β là xác suất của sự kiện: khoảng ngẫu nhiên Iβ phủ lên

điểm a trên trục số (hình 2.4)

β

I

Hình 2.4 Biểu diễn khoảng tin cậy

Xác suất β gọi là xác suất tin cậy, còn khoảng Iβ gọi là khoảng tin cậy Những ranh giới của khoảng Iβ: a1 = a~−ε và a2 = a~+ε gọi là những ranh giới tin cậy

Ta xét vấn đề tìm các ranh giới tin cậy a1 và a2:

Giả sử đối với tham số a có ước lượng không chệch a~ Nếu như ta

biết trước luật phân bố của đại lượng a~ , thì bài toán tìm khoảng tin cậy

sẽ đơn giản: chỉ cần tìm một giá trị ε sao cho

( ~aa <ε)=β

Khó khăn là ở chỗ luật phân bố của ước lượng a~ phụ thuộc vào luật

phân bố của đại lượng X và do đó, phụ thuộc vào những tham số chưa biết của nó (cụ thể vào chính tham số a )

Để khắc phục khó khăn này, có thể sử dụng một phương pháp gần đúng thô thiển như sau: thay những tham số chưa biết trong biểu thức của

ε bằng những ước lượng điểm Khi số lượng quan trắc khá lớn (khoảng 30

20÷ ), thì phương pháp này thường cho những kết quả tạm thoả mãn

Trang 10

2.5.1 Khoảng tin cậy đối với kỳ vọng toán học

Giả sử thực hiện n thí nghiệm độc lập với đại lượng ngẫu nhiên

X , các đặc trưng của nó - kỳ vọng toán học m và phương sai D chưa

biết Đối với những tham số này đã nhận được những ước lượng:

11

2 1

n

X

i n

i

~

;

Phải dựng khoảng tin cậy Iβ ứng với xác suất tin cậy β cho kỳ vọng

toán học m của đại lượng X

Khi giải bài toán này ta nhớ lại rằng đại lượng m ~ là tổng của n đại

lượng ngẫu nhiên X i độc lập và phân bố như nhau, và do đó, theo định

lý tới hạn trung tâm, khi n đủ lớn luật phân bố của nó gần trùng với luật

phân bố chuẩn Trong thực tế, thậm chí với số lượng các số hạng không

lớn lắm (khoảng 10÷20), luật phân bố của tổng có thể xem gần đúng là

chuẩn Vậy ta sẽ xuất phát từ chỗ đại lượng m~ phân bố theo luật chuẩn

Các đặc trưng của luật này - kỳ vọng toán học và phương sai tuần tự bằng

mD / n Giả sử đại lượng D đã biết, và ta tìm đại lượng εβ sao cho

m

m m

m m

m m

m m

m m m

P m

m P

σ

εσ

εσ

ε

σ

εσ

εσ

εσ

ε

εε

ε

β β

β

β β

β β

β β

β

Vậy

β σ

2

1 arg

σ

εβ m , (2.13) trong đó arg Φ∗( ) x − hàm ngược của hàm Φ∗( ) x , tức giá trị của đối số

mà ứng với nó hàm phân bố chuẩn bằng x

Bảng 2.3 Những trị số tβ tương ứng với xác suất tin cậy β

0,80 1,282 0,86 1,475 0,91 1,694 0,97 2,169 0,81 1,310 0,87 1,513 0,92 1,750 0,98 2,325 0,82 1,340 0,88 1,554 0,93 1,810 0,99 2,576

0,84 1,404 0,90 1,643 0,95 1,960 0,999 3,290

Trang 11

Phương sai D mà qua nó ta biểu diễn σm~ chưa được biết trước Ta

có thể dùng ước lượng D~ thay cho nó, vậy ta có

n D

m~ = ~ /

σ (2.14) Như vậy, bài toán dựng khoảng tin cậy đã được giải một cách gần

đúng

)

~

Để tránh nội suy ngược trong bảng hàm Φ∗( x) khi tính εβ, người

ta lập một bảng chuyên dụng giúp tính các trị số của đại lượng

diễn dưới dạng

)

~

;

~

Iβ = − βσ + βσ (2.17) Như vậy đại lượng tβ chính là số lần độ lệch bình phương trung

bình cần phải đặt về phía bên trái và bên phải kể từ tâm tản mạn để cho

xác suất rơi vào khoảng đó bằng β

Thí dụ 2.1: Có 20 quan trắc về đại lượng X viết thành bảng như

Hãy tìm ước lượng m ~ của kỳ vọng toán học m của đại lượng X

và dựng khoảng tin cậy ứng với xác suất tin cậy β =0,8

Giải:

0564 , 0 /

~

064 , 0

~

78 , 10

~

;,,

~

85100720

711007202

1

=+

m m

Vậy khoảng tin cậy: Iβ = ( 10 , 71 ; 10 , 85 ).

2.5.2 Khoảng tin cậy đối với phương sai

Bài toán về khoảng tin cậy đối vơi phương sai cũng được giải tương

tự Giả sử thực hiện n thí nghiệm độc lập về đại lượng ngẫu nhiên X với các tham số m và D chưa biết, đối với phương sai D ta tính được

ước lượng không chệch:

11

n i

i ~)(

~

, (2.18) trong đó

n

X m

n i i

=

= 1

Trang 12

Yêu cầu dựng gần đúng khoảng tin cậy cho phương sai

Từ công thức (2.18) thấy rằng đại lượng D~ là tổng n đại lượng

Những đại lượng ấy không phải là độc lập,

vì trong mỗi đại lượng đều có mặt m~ phụ thuộc vào tất cả X i Tuy

nhiên, người ta có thể chỉ ra rằng khi tăng n luật phân bố của tổng chúng

cũng dần tới luật chuẩn Thực tế với n=20÷30 đã có thể xem là chuẩn

Ta cũng giả thiết như vậy và tìm các đặc trưng của luật phân bố này:

kỳ vọng toán học và phương sai Vì ước lượng D~ không chệch, nên

D D

M[~] = Việc tính D D[~] rất phức tạp nên ở đây chỉ dẫn ra biểu thức cuối cùng:

2 4

1

31

D n n

n n

D D

)(]

~[

= μ , (2.19) trong đó μ4 − mô men tâm bậc bốn của đại lượng X

Để dùng biểu thức này, cần phải đưa vào đó những trị số của μ4 và

D (dù là những trị số gần đúng) Thay cho D có thể sử dụng ước lượng

của nó D~ Về nguyên tắc mô men tâm bậc bốn μ4 cũng có thể thay thế

bằng ước lượng của nó, thí dụ, bằng đại lượng sau:

n

m X

n i i

μ , (2.20) nhưng thay thế như vậy sẽ cho độ chính xác không cao, vì nhìn chung với

số lượng thí nghiệm hạn chế, các mô men bậc cao xác định với sai số lớn

Tuy nhiên, trong thực tế thường là dạng của luật phân bố của đại lượng

X được biết trước, chỉ không biết trước các tham số của phân bố đó mà

thôi Khi đó có thể biểu diễn μ4 qua D

Thí dụ, trường hợp thường gặp nhất - đại lượng X phân bố theo

luật chuẩn; khi đó mô men tâm bậc bốn được biểu diễn qua phương sai như sau

1

33

D n n

n D n D D

)(]

~[

2

D n D D

=]

~[ (2.21)

Trong (2.21) thay D chưa biết bằng ước lượng của nó, ta được

21

2

D n

[D

từ đó

D n

X chưa biết, nếu không có cơ sở đặc biệt nào để khẳng định là nó khác

rõ rệt so với luật chuẩn (có độ nhọn dương hoặc âm đáng kể), thì vẫn cứ nên sử dụng công thức (2.22) để nhận định về σD~

Tóm lại, nếu giá trị định hướng

D~

σ đã tìm được bằng cách nào đó, thì có thể dựng khoảng tin cậy cho phương sai tương tự như cho kỳ vọng toán học Ta viết

( D~− D <εβ)= β

P

Ngày đăng: 09/08/2014, 16:21

HÌNH ẢNH LIÊN QUAN

Hình 2.2. Tổ chức đồ thống kê - Chương 2NHỮNG KHÁI NIỆM CƠ BẢN CỦA LÝ THUYẾT XỬ LÝ SỐ LIỆU QUAN TRẮCGiả pdf
Hình 2.2. Tổ chức đồ thống kê (Trang 2)
Hình 2.1. Biểu diễn hàm phân bố thống kê - Chương 2NHỮNG KHÁI NIỆM CƠ BẢN CỦA LÝ THUYẾT XỬ LÝ SỐ LIỆU QUAN TRẮCGiả pdf
Hình 2.1. Biểu diễn hàm phân bố thống kê (Trang 2)
Hình 2.3. Đồ thị gần đúng của hàm phân bố thống kê - Chương 2NHỮNG KHÁI NIỆM CƠ BẢN CỦA LÝ THUYẾT XỬ LÝ SỐ LIỆU QUAN TRẮCGiả pdf
Hình 2.3. Đồ thị gần đúng của hàm phân bố thống kê (Trang 2)
Bảng 2.1. Những giá trị  χ 2  phụ thuộc vào  r  và  p - Chương 2NHỮNG KHÁI NIỆM CƠ BẢN CỦA LÝ THUYẾT XỬ LÝ SỐ LIỆU QUAN TRẮCGiả pdf
Bảng 2.1. Những giá trị χ 2 phụ thuộc vào r và p (Trang 5)
Bảng 2.2. Những giá trị của xác suất  P ( λ )  phụ thuộc vào  λ - Chương 2NHỮNG KHÁI NIỆM CƠ BẢN CỦA LÝ THUYẾT XỬ LÝ SỐ LIỆU QUAN TRẮCGiả pdf
Bảng 2.2. Những giá trị của xác suất P ( λ ) phụ thuộc vào λ (Trang 7)
Hình 2.4. Biểu diễn khoảng tin cậy - Chương 2NHỮNG KHÁI NIỆM CƠ BẢN CỦA LÝ THUYẾT XỬ LÝ SỐ LIỆU QUAN TRẮCGiả pdf
Hình 2.4. Biểu diễn khoảng tin cậy (Trang 9)
Bảng 2.3 theo  β = 0, 8  bằng - Chương 2NHỮNG KHÁI NIỆM CƠ BẢN CỦA LÝ THUYẾT XỬ LÝ SỐ LIỆU QUAN TRẮCGiả pdf
Bảng 2.3 theo β = 0, 8 bằng (Trang 13)
Bảng 2.4. Những giá trị  t β  thoả mãn đẳng thức  β - Chương 2NHỮNG KHÁI NIỆM CƠ BẢN CỦA LÝ THUYẾT XỬ LÝ SỐ LIỆU QUAN TRẮCGiả pdf
Bảng 2.4. Những giá trị t β thoả mãn đẳng thức β (Trang 16)
Hình 2.6. Đồ thị của nghiệm phương trình 2.47 - Chương 2NHỮNG KHÁI NIỆM CƠ BẢN CỦA LÝ THUYẾT XỬ LÝ SỐ LIỆU QUAN TRẮCGiả pdf
Hình 2.6. Đồ thị của nghiệm phương trình 2.47 (Trang 21)
Hình 2.7. Đồ thị để xác định số lần quan trắc  n - Chương 2NHỮNG KHÁI NIỆM CƠ BẢN CỦA LÝ THUYẾT XỬ LÝ SỐ LIỆU QUAN TRẮCGiả pdf
Hình 2.7. Đồ thị để xác định số lần quan trắc n (Trang 21)
Hình 3.1. Điểm ngẫu nhiên - Chương 2NHỮNG KHÁI NIỆM CƠ BẢN CỦA LÝ THUYẾT XỬ LÝ SỐ LIỆU QUAN TRẮCGiả pdf
Hình 3.1. Điểm ngẫu nhiên (Trang 25)
Hình 3.2. Góc phần tư  ứng với xác - Chương 2NHỮNG KHÁI NIỆM CƠ BẢN CỦA LÝ THUYẾT XỬ LÝ SỐ LIỆU QUAN TRẮCGiả pdf
Hình 3.2. Góc phần tư ứng với xác (Trang 25)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm