1. Trang chủ
  2. » Luận Văn - Báo Cáo

Phân tích thống kê phân phối chuẩn

55 521 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 55
Dung lượng 885,74 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Trong đó, phân phối chuẩn đóng vai trò quan trọng trong lý thuyết xác suất, đồng thời chiếm vị trí trung tâm trong các kết luận thống kê ứng dụng.. Ngoài ra, phân phối chuẩn cũng được ứn

Trang 1

LỜI CẢM ƠN

Để hoàn thành bản luận văn tốt nghiệp này, trước hết em xin bày tỏ lòng

biết ơn sâu sắc đến các thầy, cô giáo trong khoa Toán trường Đại học sư phạm

Hà Nội 2 đã động viên, giúp đỡ em trong suốt thời gian hoàn thành khoá luận

này

Đặc biệt, em xin bày tỏ lòng biết ơn sâu sắc của mình tới thầy giáo Th.s

Nguyễn Trung Dũng - người đã tạo điều kiện tốt nhất và chỉ bảo tận tình giúp

em hoàn thành khóa luận này

Em xin chân thành cảm ơn

Trang 2

LỜI CAM ĐOAN

Đề tài của em được hình thành dưới sự hướng dẫn của thầy Th.s

Nguyễn Trung Dũng cùng sự cố gắng của bản thân Trong suốt thời gian

nghiên cứu và thực hiện khoá luận này em đã tham khảo một số tài liệu (đã

nêu trong phần tài liệu tham khảo)

Em xin cam đoan những kết quả trong khoá luận tốt nghiệp là kết quả

nghiên cứu của em, không trùng với bất kỳ tác giả nào khác Nếu sai em xin

chịu hoàn toàn trách nhiệm

Hà Nội, ngày 20 tháng 04 năm 2010

Sinh viên

Nguyễn Thị Huyền Trang

Trang 3

LỜI NÓI ĐẦU

Toán ứng dụng là một ngành toán học có ý nghĩa rất to lớn và chiếm

một vị trí quan trọng Nó là cầu nối để đưa những kết quả được nghiên cứu

trên lý thuyết của giải tích , đại số, hình học vào trong các ngành khoa học

khác và thực tế cuộc sống

Lý thuyết xác suất là bộ môn có tính ứng dụng rất rộng rãi trong các

ngành khoa học tự nhiên, khoa học xã hội và thực tế cuộc sống Nó là công cụ

để giải quyết các vấn đề chuyên môn của nhiều lĩnh vực như kinh tế, sinh học

, tâm lý – xã hội Do đó bộ môn này được đưa vào giảng dạy ở hầu hết các

trường đại học và cao đẳng

Trong đó, phân phối chuẩn đóng vai trò quan trọng trong lý thuyết xác

suất, đồng thời chiếm vị trí trung tâm trong các kết luận thống kê ứng dụng

Trong thực tế nhiều biến ngẫu nhiên , nhiều quy luật tuân theo luật chuẩn hoặc

gần chuẩn Ngoài ra, phân phối chuẩn cũng được ứng dụng để mô tả nhiều

hiện tượng địa chất như hàm lượng nước trong đá trầm tích, hàm lượng của

một số nguyên tố hoá học…và đặc biệt, phân phối chuẩn còn được ứng dụng

trong các bài toán ước lượng và bài toán kiểm định giả thiết, là cơ sở đưa ra

được những kết luận thống kê có giá trị

Với mong muốn làm rõ hơn ý nghĩa của thống kê trong đời sống thông

qua một số ứng dụng cơ bản nhất của phân phối chuẩn Em đã chọn đề tài

“Phân tích thống kê phân phối chuẩn” làm đề tài khoá luận của mình

Nội dung của khoá luận bao gồm

Chương 1: Cơ sở

Chương 2: Phân tích thống kê đối với phân phối chuẩn

Với khoá luận tốt nghiệp trên, em mong rằng nó sẽ là tài liệu bổ ích cho

những ai quan tâm tới vấn đề này

Trang 4

MỤC LỤC

LỜI CẢM ƠN 1

LỜI CAM ĐOAN 2

LỜI NÓI ĐẦU 3

CHƯƠNG 1: CƠ SỞ 5

1.1 Phân phối chuẩn 9

1.2 Mẫu và phân phối mẫu của chuẩn 14

1.3 Ước lượng điểm 14

1.3.1 Một số định nghĩa 14

1.3.2 Các phương pháp tìm ước lượng điểm 16

1.4 Ước lượng khoảng 18

1.4.1 Một số định nghĩa 18

1.4.2 Phương pháp P-Q-M tìm ước lượng khoảng 19

CHƯƠNG 2 PHÂN TÍCH THỐNG KÊ VỚI PHÂN PHỐI CHUẨN 20

2.1 Ước lượng tham số 20

2.2 Khoảng tin cậy của các tham số 22

2.3 Kiểm định giả thuyết các tham số 28

2.3.1 Kiểm định giả thuyết về giá trị trung bình 28

2.3.2 Kiểm định giả thuyết về hai kỳ vọng toán của hai biến ngẫu nhiên phân phối chuẩn 32

2.3.3 Kiểm định giả thuyết về phương sai 36

2.3.4 Kiểm định giả thuyết về sự bằng nhau của hai phương sai 37

2.3.5 Kiểm định k phương sai của k biến ngẫu nhiên phân phối chuẩn 38 2.3.6 Kiểm định giả thuyết về quy luật phân phối xác suất 38

2.4 Một số bài toán 39

2.4.1 Bài toán về ước lượng tham số 39

2.4.2 Bài toán về khoảng tin cậy của các tham số 42

2.4.3 Bài toán về kiểm định tham số 46

KẾT LUẬN 54

TÀI LIỆU THAM KHẢO 55

Trang 5

CHƯƠNG 1 CƠ SỞ

1.1 Phân phối chuẩn

Định nghĩa 1.1 Biến ngẫu nhiên X được gọi là có phân phối chuẩn nếu hàm

mật độ xác suất của X có dạng

2 2 2 2

1.2

x X

t x

1 , 2

x X

1.2

x X

Trang 6

phân phối liên tục tuyệt đối

2 2

2 2

2

x

1 x ( )

( x ) 2 1

Trang 7

dxdz Khi đổi biến cận lấy tích phân không thay đổi Ta có

2

z 2

Trang 8

t t

2

Trang 9

1.2 Mẫu và phân phối mẫu của chuẩn

Định nghĩa 1.2 ( Mẫu ngẫu nhiên ) Cho biến ngẫu nhiên X Tiến hành n

quan sát độc lập về X Gọi X i là quan sát thứ i,i1,n Khi đó X 1 ,X 2 ,…,X n

được gọi là mẫu ngẫu nhiên cỡ n quan sát về biến ngẫu nhiên X

Chú ý Cho (X 1 ,X 2 ,…,X n ) là mẫu ngẫu nhiên quan sát về biến ngẫu nhiên X

Khi đó ta có

 X 1 ,X 2 ,…,X n là các biến ngẫu nhiên độc lập

 X 1 ,X 2 ,…,X n là các biến ngẫu nhiên có cùng phân phối xác suất với

biến ngẫu nhiên X

Giả sử x i là giá trị cụ thể ở lần quan sát thứ i Khi đó (x 1 , ,x n ) được gọi là

mẫu số liệu cụ thể mà mẫu ngẫu nhiên (X 1 ,X 2 ,…,X n ) nhận

Định nghĩa 1.3 (Phân phối 2 ) Đại lượng ngẫu nhiên liên tục X được gọi là

phân phối theo quy luật khi bình phương với k bậc tự do nếu hàm mật độ xác

suất của nó được xác định bằng biểu thức

Trang 10

x n 1

2 2 n

2 X

1 e x ,x > 0 n

    là hàm Gamma Nếu k là một số nguyên thì

Định lý 1.8 Nếu Z i có phân phối chuẩn tắc thì Z i ~ N (0,1), i1,k và là các

biến ngẫu nhiên độc lập Khi đó

2

( k ) 2

Định nghĩa 1.4 (Phân phối T-student) Biến ngẫu nhiên liên tục X gọi là

phân phối theo quy luật Student với n bậc tự do nếu hàm mật độ xác suất của

nó xác định bằng biểu thức sau

n 2

2 X

n ( )

t 2

Trang 11

có phân phối Student với n bậc tự do

Định nghĩa 1.5 (Phân phối FISHER – SNEDECOR ) Biến ngẫu nhiên liên

tục F được gọi là phân phối theo quy luật Fisher – Snedecor với n 1 , n 2 bậc tự

do nếu hàm mật độ xác suất của nó xác định bằng biểu thức sau

1 2

1 2

n n 2

n n 2

có phân phối theo quy luật Fisher với n 1 và n 2 bậc tự do

Định lý 1.11 Cho X 1 ,X 2 ,…,X n là quan sát về biến ngẫu nhiên X ~ N ( , 2)

Khi đó

2 n

Trang 12

Định lý 1.12 Cho X 1 ,X 2 ,…,X n là mẫu ngẫu nhiên quan sát về biến ngẫu nhiên

X ~ N ( , 2) Khi đó ta có các khẳng định sau

a

2 n

ˆ ( n 1 )s

Trang 13

ˆ ( n 1 )s

  và ( 1 ) 2 nên

2

n 1 2

ˆ ns

  ~( n ) 2

Ta phải chứng minh X n 1 và ˆs 2 n 1 là độc lập Ta có

Trang 14

Cov( nX nX n 1, X n 1 X n )= n Cov( X , X n n 1) + Cov( X n 1, X n 1)

        là tham số chưa biết

Định nghĩa 1.6 ( Ƣớc lƣợng điểm ) Mỗi hàm số ˆ( X 1 ,X 2 ,…,X n ) được gọi là

ước lượng điểm cho tham số

Định nghĩa 1.7 ( Ƣớc lƣợng không chệch ) Ước lượng điểm ˆ( X 1 ,X 2 ,…,X n )

được gọi là ước lượng không chệch cho tham số nếu E ˆ(X 1 ,X 2 ,…,X n )=,

i 1

1 ( X X )

n  là ước lượng chệch cho tham số

Trang 15

Định nghĩa 1.8 ( Ước lượng vững ) Ước lượng điểm ˆ(X 1 ,X 2 ,…,X n ) được gọi

là ước lượng vững cho tham số =( µ,σ²) nếu với   0 thì

n

ˆ lim P( X , ,X )   0

Như vậy theo hệ quả của luật số lớn Chebyshev ta có trung bình mẫu X là

ước lượng vững của kỳ vọng , s và s 2 ˆ 2 là ước lượng vững của phương sai

σ² của biến ngẫu nhiên gốc X của tổng thể

Định nghĩa 1.9 ( Ước lượng hiệu quả ) Ước lượng điểm ˆ(X 1 ,X 2 ,…,X n )

được gọi là ước lượng hiệu quả cho tham số nếu thỏa mãn

i E ˆ (X 1 ,X 2 ,…,X n ) = ,   

ii D ˆ(X 1 ,X 2 ,…,X n ) DT(X 1 ,X 2 ,…,X n ) Trong đó T(X 1 ,X 2 ,…,X n ) là ước

lượng không chệch cho bất kì của

Định nghĩa 1.10 ( Lượng thông tin Fisher) Cho biến ngẫu nhiên liên tục X

có phân phối chuẩn với hàm mật độ xác suất f (x, , 2) Lượng thông tin

Fisher chứa trong một quan sát về biến ngẫu nhiên X có tham số  ( , 2)

Kí hiệu là I () được xác định bởi

Kết quả Lượng thông tin Fisher chứa trong n quan sát X 1 ,X 2 ,…,Xn về biến

ngẫu nhiên là I n () = n I() , I() là lượng thông tin Fisher chứa trong một

lần quan sát

Định lý 1.13 ( Định lý cận dưới Cramer-Rao ) Cho (X 1 ,X 2 ,…,X n ) là mẫu

quan sát về biến ngẫu nhiên X có hàm mật độ xác xuất thỏa mãn các điều kiện

chính quy

Giả sử ˆ (X 1 ,X 2 ,…,X n ) là một ước lượng không chệch cho tham số  Khi đó

Trang 16

ta có

D ˆ (X 1 ,X 2 ,…,X n ) 1

nI( )

Chú ý Nếu phương sai của ước lượng đạt dấu bằng của cận dưới Cramer-

Rao thì ước lượng đó là ước lượng hiệu quả cho tham số 

Định nghĩa 1.11 (Ước lượng hợp lí cực đại) ˆ (X 1 ,X 2 ,…,X n ) được gọi là

ước lượng hợp lí cực đại cho tham số =( µ,σ²) nếu L( ˆ) = Max L( )

Cho X 1 ,X 2 ,…,X n là mẫu quan sát về X có phân phối chuẩn thuộc họ F(x, =(

µ,σ²)) đã biết =( µ,σ²) là hàm số chưa biết

Hàm hợp lý kí hiệu là L() = L(x 1 , ,x n , µ,σ²) được xác định bởi

L()=

n

2 i

i 1

f ( x , ,  )

Trong thực hành, để tìm ước lượng hợp lý cực đại cho tham số =( µ,σ²)

Người ta thường tìm nghiệm của hệ phương trình

Cho X 1 ,X 2 ,…,X n là các mẫu quan sát về biến ngẫu nhiên X ~ N (µ,σ²)

Bằng phương pháp mômen ta tìm các giá trị ước lượng cho µ và σ²

Do X ~ N (µ,σ²) nên ta có các mômen chính xác của X là

Trang 17

m1 =

1

1 n

i i

n

  là ước lượng hợp lý cực đại cho EX

 2 2

1

1 n

i i

Cho X 1 ,X 2 ,…,X n là mẫu quan sát về X có phân phối chuẩn thuộc họ

F(x, =( µ,σ²)) đã biết =( µ,σ²) là hàm số chưa biết

Bằng phương pháp hợp lý cực đại ta tìm các ước lượng cho các tham số µ và

2 2

2

2 2

1

2( , ) ( , ) ( , , , , )

1 = (2 )

2

i

n i

xi i

x

n x

n n

Trang 18

1 2

1

n i i

1

2 2

X n

x L

Định nghĩa 1.12 ( Khoảng tin cậy ) Cho X 1 ,X 2 ,…,X n là mẫu quan sát về biến

ngẫu nhiên X có tham số 2

Trong đó  21 là độ chính xác của ước lượng

Định nghĩa 1.13 ( Số quan sát cần thiết ) Cho độ tin cậy 1, độ chính xác

= 21 thì số quan sát n cần thiết để nhận được ước lượng với độ tin cậy

Trang 19

Nhìn chung b (n) phụ thuộc vào n ở dạng

1 2

ndo đó muốn tăng độ chính xác lên 2 lần thì phải tăng n lên 4 lần

1.4.2 Phương pháp P-Q-M tìm ước lượng khoảng

B1 Xuất phát từ một ước lượng ˆ của  2

,

    ( ước lượng không chệch, ước lượng vững, ước lượng hiệu quả, ước lượng hợp lý cực đại )

B2 Tìm biến ngẫu nhiên c  ˆ , có phân phối xác suất không phụ thuộc vào

bất kỳ tham số nào

B3 Tìm hai số c và d sao cho P c c( , ) d ˆ   1  Từ cc( , ) ˆd

Ta tìm được khoảng tin cậy cho  2

,

Trang 20

CHƯƠNG 2

PHÂN TÍCH THỐNG KÊ VỚI PHÂN PHỐI CHUẨN

2.1 Ước lượng tham số

Tính chất 2.1 Cho X 1 ,X 2 ,…,X n là mẫu quan sát về biến ngẫu nhiên

X ~ N( ,1 ) Khi đó ˆ X là ước lượng hợp lý cực đại cho 

Chứng minh

Ta có

2 i

2

n

( x i ) 2i 1

( x ) 2 i

Vậy ˆX là ước lượng hợp lý cực đại cho 

Tính chất 2.2 Cho X 1 ,X 2 ,…,X n là mẫu quan sát về biến ngẫu nhiên

2

X ~ N( ,  ) Khi đó trung bình mẫu X là ước lượng hiệu quả của kỳ vọng

toán  của biến ngẫu nhiên X

Chứng minh

Do X là ước lượng không chệch cho  và do X ~ N (µ,σ²) nên ta có

2 2

( x ) 2 X

Trang 21

ln f( X, ) = -ln

2 2

 bằng vế phải của bất đẳng thức Cramer- Rao

Vậy X là ƣớc lƣợng hiệu quả nhất của 

Tính chất 2.3 Cho X 1 ,X 2 ,…,X n là mẫu quan sát về biến ngẫu nhiên

Trang 22

X 2

1 ˆ

D

I ( ) ˆ

 là ƣớc lƣợng hiệu quả cho 2

2.2 Khoảng tin cậy của các tham số

Tính chất 2.4 Cho X 1 ,X 2 ,…,X n là mẫu quan sát về biến ngẫu nhiên

2

X ~ N( ,  ) trong đó  là tham số chƣa biết, 2 là hằng số đã biết Khi đó

khoảng tin cậy cho  là X u( ) X u( )

Trang 23

Vì N(0,1) là phân phối đối xứng nên ta chọn d = -c ,c > 0 sao cho

X ~ N( ,  ) trong đó  = EX , 2=DX là tham số chƣa biết Khi đó

Trang 24

Ta có

2 2 1 2

ˆ( 1)

ˆ( 1)( 1)

Trang 25

khoảng tin cậy cho 2

ˆ( 1)

Tính chất 2.7 Cho X 1 , ,X n là mẫu quan sát về biến ngẫu nhiên X~( X, X2)

và Y 1 , ,Y m là mẫu quan sát về biến ngẫu nhiên Y ~ N ( Y, Y2) độc lập với

mẫu trên Trong đó  X, Ylà các tham số chƣa biết, X2, Y2 là các tham số đã

Trang 26

biết.Với độ tin cậy 1- ( 0  1 ) khoảng tin cậy choX Y là

Trang 27

Tính chất 2.8 Cho X 1 , ,X n là mẫu quan sát về biến ngẫu nhiên X~( X, X2)và

Y 1 , ,Y m là mẫu quan sát về biến ngẫu nhiên Y ~ N ( Y, Y2) độc lập với mẫu

trên Trong đó  X, Ylà các tham số chƣa biết, X2, Y2 là các tham số chƣa

biết, nhƣng biết rằng X2 = Y2.Với độ tin cậy 1- ( 0  1 ) khoảng tin cậy

Trang 28

2.3 Kiểm định giả thuyết các tham số

2.3.1 Kiểm định giả thuyết về giá trị trung bình

 Trường hợp 1: Nếu phương sai 2 đã biết

Giả sử biến ngẫu nhiên gốc X trong tổng thể phân phối theo quy luật chuẩn

2

( , )

N   với phương sai đã biết nhưng chưa biết kỳ vọng toán µ

Nếu có cơ sở để giả thiết rằng giá trị của nó bằng 0 ta đưa ra giả thuyết

Trang 29

thống kê H :   0 Để kiểm định giả thuyết trên từ tổng thể mẫu kích thước

n: X 1 , ,X n

Vì đã biết phương sai 2của biến ngẫu nhiên gốc X trong tổng thể nếu tiêu

chuẩn kiểm định được chọn là thống kê

Nếu cho trước mức ý nghĩa  thì tùy thuộc vào dạng của giả thuyết đối K

miền bác bỏ “tốt nhất” được xây dựng theo các trường hợp sau

- Nếu U  u(

2

) thì ta bác bỏ H

- Nếu U < u(

2

) thì ta chấp nhận H

Cơ sở lý luận của quy tắc trên như sau

Trang 30

Nếu X ~ N( , 2) hoặc X không phải chuẩn nhưng n > 30 thì với giả thiết H

đúng   0ta có

2

0 X

 Trường hợp 2 : Nếu phương sai 2 chưa biết

Tiêu chuẩn kiểm định là thống kê

s

Ta lại có: T ~ T n-1 Trong đó T n-1 là biến ngẫu nhiên với n-1 bậc tự do Do đó

tùy thuộc vào dạng của giả thuyết đối K, miền bác bỏ “ tốt nhất ” được xây

dựng theo các trường hợp sau

a) H :   0; K:  0

Trang 31

Lúc đó với mức ý nghĩa cho trước có thể tìm được giá trị tới hạn

Student t n-1 () ta tiến hành kiểm định như sau

Cơ sở lý luận của cách làm trên như sau

Giả sử giả thiết H đúng, tức X ~ N( 0, 2)

Khi đó

2

0 0

Lúc đó với mức ý nghĩa  cho trước có thể tìm được giá trị tới hạn Student

tn-1(), ta có miền tiêu chuẩn là

Trang 32

2.3.2 Kiểm định giả thuyết về hai kỳ vọng toán của hai biến ngẫu nhiên

phân phối chuẩn

Giả sử có hai tổng thể nghiên cứu trong đó các biến ngẫu nhiên X và Y có

cùng phân phối chuẩn với các kỳ vọng toán là  X và  Y và các phương sai

là X2 và Y2 Nếu  X và  Y chưa biết song có cơ sở để giả thiết rằng giá trị

của chúng bằng nhau người ta đưa ra giả thuyết thống kê

H:  X = Y

Để kiểm định giả thuyết trên ta xét một số trường hợp sau đây

 Trường hợp 1: Nếu đã biết phương sai 2 2

X và Y

Cho hai mẫu độc lập kích thước n và m: X 1 , ,X n và Y 1 , ,Y m

Lúc đó tiêu chuẩn kiểm định được chọn là thống kê

Vì vậy với mức ý nghĩa bằng  cho trước và tùy thuộc vào dạng của giả

thuyết đối K, với phương pháp xây dựng đã làm ở các phần trên ta thu được

các miền tiêu chuẩn như sau

Trang 33

Xem xét xem U có thuộc miền tiêu chuẩn hay không để kết luận

 Trường hợp 2: Nếu chưa biết phương sai 2 2

X và Y

  song giả định rằng chúng bằng nhauX 2 Y 2

Cho hai mẫu độc lập kích thước n và m: X 1 , ,X n và Y 1 , ,Y m

Khi đó tiêu chuẩn kiểm định được chọn là

Ta biết rằng T phân phối Student với n+m-2 bậc tự do Với điều kiện giả

thuyết đúng thì tiêu chuẩn kiểm định trở thành

Trang 34

Và vẫn phân phối T m+n-2 Do đó tùy thuộc vào giả thuyết đối ta có miền bác

X Y

1 1 S

X Y

2

1 1 S

Ngày đăng: 31/10/2015, 22:01

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1] Đào Hữu Hồ ( 2004 ), “Hướng dẫn giải các bài toán Xác suất thống kê ”, Nxb ĐHQG Hà Nội Sách, tạp chí
Tiêu đề: Hướng dẫn giải các bài toán Xác suất thống kê
Nhà XB: Nxb ĐHQG Hà Nội
[2] Đào Hữu Hồ ( 2007 ) , “Xác suất thống kê ” , Nxb ĐHQG Hà Nội Sách, tạp chí
Tiêu đề: Xác suất thống kê
Nhà XB: Nxb ĐHQG Hà Nội
[3] Đặng Hùng Thắng ( 2008), “ Thống kê và ứng dụng ”, Nxb Giáo dục Sách, tạp chí
Tiêu đề: Thống kê và ứng dụng
Nhà XB: Nxb Giáo dục
[4] Nguyễn Cao Văn ( 2008), Lý thuyết xác suất và thống kê toán , Nxb Đại học Kinh tế quốc dân Sách, tạp chí
Tiêu đề: Lý thuyết xác suất và thống kê toán
Nhà XB: Nxb Đại học Kinh tế quốc dân
[5] Nguyễn Duy Tiến , Vũ Viết Yên ( 2003 ), “Lý thuyết xác suất ”, Nxb Giáo dục Sách, tạp chí
Tiêu đề: Lý thuyết xác suất
Nhà XB: Nxb Giáo dục

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w