Trong đó, phân phối chuẩn đóng vai trò quan trọng trong lý thuyết xác suất, đồng thời chiếm vị trí trung tâm trong các kết luận thống kê ứng dụng.. Ngoài ra, phân phối chuẩn cũng được ứn
Trang 1LỜI CẢM ƠN
Để hoàn thành bản luận văn tốt nghiệp này, trước hết em xin bày tỏ lòng
biết ơn sâu sắc đến các thầy, cô giáo trong khoa Toán trường Đại học sư phạm
Hà Nội 2 đã động viên, giúp đỡ em trong suốt thời gian hoàn thành khoá luận
này
Đặc biệt, em xin bày tỏ lòng biết ơn sâu sắc của mình tới thầy giáo Th.s
Nguyễn Trung Dũng - người đã tạo điều kiện tốt nhất và chỉ bảo tận tình giúp
em hoàn thành khóa luận này
Em xin chân thành cảm ơn
Trang 2LỜI CAM ĐOAN
Đề tài của em được hình thành dưới sự hướng dẫn của thầy Th.s
Nguyễn Trung Dũng cùng sự cố gắng của bản thân Trong suốt thời gian
nghiên cứu và thực hiện khoá luận này em đã tham khảo một số tài liệu (đã
nêu trong phần tài liệu tham khảo)
Em xin cam đoan những kết quả trong khoá luận tốt nghiệp là kết quả
nghiên cứu của em, không trùng với bất kỳ tác giả nào khác Nếu sai em xin
chịu hoàn toàn trách nhiệm
Hà Nội, ngày 20 tháng 04 năm 2010
Sinh viên
Nguyễn Thị Huyền Trang
Trang 3LỜI NÓI ĐẦU
Toán ứng dụng là một ngành toán học có ý nghĩa rất to lớn và chiếm
một vị trí quan trọng Nó là cầu nối để đưa những kết quả được nghiên cứu
trên lý thuyết của giải tích , đại số, hình học vào trong các ngành khoa học
khác và thực tế cuộc sống
Lý thuyết xác suất là bộ môn có tính ứng dụng rất rộng rãi trong các
ngành khoa học tự nhiên, khoa học xã hội và thực tế cuộc sống Nó là công cụ
để giải quyết các vấn đề chuyên môn của nhiều lĩnh vực như kinh tế, sinh học
, tâm lý – xã hội Do đó bộ môn này được đưa vào giảng dạy ở hầu hết các
trường đại học và cao đẳng
Trong đó, phân phối chuẩn đóng vai trò quan trọng trong lý thuyết xác
suất, đồng thời chiếm vị trí trung tâm trong các kết luận thống kê ứng dụng
Trong thực tế nhiều biến ngẫu nhiên , nhiều quy luật tuân theo luật chuẩn hoặc
gần chuẩn Ngoài ra, phân phối chuẩn cũng được ứng dụng để mô tả nhiều
hiện tượng địa chất như hàm lượng nước trong đá trầm tích, hàm lượng của
một số nguyên tố hoá học…và đặc biệt, phân phối chuẩn còn được ứng dụng
trong các bài toán ước lượng và bài toán kiểm định giả thiết, là cơ sở đưa ra
được những kết luận thống kê có giá trị
Với mong muốn làm rõ hơn ý nghĩa của thống kê trong đời sống thông
qua một số ứng dụng cơ bản nhất của phân phối chuẩn Em đã chọn đề tài
“Phân tích thống kê phân phối chuẩn” làm đề tài khoá luận của mình
Nội dung của khoá luận bao gồm
Chương 1: Cơ sở
Chương 2: Phân tích thống kê đối với phân phối chuẩn
Với khoá luận tốt nghiệp trên, em mong rằng nó sẽ là tài liệu bổ ích cho
những ai quan tâm tới vấn đề này
Trang 4MỤC LỤC
LỜI CẢM ƠN 1
LỜI CAM ĐOAN 2
LỜI NÓI ĐẦU 3
CHƯƠNG 1: CƠ SỞ 5
1.1 Phân phối chuẩn 9
1.2 Mẫu và phân phối mẫu của chuẩn 14
1.3 Ước lượng điểm 14
1.3.1 Một số định nghĩa 14
1.3.2 Các phương pháp tìm ước lượng điểm 16
1.4 Ước lượng khoảng 18
1.4.1 Một số định nghĩa 18
1.4.2 Phương pháp P-Q-M tìm ước lượng khoảng 19
CHƯƠNG 2 PHÂN TÍCH THỐNG KÊ VỚI PHÂN PHỐI CHUẨN 20
2.1 Ước lượng tham số 20
2.2 Khoảng tin cậy của các tham số 22
2.3 Kiểm định giả thuyết các tham số 28
2.3.1 Kiểm định giả thuyết về giá trị trung bình 28
2.3.2 Kiểm định giả thuyết về hai kỳ vọng toán của hai biến ngẫu nhiên phân phối chuẩn 32
2.3.3 Kiểm định giả thuyết về phương sai 36
2.3.4 Kiểm định giả thuyết về sự bằng nhau của hai phương sai 37
2.3.5 Kiểm định k phương sai của k biến ngẫu nhiên phân phối chuẩn 38 2.3.6 Kiểm định giả thuyết về quy luật phân phối xác suất 38
2.4 Một số bài toán 39
2.4.1 Bài toán về ước lượng tham số 39
2.4.2 Bài toán về khoảng tin cậy của các tham số 42
2.4.3 Bài toán về kiểm định tham số 46
KẾT LUẬN 54
TÀI LIỆU THAM KHẢO 55
Trang 5CHƯƠNG 1 CƠ SỞ
1.1 Phân phối chuẩn
Định nghĩa 1.1 Biến ngẫu nhiên X được gọi là có phân phối chuẩn nếu hàm
mật độ xác suất của X có dạng
2 2 2 2
1.2
x X
t x
1 , 2
x X
1.2
x X
Trang 6phân phối liên tục tuyệt đối
2 2
2 2
2
x
1 x ( )
( x ) 2 1
Trang 7dxdz Khi đổi biến cận lấy tích phân không thay đổi Ta có
2
z 2
Trang 8t t
2
Trang 91.2 Mẫu và phân phối mẫu của chuẩn
Định nghĩa 1.2 ( Mẫu ngẫu nhiên ) Cho biến ngẫu nhiên X Tiến hành n
quan sát độc lập về X Gọi X i là quan sát thứ i,i1,n Khi đó X 1 ,X 2 ,…,X n
được gọi là mẫu ngẫu nhiên cỡ n quan sát về biến ngẫu nhiên X
Chú ý Cho (X 1 ,X 2 ,…,X n ) là mẫu ngẫu nhiên quan sát về biến ngẫu nhiên X
Khi đó ta có
X 1 ,X 2 ,…,X n là các biến ngẫu nhiên độc lập
X 1 ,X 2 ,…,X n là các biến ngẫu nhiên có cùng phân phối xác suất với
biến ngẫu nhiên X
Giả sử x i là giá trị cụ thể ở lần quan sát thứ i Khi đó (x 1 , ,x n ) được gọi là
mẫu số liệu cụ thể mà mẫu ngẫu nhiên (X 1 ,X 2 ,…,X n ) nhận
Định nghĩa 1.3 (Phân phối 2 ) Đại lượng ngẫu nhiên liên tục X được gọi là
phân phối theo quy luật khi bình phương với k bậc tự do nếu hàm mật độ xác
suất của nó được xác định bằng biểu thức
Trang 10x n 1
2 2 n
2 X
1 e x ,x > 0 n
là hàm Gamma Nếu k là một số nguyên thì
Định lý 1.8 Nếu Z i có phân phối chuẩn tắc thì Z i ~ N (0,1), i1,k và là các
biến ngẫu nhiên độc lập Khi đó
2
( k ) 2
Định nghĩa 1.4 (Phân phối T-student) Biến ngẫu nhiên liên tục X gọi là
phân phối theo quy luật Student với n bậc tự do nếu hàm mật độ xác suất của
nó xác định bằng biểu thức sau
n 2
2 X
n ( )
t 2
Trang 11 có phân phối Student với n bậc tự do
Định nghĩa 1.5 (Phân phối FISHER – SNEDECOR ) Biến ngẫu nhiên liên
tục F được gọi là phân phối theo quy luật Fisher – Snedecor với n 1 , n 2 bậc tự
do nếu hàm mật độ xác suất của nó xác định bằng biểu thức sau
1 2
1 2
n n 2
n n 2
có phân phối theo quy luật Fisher với n 1 và n 2 bậc tự do
Định lý 1.11 Cho X 1 ,X 2 ,…,X n là quan sát về biến ngẫu nhiên X ~ N ( , 2)
Khi đó
2 n
Trang 12Định lý 1.12 Cho X 1 ,X 2 ,…,X n là mẫu ngẫu nhiên quan sát về biến ngẫu nhiên
X ~ N ( , 2) Khi đó ta có các khẳng định sau
a
2 n
ˆ ( n 1 )s
Trang 13ˆ ( n 1 )s
và ( 1 ) 2 nên
2
n 1 2
ˆ ns
~( n ) 2
Ta phải chứng minh X n 1 và ˆs 2 n 1 là độc lập Ta có
Trang 14Cov( nX n X n 1 , X n 1 X n )= n Cov( X , X n n 1 ) + Cov( X n 1 , X n 1 )
là tham số chưa biết
Định nghĩa 1.6 ( Ƣớc lƣợng điểm ) Mỗi hàm số ˆ( X 1 ,X 2 ,…,X n ) được gọi là
ước lượng điểm cho tham số
Định nghĩa 1.7 ( Ƣớc lƣợng không chệch ) Ước lượng điểm ˆ( X 1 ,X 2 ,…,X n )
được gọi là ước lượng không chệch cho tham số nếu E ˆ(X 1 ,X 2 ,…,X n )=,
i 1
1 ( X X )
n là ước lượng chệch cho tham số
Trang 15Định nghĩa 1.8 ( Ước lượng vững ) Ước lượng điểm ˆ(X 1 ,X 2 ,…,X n ) được gọi
là ước lượng vững cho tham số =( µ,σ²) nếu với 0 thì
n
ˆ lim P ( X , ,X ) 0
Như vậy theo hệ quả của luật số lớn Chebyshev ta có trung bình mẫu X là
ước lượng vững của kỳ vọng , s và s 2 ˆ 2 là ước lượng vững của phương sai
σ² của biến ngẫu nhiên gốc X của tổng thể
Định nghĩa 1.9 ( Ước lượng hiệu quả ) Ước lượng điểm ˆ(X 1 ,X 2 ,…,X n )
được gọi là ước lượng hiệu quả cho tham số nếu thỏa mãn
i E ˆ (X 1 ,X 2 ,…,X n ) = ,
ii D ˆ(X 1 ,X 2 ,…,X n ) DT(X 1 ,X 2 ,…,X n ) Trong đó T(X 1 ,X 2 ,…,X n ) là ước
lượng không chệch cho bất kì của
Định nghĩa 1.10 ( Lượng thông tin Fisher) Cho biến ngẫu nhiên liên tục X
có phân phối chuẩn với hàm mật độ xác suất f (x, , 2) Lượng thông tin
Fisher chứa trong một quan sát về biến ngẫu nhiên X có tham số ( , 2)
Kí hiệu là I () được xác định bởi
Kết quả Lượng thông tin Fisher chứa trong n quan sát X 1 ,X 2 ,…,Xn về biến
ngẫu nhiên là I n () = n I() , I() là lượng thông tin Fisher chứa trong một
lần quan sát
Định lý 1.13 ( Định lý cận dưới Cramer-Rao ) Cho (X 1 ,X 2 ,…,X n ) là mẫu
quan sát về biến ngẫu nhiên X có hàm mật độ xác xuất thỏa mãn các điều kiện
chính quy
Giả sử ˆ (X 1 ,X 2 ,…,X n ) là một ước lượng không chệch cho tham số Khi đó
Trang 16ta có
D ˆ (X 1 ,X 2 ,…,X n ) 1
nI( )
Chú ý Nếu phương sai của ước lượng đạt dấu bằng của cận dưới Cramer-
Rao thì ước lượng đó là ước lượng hiệu quả cho tham số
Định nghĩa 1.11 (Ước lượng hợp lí cực đại) ˆ (X 1 ,X 2 ,…,X n ) được gọi là
ước lượng hợp lí cực đại cho tham số =( µ,σ²) nếu L( ˆ) = Max L( )
Cho X 1 ,X 2 ,…,X n là mẫu quan sát về X có phân phối chuẩn thuộc họ F(x, =(
µ,σ²)) đã biết =( µ,σ²) là hàm số chưa biết
Hàm hợp lý kí hiệu là L() = L(x 1 , ,x n , µ,σ²) được xác định bởi
L()=
n
2 i
i 1
f ( x , , )
Trong thực hành, để tìm ước lượng hợp lý cực đại cho tham số =( µ,σ²)
Người ta thường tìm nghiệm của hệ phương trình
Cho X 1 ,X 2 ,…,X n là các mẫu quan sát về biến ngẫu nhiên X ~ N (µ,σ²)
Bằng phương pháp mômen ta tìm các giá trị ước lượng cho µ và σ²
Do X ~ N (µ,σ²) nên ta có các mômen chính xác của X là
Trang 17m1 =
1
1 n
i i
n
là ước lượng hợp lý cực đại cho EX
2 2
1
1 n
i i
Cho X 1 ,X 2 ,…,X n là mẫu quan sát về X có phân phối chuẩn thuộc họ
F(x, =( µ,σ²)) đã biết =( µ,σ²) là hàm số chưa biết
Bằng phương pháp hợp lý cực đại ta tìm các ước lượng cho các tham số µ và
2 2
2
2 2
1
2( , ) ( , ) ( , , , , )
1 = (2 )
2
i
n i
xi i
x
n x
n n
Trang 181 2
1
n i i
1
2 2
X n
x L
Định nghĩa 1.12 ( Khoảng tin cậy ) Cho X 1 ,X 2 ,…,X n là mẫu quan sát về biến
ngẫu nhiên X có tham số 2
Trong đó 2 1 là độ chính xác của ước lượng
Định nghĩa 1.13 ( Số quan sát cần thiết ) Cho độ tin cậy 1, độ chính xác
= 2 1 thì số quan sát n cần thiết để nhận được ước lượng với độ tin cậy
Trang 19Nhìn chung b (n) phụ thuộc vào n ở dạng
1 2
n do đó muốn tăng độ chính xác lên 2 lần thì phải tăng n lên 4 lần
1.4.2 Phương pháp P-Q-M tìm ước lượng khoảng
B1 Xuất phát từ một ước lượng ˆ của 2
,
( ước lượng không chệch, ước lượng vững, ước lượng hiệu quả, ước lượng hợp lý cực đại )
B2 Tìm biến ngẫu nhiên c ˆ , có phân phối xác suất không phụ thuộc vào
bất kỳ tham số nào
B3 Tìm hai số c và d sao cho P c c( , ) d ˆ 1 Từ cc( , ) ˆ d
Ta tìm được khoảng tin cậy cho 2
,
Trang 20CHƯƠNG 2
PHÂN TÍCH THỐNG KÊ VỚI PHÂN PHỐI CHUẨN
2.1 Ước lượng tham số
Tính chất 2.1 Cho X 1 ,X 2 ,…,X n là mẫu quan sát về biến ngẫu nhiên
X ~ N( ,1 ) Khi đó ˆ X là ước lượng hợp lý cực đại cho
Chứng minh
Ta có
2 i
2
n
( x i ) 2i 1
( x ) 2 i
Vậy ˆ X là ước lượng hợp lý cực đại cho
Tính chất 2.2 Cho X 1 ,X 2 ,…,X n là mẫu quan sát về biến ngẫu nhiên
2
X ~ N( , ) Khi đó trung bình mẫu X là ước lượng hiệu quả của kỳ vọng
toán của biến ngẫu nhiên X
Chứng minh
Do X là ước lượng không chệch cho và do X ~ N (µ,σ²) nên ta có
2 2
( x ) 2 X
Trang 21ln f( X, ) = -ln
2 2
bằng vế phải của bất đẳng thức Cramer- Rao
Vậy X là ƣớc lƣợng hiệu quả nhất của
Tính chất 2.3 Cho X 1 ,X 2 ,…,X n là mẫu quan sát về biến ngẫu nhiên
Trang 22X 2
1 ˆ
D
I ( ) ˆ
là ƣớc lƣợng hiệu quả cho 2
2.2 Khoảng tin cậy của các tham số
Tính chất 2.4 Cho X 1 ,X 2 ,…,X n là mẫu quan sát về biến ngẫu nhiên
2
X ~ N( , ) trong đó là tham số chƣa biết, 2 là hằng số đã biết Khi đó
khoảng tin cậy cho là X u( ) X u( )
Trang 23Vì N(0,1) là phân phối đối xứng nên ta chọn d = -c ,c > 0 sao cho
X ~ N( , ) trong đó = EX , 2=DX là tham số chƣa biết Khi đó
Trang 24Ta có
2 2 1 2
ˆ( 1)
ˆ( 1)( 1)
Trang 25khoảng tin cậy cho 2 là
ˆ( 1)
Tính chất 2.7 Cho X 1 , ,X n là mẫu quan sát về biến ngẫu nhiên X~( X, X2)
và Y 1 , ,Y m là mẫu quan sát về biến ngẫu nhiên Y ~ N ( Y, Y2) độc lập với
mẫu trên Trong đó X, Ylà các tham số chƣa biết, X2, Y2 là các tham số đã
Trang 26biết.Với độ tin cậy 1- ( 0 1 ) khoảng tin cậy choX Y là
Trang 27Tính chất 2.8 Cho X 1 , ,X n là mẫu quan sát về biến ngẫu nhiên X~( X, X2)và
Y 1 , ,Y m là mẫu quan sát về biến ngẫu nhiên Y ~ N ( Y, Y2) độc lập với mẫu
trên Trong đó X, Ylà các tham số chƣa biết, X2, Y2 là các tham số chƣa
biết, nhƣng biết rằng X2 = Y2.Với độ tin cậy 1- ( 0 1 ) khoảng tin cậy
Trang 282.3 Kiểm định giả thuyết các tham số
2.3.1 Kiểm định giả thuyết về giá trị trung bình
Trường hợp 1: Nếu phương sai 2 đã biết
Giả sử biến ngẫu nhiên gốc X trong tổng thể phân phối theo quy luật chuẩn
2
( , )
N với phương sai đã biết nhưng chưa biết kỳ vọng toán µ
Nếu có cơ sở để giả thiết rằng giá trị của nó bằng 0 ta đưa ra giả thuyết
Trang 29thống kê H : 0 Để kiểm định giả thuyết trên từ tổng thể mẫu kích thước
n: X 1 , ,X n
Vì đã biết phương sai 2của biến ngẫu nhiên gốc X trong tổng thể nếu tiêu
chuẩn kiểm định được chọn là thống kê
Nếu cho trước mức ý nghĩa thì tùy thuộc vào dạng của giả thuyết đối K
miền bác bỏ “tốt nhất” được xây dựng theo các trường hợp sau
- Nếu U u(
2
) thì ta bác bỏ H
- Nếu U < u(
2
) thì ta chấp nhận H
Cơ sở lý luận của quy tắc trên như sau
Trang 30Nếu X ~ N( , 2) hoặc X không phải chuẩn nhưng n > 30 thì với giả thiết H
đúng 0ta có
2
0 X
Trường hợp 2 : Nếu phương sai 2 chưa biết
Tiêu chuẩn kiểm định là thống kê
s
Ta lại có: T ~ T n-1 Trong đó T n-1 là biến ngẫu nhiên với n-1 bậc tự do Do đó
tùy thuộc vào dạng của giả thuyết đối K, miền bác bỏ “ tốt nhất ” được xây
dựng theo các trường hợp sau
a) H : 0; K: 0
Trang 31Lúc đó với mức ý nghĩa cho trước có thể tìm được giá trị tới hạn
Student t n-1 ( ) ta tiến hành kiểm định như sau
Cơ sở lý luận của cách làm trên như sau
Giả sử giả thiết H đúng, tức X ~ N( 0, 2)
Khi đó
2
0 0
Lúc đó với mức ý nghĩa cho trước có thể tìm được giá trị tới hạn Student
tn-1(), ta có miền tiêu chuẩn là
Trang 322.3.2 Kiểm định giả thuyết về hai kỳ vọng toán của hai biến ngẫu nhiên
phân phối chuẩn
Giả sử có hai tổng thể nghiên cứu trong đó các biến ngẫu nhiên X và Y có
cùng phân phối chuẩn với các kỳ vọng toán là X và Y và các phương sai
là X2 và Y2 Nếu X và Y chưa biết song có cơ sở để giả thiết rằng giá trị
của chúng bằng nhau người ta đưa ra giả thuyết thống kê
H: X = Y
Để kiểm định giả thuyết trên ta xét một số trường hợp sau đây
Trường hợp 1: Nếu đã biết phương sai 2 2
X và Y
Cho hai mẫu độc lập kích thước n và m: X 1 , ,X n và Y 1 , ,Y m
Lúc đó tiêu chuẩn kiểm định được chọn là thống kê
Vì vậy với mức ý nghĩa bằng cho trước và tùy thuộc vào dạng của giả
thuyết đối K, với phương pháp xây dựng đã làm ở các phần trên ta thu được
các miền tiêu chuẩn như sau
Trang 33Xem xét xem U có thuộc miền tiêu chuẩn hay không để kết luận
Trường hợp 2: Nếu chưa biết phương sai 2 2
X và Y
song giả định rằng chúng bằng nhauX 2 Y 2
Cho hai mẫu độc lập kích thước n và m: X 1 , ,X n và Y 1 , ,Y m
Khi đó tiêu chuẩn kiểm định được chọn là
Ta biết rằng T phân phối Student với n+m-2 bậc tự do Với điều kiện giả
thuyết đúng thì tiêu chuẩn kiểm định trở thành
Trang 34Và vẫn phân phối T m+n-2 Do đó tùy thuộc vào giả thuyết đối ta có miền bác
X Y
1 1 S
X Y
2
1 1 S