LỜI CẢM ƠN Trong quá trình nghiên cứu và hoàn thành khoá luận này, em đã nhận được sự quan tâm giúp đỡ tận tình của các thầy cô trong tổ Toán ứng dụng nói riêng và trong khoa Toán trường
Trang 2HÀ NỘI - 2010
Trang 3LỜI CẢM ƠN
Trong quá trình nghiên cứu và hoàn thành khoá luận này, em đã nhận được sự quan tâm giúp đỡ tận tình của các thầy cô trong tổ Toán ứng dụng nói riêng và trong khoa Toán trường Đại học sư phạm Hà Nội 2 nói chung cùng với sự hỗ trợ của các các bạn sinh viên
Em xin bày tỏ lòng biết ơn sâu sắc đối với thầy Trần Mạnh Tiến,
người đã tận tình hướng dẫn em trong suốt thời gian qua để em hoàn thành được khoá luận này
Do trình độ và thời gian nghiên cứu còn hạn chế nên những vấn đề mà
em trình bày trong khoá luận này sẽ không tránh khỏi những thiếu sót Em kính mong nhận được sự chỉ bảo và đóng góp ý kiến của các thầy cô giáo và các bạn sinh viên để khoá luận của em được hoàn thiện hơn
Em xin chân thành cảm ơn!
Sinh viên
Lại Thị Thanh Huệ
Trang 4LỜI CAM ĐOAN
Khoá luận của em được hoàn thành dưới sự hướng dẫn của thầy Trần Mạnh Tiến cùng với sự cố gắng của bản thân em Trong quá trình nghiên cứu
và thực hiện khoá luận em có tham khảo tài liệu của một số tác giả (đã nêu trong mục Tài liệu tham khảo)
Em xin cam đoan những kết quả trong khoá luận là kết quả nghiên cứu của bản thân, không trùng với kết quả của tác giả khác
Nếu sai em xin chịu trách nhiệm!
Sinh viên
Lại Thị Thanh Huệ
Trang 6MỞ ĐẦU
Các nhà toán học Pháp thế kỉ 17 như Pierre de Fermat (1601 – 1665), Blaise Pascal (1623 – 1662) đã đặt nền móng đầu tiên cho lí thuyết xác suất bởi những lời giải cho các bài toán trong các trò chơi ngẫu nhiên Cuối thế kỉ
17, James Bernoulli (1654 – 1705), nhà toán học Thụy Sĩ, được xem như người khởi xướng của lí thuyết xác suất với những nghiên cứu về luật yếu số lớn đối với dãy phép thử độc lập Pierre Simon Laplace (1749 – 1827), nhà toán học Pháp có nhiều cống hiến cho xác suất thống kê trong lĩnh vực các định lí giới hạn trung tâm Carl Friedrich Gauss (1777 – 1855), nhà toán học
vĩ đại của Đức có các đóng góp lớn đối với xác suất thống kê: Phương pháp bình phương cực tiểu và luật phân phối chuẩn Andrei Kolmogrov (1903 – 1987), nhà toán học lỗi lạc của Nga, người cách mạng hoá cho lí thuyết xác suất với hệ tiên đề xác suất hiện đại mà ông đưa ra vào đầu những năm 1930
Không thể kể hết những tên tuổi của những nhà toán học tiên phong
cũng như các nhà toán học lỗi lạc đương đại trên lĩnh vực “lý thuyết xác suất”
Ngày nay, “lý thuyết xác suất” đã trở thành một nghành toán học lớn trong nền toán học thế giới Người ta biết đến “lí thuyết xác suất” không chỉ
vì nó là một nghành toán học chặt chẽ về lí thuyết mà nó còn có ứng dụng rộng rãi trong nhiều nghành khoa học kĩ thuật, khoa học xã hội và nhân văn Đặc biệt nó gắn liền với khoa học Thống kê, một khoa học về các phương pháp thu thập, tổ chức và phân tích các dữ liệu, thông tin định lượng
Dưới sự hướng dẫn tận tình của GVC.ThS Trần Mạnh Tiến cùng với
hứng thú tìm hiểu về “Lí thuyết xác suất” em đã lựa chọn đề tài “Các định lí giới hạn và ứng dụng” để hoàn thành khoá luận tốt nghiệp của mình
Trang 7Luận văn của em trình bày một số nghiên cứu về luật số lớn, định lí giới hạn trung tâm, định lí giới hạn Moivre_Laplace, định lí giới hạn Laplace địa phương, định lí Poisson là những định lí giới hạn quan trọng nhất của lí thuyết xác suất và có nhiều ứng dụng trong thực tiễn
Với khoá luận này, em mong rằng nó sẽ là một tài liệu bổ ích cho những ai quan tâm tới vấn đề này
Hà Nội, tháng 5 năm 2010
Sinh viên
Lại Thị Thanh Huệ
Trang 8CHƯƠNG 1 KIẾN THỨC CHUẨN BỊ
1.1 Hội tụ
1.1.1 Một số định nghĩa
Cho dãy biến ngẫu nhiên X n n1 và biến ngẫu nhiên X cùng xác định trên không gian xác suất ,A, P
Định nghĩa 1.1 Hội tụ theo xác suất
Dãy biến ngẫu nhiên X X1, 2, được gọi là hội tụ theo xác suất tới biến ngẫu nhiên X , kí hiệu p
n
X X nếu 0: lim n 0
n P X X
(1.1) Hoặc tương đương, nếu 0:
lim n 1
n P X X
(1.2)
Định nghĩa 1.2 Hội tụ hầu chắc chắn
Dãy biến ngẫu nhiên X X1, 2, được gọi là hội tụ hầu chắc chắn tới biến ngẫu nhiên X , kí hiệu h c c .
n
X X nếu : lim n 1
n
(1.3)
Định nghĩa 1.3 Hội tụ theo phân phối
Dãy biến ngẫu nhiên X X1, 2, được gọi là hội tụ theo phân phối tới biến ngẫu nhiên X , kí hiệu d
n
X X nếu lim n ,
n F x F x x
tập liên tục của F x( ) (1.4) nghĩa là: nếu x là điểm liên tục của hàm phân phối F x( ) của X thì
lim n
n P X x P X x
(1.5)
Trang 91.1.2 Quan hệ giữa các dạng hội tụ
Định lí 1.1 Cho dãy biến ngẫu nhiên X n n1 là dãy giảm và p
Y bằng phản chứng
Giả sử Y n không hội tụ hầu chắc chắn tới 0
Tức là 0, và biến cố AA sao cho:
Định lí 1.2 Cho dãy biến ngẫu nhiên X n n1 hội tụ hầu chắc chắn đến biến ngẫu nhiên X khi và chỉ khi với 0 bất kì,
Trang 10Chứng minh Đặt
X , n 1 , 2 ,
X sup
n k
0
h c c n
Z tương đương với p 0
n
Z hay tương đương với:
n
X X khi và chỉ khi p
n
X X ii) Nếu p
n
X X
ii) Giả sử x R và F x liên tục, 0 ta có
X x X nx X, x X nx X, x suy ra
Trang 11n n
Trang 13iv) F x( ) xác định một cách duy nhất hàm đặc trưng X t
v) Nếu X X1, 2, ,X n là các biến ngẫu nhiên độc lập thì
vi) Nếu tồn tại E Xk thì hàm đặc trưng X t cũng tồn tại đạo hàm đến bậc
k tại mọi điểm t
Hệ quả Nếu tồn tại E Xk thì X t sẽ có khai triển Taylor như sau
tụ tại mọi t đến hàm đặc trưng t tương ứng với F x( )
1.2.2 Hàm đặc trưng của một số biến ngẫu nhiên thường gặp
Ví dụ 1.1 Cho biến ngẫu nhiên X ~ ( , ) B n p Tìm X t
Trang 14n
itx itx
it it
x n
X
x
x n
t E e e e
x e e
Trang 1512
Trang 17 2
DX
P X EX (1.9) Thay (1.9) vào ta được
Trang 18CHƯƠNG 2 CÁC ĐỊNH LÍ GIỚI HẠN VÀ ỨNG DỤNG
n
X n P
n k
k n
k
1
1 1
(2.1) Hoặc tương đương nếu 0:
n
X n P
n k
k n
k
1
1 1
X n
p n
Trang 19Định lí Chebyshev chứng minh sự hội tụ theo xác suất của trung bình
số học của một số lớn các biến ngẫu nhiên về trung bình số học của các kì vọng tương ứng
Nói cách khác nó chứng tỏ sự ổn định của trung bình số học của một số lớn các biến ngẫu nhiên xung quanh trung bình số học của các kì vọng toán của các biến ngẫu nhiên ấy
12
n n
21
n
Trang 20
Vậy ta có điều phải chứng minh
Ví dụ 2.2 Cho họ biến ngẫu nhiên độc lập X n n, 1 có phân phối được xác
Trang 21p n
Trang 22p n
2.1.3 Ứng dụng của Luật số lớn
i) Luật số lớn là cơ sở để đƣa ra định nghĩa thống kê về xác suất
Giả sử tiến hành n phép thử độc lập, như nhau và theo dõi sự xuất hiện biến cố A có liên quan
Ta có n là số phép thử đã tiến hành, n A là số phép thử có A xuất hiện, tỉ số n A
n được gọi là tần suất của A
Trang 23Gọi k là số lần suất hiện A ở phép thử thứ k thì họ k,k1 là họ độc lập các biến ngẫu nhiên cùng có phân phối rời rạc với các giá trị 0,1 với các xác suất tương ứng 1 P A và P A chưa biết
thì giới hạn này là P A
ii) Luật số lớn chính là cơ sở cho phương pháp đo lường trong vật
lí
Để xác định giá trị của một đại lượng vật lí nào đó ta thường tiến hành
đo n lần và lấy trung bình số học của các kết quả đo làm giá trị thực của đại lượng cần đo
Thật vậy giả sử xem kết quả của n lần đo là các biến ngẫu nhiên
1, 2, , n
X X X Đối với các biến ngẫu nhiên này có thể áp dụng hệ quả 2.1, vì chúng độc lập với nhau, có kì vọng toán EXi chính là giá trị thực của đại lượng vật lí đó, các phương sai đều bị chặn trên bởi 2 là độ chính xác của thiết bị đo ( thiết bị đo càng chính xác thì 2 càng nhỏ)
Do đó theo hệ quả 2.1 ta có
1 2
Trang 24Như vậy trung bình số học của các kết quả đo sẽ sai lệch rất ít so với giá trị thực của đại lượng vật lí và điều đó xảy ra với xác suất gần như bằng 1
iii) Luật số lớn còn là cơ sở cho một phương pháp được áp dụng rộng rãi trong thống kê: đó là phương pháp mẫu
Thực chất của nó là dựa vào một mẫu ngẫu nhiên khá nhỏ có thể kết luận về toàn bộ tập hợp tổng quát của các đối tượng được nghiên cứu
Chẳng hạn để đánh giá năng suất cây trồng của một vùng nào đó người
ta không cần phải điều tra trên toàn bộ diện tích của vùng đó mà chỉ cần dựa vào kết quả thu hoạch của một mẫu ngẫu nhiên khá nhỏ mà vẫn đưa ra được các kết luận đủ chính xác về năng suất cây trồng của vùng đó
2.2 Định lí giới hạn trung tâm
2.2.1 Định lí 2.2 Cho X X1, 2, là dãy các biến ngẫu nhiên độc lập có cùng phân phối, với 2
Trang 25X n
X
suy ra
Trang 26t t
Vậy ta có điều phải chứng minh
2.2.2 Ứng dụng của định lí giới hạn trung tâm
i) Định lí giới hạn trung tâm đƣợc ứng dụng trong bài toán ƣớc
lƣợng giá trị trung bình của tổng thể từ giá trị trung bình mẫu
Xét tập hợp gồm N cá thể, và một đặc tính định lượng X nào đó của mỗi cá thể đó Gọi x i là giá trị ứng với cá thể thứ i Khi đó giá trị trung bình của tổng thể là
N
x
Trang 27Gọi X i là giá trị đo được ở cá thể thứ i trong mẫu, vì mẫu chọn ngẫu nhiên nên các X i là các biến ngẫu nhiên và các biến ngẫu nhiên này độc lập cùng phân phối, EX i , DX i 2 Trung bình mẫu là
n
X
X
Theo định lí giới hạn trung tâm, khi n đủ lớn thìX1 X n có phân bố xấp
xỉ phân bố chuẩn với kì vọng n và phương sai n2 Do đó X sẽ có phân
bố xấp xỉ phân bố chuẩn với kì vọng và phương sai
X P
X P
Ấn định xác suất này bằng 1 ta có
n hay
n n n
b b
112
Vậy ước lượng khoảng của là
n X
; n X
Trang 28Ví dụ 2.3 Trọng lượng trung bình của một loại táo là (chưa biết) với độ lệch tiêu chuẩn là 12g Một mẫu ngẫu nhiên gồm 400 quả táo có trọng lượng trung bình 80,3g, với độ tin cậy 95% ước lượng khoảng cho
Lời giải
Theo lí luận ở trên ta có
21
400
12400
12
, ,
, ,
X X
b b
b b
1
400
12971400
12971
, X ,
X
, X
, X
Với giả thiết X 80,3 ta thu được 79,1281,48
Ví dụ 2.4 Đo sức bền chịu lực của một loại ống công nghiệp người ta thu
được bộ số liệu sau
4500 6500 5000 5200 4800 4900 5125 6200 5375
(đo 9 ống) Từ kinh nghiệm nghề nghiệp người ta cũng biết rằng sức bền đó
có phân phối chuẩn với độ lệch chuẩn 300 Hãy xây dựng khoảng tin cậy 95% cho sức bền trung bình của loại ống trên
Lời giải
Tính trung bình mẫu của sức bền chịu lực
4500 5375 5288899
1
,
Lí luận như ở trên ta có khoảng tin cậy cần tìm có dạng
Trang 29 1 0025 0975 197 197
2
n X
; n X
b b
b b
300971895288
,
; ,
, ,
; , ,
ii) Định lí giới hạn trung tâm đƣợc ứng dụng trong thống kê: giải
bài toán kiểm định giả thuyết về giá trị trung bình
Giả sử X X1, 2, ,X n là mẫu ngẫu nhiên rút từ biến ngẫu nhiên X có
EX và DX 2 ( nếu X không chuẩn thì n30)
Xét bài toán kiểm định giả thuyết sau
Giả thuyết H: 0
Đối thuyết K: 0
Với mức ý nghĩa và 2 đã biết
Ta tiến hành các bước sau:
- Xuất phát từ mẫu đã cho tính X và X 0
Trang 310 89, 269 88
16 1,6923
Ví dụ 2.6 Trong năm trước trọng lượng trung bình trước khi xuất chuồng của
bò ở một trại chăn nuôi là 375 kg Năm nay người ta áp dụng thử một chế độ chăn nuôi mới với hi vọng là bò sẽ tăng trọng nhanh hơn Sau thời gian áp dụng thử người ta lấy ngẫu nhiên 50 con bò trước khi xuất chuồng đem cân và tính được trọng lượng trung bình của chúng là 390 kg
Vậy với mức ý nghĩa 0,01 có thể cho rằng trọng lượng trung bình của bò trước khi xuất chuồng đã tăng lên hay không? Giả thiết trọng lượng của bò là biến ngẫu nhiên phân phối chuẩn với độ lệch chuẩn là 35,2 kg
Trang 32Lời giải
Gọi X là trọng lượng của bò trước khi xuất chuồng
Theo giả thiết X phân phối chuẩn với 35,2
Vậy trọng lượng xuất chuồng trung bình là
Xét bài toán kiểm định giả thuyết H: 375 với đối thuyết K 375 với mức ý nghĩa 0,01
Theo giả thiết n50, X 390, 35, 2, 0,01
Suy ra ta bác bỏ giả thiết H
Vậy trọng lượng trung bình của bò trước khi xuất chuồng khi áp dụng chế độ chăn nuôi mới lớn hơn 375
Tức là khi áp dụng chế độ chăn nuôi mới thì trọng lượng trung bình của bò trước khi xuất chuồng đã tăng lên
iii) Định lí giới hạn trung tâm đƣợc sử dụng tính xác suất để U rơi n
Trang 33Từ định định lí giới hạn trung tâm ta có
2
2
12
Trang 34Với Y Y1, , ,2 Y là các biến n ngẫu nhiên độc lập và có cùng phân phối B 1,p
Khi đó với mỗi i i, 1,n ta có EY i p DY; i p1 p
suy ra Y n n1 thỏa mãn các điều kiện của định lí giới hạn trung tâm
Trang 35n i
Kí hiệu X là biến ngẫu nhiên có phân phối chuẩn với kì vọng ~ np
và phương sai 2 npq Khi n đủ lớn ta có
Trang 36Ví dụ 2.8 Một kí túc xá có 650 sinh viên Xác suất để một sinh viên đến xem
phim tại câu lạc bộ vào tối thứ bảy là 0,7
a) Tính xác suất để số sinh viên đi xem phim vào tối thứ bảy ít hơn 440
b) Cần chuẩn bị bao nhiêu ghế để với xác suất 0,99 ta có thể đảm bảo đủ ghế cho người đến xem?
Lời giải
a) Gọi X là số sinh viên đến xem phim
Như là một xấp xỉ ban đầu ta coi rằng mỗi sinh viên quyết định đi xem phim
Trang 37Như vậy X có phân phối nhị thức B(650; 0,7)
Khi đó
650 0
2,326136,5
454,5
2,32611,68
481,7
P X k
P X k P X k
P X k k
Trang 38Ví dụ 2.9 Một nhà xã hội học cho rằng 12% số dân của thành phố ưa thích
một bộ phim A mới chiếu trên tivi Để khẳng định này, ông ta chọn một mẫu ngẫu nhiên gồm 500 người để hỏi ý kiến và thấy 75 người trả lời ưa thích bộ phim đó
a) Tính xác suất để trong một mẫu ngẫu nhiên gồm 500 người, số người ưa thích bộ phim ít nhất là 75 người nếu giả thiết p12% là đúng
b) Giả thiết của nhà xã hội học có đáng tin cậy không, với mức ý nghĩa là 0,05?
Lời giải
a) Gọi X là số người ưa thích bộ phim
Khi đó X có phân phối nhị thức B(500; 0,12)nếu giả thiết p 0,12đúng Khi đó X có phân phối xấp xỉ phân phối chuẩn X~ ~ N np npq , và ta có:
ta lại thấy nó xảy ra ở mẫu quan sát của ta Mâu thuẫn này chứng tỏ giả thiết
Trang 39Xét bài toán kiểm định giả thuyết H: p0,12 với đối thuyết K:
ii) Định lí giới hạn Moivre_Laplace đƣợc ứng dụng để tính xác suất
để m rơi vào khoảng từ m đến 0 m 1
Vì định lí giới hạn Moivre_Laplace là trường hợp riêng của định lí giới
hạn trung tâm, vì vậy nó cũng được ứng dụng để tính xác suất để m rơi vào khoảng từ m đến 0 m , và do i) nên ta có 1
Ví dụ 2.10 Gieo một con xúc xắc cân đối và đồng chất 12000 lần Tìm xác
suất để cho số lần xuất hiện mặt một nốt ở phía trên con xúc xắc gồm giữa
1900 và 2150
Trang 40Lời giải
Gọi X là tổng số lần xuất hiện mặt một nốt
Khi đó X có phân phối nhị thức n12000 và 1
P X
Ví dụ 2.11 Trong kho có 100 lô hàng, mỗi lô có 90 sản phẩm tốt và 10 sản
phẩm xấu, với mỗi lô người ta kiểm tra ngẫu nhiên 5 sản phẩm ( lấy có hoàn lại) Tính xác suất để tổng số sản phẩm xấu trong 100 lô hàng nằm trong khoảng từ 50 đến 70
Trang 412.4 Định lí giới hạn Laplace địa phương
2.4.1 Định lí 2.4 Giả sử X là biến ngẫu nhiên có phân phối nhị thức với tham số ( , )n p
, c 0 là hằng số và
2
212
Trang 432.4.1 Ứng dụng của định lí giới hạn Laplace địa phương
Định lí giới hạn Laplace địa phương được ứng dụng để xấp xỉ phân phối nhị thức bởi phân phối chuẩn
Ví dụ 2.12 Giả sử tỉ lệ dân cư mắc bệnh A trong vùng là 15%
a) Chọn ngẫu nhiên một nhóm 420 người.Viết công thức tính xác suất để trong nhóm có đúng 65 người mắc bệnh A
b) Tính xấp xỉ xác suất đó bằmg định lí giới hạn Laplace địa phương
Lời giải
a) Gọi X là số người mắc bệnh A trong nhóm
X có phân phối nhị thức với tham số n 420, p 0,15
0,1366.0,384640,05254
Ví dụ 2.13 Một cầu thủ ném bóng 450 lần vào rổ với xác suất ném trúng rổ
của mỗi lần ném là 0,82 Tìm xác suất để cầu thủ đó đã ném trúng 350 lần
Lời giải
Gọi X là số lần ném trúng vào rổ của cầu thủ
Khi đó X có phân phối nhị thức với tham số n450 và p0,82