• Hệ thống hóa các kiến thức cơ sở về không gian xác suất, các biến ngẫunhiên và một số phân phối xác suất quan trọng để áp dụng vào tìm hiểu vềxấp xỉ phân phối chuẩn.. Sử dụng côngthức
Trang 1TRƯỜNG ĐẠI HỌC SƯ PHẠM
KHÓA LUẬN TỐT NGHIỆP
Người hướng dẫn: T.S.LÊ VĂN DŨNG
Đà Nẵng - 05/ 2015
Trang 3Trong suốt quá trình học tập và hoàn thành luận văn này, tôi đã nhận được
sự hướng dẫn, giúp đỡ tận tình của quý Thầy Cô, gia đình và bạn bè Với lòngkính trọng và biết ơn sâu sắc tôi xin được bày tỏ lời cảm ơn chân thành tới :
- Ban chủ nhiệm Khoa Toán, các thầy cô và các cán bộ khoa Toán, trườngĐại học Sư Phạm, Đại học Đà Nẵng đã nhiệt tình giảng dạy và giúp đỡ tôi trongsuốt quá trình học tập tại trường
- Đặc biệt, tôi xin bày tỏ lòng biết ơn sâu sắc đến thầy T.S Lê Văn Dũng
là người đã hết lòng giúp đỡ, dạy bảo, động viên, và tạo mọi điều kiện thuận lợi
để tôi có thể hoàn thành luận văn tốt nghiệp này
- Nhân đây tôi cũng xin gởi lời cảm ơn đến gia đình, bạn bè đã giúp đỡđộng viên tôi cả về vật chất lẫn tinh thần trong suốt quá trình làm luận văn tốtnghiệp
Mặc dù luận văn đã được hoàn thành đúng thời gian qui định nhưng dođiều kiện thời gian và kiến thức còn hạn chế nên luận văn của tôi không tránhkhỏi những thiếu sót Vì vậy, tôi rất mong nhận được sự đóng góp ý kiến củacác thầy cô và các bạn để tạo điều kiện cho luận văn của tôi được hoàn thiệnhơn
Đà Nẵng, tháng 05 năm 2015
Sinh viên
Nguyễn Thị Thục Đoan
Trang 4MỤC LỤC
1.1 Không gian xác suất 6
1.2 Biến ngẫu nhiên 7
1.3 Các tham số đặc trưng của Biến ngẫu nhiên 8
1.4 Một số phân phối xác suất quan trọng 9
2 Xấp xỉ phân phối chuẩn 13 2.1 Định lý giới hạn trung tâm 13
2.2 Một số ví dụ 13
2.3 Xấp xỉ phân phối chuẩn của phân phối nhị thức 15
2.4 Những ví dụ về khái quát định lý giới hạn trung tâm 24
2.5 Xấp xỉ phân phối chuẩn của phân phối Poisson và Gamma 29
2.6 Các gợi ý thực tiễn về xấp xỉ phân phối chuẩn 33
2.7 Tóm tắt nội dung 34
Trang 5dự báo, bảo hiểm, khi cần đánh giá các cơ may, nguy cơ rủi ro, Nhà toán họcPháp Laplace ở thế kỉ 19 đã tiên đoán rằng : "Môn khoa học này hứa hẹn sẽ trởthành một trong những đối tượng quan trọng nhất của tri thức nhân loại Rấtnhiều vấn đề quan trọng nhất của đời sống thực tế thuộc về những bài toán của
lý thuyết xác suất" Và "xấp xỉ phân phối chuẩn" là một trong những bài toánnhư thế
2 Mục đích nghiên cứu
• Hệ thống lại kiến thức cơ sở về lý thuyết xác suất đã học
• Tìm hiểu mở rộng thêm kiến thức về xấp xỉ phân phối chuẩn
3 Phương pháp nghiên cứu
• Nghiên cứu lí luận: Trước tiên là đọc các tài liệu liên quan đến nội dung đềtài
• Hệ thống hóa các kiến thức cơ sở về không gian xác suất, các biến ngẫunhiên và một số phân phối xác suất quan trọng để áp dụng vào tìm hiểu vềxấp xỉ phân phối chuẩn
• Hỏi,trao đổi và tham khảo ý kiến của giáo viên hướng dẫn,nghiên cứu vềxấp xỉ phân phối chuẩn
Trang 6Xấp xỉ phân phối chuẩn SVTH: Nguyễn Thị Thục Đoan
• Đưa ra các khái niệm, định lý, ví dụ, và chứng minh rõ ràng về xấp xỉ phânphối chuẩn
4 Cấu trúc luận văn
Bố cục bao gồm 2 chương :
• Chương 1 Kiến thức cơ sở,hệ thống hóa các kiến thức liên quan để hổ trợcho việc tìm hiểu xấp xỉ phân phối chuẩn
• Chương 2 Xấp xỉ phân phối chuẩn
Do thời gian thực hiện khóa luận không nhiều, kiến thức còn hạn chế nên khilàm khóa luận không tránh khỏi những hạn chế và sai sót Tôi mong nhận được
sự góp ý và những ý kiến phản biện của quý thầy cô và bạn đọc Tôi xin chânthành cảm ơn!
Đà Nẵng, tháng 05 năm 2015
Sinh viên
Nguyễn Thị Thục Đoan
Trang 7KIẾN THỨC CƠ SỞ
1.1 Không gian xác suất
1.1.1 Phép thử
Trong toán học có những khái niệm không có định nghĩa mà chỉ có thể mô
tả chúng bằng những hình ảnh hoặc tư duy trực quan Chẳng hạn trong hìnhhọc các khái niệm điểm, đường thẳng, mặt phẳng là những khái niệm không cóđịnh nghĩa Trong xác suất, khái niệm phép thử là khái niệm cơ bản không cóđịnh nghĩa Ta có thể hiểu phép thử là việc thực hiện một nhóm các điều kiện
cơ bản nào đó để quan sát một hiện tượng có xảy ra hay không Phép thử đượcgọi là ngẫu nhiên nếu ta không thể dự báo trước chính xác kết quả nào sẽ xảy
ra khi ta thực hiện phép thử đó
1.1.2 Không gian mẫu
Tập hợp tất cả các kết quả có thể xảy ra của một phép thử ngẫu nhiên được
gọi là không gian mẫu Ta thường kí hiệu là Ω
Cho không gian mẫu Ω Ta chỉ xét 1 lớp F các tập con của Ω thoã mãn 3điều kiện:
Trang 8Xấp xỉ phân phối chuẩn SVTH: Nguyễn Thị Thục Đoan
+ Với mọi A ∈ F, 0 ≤ P(A) ≤ 1
1.2 Biến ngẫu nhiên
Định nghĩa 1.1 Cho không gian xác suất (Ω, F, P ) Ánh xạ X : Ω →R đượcgọi là Biến ngẫu nhiên nếu X là hàm đo được, tức là với mọi a ∈ R, {ω ∈ Ω : X(ω) < a } ∈ F
1.2.1 Hàm phân phối xác suất
Định nghĩa 1.2 Cho biến ngẫu nhiênX, hàm số F (x) = P (X < x), x ∈R được
gọi là hàm phân phối xác suất của X
1.2.2 Biến ngẫu nhiên độc lập
Cho n Biến ngẫu nhiên X1, , X n xác định trên cùng một không gian mẫu
có các hàm phân phối xác suất lần lượt là F1(x), , F n (x) Ta nói các biến ngẫunhiênX1, , X n độc lập nếu với mọi x1, , x n ∈R ta có
P (X1 < x1, , X n < x n ) = F1(x1) F n (x n)
1.2.3 Biến ngẫu nhiên rời rạc và biến ngẫu nhiên liên tục
Ta gọi X là biến ngẫu nhiên rời rạc, nếu nó có miền giá trị hữu hạn hoặc vôhạn đếm được Nếu biến ngẫu nhiên X có miền giá trị x1, x2, , x n thì bảng số
P P (X = x1) P (X = x2) P (X = x n)
được gọi là bảng phân phối xác suất biến ngẫu nhiên X
Trang 9Biến ngẫu nhiên X được gọi là biến ngẫu nhiên liên tục nếu tồn tại một hàm
số f : R→R khả tích không âm sao cho với mọi y ∈R,
F (y) =
∫ y
−∞
f (x)dx,
trong đó : F (y) là hàm phân phối của X
Khi đó, f (x) được gọi là hàm mật độ của X
1.3 Các tham số đặc trưng của Biến ngẫu nhiên
Cho Biến ngẫu nhiên X, sốD(X) = E(X − E(X))2 được gọi là phương sai của
Biến ngẫu nhiên X.
+ Nếu Biến ngẫu nhiên rời rạc X có bảng phân phối xác suất
X x1 x2 x n
P p1 p2 p n
Trang 10Xấp xỉ phân phối chuẩn SVTH: Nguyễn Thị Thục Đoan
1.4 Một số phân phối xác suất quan trọng
1.4.1 Phân phối Bernoulli
Định nghĩa 1.3 Biến ngẫu nhiên rời rạcXđược gọi là có phân phối Bernoulli
với tham số p(0 < p < 1) nếu X có hàm mật độ xác suất
Nếu X ∼ Ber(p) thì E(X) = p và V ar(X) = p(1 − p)
Ví dụ 1.4 Chọn ngẫu nhiên 1 sinh viên Đặt:
X =
{
1 nếu sinh viên đó hút thuốc lá
0 nếu sinh viên đó không hút thuốc láNếu có 20% sinh viên hút thuốc lá thì hàm mật độ xác suất của X là
Trang 111.4.2 Phân phối nhị thức
Định nghĩa 1.5 Biến ngẫu nhiên rời rạc X được gọi là có phân phối nhị
thức với tham số n và p(n ∈N\ {0} , 0 < p < 1) nếu X có hàm mật độ xác suất
(ii) Cho X ∼ Bin(n, p) , khi đó E(X) = np và V ar(X) = np(1 − p).
Ví dụ 1.7 Tung 10 lần một con xúc xắc, gọi X là số lần xuất hiện mặt 1 chấm.Khi đó X ∼ Bin(10; 1/6).
Ví dụ 1.8 Giả sử ở một siêu thị có đến 75% khách hàng thanh toán bằng thẻ
tín dụng Chọn ngẫu nhiên 10 khách hàng của siêu thị đó, gọi X là số kháchhàng thanh toán bằng thẻ tín dụng, khi đó X ∼ Bin(10; 0.75) Do đó ta có
E(X) = np = 7.5, V ar(X) = np(1 − p) = 1.875
1.4.3 Phân phối Poisson
Định nghĩa 1.9 Biến ngẫu nhiên rời rạcX được gọi là có phân phối Poisson
với tham số λ (λ > 0) nếu X có hàm mật độ xác suất
p(x; λ) = e
−λ λ x
x! x ∈NKhi đó, E(X) = λ, V ar(X) = λ.
Kí hiệu: X ∼ P oi(λ)
Ví dụ 1.10 GọiX là số côn trùng bị dính bởi một cái bẫy trong một ngày Giả
sử X có phân phối Poisson với tham số λ = 4.5 có nghĩa là trung bình một ngày
có 4.5 con côn trùng bị dính bẫy Xác suất có đúng 3 con côn trùng bị dính bẫytrong một ngày là
P (X = 3) = e
−4.5 (4.5)5
5! = 0.1708
Trang 12Xấp xỉ phân phối chuẩn SVTH: Nguyễn Thị Thục Đoan
Định lý 1.11 Cho X1, X2, , X n là các biến ngẫu nhiên độc lập và có cùng phân phối P oi(λ), khi đó S = X1+ X2+ + X n ∼ P oi(nλ).
1.4.4 Phân phối chuẩn
Định nghĩa 1.12 Biến ngẫu nhiên liên tụcX được gọi là có phân phối chuẩn
với tham số µ và σ2 (−∞ < µ < ∞ và σ > 0) nếu X có hàm mật độ xác suất
f (x; µ, σ) = 1
σ √
2π e
− (x −µ)2 2σ2 , x ∈R
Kí hiệu: X ∼ N(µ, σ2 )
Biến ngẫu nhiên chuẩn có tham sốµ = 0 và σ = 1được gọi là phân phối chuẩn
tắc Một biến ngẫu nhiên có phân phối chuẩn tắc được kí hiệu bởi Z Hàm mật
σ
)
. (v) Với α < β
P (α < X < β) = P (α ≤ X ≤ β) = Φ
(
β − µ σ
)
− Φ(α − µ
σ
)
Ví dụ 1.14 Chiều cao của nam thanh niên trưởng thành ở Việt Nam có phân
phối chuẩnN (µ, 0.12) Chọn ngẫu nhiên 100 nam thanh niên trưởng thành Tính
Trang 13xác suất sai số tuyệt đối giữa chiều cao trung bình của 100 nam thanh niên đượcchọn µ không vượt quá 0.03
Trang 14CHƯƠNG 2
XẤP XỈ PHÂN PHỐI CHUẨN
2.1 Định lý giới hạn trung tâm
Định lý 2.1 Cho X1, X2, , X n (n ≥ 1) là n những biến độc lập bất kỳ có cùng phân phối xác suất F , có một giá trị trung bình hữu hạn µ, và có phương sai hữu hạn σ2 Cho S n = X1+ X2+· · · + X n , X = X n = X1+X2 +···+X n
n , thì (a) ∀x ∈R, P
(√
n(X −µ)
→ Φ(x) khi n → ∞ Nói cách khác, với n đủ lớn
S n ≈ N(nµ, nσ2),
X ≈ N(µ, σ2
n ).
2.2 Một số ví dụ
Ví dụ 2.2 Xem biến ngẫu nhiên nhị thức X với tham số n và p; chúng tôi sẽ
cố địnhp = 0.1 và xem ảnh hưởng của việc tăngn trên pmf của X Nhắc lại pmfnhị thức có công thức P (X = x) =(n
x
)
p x(1− p) n −x , x = 0, 1, · · · , n Sử dụng côngthức này, vớin = 10, 20, 50 và 100, chúng tôi tính và phác thảo (như hình 1) pmfcủa X trong dạng biểu đồ, biểu đồ này là một hệ thống các hình chữ nhật vớichiều cao tương ứng với một giá trị x bằng (hoặc tỉ lệ với) xác suất của giá trị
x
Trang 15Hình 1: Bin(n, 0.1) pmf với n = 10, 20, 50, 100
Chúng tôi thấy biểu đồ này, vớin nhỏ nhất (n = 10), thì biểu đồ nghiêng hẳn vềmột phía Khi n tăng lên, biểu đồ ít bị nghiêng hơn, và với n lớn nhất n = 100,biểu đồ có hình dạng cái chuông, tập trung ở 10 và 11, giống như đồ thị củahàm mật độ xá suất của biến ngẫu nhiên chuẩn
Giải thích như thế nào? Công thức cho hệ số độ nghiêng của một phân phốinhị thức là √1−2p
np(1 −p), với n → ∞ , p không đổi, sẽ bằng 0 Sự phân phối sẽ trởnên gần như cân bằng khi n càng lớn, dù lúc đầu nó bị nghiêng rất nhiều khi n
nhỏ Hơn nữa, nói chung điều này đúng khi phân phốiBin(n, p) có thể được ướctính bằng phân phốiN (N p, np(1 − p)) với mọipcố định khi n lớn Nếu pgần 0.5,một biểu đồ nhìn khá bình thường sẽ được tạo ra ngay cả khi n nhỏ (n = 20);nếup càng gần 0 hoặc 1, một n lớn hơn là cần thiết để tạo ra một biểu đồ nhìnbình thường Chúng ta sẽ thấy minh họa thực nghiệm này được xác minh bởimột định lý dưới đây
Ví dụ 2.3 Nhắc lại tổng n biến mũ độc lập có kỳ vọng λ, được phân phối bởicông thức G(n, λ), phân phối G với tham số n và λ Chúng ta sẽ cho λ = 1 và
n thay đổi, chọn n = 1, 3, 10, 50, lần lượt, và phác thảo công thức của G(n, λ)
Trang 16Xấp xỉ phân phối chuẩn SVTH: Nguyễn Thị Thục Đoan
Chúng ta cho một hiện tượng tương tự với ví dụ nhị thức trước Khi n nhỏ,mật độ phân phối bị nghiêng Nhưng khi n tăng, mật độ phân phối dần dần trởthành hình chuông, giống như mật độ chuẩn (hình 2)
Điểm chung gì giữa ví dụ nhị thức và ví dụ Gamma? Trong ví dụ nhị thức,một biến Bin(n, p) là tổng của n độc lập các biến Ber(p), trong khi trong ví dụGamma một biến G(n, 1) là tổng của n độc lập các biến Exp(1)
Hình 2: Bin(n, 0.1) pmf với n = 10, 20, 50, 100
Trong cả hai trường hợp, chúng ta thấy là khi n lớn (khi chúng tôi gắn một
số lượng lớn các biến ngẫu nhiên độc lập với nhau), tổng đó có một mật độ nhìn
tương tự như mật độ chuẩn Đây thực tế chính là những gì định lý giới hạn trungtâm nói lên Không quan trọng kiểu biến nào bạn thêm vào, nếu bạn thêm mộtgiá trị lớn của những biến độc lập, bạn sẽ có được một mật độ chuẩn
2.3 Xấp xỉ phân phối chuẩn của phân phối nhị thức
Một trường hợp rất quan trọng trong đó định lý giới hạn trung tâm được
áp dụng là sự phân phối nhị thức Định lý giới hạn trung tâm cho phép chúng
ta được lấy xấp xỉ những xác suất nhị thức quá dài, bao gồm những chuỗi giaithừa lớn sử dụng những xấp xỉ phân phối chuẩn đơn giản và chính xác Trước
Trang 17hết chúng ta cho giá trị chính xác trên sự xấp xỉ phân phối chuẩn của phân phốinhị thức.
Định lý 2.4 (Định lý giới hạn trung tâm Moivre-Laplace) Cho X ∼ Bin(n, p) Sau đó cho mọi p cố định và x ∈ R,
Định lý giới hạn trung tâm demoivre-laplace cho chúng ta biết rằng nếu
X ∼ Bin(n, p), thì chúng ta có thể lấy xấp xỉ loại ≤ xác suất P (X ≤ k) khi:
Trang 18Xấp xỉ phân phối chuẩn SVTH: Nguyễn Thị Thục Đoan
Chú ý, trong trường hợp áp dụng xấp xỉ chuẩn vào phân phối nhị thức, chúng
ta đang sử dụng một phân bố liên tục để lấy xấp xỉ một phân bố rời rạc, chỉ lấy
giá trị số nguyên Chất lượng của sự lấy xấp xỉ tăng lên, thỉnh thoảng rất nhiều,
nếu chúng ta lấp đầy những khoảng cách giữa các số nguyên liên tiếp Chúng ta
giả sử rằng một biến cố của X = x thật sự tương ứng với x − 1
2 ≤ X ≤ x + 1
2.Trong trường hợp này, để lấy xấp xỉ P (X ≤ k) chúng ta sẽ mở rộng miền biến
cố tới k + 12 và lấy xấp xỉ P (X ≤ k) khi:
Việc lấy xấp xỉ phân phối chuẩn đã được điều chỉnh này được gọi là lấy xấp xỉ
phân phối chuẩn với một hệ số hiệu chỉnh liên tục Hệ số hiệu chỉnh liên tục nên
luôn luôn được hoàn thành khi đang tính toán một xấp xỉ phân phối chuẩn choxác suất nhị thức Ở đây, những công thức xấp xỉ phân phối chuẩn với hệ sốhiệu chỉnh liên tục được liệt kê dưới đây để dễ tham khảo:
Chúng ta sẽ áp dụng hệ số hiệu chỉnh liên tục và định lý giới hạn địa phương
để tìm những xấp xỉ phân phối chuẩn cho những xác suất nhị thức trong mộtvài ví dụ
Ví dụ 2.6 (Tung đồng xu) Đây là ví dụ đơn giản nhất của một xấp xỉ phân
phối chuẩn của xác suất nhị thức Chúng ta sẽ giải một số vấn đề bằng cách ápdụng phương pháp xấp xỉ phân phối chuẩn
Đầu tiên, giả sử một đồng xu đồng được tung 100 lần Xác suất để có mặt ngửa
từ 45 đến 55 lần là bao nhiêu? Kí hiệu X là số mặt ngửa có được trong 100 lầntung, X ∼ Bin(n, p), với n = 100, p = 0.5 Do đó, sử dụng phương pháp xấp xỉ
Trang 19phân phối chuẩn với hệ số hiệu chỉnh liên tục:
99% chắc chắn phần trăm mặt ngửa sẽ từ 45% đến 55%? Phần trăm mặt ngửa
từ 45% đến 55% nếu và chỉ nếu số mặt ngửa từ 0.45n và 0.55n Sử dụng xấp xỉphân phối chuẩn với hệ số hiệu chỉnh liên tục, một lần nữa, chúng ta muốn
Bây giờ, từ một bảng tiêu chuẩn bình thường, chúng ta tìm thấyΦ(2.575) = 0.995
Vậy nên, chúng ta cân bằng
số người tìm thấy giá trị n cần cao hơn giá trị họ đoán
Ví dụ 2.7 (Bỏ phiếu: Dự đoán người thắng) Xấp xỉ phân phối chuẩn cho
những xác suất nhị thức thường được sử dụng để thiết kế bầu chọn cho một vấn
Trang 20Xấp xỉ phân phối chuẩn SVTH: Nguyễn Thị Thục Đoan
đề, ví dụ bầu chọn để dự đoán một người thắng cuộc trong một kỳ bầu chọn
Cho rằng trong cuộc bầu chọn có 2 ứng cử viên A và B, và trong số tất cả người
bỏ phiếu, 52% bầu cho A và 48% bầu cho B Một cuộc bình chọn của 1400 người
bỏ phiếu đã hoàn tất, xác suất nào để cuộc bầu chọn dự đoán đúng người chiếnthắng?
Ký hiệu X cho số những người bầu cho A Cuộc bỏ phiếu sẽ dự đoán đúngngười thắng cuộc nếu X > 700 Bằng cách sử dụng xấp xỉ phân phối chuẩn hiệuchỉnh liên tục
Ví dụ 2.8 (Bỏ phiếu bầu chọn: Dự đoán tỉ lệ bầu chọn) Coi cuộc bầu chọn
chỉ có hai ứng cử viên A và B, và cho rằng tỉ lệ người bỏ phiếu bầu cho A là p.Một cuộc bầu chọn có n người bỏ phiếu được thực hiện, và chúng ta muốn biếtvới giá trị nào của n nếu với xác suất 95% chúng ta muốn dự đoán giá trị đúngcủa p với sai số tối đa 2%
Ký hiệu X là số lượt người bầu cho A trong tổng số n người tham gia bỏphiếu Chúng ta sẽ ước tính giá trị đúng của p = X n Chúng ta muốn chắc chắn
P ( X
n − p ≤ 0.02
√
p(1 − p)
)
≥ 0.95