Xuất phát từ nhu cầu phát triển và tính thời sự của việc nghiên cứu xác suất cơ sở, chúng tôi quyết định chọn đề tài với tên gọi: Xác suất cơ sở qua các ví dụ để tiến hành nghiên cứu..
Trang 1MỞ ĐẦU
1 Lý do chọn đề tài
Khoa học nghiên cứu về xác suất là một phát triển trong thời kỳ cận đại Việc chơi cờ bạc (gambling) cho chúng ta thấy rằng các ý niệm về xác suất đã có từ trước đây hàng nghìn năm, tuy nhiên các ý niệm đó được mô tả bởi toán học và sử dụng trong thực tế thì có muộn hơn rất nhiều Ảnh hưởng chính của lý thuyết xác suất trong
cuộc sống hằng ngày đó là việc xác định rủi ro và trong buôn bán
hàng hóa
Hai nhà toán học Pierre de Fermat và Blaise Pascal là những người đầu tiên đặt nền móng cho học thuyết về xác suất vào năm (1654) Christiaan Huygens (1657) được biết đến như là người đầu tiên có công trong việc đưa xác suất thành một vấn đề nghiên cứu khoa học Ngày nay lý thuyết xác suất trở thành một ngành vô cùng quan trọng của toán học và các ngành khoa học khác
Với sự phát triển của khoa học công nghệ, ngày nay máy tính giúp cho việc tính toán các vấn đề xác suất thống kê ngày càng trở nên dễ dàng, một khi đã có các số liệu đúng đắn và mô hình hợp lý Thế nhưng, bản thân máy tính không biết mô hình nào là hợp lý Đấy
là vấn đề của người sử dụng: cần phải hiểu được bản chất của các khái niệm và mô hình xác suất thống kê, thì mới có thể dùng được chúng
Xuất phát từ nhu cầu phát triển và tính thời sự của việc nghiên
cứu xác suất cơ sở, chúng tôi quyết định chọn đề tài với tên gọi: Xác
suất cơ sở qua các ví dụ để tiến hành nghiên cứu Chúng tôi hy vọng
tạo được một tài liệu tham khảo tốt cho những người muốn tìm hiểu
Trang 2về các kết quả rời rạc và liên tục của lý thuyết xác suất cùng với ứng dụng chúng trong nhiều lĩnh vực khác nhau
2 Mục đích nghiên cứu
Mục tiêu của đề tài là nhằm giúp người đọc hiểu đúng bản chất của những khái niệm và phương pháp cơ bản nhất của xác suất cơ sở
3 Đối tượng và phạm vi nghiên cứu
Đối tượng nghiên cứu của đề tài là lý thuyết xác suất và thống kê Phạm vi nghiên cứu của đề tài là xác suất cơ sở và các ứng dụng
4 Phương pháp nghiên cứu:
Thu thập các tài liệu của các tác giả nghiên cứu liên quan đến Xác
suất cơ sở
Tham gia các buổi seminar của thầy hướng dẫn để trao đổi các kết quả đang nghiên cứu
5 Ý nghĩa khoa học và thực tiễn của đề tài
Tổng quan các kết quả của các tác giả đã nghiên cứu liên quan đến xác suất cơ sở và các ứng dụng thực tế qua các ví dụ minh họa, nhằm xây dựng một tài liệu tham khảo cho những ai muốn nghiên
cứu về Lý thuyết xác suất và các ứng dụng
6 Cấu trúc của luận văn
Nội dung của luận văn được chia thành 2 chương
Chương 1 giới thiệu các khái niệm và kết quả về xác suất cơ sở liên quan đến phần rời rạc
Chương 2 trình bày các khái niệm và kết quả về xác suất cơ sở liên quan đến phần liên tục
Trong mỗi phần sẽ đưa vào các ví dụ minh họa với mức độ khác nhau
Trang 3CHƯƠNG 1 CÁC KẾT QUẢ RỜI RẠC
1.1 PHÂN PHỐI ĐỀU
Định nghĩa 1.1.1 Phân phối đều (Uniform distribution)
Có m kết quả đồng khả năng xảy ra (thường được gọi là kết quả)
và mỗi kết quả có cùng một xác suất 1/m Mỗi kết quả này được gọi
là một biến cố sơ cấp (hay sự kiện sơ cấp) Một tập hợp A gồm k kết quả xảy ra, với k ≤ m được gọi là một biến cố (hay sự kiện) và xác suất của nó ℙ(A) được tính bằng k/m:
Định nghĩa 1.2.1 Xác suất điều kiện
Với hai sự kiện A và B với ℙ( ) > 0, xác suất điều kiện ℙ( | )
của A khi B đã xảy ra được định nghĩa là :
ℙ( | ) = ℙ( ∩ )
ℙ( ) (1.2)
Mệnh đề 1.2.1 Công thức xác suất đầy đủ
Nếu B 1 , …, B n là các sự kiện xung khắc từng đôi một, là một phân hoạch của , tức là có B i ∩ B j = ∅ với 1 ≤ i < j ≤ n và B 1 ∪ B 2 ∪ · · ·
∪ B n = , và ngoài ra ℙ(Bi ) > 0 cho 1 ≤ i ≤ n, khi đó với bất kỳ sự kiện A, ta có :
ℙ( ) = ℙ( | )ℙ( ) + ℙ( | )ℙ( ) + ⋯ + ℙ( | )ℙ( )
(1.4)
Trang 4* Chứng minh : Bằng cách ứng dụng trực tiếp định nghĩa và công thức xác suất đầy đủ, ta có:
Trang 5Cho A 1 ,…, A n tập các sự kiện đôi một không xung khắc và A = A 1
* Chứng minh : (Bằng quy nạp trong n)
- Với n = 2 (n = 1 công thức là tầm thường) Đối với hai sự kiện A
và B
ℙ(A ∪ B) = ℙ((A\(A∩B)) ∪ (B \(A∩B)) ∪ (A∩B))
= ℙ(A\(A∩B)) + ℙ(B \(A∩B)) + ℙ(A∩B)
= ℙ(A) - ℙ(A∩B) + ℙ(B) - ℙ(A∩B) + ℙ(A∩B)
= ℙ(A) + ℙ(B) - ℙ(A∩B)
- Giả sử công thức đúng cho bất kỳ tập của n sự kiện (n > 2) Khi
đó với bất kỳ tập A1, …, An+1 của n +1 sự kiện, xác suất ℙ(⋃ ) bằng :
Trang 6thức (1.10) cho n + 1, với các dấu chính xác Điều này hoàn thành
chứng minh mệnh đề
Ví dụ 1.3.1
Bài toán lá phiếu Nguyên bản của nó được phát biểu có hệ
thống là: một cộng đồng cử tri gồm m người phe hữu và n người phe
tả bỏ phiếu cho ứng cử viên của mình, trong đó m ≥ n Xác suất mà trong quá trình đếm các lá phiếu bí mật các ứng cử viên phe hữu sẽ không thấp hơn phe tả là gì? Câu hỏi này đã xuất hiện trong nhiều hoàn cảnh
Trong đề tài này, chúng tôi bắt đầu với một trường hợp cụ thể m =
n Có 2n ly rượu trong số đó n ly rượu thật và n ly rượu giả Trong
một trò chơi phổ biến tại địa phương, một người tham gia bịt mắt
uống tất cả 2n ly tại một thời điểm, được lựa chọn một cách ngẫu
nhiên Người tham gia được tuyên bố là người chiến thắng nếu say với thể tích rượu thật uống luôn luôn là không nhiều hơn so với rượu
giả Chúng ta sẽ kiểm tra xem điều này xảy ra với xác suất 1/(n +1) Xem xét di động ngẫu nhiên trên tập hợp{- n, - n +1, …, n} trong
đó người tham gia sẽ di chuyển lên một bước nếu uống ly rượu giả
và sẽ lùi một bước nếu uống rượu thật Việc đi bộ bắt đầu từ gốc (lúc
Trang 7chưa uống) và sau 2n bước luôn luôn trở về vị trí ban đầu (số lượng
rượu thật = số lượng rượu giả)
Hình 1.1
Trên hình 1.1 bao gồm thời gian, bước đi X(t) của việc đi bộ bắt đầu từ điểm (0, 0) và kết thúc tại (2n, 0) và mỗi lần nhảy lên và sang
phải hoặc xuống và sang phải Chúng ta nhìn thấy xác suất mà các
bước còn lại ở phía trên đường X = -1
Tổng số các đường đi dẫn từ (0, 0) đến (2n, 0) là (2n)!/n!n! Số
lượng các đường đi ở trên đường thẳng cũng giống như tổng số các
đường đi từ (1, 1) đến (2n, 0) là ít hơn tổng số các đường đi từ (1, -3) đến (2n, 0) Thật vậy, bước thứ nhất từ (0, 0) phải là bước lên Tiếp theo, nếu một bước từ (0, 0) đến (2n, 0) tiếp xúc hoặc xuyên qua đường X = -1, thì chúng ta có thể phản xạ bit đầu tiên của nó và thu được một đường đi từ (1, -3) đến (2n, 0) Điều này đôi khi được gọi
Trang 8Bây giờ giả sử rằng số ly rượu giả là m, số ly rượu thật là n, m >
n Như trước, chiến thắng trò chơi có nghĩa là tại mỗi lần số lượng
tiêu thụ rượu giả là không ít hơn so với rượu thật Sau đó tổng số các
Định nghĩa 1.4.1 Biến ngẫu nhiên
Biến ngẫu nhiên (BNN) là một hàm X trên tập hợp kết quả ,
Trang 9Cho 2 BNN X và Y, với các giá trị rời rạc X( ) và Y( ) Xét sự
kiện {X = x i , Y = y j } (với bất kỳ cặp giá trị x i , y j của X, Y), phân bố xác suất đồng thời của cặp X, Y là ℙ( = , = )
Phân bố xác suất điều kiện của X = x i khi điều kiện Y = y j (cố định) xảy ra là :
Trang 10Phương sai của BNN rời rạc X có = là một số được ký hiệu
và xác định như sau :
Var = ( − ) ; (1.20) Bằng cách sử dụng tính chất của kỳ vọng, chúng ta có
Var = ( − 2 + ) = ( ) − 2 ( ) +
= ( ) − 2 +
= ( ) − [ ( )] (1.21)
Định nghĩa 1.4.8 Hiệp phương sai của hai BNN
Mệnh đề 1.4.3 Một số tính chất của phương sai
Định nghĩa 1.5.1 Phân phối nhị thức (Binomial distribution)
BNN X được gọi là có phân phối nhị thức với hai tham số n, p nếu
Trang 11Phân phối hình học với tham số q (0 ≤ q ≤ 1) là phân bố xác suất rời rạc tập trung tại tập hợp các số tự nhiên, cho bởi công thức sau:
Định nghĩa 1.5.3 Phân phối Poisson (Poisson distribution)
Một biến ngẫu nhiên X được gọi là có phân phối Poisson với tham số λ, nếu như các giá trị của nó là các số nguyên không âm, và với mọi k ∈ Z + ta có
Trang 12( ) = = = ( ) ( )
∈
; (1.32)
Chú ý 1.5.1
Mệnh đề 1.5.5 Một số tính chất của hàm sinh xác suất ( )
Định nghĩa 1.5.5 Hàm sinh moment (The moment generating
Trang 13Mệnh đề 1.6.2 Bất đẳng thức Markov
Cho bất kỳ biến ngẫu nhiên X không âm với kỳ vọng hữu hạn, với
> 0 bất kỳ cho trước, ta luôn có :
Một số tính chất của hàm Φ( ) :
Trang 14(1) lim
→ Φ( ) = 1 (2) Φ( ) = 1 − Φ(− ) ∀ ∈ ℝ, kéo theo rằng
(có nghĩa là phương sai của phân phối chuẩn tắc là 1)
(5) Φ( ) là hàm không giảm và liên tục trong x
Mệnh đề 1.6.5 Định lý De Moivre – Laplace địa phương (The local
Trang 15ℙ( ≤ ≤ ) = ℙ −
(1 − )≤
−(1 − )≤
−(1 − ) ≈ Φ −
(1 − ) − Φ
−(1 − ) (1.54)
Ví dụ 1.6.4
1.7 QUÁ TRÌNH PHÂN NHÁNH
Mô hình dẫn đến một quá trình phân nhánh là đơn giản Ban đầu,
ta có một mục (một hạt hay một sinh vật sinh học) sản xuất ngẫu nhiên một số 'con', mỗi con trong số đó tạo ra ngẫu nhiên một số con cái và cứ như vậy Điều này tạo ra một cấu trúc "cây giống" trong đó
có một liên kết với bố mẹ và một số liên kết với con cái riêng của mình
Mỗi điểm (ngẫu nhiên) của cây nổi lên có một đường dẫn nối nó với tổ tiên xa xôi nhất (gọi là nguồn gốc, hoặc mục gốc của cây) Chiều dài của đường dẫn, tương đương với số lượng của các liên kết trong nó Mỗi điểm đưa đến một cây con mọc từ nó (đối với một số điểm có thể không tiếp tục, khi số lượng con cái là số không)
Xét các BNN X0, X1, X2, … trong đó X n cho kích thước của dân số
trong thế hệ thứ n Đó là :
X0 = 1,
X1 = số con sau phân hạch 1,
X2 = số con sau phân hạch thứ 2,
v.v…
Các BNN X n và X n+1 có liên quan bởi phép đệ quy sau đây :
= ( ) (1.55) trong đó ( ) là số con cháu sản xuất bởi các thành viên thứ i của thế
Trang 16hệ thứ n Các BNN ( ) được cho là chuỗi các BNN độc lập phân phối giống nhau, và phân phối chung của chúng xác định quá trình phân nhánh
Bằng cách sử dụng kỳ vọng có điều kiện, giá trị trung bình
(tức là kỳ vọng kích thước của thế hệ thứ n) bằng :
= ( ) ℙ( = ) = ( ) (1.56) Giá trị ( ) không phụ thuộc vào k và i, và biểu thị bằng Khi đó :
= , = ( ) , … , = ( ) , … (1.57)
Nhận xét 1.7.1
Hàm sinh xác suất của các BNN ( )(không phụ thuộc vào n và
của thế hệ thứ n, thì ( ) = ( ) và bằng đệ quy,
( ) = ( ) , ≥ 1 (1.58) Xác suất bị tuyệt chủng
≔ ℙ( = 0) = (0) = (0) (1.59)
Do = ( ), bằng trực giác ta sẽ kỳ vọng giới hạn
= lim → = lim → (0) để được một điểm cố định của ánh
xạ ⟼ ( ), tức là một nghiệm của = ( )
Trong thực tế, giới hạn xác suất bị tuyệt chủng tồn tại và
= nghiệm không âm nhỏ nhất thỏa = ( ) (1.60)
Ví dụ 1.7.1
Ví dụ 1.7.2
Trang 17CHƯƠNG 2 CÁC KẾT QUẢ LIÊN TỤC
2.1 PHÂN PHỐI ĐỀU HÀM MẬT ĐỘ XÁC SUẤT BIẾN NGẪU NHIÊN ĐỘC LẬP
Định nghĩa 2.1.1 Phân phối đều (Uniform distribution)
Một sự kiện (nghĩa là một tập hợp con) A ⊆ có xác suất:
ℙ( ) = ( )
( ) (2.1)
trong đó ( ) là độ đo (diện tích hoặc chiều dài) của A và ( ) là
độ đo của , được gọi là phân phối đều trên
thì f (x) được gọi là hàm mật độ xác suất
Định nghĩa 2.1.3 Biến ngẫu nhiên (BNN)
Biến ngẫu nhiên là một hàm X trên tập hợp kết quả ,
Trang 18∈ ℝ ⟼ ( ) = ℙ( < ) (2.11)
Chú ý 2.1.1
Định nghĩa 2.1.5 Hàm mật độ đồng thời - Hàm phân phối đồng thời
(The joint density function - The joint distribution function)
Hàm phân phối đồng thời của hai BNN thực X, Y được kí hiệu
Định nghĩa 2.1.6 Hàm mật độ điều kiện | ( | ) của BNN Y có
điều kiện trên { = }
Trang 192.2 KỲ VỌNG, KỲ VỌNG ĐIỀU KIỆN PHƯƠNG SAI HÀM SINH HÀM ĐẶC TRƯNG
Trang 20Định nghĩa 2.3.1 Một biến ngẫu nhiên X được gọi là có phân phối
chuẩn (hoặc phân phối Gauss) với hai tham số µ và σ 2 , kí hiệu X
Mệnh đề 2.3.1 Một số tính chất của phân phối chuẩn
Mệnh đề 2.3.2 Định lý giới hạn trung tâm đối với chuỗi BNN độc
Trang 21Vectơ = ⋮ được gọi là có phân phối chuẩn n
chiều, ~ ( , ∑), nếu hàm mật độ ( ) có dạng :
√2 (det Σ) / exp −1
2〈 − , Σ ( − )〉 (2.60) Trong đó:
Ví dụ 2.3.3 Xét vectơ chuẩn hai chiều gồm BNN X, Y Hàm mật độ
cho ở dạng (2.60) với n = 2 Ở đây, ma trận xác định dương Σ và Σ
Trang 22( ) = 1
−12(1 − )
Mệnh đề 2.3.4 Một số tính chất của vectơ phân phối chuẩn n chiều
Ví dụ 2.3.4
Ví dụ 2.3.5
Trang 23KẾT LUẬN
Qua một thời gian tìm hiểu, tiếp cận và nghiên cứu về Xác suất cơ
sở qua các ví dụ, luận văn đã hoàn thành và đạt được mục tiêu nghiên cứu của đề tài với những kết quả cụ thể sau:
- Tổng quan và hệ thống một cách đầy đủ các công thức tính xác suất của một sự kiện, khái niệm về phân phối đều, định nghĩa và công thức xác định các tham số đặc trưng, các dạng hàm sinh của biến ngẫu nhiên liên quan đến phần rời rạc cũng như liên tục của xác suất cơ sở Chúng tôi cũng đưa vào luận văn các dạng phân phối xác suất của biến ngẫu nhiên trong các trường hợp khác nhau và mở rộng
hơn trong không gian n chiều
- Trình bày rõ ràng, chi tiết về công thức, ý nghĩa vận dụng của các bất đẳng thức Chebyshev, bất đẳng thức Markov, bất đẳng thức Jensen và định lý De Moivre-Laplace trong lý thuyết xác suất Chúng tôi cũng đã mở rộng tìm hiểu và đưa vào các bài toán về quá trình phân nhánh, nghiên cứu các vấn đề mang tính di truyền và kế thừa
- Và đặc biệt nhiều ví dụ mang tính tổng quát hoặc cụ thể hơn so với các bài toán trong tài liệu tham khảo được đưa vào trong luận văn nhằm làm sáng tỏ vấn đề nghiên cứu
Với những gì đã khảo sát được, luận văn sẽ là một tài liệu tham khảo hữu ích cho bản thân khi tiếp tục đi sâu nghiên cứu sau này và
hy vọng cũng là nguồn tư liệu tốt cho những ai quan tâm nghiên cứu
về các kết quả rời rạc và liên tục của lý thuyết xác suất, cùng với ứng dụng chúng trong nhiều lĩnh vực khác nhau
Trong điều kiện thời gian và khuôn khổ của luận văn nên chúng tôi chưa đi sâu nghiên cứu ứng dụng thực tiễn của các phân phối liên tục Đó như là hướng phát triển của luận văn
Trang 24Trong quá trình làm luận văn, mặc dù đã có rất nhiều cố gắng song do điều kiện khách quan và năng lực có hạn của bản thân nên luận văn khó tránh khỏi những thiếu sót, tác giả rất mong nhận được những góp ý chân thành của quý thầy cô và bạn đọc để có thể tiếp tục tìm hiểu, nghiên cứu và phát triển luận văn sau này