Kiến thức cơ sở
Đại lượng ngẫu nhiên và hàm phân phối đại lượng ngẫu nhiên
1.2.1: ĐẠI LƯỢNG NGẪU NHIÊN Định nghĩa 1.2.1
Cho không gian xác suất (Ω, 𝒜, 𝑃) Đại lượng ngẫu nhiên là hàm đo được từ Ω vào ℝ
SVTH: TRẦN THỊ HIỀN Trang 12 Định lý 1.2.1 i Nếu 𝑋, 𝑌 là các ĐLNN trên (Ω, 𝒜, 𝑃); 𝑎, 𝑏 là các hằng số thực thì
Y (Y ≠ 0); max (𝑋, 𝑌) ; min (𝑋, 𝑌) cũng là các ĐLNN trên (Ω, 𝒜, 𝑃) ii Nếu X là ĐLNN trên (Ω, 𝒜, 𝑃), 𝑔 là hàm đo được trên R thì 𝑔 𝑜 𝑋 là ĐLNN trên (Ω, 𝒜, 𝑃)
1.2.2: HÀM PHÂN PHỐI XÁC SUẤT CỦA ĐLNN: Định nghĩa 1.2.2 Trong không gian xác suất (Ω, 𝒜, 𝑃) cho ĐLNN X Ta gọi hàm thực F(x) được xác định bởi hệ thức : F(x) = P(X< x), 𝑥 ∈R ((𝑋 < 𝑥) { 𝜔 ∈ Ω ∶ 𝑋(𝜔) < 𝑥}) là hàm phân phối của X
Tính chất 1.2.2 i 0 ≤ 𝐹(𝑥) ≤ 1 ; ∀𝑥 ∈ 𝑅 ii Nếu 𝑥 1 ≤ 𝑥 2 thì 𝐹(𝑥 1 ) ≤ 𝐹(𝑥 2 ) iii lim x 𝐹(𝑥) = 1, lim x 𝐹(𝑥) = 0 iv F(x) liên tục trái trên R
Chứng minh: i Theo tính chất xác suất : 0 ≤ 𝑃(𝑥) ≤ 1 mà F(x)= P(X< x) nên suy ra
SVTH: TRẦN THỊ HIỀN Trang 13
𝐶 𝑛 = {𝑥 𝑛 ≤ 𝑋 ≤ 𝑥 0 } nên 𝐶 𝑛 ⊃ 𝐶 𝑛+1 ⊃ ⋯ và ⋂ 𝑛≥1 𝐶 𝑛 = ∅ (1) Chứng minh (1): Giả sử ∃𝜔 ∈ ⋂ 𝑛≥1 𝐶 𝑛 thì 𝜔 ∈ 𝐶 𝑛 với mọi 𝑛
⇔ 𝐹(𝑥 0 ) = 𝐹(𝑥 0 − ) Vậy F(x) liên tục trái tại 𝑥 0
SVTH: TRẦN THỊ HIỀN Trang 14
- Hàm phân phối 𝐹 𝑋 (𝑥) được gọi rời rạc nếu nó có dạng: 𝐹(𝑥) : i i i x x p
trong đó 𝑝 𝑖 > 0, ∑ 𝑝 𝑖 𝑖 = 1 và 𝑆 = {𝑥 𝑖 : 1 ≤ 𝑖 ≤ ∞} là tập con không quá đếm được của R
- Đại lượng ngẫu nhiên X có phân phối rời rạc khi và chỉ khi có một tập 𝑆 {𝑥 𝑖 : 1 ≤ 𝑖 ≤ 𝑛 ≤ ∞} hữu hạn hoặc đếm được sao cho 𝑃[𝑋 ∈ 𝑆] = 1 Nếu đặt
𝑝 𝑖 = 𝑃[𝑋 = 𝑥 𝑖 ]; ∀𝑖 ≥ 1 thì rõ ràng ta có:
- Bảng phân phối xác suất của X
1.2.4: PHÂN PHỐI CỦA HÀM ĐLNN
Giả sử X là ĐLNN với hàm phân phối 𝐹 𝑋 (𝑥) và h(x) là hàm Borel Khi đó hàm phân phối của Y = h(X) là
Nếu h tăng và có hàm ngược thì
Các đặc trưng số của đại lượng ngẫu nhiên rời rạc
1.3: CÁC ĐẶC TRƯNG SỐ CỦA ĐLNN RỜI RẠC
1.3.1: KÌ VỌNG Định nghĩa 1.3.1 Cho X là ĐLNN rời rạc với miền giá trị {𝑥 𝑖 , 𝑖 ∈ 𝐼}
hội tụ tuyệt đối thì giá trị 𝐸(𝑋)
được gọi là kì vọng toán của X
Tính chất của phép toán kỳ vọng trong xác suất bao gồm các điểm chính sau: (i) EX là một phiếm hàm tuyến tính trên tập hợp các biến ngẫu nhiên rời rạc (ii) Giá trị kỳ vọng của một hằng số c là chính nó, tức là E(c) = c (iii) Nếu X ≥ 0 thì E(X) cũng phải lớn hơn hoặc bằng 0; và nếu X ≤ Y thì E(X) ≤ E(Y) (iv) Kỳ vọng của một biến ngẫu nhiên I_A là xác suất của A, cho mọi A thuộc tập 𝒜 (v) Đối với một dãy các biến ngẫu nhiên rời rạc (X_n), nếu giới hạn trên của X_n tiến tới X (và giới hạn dưới cũng vậy), thì giới hạn trên của E(X_n) sẽ tiến tới E(X) (và giới hạn dưới cũng tương tự) (vi) Nếu X và Y là các biến ngẫu nhiên độc lập và kỳ vọng của chúng tồn tại, thì E(XY) = E(X)E(Y).
* Ý nghĩa của kì vọng toán : Đặc trưng cho giá trị trung bình của các giá trị của X
1.3.2 : PHƯƠNG SAI Định nghĩa 1.3.2 Giả sử X là ĐLNN có kì vọng EX, nếu tồn tại 𝐸(𝑋 − 𝐸𝑋) 2 thì ta nói đó là phương sai của X
SVTH: TRẦN THỊ HIỀN Trang 16
- 𝜎(𝑋) = √𝐷(𝑋) được gọi là độ lệch quân phương của X hoặc độ lệch chuẩn của X
- Với 𝑘 ∈ 𝑁 trong điều kiện tồn tại, ta gọi 𝑚 𝑘 = 𝐸(𝑋 𝑘 )là momen bậc k của
- 𝜇 𝑘 = 𝐸(𝑋 − 𝐸𝑋) 𝑘 được gọi là momen quy tâm bậc k của X
Tính chất 1.3.2 i (BĐT Chebyshev) Nếu 𝐷(𝑋) < +∞ lúc đó ∀𝜀 > 0 ta có:
𝜀 2 ii D(c)=0 ; c = const iii Nếu D(X) = 0 thì 𝑋 = 𝐸𝑋 hầu khắp nơi iv 𝐷(𝑋) = 𝐸(𝑋 2 ) − (𝐸𝑋) 2 v 𝐷(𝑎𝑋 + 𝑏) = 𝑎 2 𝐷(𝑋) ∀𝑎, 𝑏 ∈ 𝑅 vi Nếu {𝑋 1 , 𝑋 2 , … , 𝑋 𝑛 } là ĐLNN độc lập có phương sai hữu hạn thì
Phương sai là chỉ số đo lường độ phân tán của đại lượng ngẫu nhiên X so với giá trị kỳ vọng Khi phương sai nhỏ, điều này cho thấy độ phân tán của dữ liệu cũng giảm theo.
1.3.3: TRUNG VỊ (Mêdian) Định nghĩa 1.3.3 Giả sử X là ĐLNN; Med(X) được gọi là trung vị của
SVTH: TRẦN THỊ HIỀN Trang 17
X có thể có 1 hay nhiều trung vị
Med(X) là điểm phân đôi khối lượng xác suất thành hai phần bằng nhau
1.3.4: MODE Định nghĩa 1.3.4 Giả sử X là đại lượng ngẫu nhiên có hàm mật độ f(x), ta gọi điểm cực đại của f(x) là mode của X Kí hiệu là Mod(X)
1.3.5: PHÂN VỊ CẤP P Định nghĩa 1.3.5 𝑥 𝑝 được gọi là phân vị cấp p của phân phối F(x) nếu :
Ví dụ: Cho X có phân phối
SVTH: TRẦN THỊ HIỀN Trang 18
Các phân phối rời rạc dùng trong xác suất thống kê
Phân phối nhị thức
Định nghĩa 2.1.1 Đại lượng ngẫu nhiên X được gọi là có phân phối nhị thức tham số 𝑛, 𝑝 nếu : Im(X)= {0;1;2 n} và có xác suất 𝑃[𝑋 = 𝑘] = 𝐶 𝑛 𝑘 𝑝 𝑘 (1 − 𝑝) 𝑛−𝑘 với k = 0, 𝑛; 0 < 𝑝 < 1
Bảng phân phối xác suất của X có dạng
Trong khai triển nhị thức Newton, xác suất 𝑃(𝑋 = 𝑘) được tính bằng công thức 𝑃 𝑘 = 𝐶 𝑛 𝑘 𝑝 𝑘 (1 − 𝑝) 𝑛−𝑘 Theo định lý 2.1.1, nếu 𝑋 1, 𝑋 2, …, 𝑋 𝑛 là các biến ngẫu nhiên độc lập với phân phối 𝑋 𝑖 ~𝐵(𝑛 𝑖, 𝑝) cho 𝑖 = 1, …, 𝑛, thì tổng của chúng sẽ có phân phối 𝐵(𝑛 1 + 𝑛 2 + ⋯ + 𝑛 𝑛; 𝑝).
Với n = 1 Ta có 𝑋 1 ~𝐵(𝑛 1 , 𝑝) hiển nhiên
Theo giả thiết 𝑋 1 ; 𝑋 2 là các ĐLNN độc lập,
SVTH: TRẦN THỊ HIỀN Trang 19
SVTH: TRẦN THỊ HIỀN Trang 20
*Xét tương tự với n ĐLNN độc lập ta có (𝑋 1 + 𝑋 2 + 𝑋 3 + ⋯ +
Vậy (𝑋 1 , 𝑋 2 , 𝑋 3 , … , 𝑋 𝑛 ) là ĐLNN độc lập ; 𝑋 𝑖 ~𝐵(𝑛 𝑖 , 𝑝), i=1,2,…,n thì tổng hữu hạn của chúng có phân phối 𝐵(𝑛 1 + 𝑛 2 + ⋯ + 𝑛 𝑛 ; 𝑝) Định lý 2.1.2 Các tham số đặc trưng
X có phân phối nhị thức với tham số 𝑛, 𝑝 khi đó:
1 Gọi 𝑋 𝑖 là số lần thành công trong phép thử thứ i; i=1,2,…,n trong dãy n phép thử Becnoulli thì 𝑋 𝑖 là ĐLNN có bảng phân phối xác suất là:
Ta có (𝑋 1 , 𝑋 2 , 𝑋 3 , … , 𝑋 𝑛 ) là ĐLNN độc lập với nhau
SVTH: TRẦN THỊ HIỀN Trang 21 Định lý 2.1.3 Giả sử X là số thành công trong n phép thử Bernoulli với xác suất thành công p, không quá gần 0 và 1, 𝑥 𝑘 = k np npq
bị chặn đều Khi đó :
Từ định lý trên ta có công thức tính gần đúng
Chứng minh Sử dụng công thức Stirling ln(𝑛!) = ln√2𝜋𝑛 + 𝑛 ln 𝑛 − 𝑛 + 𝑜( 1
𝑛) (4) Để khai triển tiệm cận hệ số nhị thức trong: 𝑃(𝑋 = 𝑘) = 𝐶 𝑛 𝑘 𝑝 𝑘 𝑞 𝑛−𝑘 với 𝑞 = 1 − 𝑝 (5)
Ta có: 𝑥 𝑘 = k np npq ⇒ 𝑘 = 𝑛𝑝 + 𝑥 𝑘 √𝑛𝑝𝑞 và 𝑛 − 𝑘 = 𝑛𝑞 − 𝑥 𝑘 √𝑛𝑝𝑞 Từ đó và (4) ta thu được ln(𝑘!) = ln√2𝜋𝑘 + (𝑛𝑝 + 𝑥 𝑘 √𝑛𝑝𝑞) ln(𝑛𝑝 + 𝑥𝑘 √𝑛𝑝𝑞) − 𝑛𝑝 − 𝑥𝑘 √𝑛𝑝𝑞 + 𝑜 (1 𝑛) (6) ln((𝑛 − 𝑘) !) = ln√2𝜋(𝑛 − 𝑘) + (𝑛𝑞 − 𝑥 𝑘 √𝑛𝑝𝑞) ln(𝑛𝑞 − 𝑥 𝑘 √𝑛𝑝𝑞) − 𝑛𝑞 + 𝑥𝑘 √𝑛𝑝𝑞 + 𝑜 ( 1 𝑛 ) (7)
Sử dụng công thức : ln(1 − 𝑥) = 𝑥 − 𝑥 2
SVTH: TRẦN THỊ HIỀN Trang 22 ln(𝑛𝑝 + 𝑥 𝑘 √𝑛𝑝𝑞) = ln(𝑛𝑝) + ln (1 + 𝑥𝑘 √ 𝑞
ln nq x k npq ln( nq ) ln(1 x k nq p )
Từ (4) đến (8) ta suy ra kết luận của định lý Định lý 2.1.4 (Định lí giới hạn tích phân Moivre-Laplace)
Giả sử X là số thành công trong n phép thử Bernoulli với xác suất thành công 𝑝, không quá gần 0 và 1 khi đó :
được gọi là hàm Laplace Định lý này cho ta công thức xấp xỉ
SVTH: TRẦN THỊ HIỀN Trang 23
Phân phối Poison
Định nghĩa 2.2.1 Giả sử 𝜆 là một số thực dương, ta nói X là ĐLNN có phân phối Poisson với tham số 𝜆 nếu: Im(X)= {0;1;2;… } và
Rõ ràng hệ xác suất 𝑃 𝑘 = 𝑒 −𝜆 𝜆 𝑘
𝑘=0 e −λ e λ = 1 Định lý 2.2.1 Nếu 𝑋 1 , 𝑋 2 , 𝑋 3 , … , 𝑋 𝑛 là ĐLNN độc lập với nhau và 𝑋 𝑖 ∼ 𝑃(𝜆 𝑖 ); 𝜆 𝑖 > 0 ∀𝑖 = 1, 𝑛 thì tổng hữu hạn ĐLNN độc lập có phân phối 𝑃(𝜆 1 + 𝜆 2 + ⋯ + 𝜆 𝑛 )
SVTH: TRẦN THỊ HIỀN Trang 24
Tương tự với n ĐLNN độc lập ta cũng có (𝑋 1 + 𝑋 2 + 𝑋 3 + ⋯ + 𝑋 𝑛 )
Cho 𝑋 1 ; 𝑋 2 là ĐLNN độc lập ; 𝑋 1 ~𝑃(𝜆 1 ); 𝑋 2 ~𝑃(𝜆 2 ) ; 𝜆 1 ; 𝜆 2 > 0 thì
X với điều kiện 𝑋 1 + 𝑋 2 = 𝑛 là phân phối 𝐵 (𝑛, 𝜆 1
Theo công thức xác suất điều kiện ta có
SVTH: TRẦN THỊ HIỀN Trang 25
Mà X 1 + X 2 ~𝑃(𝜆 1 + 𝜆 2 ) (chứng minh trên) nên ta có:
𝑛! (11) Thay (10) và (11) vào (9) ta được:
Vậy phân phối của 𝑋 1 với điều kiện 𝑋 1 + 𝑋 2 = 𝑛 là phân phối nhị thức với 𝑝 = 𝜆 1
(𝜆 1 +𝜆 2 ) Định lý 2.2.3 Các tham số đặc trưng của phân phối Poisson
Nếu ĐLNN X có phân phối poisson với tham số 𝜆 > 0, thì :
SVTH: TRẦN THỊ HIỀN Trang 26
SVTH: TRẦN THỊ HIỀN Trang 27
= 𝜆 + 𝜆 Vậy 𝐷(𝑋) = 𝜆 2 + 𝜆 − 𝜆 2 = 𝜆 Định lý 2.2.4 Định lí Poisson
Cho X∼B(n,𝑝 𝑛 ) Khi 𝑛 → ∞, 𝑝 𝑛 → 0 , 𝑛𝑝 𝑛 = 𝜆 (const) thì n→∞lim 𝑃 𝑛 (𝑘) = 𝑒 −𝜆 𝜆 𝑘
𝑘! Định lý poisson cho ta công thức xấp xỉ:
SVTH: TRẦN THỊ HIỀN Trang 28
𝑘! Định lý 2.2.5 Cho 𝑋 𝑖 ~𝐵(1; 𝑝); 𝑋 𝑖 độc lập 𝑆 𝑛 = 𝑋 1 + ⋯ + 𝑋 𝑛 ;
SVTH: TRẦN THỊ HIỀN Trang 29
Vậy 𝑆 𝜏 = 𝑋 1 + ⋯ + 𝑋 𝜏 ~𝑃(𝜆𝑝) Định lý 2.2.6 Cho 𝑋~𝐵(𝑛; 𝑝); 𝑌~𝑃(𝜆), với 𝜆 = 𝑝
SVTH: TRẦN THỊ HIỀN Trang 30
SVTH: TRẦN THỊ HIỀN Trang 31
Phân phối siêu hình học
Định nghĩa 2.3.1 ĐLNN X được gọi là có phân phối siêu hình học với tham số N,M,n với M