KHÁI NIỆM BIẾN NGẪU NHIÊN Như chúng ta ñã biết, một không gian mẫu M có thể ñược mô tả không thuận lợi nếu những phần tử của M không phải là các con số.. Cho biến ngẫu nhiên X trên khô
Trang 1
Biến ngẫu nhiên
1 KHÁI NIỆM BIẾN NGẪU NHIÊN
Như chúng ta ñã biết, một không gian mẫu M có thể ñược mô tả không
thuận lợi nếu những phần tử của M không phải là các con số Để tiện lợi trong
việc mô tả, giải toán và ñưa vào một số khái niệm mới, người ta sẽ tìm một qui tắc, theo ñó, mỗi phần tử m thuộc M có thể ñược biểu diễn bởi một số thực x
tương ứng Ý tưởng này dẫn ñến khái niệm Biến ngẫu nhiên
1.1 Định nghĩa Cho trước không gian xác suất M Một hàm X: M → sao cho với mọi khoảng K trong , tập hợp
{m ∈ M / X(m) ∈ K} là một biến cố của M, ñược gọi là một Biến ngẫu nhiên ( viết tắt là BNN ) trên M
Miền giá trị của X ñược ký hiệu là Im(X), i.e
Im(X) = {x ∈ / ∃m ∈ M , X(m) = x}
• Để ñơn giản cách viết, biến cố {m ∈ M / X(m) ∈ K} ñược viết là {X ∈ K} Đặc biệt, với các số thực a và b, các biến cố: {m ∈ M / X(m) = a}; {m ∈ M /
X (m) < a}; {m ∈ M / a ≤ X(m) ≤ b}; {m ∈ M / X(m) ≥ b}; …
lần lượt ñược viết là {X = a}; {X < a}; {a ≤ X ≤ b}; {X ≥ b}; …
Các xác suất P({X = a}); P({X < a}); P({a ≤ X ≤ b})…ñược viết gọn là
P(X = a); P(X < a); P(a ≤ X ≤ b) …
Dựa vào các tính chất của hàm thực, chúng ta có:
1.2 Định lý Giả sử X và Y là các BNN trên cùng một không gian xác
suất M; a và b là các hằng số thực; khi ñó, các hàm aX + bY, XY, max(X, Y),
min(X,Y) và X/Y (với Y ≠ 0) cũng là các BNN trên M Ngoài ra, nếu ϕ là một hàm
liên tục xác ñịnh trên Im(X) thì ϕoX cũng là một BNN trên M
1.3 Thí dụ
Trang 21.3.1 Tham khảo lại Định nghĩa 1.6.1 và Định lý 1.6.2; với B(p), không
gian mẫu là M = {T, B}, trong ñó, T và B lần lượt chỉ các kết quả sơ cấp "Thành
công" và "Thất bại" Hàm số thực X trên M ñược xác ñịnh bởi:
X(T) = 1 và X(B) = 0
là một biến ngẫu nhiên trên M "Qui tắc" ñể thành lập hàm X là "số lần
thành công trong B(p)" Chúng ta nói rằng X là biến ngẫu nhiên chỉ số lần thành
công trong B(p) X có miền giá trị là {0, 1}, và
kết quả sơ cấp Như vậy, chúng ta có BNN X chỉ số lần thành công trong quá
trình B(n;p) X có miền giá trị là {0, 1, 2, …, n}, và xác suất ñể có k thành
công trong quá trình là: (Định lý 1.6.2.)
1.3.3 Trong mô hình phân phối siêu hình học ở ñoạn 1.2, nếu gọi X là biến
ngẫu nhiên chỉ số phần tử "ñược ñánh dấu" trong mẫu kích thước n thì biến cố
{X = k} = Ak (Ak: “có k phần tử ñược ñánh dấu trong mẫu”)
C
n k k
T N T n N
trong ñó k ∈ {max[0,n - (N - T)],…, min (T, n)}
−
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
hoặc một thí dụ ỏ phần trước, tác giả ghi thêm số chương vào phía trước số chỉ mục e.g Khi cần tham khảo Định nghĩa 6.1 ở chương 1, tác giả ghi: Định nghĩa
1.6.1; Định lý 2.3 ở chương 2, sẽ ñược ghi là Định lý 2.2.3…
Khi ñó, người ta nói rằng: Biến ngẫu nhiên X tuân theo luật ( hay có luật)
phân phối siêu hình học
1.3.4 Một công ty nghiên cứu phản ứng của thị trường ñối với một loại sản
phẩm mới ở 3 mức ñộ: Tốt , trung bình và kém Không gian mẫu M gồm 3 biến cố
Trang 3sơ cấp: {tốt, trung bình, kém} Chúng ta có thể xác ñịnh một biến ngẫu nhiên X trên M như sau:
X(tốt) = 1; X(trung bình) = 0; X(kém) = −1
Miền giá trị của X là {−1, 0, 1}
2 HÀM PHÂN PHỐI XÁC SUẤT TÍCH LŨY
2.1 Định nghĩa Cho biến ngẫu nhiên X trên không gian xác suất M Với
mọi x thuộc , {X < x} là một biến cố, nên tồn tại P(X < x) Hàm F ñược xác ñịnh
bởi:
∀x ∈ , F(x) = P(X < x )
ñược gọi là Hàm phân phối xác suất tích lũy (hay nói gọn là hàm phân
phối, viết tắt là h.p.p ) của X
Từ ñịnh nghĩa của h.p.p và tính chất của xác suất, dễ thấy rằng:
∀x ∈ , 0 ≤ F (x) ≤ 1 H.p.p F của BNN X có các tính chất cơ bản ñược thể hiện ở ñịnh lý sau:
2.2 Định lý Cho biến ngẫu nhiên X xác ñịnh trên một không gian xác
suất; F là h.p.p của X Khi ñó,
(iii) F liên tục bên trái trên
(iv) P(a ≤ X < b) = F (b) − F (a) với mọi a và b thỏa a < b (v) P(X = a) = F (a+) −−− F (a) với mọi a ∈
Trang 4Với mọi n ∈ *, ñặt A n = {X < x n } thì (A n) là một dãy giảm các biến cố
n n
từ ñó, chúng ta có F (x−−−) = F (x)
Vậy, F liên tục bên trái tại mọi ñiểm x ∈
Phần chứng minh (iv) và (v) ñược xem như bài tập.
( Gợi ý: Để chứng minh (v), dùng n { 1}
n
C = a ≤ X < + a
Ngược lại, người ta chứng minh ñược rằng:
2.3 Định lý Nếu một hàm F: → thỏa ba tính chất (i), (ii) và (iii) trong
Định lý 2.2.2 thì F là h.p.p của một biến ngẫu nhiên trên một không gian xác suất nào ñó
Trang 5Thí dụ Cho BNN X có h.p.p F ñược xác ñịnh bởi:
Các ñịnh lý 2.2.2 và 2.2.3 cho chúng ta thấy rằng: Nếu biết h.p.p F của một
BNN X thì chúng ta biết ñược ñầy ñủ về X Vì vậy, hàm phân phối là một ñặc
trưng ñầy ñủ của một biến ngẫu nhiên Khi biết h.p.p F của BNN X, người ta nói
rằng phân phối xác suất của X ñược xác ñịnh
Có hai loại phân phối xác suất: Loại rời rạc và loại liên tục
3.1 Định nghĩa Một biến ngẫu nhiên X trên không gian xác suất M ñược
gọi là có phân phối xác suất thuộc loại rời rạc hay X là BNN rời rạc nếu Im(X)
là một tập hợp hữu hạn hoặc ñếm ñược Nói cách khác, X là một BNN rời rạc nếu
các phần tử của Im(X) có thể liệt kê ñược thành một dãy Giả sử Im(X) = {x1, x2, ., xn, …} Hàm f : → ñược xác ñịnh bởi:
ñược gọi là Hàm mật ñộ xác suất hay nói gọn là Hàm mật ñộ ( viết tắt là
Trang 6Khi Im(X) là hữu hạn, phân phối xác suất của X có thể ñược trình bày dưới
dạng bảng gọi là Bảng phân phối xác suất:
x x1 x2 xn
f (x) p1 p2 pn
trong ñó, p i = f (xi), với mọi i ∈ {1, 2, …, n}
của hai con xúc xắc Không gian mẫu M tương ứng là hữu hạn ñều và gồm 36 ñiểm (Thí dụ 1.1.3.1) Gọi X là BNN chỉ số lớn nhất trong hai số xuất hiện, i.e với mọi (a,b) thuộc M, X(a,b) = max (a,b)
P(2 ≤ X < 5) = P(X = 2) + P(X = 3) + P(X = 4) = 3 + 5 + 7 = 15
36 36 36 36
Phân phối xác suất của X có thể ñược trình bày dưới dạng một Biểu ñồ:
f (x)
Trang 7
0 1/36 2/36 3/36 4/36 5/36 6/36 7/36 8/36 9/36 10/36 11/36
x
3.2 Định nghĩa Cho BNN X có hàm phân phối F
(a) Nếu F liên tục trên thì X ñược gọi là có phân phối xác suất thuộc loại
liên tục hay X là BNN liên tục
(b) Giả sử X là một BNN liên tục Nếu h.p.p F có ñạo hàm trên thì hàm
f = F’ ñược gọi là hàm mật ñộ (viết tắt là h.m.ñ.) của X Trong trường hợp này, F
ñược viết dưới dạng:
và X ñược gọi là liên tục tuyệt ñối
X hoàn toàn ñược xác ñịnh nếu và chỉ nếu h.m.ñ của X ñược xác ñịnh
Đối với BNN liên tục, giáo trình này chỉ khảo sát loại tuyệt ñối liên tục nên
ñể ñơn giản cách trình bày, chúng ta gọi chung là BNN liên tục
3.3 Định lý Một hàm thực f xác ñịnh trên là hàm mật ñộ của một
BNN X nếu và chỉ nếu f thỏa mãn hai tính chất sau:
(i) f (x) ≥ 0 với mọi x ∈ và (ii) f x dx ( ) 1
(a) Nếu f là h.m.ñ của một BNN X thì dựa vào các tính chất của h.p.p của
X, dễ thấy rằng f thỏa hai tính chất (i) và (ii)
.(b) Bây giờ giả sử f thỏa (i) và (ii) Với mọi số thực x, ñặt:
Trang 8Vậy f là h.m.ñ của BNN X
3.4 Chú ý Giả sử X là một BNN liên tục có h.p F và h.m.ñ f Khi ñó,
với mọi số thực a và b thỏa a < b:
(i) P(a ≤ X < b) = ( ) ( ) b ( )
a
F b − F a = ∫ f x dx;
(ii) P(X = a) = F ( a+) −−− F (a) = 0 ( vì F liên tục tại a )
(iii) P(a < X < b) = P(a ≤ X < b) = P(a < X ≤ b) = P(a ≤ X ≤ b);
Như vậy, sự thay ñổi giá trị của h.m.ñ của X tại một ñiểm không làm
thay ñổi phân phối xác suất của X
Thí dụ, h.m.ñ f xác ñịnh bởi
0 ( )
có thể ñược viết là
0 ( )
Đồ thị hàm mật ñộ f của một BNN liên tục
Diện tích của vùng ñược tô ñen trong hình là xác suất P(a ≤ X ≤ b)
3.5 Thí dụ Cho BNN X rời rạc có h.m.ñ f ñược xác ñịnh bởi:
Khi ñó, h.p.p F của X ñược xác ñịnh bởi:
Trang 9F x
x x
3.6 Thí dụ Cho BNN X liên tục có h.m.ñ f ñược xác ñịnh bởi:
3 1( )
(0 3) ( ) (3) (0)
P < X < = ∫ f x dx = F − F =
4 VECTƠ NGẪU NHIÊN
Trong nhiều trường hợp, khi nghiên cứu một ñối tượng, chúng ta phải ghi nhận cùng một lúc nhiều ñặc tính của ñối tượng Thí dụ., khi quan sát tầm vóc mỗi người, chúng ta phải ñể ý ñến cả chiều cao, ñược biểu diễn bởi BNN X1, lẫn khối lượng, ñược biểu diễn bởi BNN X2, của người ñó Như vậy, tầm vóc của một người ñược ñặc trưng bởi một bộ hai BNN (X1, X2 ), mà người ta gọi là một
vectơ ngẫu nhiên viết tắt là VTNN ) Ở thí dụ này., VTNN có 2 thành phần nên
ñược gọi là một Biến ngẫu nhiên 2 chiều Một VTNN có n thành phần ñược gọi
là một BNN n chiều
4.1 Định nghĩa Giả sử X1, X2, …, và Xn là n biến ngẫu nhiên trên không gian xác suất M Hàm X: M → n ñược xác ñịnh bởi:
Trang 10∀m ∈ M , X (m) = (X1(m), X2(m), …, Xn(m))
ñược gọi là một vectơ ngẫu nhiên (viết tắt là VTNN) n thành phần hay một
Biến ngẫu nhiên n chiều trên M
Người ta viết: X = (X1, X2, …, Xn); các BNN Xi (i = 1, …, n) ñược gọi là
các thành phần của VTNN X
Miền giá trị của X là Im(X) = Im(X1) × Im(X2) × × Im(Xn)
Để ñơn giản cách viết, với mọi tập con A trong n, biến cố
Sau này, ñể ñơn giản cách trình bày, giáo trình chỉ trình bày các vấn ñề liên
quan trong trường hợp biến ngẫu nhiên hai chiều (X1, X2) Đối với BNN n chiều (X1, X2, …, Xn), chúng ta cũng có biểu thức tương tự
5 HÀM PHÂN PHỐI, HÀM MẬT ĐỘ ĐỒNG THỜI
5.1 Định nghĩa Cho VTNN X = (X1, X2) trên một không gian xác suất
Hàm F: 2 → ñược xác ñịnh bởi:
F (x1, x2) = P ( X1< x X1, 2< x2)
ñược gọi là hàm phân phối (tích lũy) ñồng thời của các BNN X1, X2 hay hàm
phân phối (h.p.p.) của VTNN X.
Tương tự như trường hợp BNN, h.p.p F của VTNN X = (X1, X2) có các tính chất sau:
(i) Với mọi a = (a1, a2) và b = (b1, b2) thuộc 2,
Trang 111 2
lim ( , ) 1
x x
F x x
→+ ∞
→+ ∞
=
5.2 Định nghĩa Cho VTNN X = (X1, X2) rời rạc trên một không gian
xác suất Hàm f : 2 → ñược xác ñịnh bởi:
X
ñược gọi là h.m.ñ ñồng thời của các BNN X1, X2 hay h.m.ñ của VTNN X
Nếu F là h.p.p của X thì với mọi (x1, x2) ∈ 2,
Trang 12(a) f (x1, x2) ≥ 0 với mọi (x1, x2) ∈ 2 , và
6 HÀM MẬT ĐỘ BIÊN, MẬT ĐỘ ĐIỀU KIỆN
6.1 Định nghĩa Cho VTNN X = (X1, X2) có h.m.ñ f Với hai số thực a
và b (a < b), biến cố {a < X1 < b} xảy ra nếu và chỉ nếu biến cố {a < X1 < b} và {- ∞ < X2 < + ∞} cùng xảy ra Do ñó:
( tr−êng hîp liª n tôc )
Như vậy, f1 là h.m.ñ của riêng BNN X1 và ñược gọi là h.m.ñ biên của
Trang 13p11
p21
pn1
p12
p22
pn1
p1m
p2m
Trang 14Tương tự, bạn ñọc hãy tìm h.m.ñ.biên f 2 của X2
6.2.2 Cho hai BNN X và Y trên cùng một không gian xác suất, có h.p.p
ñồng thời F ñược cho bởi:
(b) H.m.ñ biên f1 của X ñược xác ñịnh với mọi x ∈ bởi:
Trang 156.3 Định lý và Định nghĩa Cho hai BNN X và Y trên cùng một không
gian xác suất có h.m.ñ ñồng thời f và hai h.m.ñ biên của X và Y lần lượt là f 1
và f 2 Giả sử x là một số thực sao cho f1 (x) > 0 Hàm f ( / x) ñược xác ñịnh
với mọi y thuộc bởi
Tương tự, Giả sử y là một số thực sao cho f2 (y) > 0 Hàm f ( / y) ñược
xác ñịnh với mọi x ∈ bởi
Tương tự, xác suất ñiều kiện của biến cố {c < X < d}, với ñiều kiện {Y = y}
ñã xảy ra (hay với giả thiết {Y = y}) là
Trang 16H.m.ñ biên f 1 và f 2 , theo thứ tự, của hai biến X và Y ñược xác ñịnh bởi:
thời f và các h.m.ñ biên f1, f2, … và fn, theo thứ tự, của các BNN X1, X2,
…và Xn Các BNN X1, X2, …và Xn ñược gọi là ñộc lập nếu với mọi (x1,
Trang 177.1 Định nghĩa Giả sử X là BNN có h.m.ñ f sao cho x f x dx ( )
ñược gọi là giá trị kỳ vọng ( hay nói gọn là kỳ vọng ) của X, và ñược ký hiệu là
E(X) hay µµX hay µµµ, nếu không có sự lầm lẫn
7.2 Định lý Giả sử X và Y là hai BNN trên cùng một không gian xác suất,
có h.m.ñ lần lượt là f và g; k là một số thực, ϕ là một hàm thực liên tục trên
Im(X) Ngoài ra, X và Y có kỳ vọng Khi ñó,
(i) Nếu P(X = k) = 1 thì E(X) = k
(ii) Biến ngẫu nhiên ϕoX có kỳ vọng nếu và chỉ nếu ( ) ( ) x f x dx
(iii) BNN kX có kỳ vọng và E(kX ) = kE(X)
(iv) BNN X + Y có kỳ vọng và E(X + Y) = E(X) + E(Y)
(v) Nếu X và Y ñộc lập thì E(XY) = E(X).E(Y)
Chứng minh
Giả sửchỉ X và Y rời rạc
(i) Hiển nhiên
(ii) Giả sử ϕoX có miền giá trị là {z1, z2, }; với mỗi zk, ñặt
Ak = {xi ∈ Im(X) / ϕ(xi) = zk)},
Trang 18nên E(kX) = kE(X)
(iv) Ký hiệu fX.Y là h.m.ñ ñồng thời của X và Y, chúng ta có:
Trang 19Trường hợp BNN liên tục dược chứng mih tương tự.(Dành cho bạn ñọc)
(a) E(X1 + X2 + + Xn) = E(X1) + E(X2) + + E(Xn)
(b) Nếu X1, X2, , Xn ñộc lập thì
E(X1X2 Xn) = E(X1)E(X2) E(Xn)
7.3 Định nghĩa Giả sử X là B NN có h.m.ñ f Người ta gọi Mode của
X, ký hiệu Mod(X), là giá trị xo ∈ Im(X) sao cho:
( )o max ( )
7.4 Định nghĩa Giả sử X là một BNN có h.m.ñ f và có kỳ vọng µ Nếu
tồn tại E(X − µ )2 thì người ta gọi nó Phương sai của X, ký hiệu Var(X) hay
D(X) hay σ2X hay σ 2 Vậy,
với ñiều kiện là tích phân hoặc chuỗi nêu trên hội tụ tuyệt ñối
Khi có D(X), số thực σX = D X ( ) ñược gọi là Độ lệch chuẩn của X
• Chú ý rằng:
E((X − µ) )2 = E (X2− µ2 X + µ2) = E( )X 2− µ2 E( )X + µ 2
nên: D(X) = E(X2 ) −−−− µµ2
Từ biểu thức của phương sai và tính chất của kỳ vọng, chúng ta có:
7.5 Định lý Giả sử X và Y là hai biến ngẫu nhiên có phương sai; a và b là
Trang 20Hệ quả. Giả sử X là biến ngẫu nhiên có kỳ vọng µ và ñộ lệch chuẩn σ > 0 Biến ngẫu nhiên X* xác ñịnh bởi
* X
= σ
có kỳ vọng bằng 0 và phương sai bằng 1, i.e E(X*) = 0 và D(X*) = 1
X* ñược gọi là Biến ngẫu nhiên chuẩn hóa của X
7.6 Thí dụ
7.6.1 Gieo 2 con xúc xắc vô tư và quan sát số nút xuất hiện ở mặt trên của
hai con xúc xắc Gọi X là BNN chỉ số lớn nhất trong hai số xuất hiện, và Y là
Không gian mẫu gồm 36 ñiểm ñồng khả năng
(a) Bảng phân phốijj xác suất của X:
Trang 21P(X = yk) 25/36 10/36 1/36 Với cách tính như trên, kỳ vọng, phương sai và ñộ lệch chuẩn của Y lần lượt là:
µY = E(Y) = 13
σ =2Y D ( )Y = E(Y2)− µ =2Y 185
σ =Y D( )Y = 0,527046
(b) Luật phân phối xác suất của VTNN (X,Y):
Miền giá trị của (X,Y) là Im(X) × Im(Y) Xác suất:
7.6.2 Một người tham gia trò chơi sau: Từ một hộp chứa 3 bi ñỏ và 7 bi
trắng cùng cỡ, rút ngẫu nhiên 1 bi Nếu ñược bi màu ñỏ thì ñược 5.000ñ, ñược bi màu trắng thì mất 2.300ñ Hỏi có nên tham gia trò chơi này nhiều lần không?
chơi thì X có miền giá trị {− 2300; 5000} và phân phối xác suất của X là:
P (X = − 2300) = 7/10 và P (X = 5000) = 3/10
Kỳ vọng của X:
Trang 22E(X) = − 2300 × 7/10 + 5000 × 3/10 = − 110
Vậy, nếu tham gia chơi nhiều lần, trung bình, mỗi lần chơi, người tham
gia trò chơi mất 110ñ Do ñó, không nên tham gia trò chơi này nhiều lần
7.6.3 Một xạ thủ có 4 viên ñạn Anh ta lần lượt bắn từng viên vào bia và sẽ
ngừng bắn khi có một viên trúng bia; nếu không, anh ta sẽ bắn cho ñến khi hết ñạn Biết rằng xác suất bắn trúng bia ở mỗi lần bắn là 0,8 Đặt X biểu thị số ñạn
mà xạ thủ ñã bắn Hãy tìm luật phân phối xác suất của X rồi tính kỳ vọng và phương sai của X
D(X) = 12 × 0,8 + 22 × 0,16 + 32 × 0,032 + 42 × 0,008 − (1,248)2 = 0,2985
8 BẤT ĐẲNG THỨC CHEBYSHEV −−−− LUẬT SỐ LỚN
8.1 Định lý ( Bất ñẳng thức Chebyshev) Cho biến ngẫu nhiên X có kỳ
vọng µ và ñộ lệch chuẩn σ Khi ñó, với mọi số thực ε > 0 cho trước,
P( |||| X −−−− µµµ |||| ≥≥≥ εεεε ) ≤≤≤ 2
2
σ εεεε
Chứng minh