Đại lượng ngẫu nhiên và quy luật phân phối sản xuất
Trang 1CHƯƠNG 2
ĐẠI LƯỢNG NGẪU NHIÊN VÀ QUY LUẬT PHÂN PHỐI XÁC SUẤT
Nội dung
Đại lượng ngẫu nhiên (ĐLNN) và phân loại cácĐLNN Quy luật phân phối xác suất (PPXS) của ĐLNN
Bảng PPXS của ĐLNN rời rạc Hàm PPXS của ĐLNN ( rời rạc hay liên tục) Hàm mật độ xác suất của ĐLNN liên tục
Các phép tốn trên các ĐLNN Hàm của đại lượng ngẫu nhiên rời rạc
Các đặc trưng số cơ bản của ĐLNN
Các phân phối thơng dụng: Nhị thức, Siêu bội, Poisson, Chuẩn
Phương pháp tính xấp xỉ giữa các phân phối xác suất
1 ĐẠI LƯỢNG NGẪU NHIÊN - QUYLUẬT PHÂN PHỐI XÁC SUẤT CỦA ĐẠI LƯỢNG NGẪU NHIÊN
Ví dụ 2.1
Bảng dưới đây ghi kết quả khảo sát số xe máy hiện cĩ ở 6.487 hộ gia đình tại Tp
Hồ Chí Minh năm 2003
Số xe máy (X) Số hộ (ni) Tần suất
Giả sử ta chọn ngẫu nhiên một hộ gia đình trong 6487 hộ trên, gọi X là số xe máy
của hộ đã chọn tại thời điểm khảo sát Khi đĩ X là một đại lượng vì nĩ cĩ thể nhận các
giá trị số (0, 1, …, 5); tuy nhiên ta khơng thể biết trước một cách chắc chắn giá trị của X
bằng bao nhiêu vì nĩ tùy thuộc vào hộ được chọn Nĩi cách khác X cĩ thể nhận một giá
trị ngẫu nhiên thuộc tập {0, 1, …, 5} Ta bảo X là một đại lượng ngẫu nhiên
Ví dụ 2.2
Một xạ thủ bắn một viên đạn trúng vào bia hình trịn bán kính 50cm Gọi K là khoảng cách ( đo bằng cm) từ tâm của bia đến điểm chạm của viên đạn vào bia Khi đĩ T
cũng là một đại lượng ngẫu nhiên nhận giá trị thuộc tập [0, 50]
Trang 21.1 MÔ TẢ KHÁI NIỆM ĐẠI LƯỢNG NGẪU NHIÊN – PHÂN LOẠI CÁC ĐẠI LƯỢNG NGẪU NHIÊN
Đại lượng ngẫu nhiên (cịn gọi là biến ngẫu nhiên) là một đại lượng (tức
là cân, đong, đo hoặc đếm được) mà cĩ thể nhận giá trị bất kỳ thuộc một tập hợp số xác định một cách ngẫu nhiên với xác suất nhất định ĐLNN thường được ký hiệu bởi các chữ X, Y, Z , … Cịn các giá trị của ĐLNN
thường được ký hiệu bởi x, y, z, …
Trong ví dụ 2.1, đại lượng ngẫu nhiên X nhận giá trị một cách ngẫu nhiên thuộc tập {0, 1, 2, 3, 4, 5}, ta viết X = {0, 1, 2, 3, 4, 5} Khả năng (xác suất) để X nhận giá trị 3
là 27,7% Trong ví dụ 2.2, đại lượng ngẫu nhiên K nhận giá trị một cách ngẫu nhiên
thuộc tập [0, 50cm] Căn cứ vào tập giá trị của ĐLNN, ta phân chúng thành hai loại: rời
rạc và liên tục Cụ thể, ta cĩ phân loại dưới đây
Đại lượng ngẫu nhiên rời rạc: Đĩ là ĐLNN mà tập các giá trị cĩ thể cĩ
của nĩ là một tập rời rạc, tức là cĩ thể đánh số thành một dãy (hữu hạn hay
vơ hạn)
Đại lượng ngẫu nhiên liên tục: Đĩ là ĐLNN mà tập các giá trị cĩ thể cĩ
của nĩ là một đoạn hay khoảng (hữu hạn hay vơ hạn)
Nhận xét quan trọng
Cần phân biệt ĐLNN với BCNN ĐLNN thì nhận giá trị này khác một cách ngẫu nhiên nhưng khơng cĩ xác suất, BCNN là một sự kiện cĩ thể xẩy ra sau khi thực hiện phép thử với xác suất xác định nhưng BCNN khơng cĩ giá trị
Tuy nhiên ĐLNN và BCNN cĩ mối quan hệ khăng khít với nhau Cụ thể, khi gán cho mỗi ĐLNN một giá trị cụ thể hoặc một ràng buộc nào đĩ về giá trị, ta sẽ nhận được một BCNN với xác suất xác định Về mặt hình thức, cĩ thể hình dung ĐLNN như là hàm của BCNN trên khơng gian các biến cố sơ cấp
Trở lại ví dụ 2.1 Ta cĩ (X=3) là một BCNN với P(X=3) = 0,277 Tương tự (X<3),
(X>3), (X≤3), (X≥3) cũng là những BCNN mà cĩ thể dễ dàng tính xác suất của chúng theo bảng số liệu đã cho
Một cách tổng quát, với mỗi ĐLNN X tùy ý và x, y là hai số thực bất kỳ (x<y), (X<x), (X=x), (X>x), (X≤x), (X≥x), (x<X<y), đều là các BC mà nĩi chung là ngẫu nhiên Qua xác suất của các BC này, ta sẽ biết được những giá trị nào hoặc những khoảng giá trị nào
X dễ nhận, những giá trị nào hay những khoảng giá trị nào X ít nhận hay khơng thể nhận Nĩi một cách khác, xác suất của những BC đĩ (khi cho x, y chạy khắp tập số thực) phản
ánh quy luật phân phối xác suất của X
1.2 BẢNG PHÂN PHỐI XÁC SUẤT CỦA ĐLNN RỜØI RẠC
Đối với ĐLNN rời rạc, quy luật PPXS thường được cho bằng bảng
Bảng phân phối xác suất: Đĩ là bảng liệt kê tất cả các giá trị cĩ thể cĩ
của đại lượng ngẫu nhiên rời rạc X cùng với xác suất để X nhận từng giá trị đĩ
X x1 x2 … xn … (nếu vơ hạn)
XS tương ứng
P(X = xi)
Trang 3 Tính chất đặc trưng: Các xác suất tương ứng pi trong bảng PPXS có hai
tính chất đặc trưng sau đây
(i) 0 ≤ pi ≤1;
(ii) np 1
1
i∑ i =
=
Các tính chất khác
(i) P(a ≤ X < b) =
i
i
a x b
p
≤∑< ;
(ii) P(a < X < b) =
i
i
a x b
p
<∑< Tương tự cho các BCNN với các dấu bất đẳng thức khác
Ví duï 2.3
Xét lại ví dụ 2.1 Chọn ngẫu nhiên một hộ, đặt X là số xe máy của hộ được chọn
Khi đó X là ĐLNN có các giá trị là thuộc tập{0,1, 2,3, 4,5}
Tìm quy luật PPXS của đại lượng ngẫu nhiên X (tức là lập bảng PPXS của X)
Tính xác suất để của BCNN (2<X<5)
Giải
Chúng ta sẽ tính xác suất tương ứng để X nhận từng các giá trị của nó Bảng PPXS của X như sau:
P(2<X<5) = 0,277 + 0,050 = 0, 327
Ví duï 2.4
Một xạ thủ được phép bắn 3 viên đạn Biết xác suất bắn trúng mục tiêu của mỗi viên đạn đều 0,8 Gọi X là số viên đạn anh ta bắn trúng bia Hãy lập bảng phân phối xác
suất của X
Giải
Ta có X = {0, 1, 2, 3} Ta cần tìm P(X = k), k = 0, 1, 2, 3
Xem phép thử là bắn 1 viên đạn và A là biến cố viên đạn đó trúng mục tiêu Ta có P(A) = 0,8 không đổi ở mỗi lần bắn nên đây là một dãy 3 phép thử Bernoulli với p = 0,8 ;
q = 1 – p = 0,2 Áp dụng công thức Bernoulli, ta được
P(X = 0) = P3(0 ; 0,8) = 00,80.0,23 = 0,008 ;
3
C
P(X = 1) = P3(1 ; 0,8) = 10,81.0,22 = 0,96 ;
3
C
P(X = 2) = P3(2 ; 0,8) = 20,82.0,21 = 0,384 ;
3
C
Trang 4P(X = 3) = P3(3 ; 0,8) = 00,83.0,20 = 0,512
3
C
Vậy, bảng phân phối xác suất của X là
1.3 HÀM PHÂN PHỐI XÁC SUẤT CỦA ĐLNN
Hàm phân phối xác suất của ĐLNN tùy ý X (rời rạc hay liên tục) là hàm
số F(x) xác định trên tập số thực bởi cơng thức sau
F(x) = P(X < x) , x ∈
Tính chất : Hàm phân phối xác suất cĩ các tính chất sau
(1) F(x) là hàm khơng giảm và liên tục trái;
(2) 0 ≤ F(x) ≤ 1, ∀ x ∈ ;
−∞
x
+∞
x
(5) P(a ≤ X < b) = F(b) – F(a), với mọi a, b ∈ , a < b
(6) F(x) đặc trưng cho loại của ĐLNN X theo nghĩa sau
* F(x) gián đoạn khi và chỉ khi X rời rạc;
* F(x) liên tục trên khi và chỉ khi X liên tục
Chú ý: Ba tính chất đầu đặc trưng cho hàm PPXS theo nghĩa sau đây: nếu F(x) là hàm số
xác định trên và cĩ các tính chất (1), (2), (3) thì F(x) là hàm phân phối xác suất của một đại lượng ngẫu nhiên nào đĩ Hàm PPXS cịn gọi là hàm tích lũy xác suất
Nếu X là đại lượng ngẫu nhiên rời rạc hữu hạn cĩ bảng phân phối xác suất như sau
( x1 < x2 < … < xn), thì hàm phân phối xác suất của X là
1 2 1
1
0
( )
1
n
n
x x
x x x p
F x
x x x
p p p
x x
−
−
≤
⎧
⎪⎪
= ⎨
⎪
>
⎪⎩
,nếu ,nếu
,nếu ,nếu
1.4 HÀM MẬT ĐỘ XÁC SUẤT CỦA ĐLNN LIÊN TỤC
Khác với bảng PPXS của ĐLNN rời rạc, hàm PPXS khơng cho ta biết rõ PPXS của ĐLNN trong lân cận của bất kỳ điểm nào trên trục số Hơn nữa, cần chú ý rằng nếu X
Trang 5là ĐLNN liên tục thì P(X=x) = 0 với mọi số thực x Ta sẽ dưa vào khái niệm hàm mật độ xác suất cho ĐLNN liên tục
Hàm mật độ xác suất của ĐLNN liên tục X là hàm f(x) định nghĩa như
sau
f(x): =
0
lim
x
x
Δ → +
≤ ≤ + Δ
lim
x
x
Δ → +
− Δ ≤ ≤
Tất nhiên là trong giả thiết rằng cả hai giới hạn đĩ tồn tại hữu hạn Nếu đại lượng ngẫu nhiên liên tục X cĩ hàm phân phối xác suất F(x) khả vi thì hàm mật độ XS chính là đạo hàm của hàm PPXS: f(x) = F’(x), x∈
Tính chất : Hàm mật độ xác suất cĩ các tính chất sau
(1) f(x) ≥ 0, x ∈ ;
+∞
∞
−
= 1 )
( dx x f
Ngược lại , một hàm số f(x) cĩ các tính chất (1), (2) phải là hàm mật độ xác suất của một đại lượng ngẫu nhiên nào đĩ
(3) P(a < X < b) = P(a ≤ X < b) = P(a < X ≤ b) = P(a ≤ X ≤ b) = ∫a ;
b
dx x
f( ) (a,b ∈ , a < b)
(4) F(x) = ∫ , x ∈
∞
−
x dt t
f )(
1.5 CÁC PHÉP TOÁN TRÊN CÁC ĐLNN – HÀM TRÊN ĐLNN
Để đơn giản, ta chỉ xét các ĐLNN rời rạc Giả sử X và Y là các ĐLNN rời rạc độc lập (tức là dù ĐL này nhận giá trị nào cũng khơng hề ảnh hưởng đến PPXS của ĐL kia) cĩ bảng phân phối xácsuất như sau
Khi đĩ X + Y là đại lượng ngẫu nhiên rời rạc cĩ bảng phân phối xác suất là
Trang 6Trong đó zk là các giá trị khác nhau của các tổng xi + yj và p’’k = ,
p p z
+∑= Còn XY là đại lượng ngẫu nhiên rời rạc có bảng phân phối xác suất là
Trong đó zk là các giá trị khác nhau của các tích xiyj và p’’k = ,
x y
p p z
=
∑
Nếu ta có một hàm số ϕ được xác định trên tập tát cả các giá trị của đại lượng ngẫu nhiên X thì Y = ϕ(X) trở thành một đại lượng ngẫu nhiên mới có cùng luật PPXS với X Giá trị của đại lượng ngẫu nhiên Y được xác địnhtheo giá trị của X thông qua hàm ϕ
Giả sử ta có quy luật phân phối xác suất của X như sau
Khi đó, , ta xác định các giá trị yi của Y=ϕ(X) bởi y i =ϕ(x i), i=1,n
Y ϕ(x1) ϕ(x2) … ϕ(xj) … ϕ(xn)
P(Y = yi) p1 p2 … pj … pn
Chú ý nếu ϕ(xi)= ϕ(xj) thì ta đặt y*= ϕ(xi)= ϕ(xj) và cộng dồn xác suất của chúng lại:
p(Y = y*) = pi + pj
Ví duï 2.5
Cho hai đại lượng ngẫu nhiên X và Y có bảng phân phối xác suất lần lượt là
Hãy lập bảng phân phối xác suất của các đại lượng X+Y, XY
Giải Đối với từng phép toán đã cho ta lập bảng ghi các giá trị và xác suất tương ứng
a) Trường hợp X+Y
X
Y
Y
0,2 0,3 0,5
Trang 71 và Bảng 2 suy ra
}
0,09 = 0,24 , (X+Y = 4) = 0,15
Vậy, bảng i xá của X+Y là
Từ Bảng
X+Y = {−1, 0, 1, 2, 3, 4,
P (X+Y = -1) = 0,08 ,
P (X+Y = 0) = 0,12 ,
P (X+Y = 1) = 0,20 + 0,06 = 0,26 ,
P (X+Y = 2) = 0,09 + 0,06 = 0,15 ,
P (X+Y = 3) = 0,15 +
P
phân phố c suất
X+Y -1 0 1 2 3 4
P 0,08 0,12 0,26 0,15 0,24 0,15
b) Trường XY
Ta chỉ cần lập lại bảng giá trị của tích XY tương tự như Bảng 1, nhưng kết quả ở mỗi ô giữa trong bảng mới sẽ l
hợp
à tích các giá trị thuộc dòng 1 lần lượt với các giá trị thuộc cột 1 (xem Bảng 3)
Y -1 0 -1 -2
1 0 1 2
2 0 2 4 Bảng 3
ảng 2 suy ra
}
0,06 + 0,06 = 0,20 ,
0,09 = 0,24 ,
ậy, bảng phân phối xác suất của XY là
Từ Bảng 3 và B
XY = {−2 −, 1, 0, 1, 2, 4 ,
P (XY = -2) = 0,20 ,
P (XY = -1) = 0,12 ,
P (XY = 0) = 0,08 +
P (XY = 1) = 0,09 ,
P (XY = 2) = 0,15 +
P (XY = 4) = 0,15
V
Trang 8Lưu ý: Bảng 1 và Bảng 2 cĩ thể ghi chung thành một bảng (xem Bảng A) ; Bảng 3 và Bảng 2 cĩ thể ghi chung thành một bảng (xem Bảng B) Trong hai bảng này, gĩc trái của mỗi ơ ghi giá trị, gĩc phải ghi xác suất tương ứng
X
Y
0
0,2
1 0,3
2 0,5
X
Y
0 1 2
-1
0,4
-1
0,08
0 0,12
1 0,20
0,08
-1 0,12
-2 0,20
1
0,3
1
0,06
2 0,09
3 0,15
0,06
1 0,09
2 0,15
2
0,3
2
0,06
3 0,09
4 0,12
0,06
2 0,09
4 0,15
Bảng A Bảng B
2 CÁC SỐ ĐẶC TRƯNG CỦA ĐẠI LƯỢNG NGẪU NHIÊN
Ngồi bảng phân phối của ĐLNN rời rạc, hàm phân phối của ĐLNN tùy ý và hàm mật độ của ĐLNN liên tục, chúng ta cịn dùng vài con số để đặc trưng cho ĐLNN – đĩ là các số đặc trưng về vị trí và độ phân tán của các giá trị và xác suất tương ứng của ĐLNN
2.1 KỲ VỌNG CỦA ĐẠI LƯỢNG NGẪU NHIÊN
Định nghĩa : Kỳ vọng của đại lượng ngẫu nhiên X là một số, ký hiệu là EX, được xác định như sau:
Đối với ĐLNN rời rạc cĩ giá trị x i và xác
suất tương ứng p i , i = 1, 2, 3, …
Đối với ĐLNN liên tục cĩ hàm mật độ
f(x), x∈
EX := i i
i
x p
∑ Khi X vơ hạn thì phải giả thiết rằng chuỗi
trên hội tụ
EX := xf x dx( )
+∞
−∞∫ Khi tập giá trị của X là khoảng vo hạn thì phải giả thiết tích phân trên hội tụ
Ý nghĩa: Kỳ vọng của ĐLNN X là giá trị trung bình theo xác suất của X, tức
là giá trị trung bình của X khi mỗi giá trị của X được gắn với trọng số chính là xác suất tương ứng của giá trị đĩ EX sẽ trùng với trung bình cộng số học
1
1 n
i i
x
n ∑= của các giá trị của X khi X rời rạc hữu hạn n giá trị và
1 n
n
= = = = , tức là khi phân phối xác suất của X đều
Trang 9Ví dụ 2.6
Cơng ty dịch vụ cĩ 8 nhân viên Bảng 2.3 thể hiện tiền lương hàng tuần của 8
nhân viên đĩ như sau:
Bảng 2.3
Lương xi (USD) Số nhân viên (ni) Tần suất
Chọn ngẫu nhiên một nhân viên của cơng ty Đặt X là tiền lương của nhân viên
đĩ Hãy lập bảng PPXS và tính kỳ vọng của đại lượng ngẫu nhiên X
Giải
Ta cĩ luật phân phối xác suất của X như sau:
X 240 320 450 600
Px 0,375 0,250 0,125 0,250
1
: n i i 376, 25
i
=
Giá trị trung bình cộng số học ở đây là 402,5 (USD) Rõ ràng kỳ vọng phản ánh
chính xác hơn tình hình lương của cơng ty Tuy cơng ty cĩ 4 mức lương nhưng lương
bình quân của 8 nhân viên khơng phải là 402,5 USD mà chỉ là 376,24USD
Tính chất Với mọi ĐLNN X, Y và đại lượng hằng C, ta cĩ:
(1) E(C) = C ;
(2) E(C.X) = C.E(X);
(3) E(X + Y) = E(X) + E(Y);
(4) E(X.Y) = E(X).E(Y) nếu X, Y độc lập
2.2 PHƯONG SAI VÀ ĐỘ LỆCH CHUẨN CUUA ĐẠI LƯỌNG NGẪU NHIEAN
Định nghĩa: Phương sai của đại lượng ngẫu nhiên X, ký hiệu là DX (hayVarX),
được xác định bởi biểu thức sau:
Cịn độ lệch chuẩn của X, ký hiệu σX, được xác định bởi σX := DX ≥ 0
Trang 10Đối với ĐLNN rời rạc cĩ giá trị x i và xác
suất tương ứng p i , i = 1, 2, 3, … Đối với ĐLNN liên tục cĩ hàm mật độ f(x), x∈
DX :=
2 2
x p ⎛ x p ⎞
− ⎜ ⎟
σX := DX Khi X vơ hạn thì phải giả thiết rằng các
chuỗi trên hội tụ
DX :=
2
x f x dx xf x dx
σX := DX Khi tập giá trị của X là khoảng vơ hạn thì phải giả thiết các tích phân trên hội tụ
Ý nghĩa: Phương sai và độ lệch chuẩn của X là số khơng âm dùng để đo mức độ phân tán của các giá trị của X xung quanh trọng tâm EX của nĩ DX cịn gọi là độ phân tán trung bình bình phương, σX cịn gọi là độ phân tán trung bình DX (σX) càng nhỏ thì giá trị của X càng ít phân tán mà cĩ độ tập trung xung quanh kỳ vọng càng lớn Ngược lại, DX (σX) càng lớn thì các giá trị của X càng ít tập trung mà phân
tán rộng Độ lệch chuẩn hay dùng hơn phương sai vì nĩ cùng đơn vị với X
Tính chất Với mọi ĐLNN X, Y và đại lượng hằng C, ta cĩ
(1) D(C) = 0;
(2) DCX = C2.DX;
(3) D(X+Y) = DX + DY nếu X, Y độc lập
Ví dụ 2.7
Xét lại ví dụ 2.3 Tính phương sai và độ lệch chuẩn σX của X
Giải
Ta cĩ X ={240,320,450,600} với bảng phân phối như sau
X 240 320 450 600
Px 0,375 0,250 0,125 0,250
Theo ví dụ 2.3, ta đã tính được Cịn phương sai và độ lệch chuẩn của X như sau:
1
376, 25
n
i i i
=
DX =240 0,375 320 0, 25 450 0,125 600 0, 25 376, 252 + 2 + 2 + 2 − 2 =20.948, 44;
σ = D X = 2 0 9 4 8 , 4 4 = 1 4 4 , 7 4
2.3 MODE VÀ MEDIAN CỦA ĐẠI LƯỢNG NGẪU NHIÊN
Ngồi hai đặc trưng cơ bản là kỳ vọng và phương sai, người ta cịn xét một vài đặc trưng khác của ĐLNN như Mode, Median (trung vị), Moment, hệ số bất đối xứng,
hệ số chọn Chúng giúp đặc trưng đầy đủ hơn các ĐLNN Ở đây chúng ta chỉ giới thiệu thêm hai đặc trưng là Mode và Median (trung vị)
Mode: Cho ĐLNN X Nếu X rời rạc thì Mode của X, ký hiệu Mod(X), là giá trị mà
tại đĩ xác suất tương ứng lớn nhất Nếu X liên tục với hàm mật độ XS là f(x) thì
Mode của X là giá trị mà tại đĩ f(x) đạt giá trị lớn nhất Tất nhiên X cĩ thể khơng cĩ hoặc cĩ nhiều giá trị Mod(X)