XÁC XUẤT VÀ THỐNG KÊ TOÁN
Trang 1- H ớng dẫn các ph ơng pháp, công thức tính toán xác suất của bi n cố ngẫu nhiên, đ i l ng ngẫu nhiên, các ph ơng pháp ớc l ng tham số, kiểm đ nh gi thi t thông qua các ví d và các bài toán điển hình
- Trình bày đ c m t số các ứng d ng, các mối quan hệ cũng nh các gi i pháp của toán h c thống kê hiện đ i đối với các lĩnh vực quan tr ng khác nh kinh t , khoa h c kỹ thuật và đ i sống
- Rèn luyện t duy toán h c, kh năng suy luận, phán đoán cũng nh kỹ năng tính toán, đánh giá
và gi i quy t các vấn đ có liên quan đ n xác suất và thống kê trong các lĩnh vực kinh t , kỹ thuật
* Kỹ năng:
Sau khi hoàn tất h c phần ng i h c có kh năng:
Trang 2Trong suốt quá trình h c tập h c phần, ng i h c cần có:
- Thái đ h c tập tích cực, tinh thần tự h c cao, kh năng tự đào t o và hoàn thiện ki n thức có hiệu qu
+ Kiểm tra giữa kỳ: 20% , (Hình thức thi tự luận,th i gian thi 60 phút)
- Đánh giá cuối h c phần (2): 70% , (Hình thức thi tự luận,th i gian thi 90 phút)
Điểm đánh giá h c phần: 100% , thang điểm 10, là tổng của 2 m c (1) và (2) nêu trên
Gi sử m t công việc nào đó cần ph i chia thành k giai đo n để thực hiện Có n 1 cách thực
hiện giai đo n m t, n2cách thực hiện giai đo n hai, , n k cách thực hiện giai đo n k Vậy có n cách
để thực hiện toàn b công việc, với:
Trang 3!15
n n
B
Ví d ụ 1.4: Cần xếp 5 cuốn sách vào 3 ngăn để sách Hỏi có bao nhiêu cách xếp?
Gi i
M i cách x p 5 cuốn sách vào 3 ngăn để sách là m t chỉnh h p lặp chập 5 của 3 phần tử (m i
lần x p 1 cuốn sách vào 1 ngăn xem nh 1 lần ch n 1 ngăn trong 3 ngăn Do có 5 cuốn sách nên việc ch n ngăn đ c ti n hành 5 lần)
Trang 4C n k
i) Quy ớc 0!= 1
ii) C n k C n nk
iii) 1 k11
n k n k
C
Ví d ụ 1 6 : M ỗi đề thi gồm 4 câu hỏi đ ợc lấy trong bộ 25 câu hỏi ôn tập cho tr ớc Hỏi có thể
Gi i
Số đ thi có thể thành lập đ c là m t tổ h p chập 4 của 25 phần tử:
650.124
.3.2.1
25.24.23.22
!21
!
4
!25)!
425(4
!25
Ví d ụ 1.7: Một mạng LAN có 16 cổng kết nối đến các máy tính Giả sử tại mỗi th i điểm bất kỳ
m ỗi cổng hoặc có máy kết nối hoặc không có máy kết nối nh ng có thể hoạt động hoặc không thể
ho ạt động Hỏi có bao nhiêu cấu hình (cách chọn) trong đó 10 cổng có kết nối, 4 cổng không kết nối nh ng có thể hoạt động và 2 cổng không hoạt động?
Gi i
Để xác đ nh số cách ch n (cấu hình), có 3 b ớc:
B ớc 1: Ch n 10 cổng có k t nối, có 8008
!6
!
10
!16
!
4
!6
Giá tr của các hệ số trong nh thức Newton (tức trong khai triển của các hằng đẳng thức đáng
nhớ) đ c xác đ nh từ tam giác Pascal nh sau:
Trang 5n n n n n n n n n
n n
n n
n n
b a C b
a C b a
C b
a C b a C b a C b
a
0
0 1
) 1 ( ) 1 ( 2
2 2 1 1 1 0 0
.)
(
(a, b là cá c số thực; n là số tự nhiên)
1.2 CÁC KHÁI NI M C B N C A XÁC SU T
Phép thử: Khi quan sát m t hiện t ng, làm m t thí nghiệm, ti n hành m t công việc mà có
quan tâm đ n k t qu , tức là đư thực hiện m t phép thử ngẫu nhiên, g i tắt là phép thử (test), ký
hiệu là T
Vậy phép thử là m t tập h p các hành đ ng, thao tác có kh o sát k t qu
Biến cố: M i k t qu có thể x y ra hoặc không x y ra của m t phép thử, g i là m t bi n cố
ngẫu nhiên hay sự kiện ngẫu nhiên, g i tắt là bi n cố hay sự kiện, ký hiệu b i các ký tự bất kỳ A,
B, C,…,X, Y, Z,….,Γ,Δ,Λ,Ψ,Φ,Σ,…
Không gian mẫu: Tập h p tất c các k t qu có thể x y ra của m t phép thử đ c g i là
không gian các bi n cố ngẫu nhiên của phép thử hay không gian mẫu, ký hiệu là
Vậy m i tập con A của không gian mẫu (A ) là m t bi n cố (hay sự kiện), và không gian
mẫu còn đ c g i là không gian các bi n cố (không gian các sự kiện)
Ví dụ 1.8: Tung một đồng xu là thực hiện một phép thử Kết quả mặt sấp xuất hiện hay mặt ngửa xuất hiện là những biến cố có thể xảy ra.
Trang 66
Biến cố không thể: Là bi n cố không thể x y ra khi thực hiện phép thử, ký hiệu Vậy bi n cố
không thể, v b n chất, là m t tập r ng nên còn g i là biến cố rỗng
Ví dụ 1.9: Thực hiện phép thử tung một viên xúc xắc (xí ngầu), khi đó:
K hông gian mẫu của phép thử là: = {1, 2, 3, 4, 5, 6}
Nếu mặt (1) xuất hiện, tức các biến cố {1}, A, C, D xảy ra
Nếu mặt (2) xuất hiện, tức các biến cố {2}, B, C, D xảy ra
* Chú ý: M i bi n cố sơ cấp đ u là bi n cố ngẫu nhiên, ng c l i bi n cố ngẫu nhiên nói chung không là bi n cố sơ cấp
Hiện t ng hai hay nhi u bi n cố trong m t phép thử có kh năng x y ra nh nhau, đ c g i
là hiện t ng đồng kh năng của các bi n cố, khi đó các bi n cố đ c g i là các bi n cố đồng kh năng
Trong m t phép thử mà m i bi n cố sơ cấp đ u đồng kh năng thì số phần tử của không gian mẫu đ c g i là số tr ng h p đồng kh năng của phép thử
Ví dụ 1.10: Trong phép thử một tung đồng xu (cân đối đồng chất), số tr ng hợp đồng khả năng
6
1.2.4 Các phép toán v bi n c :
V mặt toán h c, m i bi n cố là m t tập h p, vì vậy cũng có các phép toán v bi n cố nh đối với các tập h p
Cho các bi n cố ngẫu nhiên A, B
a) T ng (h p hay ph n h p) của hai bi n cố A và B là m t bi n cố, ký hiệu A+B, đ nh b i:
A+B x y ra khi A x y ra hoặc B x y ra
b) Tích (giao hay ph n giao) của hai bi n cố A và B là m t bi n cố, ký hiệu A.B, đ nh b i:
A.B x y ra khi A và B đồng th i x y ra
c) Hi u (hay ph n trừ) của bi n cố A và bi n cố B là m t bi n cố, ký hiệu A–B, đ nh b i:
A–B (hay A \ B) A–B x y ra khi A x y ra và B không x y ra
d) Ph n bù của bi n cố trong là m t bi n cố, ký hiệu A, đ nh b i:
A =\A={ A}
Trang 77
* Chú ý: Phần bù của m t bi n cố trong không gian mẫu chính là hiệu của với bi n cố đó,
và khi đó còn đ c g i là bi n cố đối lập của bi n cố đư cho (A là bi n cố đối lập của A)
Ví dụ 1.11: Hai sinh viên X, Y cùng dự thi Gọi A là biến cố sinh viên X thi đạt, B là biến cố sinh
cùng thi đạt Khi đó: C = A+B và D = A.B
Ví dụ 1.12: Kiểm tra n sản phẩm trong một lô sản phẩm S Gọi A i là biến cố gặp sản phẩm thứ i
là một phế phẩm, B là biến cố trong số n sản phẩm đ ợc kiểm tra có ít nhất một phế phẩm, C là biến cố tất cả các sản phẩm đ ợc kiểm tra đều là phế phẩm, D là biến cố tất cả các sản phẩm
đ ợc kiểm tra đều là sản phẩm tốt (tức kiểm tra n sản phẩm không thấy có phế phẩm nào) Khi đó:
B A B
Trong m t phép thử, bi n cố chắc chắn là tổng của m i bi n cố sơ cấp có thể x y ra
Ví dụ 1.13: Gieo 1 viên xúc xắc Gọi A là biến cố xuất hiện mặt có 2 chấm, B là biến cố xuất hiện mặt có số chấm chẵn Khi đó:
A là một biến cố sơ cấp và là biến cố ngẫu nhiên
B là biến cố ngẫu nhiên (nh ng không là biến cố sơ cấp)
Trang 88
Biến cố tương đương: Hai bi n cố A, B đ c g i là t ơng đ ơng nhau n u A B và B A,
ký hiệu: AB hay BA
Biến cố xung khắc: Hai bi n cố A và B đ c g i là xung khắc nhau n u bi n cố này x y ra thì
bi n cố kia không x y ra
Biến cố đối lập: Hai bi n cố A và B đ c g i là đối lập nhau n u:
i) A, B xung khắc nhau: A.B =
ii) Có ít nhất m t bi n cố x y ra: A+B =
Họ biến cố xung khắc: H các bi n cố A1,A2, ,A n đ c g i là h bi n cố xung khắc từng đôi (h xung khắc từng đôi hay h xung khắc) n u có m t bi n cố bất kỳ trong h x y ra thì các
bi n cố còn l i không x y ra
n A A
1A
A xung khắc nhau
1 ,
1 A
A đối lập nhau
4 2
1,A ,A
A là một họ xung khắc
6 5 4 3 2
Đ nh nghƿa 1.5: Đ nh nghƿa xác xu t theo quan đi m c đi n (classical):
Cho A , xác xuất của bi n cố A, ký hiệu P(A) đ nh b i:
P(A) =
n m
Trang 9Đ nh nghƿa 1.6: Đ nh nghƿa xác xu t theo quan đi m th ng kê (statistics):
Khi thực hiện n lần m t phép thử T và thấy bi n cố A xuất hiện m lần, thì tỷ số
n
m A
f n( )
đ c g i là tỷ lệ xuất hiện của bi n cố A qua n phép thử
N u thực hiện phép thử T đ n N lần (với N khá lớn) mà có M lần bi n cố A xuất hiện, thì tỷ
t iếp tục tung 1000 lần thấy số lần mặt sấp xuất hiện vào khoảng từ 249 đến 251 lần, tức f n (S) dao
động quanh giá trị 0,25 vậy xác suất mặt sấp xuất hiện là: P(S)=0,25
* Chú ý: Đối với những phép thử không có số tr ng h p đồng kh năng, để xác đ nh xác xuất của m t bi n cố, ph i dùng đ n khái niệm tần suất và đ nh nghĩa xác xuất theo quan điểm thống
kê
Đ nh nghƿa 1.7: Đ nh nghƿa xác xu t theo h tiên đ Kolmogorov:
Cho K là h các tập con của không gian mẫu , K = {A A }, (tức K chứa ) và m t
ánh x P: K [0, 1] th a 3 tiên đ sau:
(Tđ1): 0 P ( A) 1, A
(Tđ2): P() = 1
(Tđ3): P(A+B) = P(A) + P(B), n u A.B =
Khi đó với A bất kỳ thu c , giá tr P(A) đ c g i là xác xuất của bi n cố A
Đ nh nghƿa 1.8: Đ nh nghƿa xác xu t theo quan đi m đ đo (measurement):
M t phép thử T có vô h n bi n cố sơ cấp đồng kh năng A là bi n cố bất kỳ trong phép thử
N u có thể biểu diễn:
- Mi n M là tập h p vô h n của tất c các bi n cố sơ cấp trong phép thử T
- Mi n m là tập h p vô h n của các bi n cố sơ cấp thuận l i cho A x y ra
Thì xác suất để bi n cố A x y ra là:
P(A) =
).(
).(
M miên
đo đô
m miên
đo đô
Trong đó, khái niệm đ đo mi n có thể là đ dài, diện tích, thể tích, khối l ng của mi n đó
Ví dụ 1.18: Hai ng i X và Y hẹn gặp nhau tại một quán café trong khoảng từ 19 gi đến 20 gi tối, mỗi ng i có thể đến chỗ hẹn vào bất kỳ th i điểm nào trong khoảng th i gian này Đến gần
Trang 1010
gi hẹn cả hai đều có việc đột xuất, nên giao hẹn lại rằng ng i nào đến tr ớc sẽ ch , quá th i
Đi u kiện hai ng i gặp nhau là: x y 20
Biểu diễn x, y trong hệ to đ Descartes, đơn v là phút
2020
x y
x y y
x
y x y
4060
2
2 2
Trang 1111
i) Do 0 m n
n
n n
iii) A + B có m + r phần tử
Nên P(A + B) =
n
r n
m n
r m
m n
Khi đó: P(A + B) = P(A) + P(B) – P(A.B)
Chứng minh: (Bằng ph ơng pháp xác xuất cổ điển)
G i n là số phần tử của
G i m là số phần tử của A
G i r là số phần tử của B
Khi đó : A+B có (m +r) phần tử n u A.B =
Và: A+B có (m +r – s) phần tử n u A.B ≠ với s là số phần tử của A.B
Trang 12m
=
n
s n
r n
Gi i
G i A là bi n cố ch n đ c m t h c sinh gi i Toán, B là bi n cố ch n đ c m t h c sinh gi i
Ngo i ngữ:
4,010
40)
P
5,010
50)
P
Thì A.B là bi n cố ch n đ c h c sinh gi i c Toán và Ngo i ngữ:
3,010
30)
P
Khi đó A+B chính là bi n cố ch n đ c h c sinh gi i ít nhất m t môn, theo công thức c ng:
6,03,05,04,0).()()()
Đ nh nghƿa 1.9: Cho A, B có P(B ) > 0 Xác xuất của bi n cố A x y ra trong đi u kiện bi n
cố B đư x y ra, đ c g i là xác xuất có đi u kiện của bi n cố A đối với bi n cố B, ký hiệu P ( B A ),
đ nh b i:
r
s B P
B A P B A
)(
).()(
Trong đó: r là số tr ng h p thuận l i để B x y ra
s là số tr ng h p thuận l i để A.B x y ra
Ví dụ 1.21: Tung 1 viên xúc xắc Tính xác suất:
1) Xuất hiện mặt 1 khi biết rằng đã xuất hiện mặt lẻ
2) Xuất hiện mặt lẻ khi biết rằng đã xuất hiện mặt 1
Gi i
G i A là bi n cố xuất hiện mặt 1, B là bi n cố xuất hiện mặt lẻ, khi đó:
Trang 136
1})1({
)()
6/1)(
).()
B P
B A P B A
Và xác suất xuất hiện mặt lẻ khi bi t rằng đư xuất hiện mặt 1:
16/1
6/1)(
).()
A P
A B P A B P
().()
(
).()
B P
B A P B
A
)()
().()
(
).()
A P
A B P A
B
Do: P(A.B)P(B.A), k t h p (1) và (2) suy ra đpcm
Công thức cũng đúng trong tr ng h p P(A) = 0 hay P(B) = 0
* Công thức nhân xác suất mở rộng v i P(A), P(B), P(C) > 0
).(.)()
() (A B C P A P B A P C A B
* T rường hợp tổng quát với P(A 1 ), P(A 2 ),…, P(A n ) > 0
)
.(
).(.)()
()
1.9
2.10
3).(.)()
() ()
Trang 1414
* Chú ý: - Cho A, B có P(B) >0
A, B đ c lập nhau P ( B A ) = P(A)
- Các bi n cố đ c lập nhau, thông th ng, thu c v các không gian mẫu khác nhau
Ví dụ 1.23: Thực hiện phép thử tung một lúc 2 đồng xu Gọi S i là biến cố xuất hiện mặt sấp đồng xu i, (i=1,2) Chứng minh rằng S 1 , S 2 là 2 biến cố độc lập nhau
Gi i
Không gian mẫu của phép thử tung 2 đồng xu là =(S,S),(S,N),(N,S),(N,N)
Trong đó các bi n cố: S1 =(S,S),(S,N), S2 =(S,S),(N,S), S1 S2 = S1 S2 ={(S,S)}
N u chỉ xét đồng xu 1 thì không gian mẫu là 1 = {S1,N1}
N u chỉ xét đồng xu 2 thì không gian mẫu là 2 = {S2,N2}
Vậy S1, S 2lần l t thu c 1, 2là những không gian mẫu đơn gi n khác nhau
Trong không gian mẫu của phép thử tung 2 đồng xu, có:
1.2
Trang 15* Nh n xét: Khi 2 bi n cố đ c lập với nhau, sự xuất hiện hay không xuất hiện của bi n cố này
không làm thay đổi xác suất của bi n cố kia
A1, 2, , đ c lập từng đôi P A i.A j P(A i).P(A j) i j,(i, j1,n)
Họ biến cố độc lập toàn phần: H các bi n cố A1,A2, A n đ c g i là h bi n cố đ c lập toàn phần (h đ c lập toàn phần (toàn thể) hay họ độc lập) n u m t bi n cố bất kỳ của h và tích của m t số hữu h n các bi n cố còn l i của h là đ c lập với nhau, tức:
n A A
n
i j j j
()
()
()
()
(A1A2 A n P A1 P A2A1 P A3A1A2 P A n A1A2 A n1
Do A1,A2, ,A n là m t h đ c lập (toàn phần), nên:
)()(A2 A1 P A2
)()(A3 A1A2 P A3
………
)()
(A n A1A2 A n1 P A n
Thay vào v trái của (1) suy ra đpcm
Ví dụ 1.24: Có 3 ng i chơi bóng rổ, mỗi ng i ném rổ một quả Xác xuất ném trúng rổ lần l ợt của mỗi ng i là 0,5; 0,6; 0,7 Tính xác xuất để:
a) Cả 3 ng i đều ném trúng rổ
b) Có ít nhất một ng i ném trúng rổ
Trang 16n P F A P A P F A A
P A
F P A P A F P A P F
P
1 2
2 1
1) ( ) ( ) ( ) ( ) ( ) ( ) ( )(
Trang 17)()
()()
(A1 P F A1 P A2 P F A2 P A n P F A n
Ví dụ 1.25: Có 4 dây chuyền sản xuất ra cùng một loại sản phẩm trong đó:
Xác suất xuất hiện 1 phế phẩm của dây chuyền I là 0,04
Xác suất xuất hiện 1 phế phẩm của dây chuyền II là 0,03
Xác suất xuất hiện 1 phế phẩm của dây chuyền III là 0,05
Xác suất xuất hiện 1 phế phẩm của dây chuyền IV là 0,058
Từ một hộp đựng 8 sản phẩm của dây chuyền I, 12 sản phẩm của dây chuyền II, 10 sản phẩm của dây chuyền III và 5 sản phẩm của dây chuyền IV, lấy ngẫu nhiên ra 1 sản phẩm Tính xác suất để sản phẩm lấy ra là một phế phẩm
1005.035
1203.035
804
)()
()(
F P
A F P A P F A
Chứng minh:
Từ công thức nhân xác suất:
)()
()()
().(A F P A P F A P F P A F
Suy ra đpcm
Ví dụ 1.26: Cũng lấy từ các giả thiết của ví dụ 1.25 trên, nh ng với giả sử đã biết sản phẩm lấy ra
là một phế phẩm Hỏi xác suất sản phẩm đó đ ợc sản xuất b i dây chuyền nào là lớn nhất?
Gi i
Áp d ng công thức Bayes:
)(
)()
()(
F P
A F P A P F A
Trang 1818
Xác suất s n phẩm lấy ra đ c s n xuất b i các dây chuy n I, II, III, IV lần l t là:
2177,0042,035
804,0)
(
)()
()(
* 1
1
F P
A F P A P F A P
2449,0042,035
1203,0)
(
)()
()(
* 2
2
F P
A F P A P F A P
3401,0042,035
1005,0)
(
)()
()(
* 3
3
F P
A F P A P F A P
1973,0042,035
5058,0)
(
)()
()(
* 4
4
F P
A F P A P F A P
Vậy s n phẩm ph phẩm lấy ra đó đ c s n xuất b i dây chuy n III với xác suất lớn nhất
Ví dụ 1.27: Có 5 bình đựng bi, trong đó có 2 bình loại 1 mỗi bình đựng 3 bi trắng 4 bi đỏ, 1 bình loại II đựng 3 bi trắng 2 bi đỏ và 2 bình loại III mỗi bình đựng 4 bi trắng 3 bi đỏ Chọn ngẫu
nh iên một bình và từ bình đó chọn ngẫu nhiên một bi
4
*5
25
3
*5
17
3
*5
4
*52)
(
)()
()
F P
A F P A P F A P
Trang 19Ví dụ 2.1: Tung một đồng xu và quy ớc nếu mặt sấp xuất hiện thì đ ợc h ng 1 ngàn đồng, còn nếu mặt ngửa xuất hiện thì mất 1 ngàn đồng Gọi X là số tiền đ ợc hoặc mất sau mỗi lần tung, thì X là một ĐLNN
Xét ánh x : X: = {S, N} R
Tập giá tr : X = X() = {-1, 1} là tập h p hữu h n (có 2 phần tử) mà X có thể nhận đ c
Ví dụ 2.2: Xét phép thử bắn không hạn chế số viên đạn vào một bia ngắm cho đến khi bắn trúng
bia thì dừng Gọi K là số viên đạn bắn không trúng bia, thì K là một ĐLNN
Ví dụ 2.3: Đo chiều cao ngẫu nhiên của một cộng đồng ng i Gọi H là chiều cao của một ng i
đ ợc chọn bất kỳ, thì H có thể nhận bất kỳ giá trị nào từ 0 đến , vậy H là một ĐLNN
Không gian mẫu: ={ h0h,hR}=[0, )
Xét ánh x : H: R
i H(i ) = i
Tập giá tr : H = H() [0, ) là tập vô h n không đ m đ c
Trang 2020
Đ nh nghƿa 2.2:
ĐLNN rời rạc: ĐLNN X đ c g i là r i r c n u tập giá tr X() là tập hữu h n hay đ m
đ c
ĐLNN liên tục: ĐLNN X đ c g i là liên t c n u a,bR,ab: a,b X() (hay nói
cách khác, n u các giá tr của X lấp đầy m t kho ng thực nào đó)
Ví dụ 2.4: ĐLNN X trong ví dụ 2.1 và ĐLNN K trong ví dụ 2.2 là những ĐLNN r i rạc Còn ĐLNN H trong ví dụ 2.3 là ĐLNN liên tục
* Chú ý:
1) Khi X() = {x1, x2, ……., x n} là m t tập hữu h n hay đ m đ c, ng i ta quy đ nh cách
liệt kê các phần tử x1, x2, ……., x n trong tập h p theo thứ tự tăng dần: x1<x2<……<x n
2) Khi ĐLNN X nhận giá tr x, biểu diễn: (X = x) ={X()x}
Khi ĐLNN X nhận giá tr nh hơn x, biểu diễn: (X < x) ={X()<x}
* Nh n xét: X là ĐLNN liên t c xR, P(X=x) = 0 (ng i đ c tự kiểm chứng)
Khái ni m:
N u hai bi n cố A và B đ c lập thì có biểu thức của xác suất tích A.B là: P(A.B) =P(A).P(B)
M r ng khái niệm đ c lập cho 2 ĐLNN r i r c X và Y: (X=x i ), (Y=y j) bằng ký hiệu quy ớc:
(X=x i , Y=y j ) = [(X=x i ).(Y=y j)]
và đ nh nghĩa sau:
Đ nh nghƿa 2.3:
Cho X, Y: R là hai ĐLNN r i r c với X()=(x1, x2,…, x n ), Y()=(y1, y2, …, y n)
X, Y đ c g i là đ c lập nhau P(X=x i , Y=y j ) = P[(X=x i ).(Y=y j )] = P(X=x i ) P(Y=y j) ,i, j (*)
Ví dụ 2.5: Chọn ngẫu nhiên 1 ng i trong cộng đồng dân c Gọi X, Y, Z lần l ợt là ngày sinh (không tính tháng năm), chiều cao (đơn vị tính bằng cm) và trọng l ợng (đơn vị tính bằng kg) của
Đ nh nghƿa 2.4:
Cho X, Y: R là 2 ĐLNN
T ổng của X và Y, ký hiệu X + Y, đ nh b i:
(X+Y)() = X() +Y(),
Trang 21Gi sử các k t qu x y ra là: 1 = (tôm, gà, cá), 2= (cua, bầu, cua)
3 = (cua, cua, cua), 4 = (bầu, tôm, nai)
Khi đó tổng số ti n thu đ c của 2 ng i X và Y nh sau:
đ c g i là hàm phân phối xác xuất (Probability Distribution Function) của ĐLNN X
Vậy hàm phân phối xác suất của m t ĐLNN X là hàm số có mi n giá tr là mi n của các xác suất
để ĐLNN X nhận giá trị nhỏ hơn x thực nào đó
M nh đ 1: Cho X là ĐLNN r i r c, có X()={x1, x2,…, x n }, p i =P(X=x i), và hàm phân phối xác
p p
x x x p p
p
x x x
F
n n
i i
i
1
0)
(
2 1
1 2
Trang 2222
= 0 + p1 + 0 + p2 + 0 =p1 + p2Làm t ơng tự các b ớc trên, suy ra côngthức cũng đúng với xi<xxi+1
* x n <x: (X<x) = và F(x) = p1+p2+…… +p n
Nên: 1=p() = p(X<x) = F(x) = p1+p2+…… +p n
Vậy mệnh đ đư đ c chứng minh
Ví dụ 2.7: Xây dựng hàm phân phối xác xuất của đại l ợng ngẫu nhiên số nút X xuất hiện khi thực hiện phép thử tung xúc xắc
Gi i
Khi x1 thì F(x) = P(X<x) =P(X<1) = 0
Khi 1<x2 thì F(x) = P(X<x) =P(X<2) = P(X=1) =
61
Khi 2<x3 thì F(x)= P(X<x) =P(X<3)= P(X=1)+P(X=2) =
3
16
16
16
16
16
16
16
16
16
16
16
66
16
16
16
16
16
65
6/5
54
3/2
43
2/1
32
3/1
21
6/1
10
)()(
x x x x x x x
x X P x F
M nh đ 2: Cho X là m t ĐLNN liên t c có hàm phân phối xác xuất là F(x), khi đó:
Trang 2424
P(a X<b)=F(b) – F(a)
M nh đ 4: Cho X là ĐLNN liên t c có hàm phân phối xác xuất F(x) Khi đó:
P(a X<b) = P(a<X<b) = P(a<X b) = P(a X b) = F(b) – F(a)
Chứng minh:
Chứng minh t ơng tự mệnh đ 3, ta có:
P(a X<b) = F(b) – F(a)
Do : (a X<b) = (X=a)+ (a<X<b)
P(a X<b) = P(X=a) + P(a<X<b)
= P(a<X<b) (do: P(X=a) = 0 vì X liên t c)
Chứng minh t ơng tự cho các đẳng thức còn l i
đ c g i là bảng phân phối xác xuất của ĐLNN r i r c X
* Chú ý: Không thể thi t lập đ c b ng phân phối xác suất cho các ĐLNN liên t c (ng i đ c tự kiểm chứng)
Đ nh nghƿa 2.7:
Cho X là m t ĐLNN liên t c có hàm phân phối xác suất F(x), khi đó hàm:
f(x)=F ’(x) , xR
đ c g i là hàm mật độ xác xuất (Probability Density Function) của ĐLNN X, hay g i tắt là hàm
mật đ (Density Function) của X
Trang 25Kỳ v ng của ĐLNN X, ký hiệu E(X), là m t tr số xác đ nh nh sau:
- N u X là ĐLNN r i r c có b ng phân phối xác xuất là
Ví dụ 2.8: Để kiểm tra thu nhập hàng năm của công nhân công ty A, ng i ta chọn ngẫu nhiên
Trang 2626
Thu nhập (triệu đồng/năm) 30 40 50 60 70 80
Số công nhân 16 60 160 100 40 24
Tính thu nhập trung bình trong 1 năm của công nhân công ty A
Gi i
G i X là thu nhập (triệu đồng /năm) của công nhân công ty A Khi đó X là m t ĐLNN có b ng
phân phối xác xuất:
i p x
1
54400
24
*8040
*70100
*60160
*5060
*4016
*30)
ij p p q p
i ij n
i m
j ij m
j i n
i ij j m
j n
i ij i m
j n
i ij j i m
j
n
i
q y p x p
y p
x p
y p
x p
1 1 1 1
1 1
1 1
1 1
1
)(
Trang 27x E p x p
n
i i i n
1 1 1
1
j j m
j i i n
i j i j i m
j n
i ij j i m
j n
i
q y p
x q
p y x p
Đ nh nghƿa 2.9: Ph ơng sai của ĐLNN X, ký hiệu D(X) hay V(X), là m t giá tr đ c xác đ nh
Đ l ch tiêu chu n (Standard Deviation): Hay còn g i là đ lệch quân ph ơng của ĐLNN X, ký
hiệu (X), là tr số căn bậc hai của ph ơng sai D(X):
(X) = D ( X)
(X) luôn có cùng đơn v đo với X
* Ý nghĩa của phương sai:
Trang 2828
Ph ơng sai của ĐLNN X chính là kỳ v ng của bình ph ơng đ chênh lệch giữa giá tr của X
và giá tr kỳ v ng E(X) của nó Hay nói cách khác, ph ơng sai của ĐLNN X là đ phân tán của các giá tr mà X nhận đ c quanh giá tr kỳ v ng của nó
Ví dụ 2.9: Cho X, Y, Z, T là 4 ĐLNN lần l ợt có các bảng phân phối xác xuất nh sau:
1) Tính kỳ vọng và ph ơng sai của 4 ĐLNN trên
2) So sánh các ph ơng sai Hỏi trong 2 ĐLNN Z và T, ĐLNN nào có khả năng nhận giá trị
Gi i:
1) Dễ dàng tính đ c các kỳ v ng: E(X) = E(Y) = E(Z) = E(T) = 0
Và các ph ơng sai: D(X) = 0, D(Y) = 100, D(Z) = 3400, D(T) = 6700
2) Vậy: D(X) < D(Y) < D(Z) < D(T)
Do đó, có thể nhận thấy Y phân tán hơn X, Z phân tán hơn Y và T phân tán hơn Z
Vậy từ ví d 2.9, có thể nói ph ơng sai của ĐLNN là đ phân tán của những giá tr mà ĐLNN
Trang 2929
=E(X2) – 2E(X)E(X) + (E(X))2
= E(X2) – (E(X))2iii) Do X=x i .X .x i
Nên n u X có b ng phân phối xác suất:
D
1
2 1
2
.)(
).(.)
1
2 2
X D p
X E x p
X E x
n
i
i i
2
X D p X E x p
X E x
+ E{[2.(X – E(X)].[(Y – E(Y)]}}
=D(X) + D(Y) + E[2.(X – E(X)).(Y – E(Y))]
Do X và Y đ c lập, nên X – E(X) và Y – E(Y) cũng đ c lập nhau Và do đó:
E{2.[(X – E(X)].[(Y – E(Y)]} = 2.E[X – E(X)] E[Y – E(Y)] = 2 * 0 * 0 = 0
Vậy: D(X+Y) = D(X) + D(Y)
Đ nh nghƿa 2.10: Mod (hay Y u v ) của ĐLNN X, ký hiệu Mod(X) (hay Mod X), là:
- Giá tr x i có xác suất p i lớn nhất n u X là ĐLNN r i r c có b ng phân phối xác xuất sau:
Trang 30Đ nh nghƿa 2.11: Med (hay Trung v ) của ĐLNN X, ký hiệu Med(X) (hay Med X), là giá tr m mà
t i đó xác suất đ c chia phân phối thành 2 nửa xấp xỉ nhau, tức:
Ví dụ 2.11: Cũng với ví dụ 2.10 trên, thì Med(X)=4,
vì: P(X<4) = P(X=1) + P(X=2) + P(X=3) =
2
116
78
14
116
38
116
1
Vậy đây có ModX = MedX = 4
Ví dụ 2.12: Cho ĐLNN r i rạc Y có bảng phân phối xác suất:
Dễ dàng thấy Mod Y=1 và Mod Y= 2, do P(Y=1) = P(Y=2)=
83
nên Med Y = k với 1 k2
Ví dụ 2.13: Cho X là ĐLNN liên tục có hàm mật độ f(x) =
22
vậy Med X = 0
Trang 3131
* Chú ý:
i) M t ĐLNN có thể có nhi u Mod và Med (tức Mod và Med không có tính duy nhất)
ii) N u m 1 và m 2 cùng là Med của X m[m1,m2], m cũng là Med của X
2.4.5 Hi p ph ng sai (Covariance)
Đ nh nghƿa 2.12:
Cho 2 ĐLNN X, Y có E(X), E(Y) hữu h n, khi đó hiệp ph ơng sai hay Covariance của X và Y,
ký hiệu Cov(X, Y), là giá tr kỳ v ng xác đ nh nh sau:
(
)()
().()()
(
),(
Y D X D
Y E X E Y X E Y X
Y X Cov
N u r = 0: X, Y đ c g i là không t ơng quan nhau
N u 0 < r < 1: X, Y t ơng quan thuận
N u r = 1: X, Y t ơng quan tuy n tính thuận
N u -1< r < 0: X, Y t ơng quan ngh ch
N u r = -1: X, Y t ơng quan tuy n tính ngh ch
* Nh n xét 1: X, Y đ c lập nhau X, Y không t ơng quan
(
)()
().(
Y D X D
Y E X E Y X
Nh ng X và Y không đ c lập, vì:
P(X=0) = P(Y=0) =
21
Trong khi P(X=0, Y=0) =0
0 = P(X=0, Y=0) ≠ P(X=0) = P(Y=0) =
41
Vậy X, Y không đ c lập nhau
* B đ Cauchy: Cho X, Y là 2 ĐLNN Khi đó:
Trang 32] = E(X2)E(Y2) Khi đó ’ = 0, ph ơng trình g( ) = 0 có nghiệm kép 1=2= a Vậy g(a) =E(X – aY)2
= 0 () (X – aY) = 0X = aY
i) Với a = E(X), b = E(Y)
Khi đó : E[(X – a)(Y – b)] = E(X.Y) – E(X).E(Y) (1)
Trang 33- M i phép thử chỉ quan tâm đ n k t qu A hay A x y ra
- Xác xuất để A x y ra trong m i phép thử là m t hằng số (P(A)= const)
Ví dụ 3.1: Ng i ta thực hiện kiểm tra ngẫu nhiên 10 sản phẩm trong số 100 sản phẩm Hỏi 10 phép thử đó có thỏa l ợc đồ Bernoulli không, nếu:
a) Kiểm tra theo ph ơng pháp chọn lặp
b) Kiểm tra theo ph ơng pháp không chọn lặp
Tr l i:
a) Th a b) Không th a
G i X là số lần bi n cố A xuất hiện trong n phép thử th a l c đồ Bernoulli, thì X đ c g i là
ĐLNN r i r c có phân phối nh thức (Binomial Distribution)
Ký hiệu: X ~ B(n, p), p = P(A)
n p q C k X
k
k k
k n k k
n p q C k
X k
G i X i là số lần bi n cố A xuất hiện trong phép thử thứ i (trong n phép thử th a l c đồ
Bernoulli), b ng phân phối X i nh sau:
Trang 34;3
P(x=2) =
1 2 2 3
6
56
C
C C k X P
4 39 3
13.)3(
C
C C X
k n M N k M n
N
k n M N k M
C
C C X
E C
C C k
X
P
0
)(
.)
C
Cn N
k n M N
k n M N k
M n
Trang 351 1 1
n N M M
C C
n
N n N n
M n
C C
n M N n
1 ) 1 ( ) 1 ( 1
)1()
1(
)1)(
n n M N
nM N
N
n M nM
M n N
n N N
M n N
N
n n M
11
)1(
)1
2
Cho X ~ H(N, M, n), trong tr ng h p N quá lớn và n rất nh so với N (n « N), thì có thể xấp
xỉ v X B(n, p ) với p =
N M
3.3 PHỂN PH I POISSON
G i X là số lần bi n cố A xuất hiện trong m t mi n kh o sát nào đó (kho ng th i gian, vùng
đ a lý hay mi n hình h c,…), thì X đ c g i là ĐLNN r i r c có phân phối Poisson với tham số
là giá tr trung bình của số lần A xuất hiện tr ớc đó
Ký hiệu: X ~ P( )
Công thức:
!
.)(
k
e k X P
1) G i X là số tàu cập b n trong ngày, khi đó: X ~ P(5)
Tra b ng phân phối Poisson P(X=k) với =5 và k=3 => P(X=3) = 0,1404
2) Áp d ng P(X A) = 1 – P(X A)
Tra b ng phân phối Poisson P(X k) với = 5 và k = 3 => P(X 3) = 0,2650
Vậy P(X 4) = 1 – P(X 3) = 1 – 0,2650 = 0,7350
Trang 36k k
k k
e k k
+
D(X)=E(X2) – [E(X)]2
=2+ –2
=
3.3.3 Quan h giữa phơn ph i Poisson và phơn ph i nh th c:
* Cho X ~ B(n, p) Khi n quá lớn và p khá bé, có thể xấp xỉ XP( ) với =np
Ví dụ 3.5: Một ng i tập bắn có xác xuất bắn trúng đích là p=0,001 Khi thực hiện đợt bắn 5000 phát Tính xác xuất để có ít nhất 2 phát trúng đích
Gi i:
G i X là số phát bắn trúng đích trong 5000 phát bắn, khi đó:
nên có thể xấp xỉ X P( ) với = np = 5000*0,001 = 5
P(X2) = 1 – P(X1) = 1 – 0,0404 = 0,9596 (tra b ng PP Poisson P(X k) với =5 và k =1)
gần đúng P(X=k)
Thật vậy, n u g i Y là số lần A xuất hiện trong n phép thử
Do: P( A) =1 – P(X=A) = 1– p = q, nên: Y ~ B(n, q)
Trang 3737
Ví dụ 3.7: Trong một hãng sản xuất đĩa nhạc, trung bình cứ sản xuất 1000 đĩa thì có một đĩa lỗi Tìm xác xuất để khi hãng đó sản xuất 6000 thì có không quá 7 đĩa lỗi
Gi i:
G i X là số đĩa nh c không b l i khi s n xuất 6000 đĩa,
Và Y là số đĩa nh c b l i khi s n xuất 6000 đĩa
ĐLNN liên t c X đ c g i là có phân phối chuẩn (Normal Distribution) với kỳ v ng
ph ơng sai 2 n u hàm mật đ của X có d ng:
f(x)=
2
2 1
Ký hiệu: X ~ N( ,2)
Khi X ~ N(0, 1), X đ c g i là có phân phối chuẩn tắc (hay chuẩn hóa: Standard Normal Dist.)
Đ nh lỦ 3.4: (Đưa phân phối chuẩn về phân phối chuẩn tắc)
=P(X < x)
=x e t
2
2 1
2
Vậy: Z ~ N(0, 1)
Trang 38
là hàm chẵn) =
0
2 0
2
2 2
2
2 2
e xe
Trang 39t e
(
dt : đ c g i là hàm phân phối xác suất Gauss
(x), F(x ) chính là hàm mật đ và hàm phân phối xác suất của ĐLNN X ~ N(0, 1)
Trang 40i
Chứng minh:
i) G i F(x) là hàm phân phối xác suất của ĐLNN X +, khi đó:
2
2 1