Nội dung gồm 8 chương Chương I Biến cố và xác suất của biến cố Chương II Biến ngẫu nhiên và phân phối xác suất Chương III Kỳ vọng toán Chương IV Một số phân phối xác suất thường gặp
Trang 11 | P a g e
NGUYỄN VĂN ĐẮC
BÀI GIẢNG TOÁN 5
Trang 2Giới thiệu môn học
Lý thuyết xác suất ra vào nửa cuối thế kỷ thứ 17 ở nước Pháp, nó là bộ phận của toán học nghiên cứu các quy luật của hiện tượng ngẫu nhiên Hơn 300 năm tồn tại và phát triển, đến nay lý thuyết này đã có nội dung vô cùng phong phú, được áp dụng trong nhiều ngành khoa học cũng như trong cuộc sống đời thường Thống kê toán học(TKTH) là khoa học về các phương pháp toán học để xử lí các kết quả thực nghiệm hoặc các dữ liệu thống kê nhằm rút ra các kết luận khoa học và thực tiễn Để có được những phán đoán chính xác, TKTH phải dựa vào lí thuyết xác suất
Mục đích của môn học Xác suất & thống kê trong chương trình đào tạo của các trường kỹ thuật là trang bị cho kỹ sư tương lai những khái niệm và kết quả cơ bản của lý thuyết xác suất & thống kê toán học, để giúp người học tiếp thu các môn học có liên quan và cách thức thu thập xử lý số liệu trong quá trình công tác sau này
Nội dung gồm 8 chương
Chương I Biến cố và xác suất của biến cố
Chương II Biến ngẫu nhiên và phân phối xác suất
Chương III Kỳ vọng toán
Chương IV Một số phân phối xác suất thường gặp
Chương V Mẫu ngẫu nhiên và phân phối của một số thống kê cơ bản
Chương VI Ước lượng tham số
Chương VII Kiểm định giả thiết
Chương VIII Hồi quy và tương quan tuyến tính
Trang 33 | P a g e
Tài liệu tham khảo chính
[1] Ronald E Walpole, Raymond H.Myers và Sharon L.Myers, Xác suất và thống kê dành cho kỹ sư và nhà khoa học(Bản dịch lần 1 của Bộ môn ĐS-XS&TK ĐHTL) [2] Morris H DeGroot, Mark J Schervish, Probability and Statistics(Third edition) [3] Đặng Hùng Thắng, Mở đầu về lí thuyết xác suất và các ứng dụng,Nhà XBGD,1997 [4] Trần Mạnh Tuấn, Xác suất & Thống kê lý thuyết và thực hành tính toán, Nhà xuất bản ĐHQGHN, 2004
Trang 4NGUYỄN VĂN ĐẮC
BÀI GIẢNG TOÁN 5
TUẦN 1
Trang 55 | P a g e
BIẾN CỐ
1.1 Phép thử và không gian mẫu
Ta đã biết trong toán học có những khái niệm cơ bản không được định nghĩa, chẳng hạn như điểm,
đường thẳng, mặt phẳng, tập hợp Phép thử ngẫu nhiên là một khái niệm kiểu như vậy, các hành động
mà các kết quả của nó không thể dự đoán trước đều được gọi chung là phép thử ngẫu nhiên, gọi tắt là phép thử (do ta không quan tâm đến những hành động có thể dự đoán trước được kết quả)
Tuy không đoán được kết quả của phép thử nhưng ta có thể liệt kê được các kết quả của nó
S biểu thị cho kết quả mặt sấp xuất hiện, N biểu thị cho kết quả mặt ngửa xuất hiện
Ví dụ 1.2 Lấy ngẫu nhiên hai số x, y trong [0, 2] Không gian mẫu là
Trong các Ví dụ trên, ta dễ dàng xác định được không gian mẫu Đôi khi ta gặp tình huống khó khăn
hơn Khi đó có thể dùng sơ đồ cây để xác định không gian mẫu, Ví dụ sau sẽ minh họa cho cách này
Ví dụ 1.4 Tung một đồng xu, nếu mặt ngửa xuất hiện ta tung đồng xu đó lần thứ hai còn mặt sấp
xuất hiện ta tung một con xúc xắc Hãy xác định không gian mẫu?
Trang 6Sơ đồ cây cho kết quả của phép thử là
Tung lần 1 Tung lần 2 Điểm mẫu
1.2 Biến cố và các phép toán biến cố
Với mỗi phép thử cụ thể, ta có thể quan tâm đến một sự kiện nào đó gồm một hoặc một số kết quả Chẳng hạn, trong một trò chơi may rủi như sau: Gieo hai đồng xu, nếu hai mặt ngửa xuất hiện thì người chơi được 5000 đồng ngược lại thì người chơi mất 1000 đồng Lúc này, không gian mẫu là
={SS, NN, SN, NS}
Sự kiện mà ta quan tâm gồm “hai mặt ngửa xuất hiện” = {NN}
và “không có hai mặt ngửa xuất hiện” ={NN, SN, NS} Mỗi sự kiện trên
đã được đồng nhất với một tập con của không gian mẫu, người ta gọi là các biến cố Tổng quát, ta có định nghĩa sau
Định nghĩa 1.2
Mỗi tập con của không gian mẫu được gọi là một biến cố
Dùng các chữ cái in hoa như A, B, C, A1, A2,… để ký hiệu cho biến cố
Đặc biệt, sự kiện không bao giờ xảy ra khi thực hiện phép thử thì được đồng nhất với tập rỗng nên
ký hiệu bởi và gọi là biến cố không, còn sự kiện chắc chắn sẽ xảy ra khi thực hiện phép thử thì được
ký hiệu bởi S và gọi là biến cố chắc chắn
Mỗi điểm mẫu cũng là một biến cố, gọi là biến cố sơ cấp
Trong lý thuyết tập hợp ta đã biết các khái niệm tập con, hai tập hợp bằng nhau, phần bù và các phép toán hợp hai tập, giao hai tập Tương ứng , ta có các khái niệm và phép toán biến cố trong lý thuyết xác
suất như sau
Định nghĩa 1.3
Cho A và B là hai biến cố của một phép thử với không gian mẫu là S
+ A B thì ta nói biến cố A kéo theo biến cố B
+ A = B thì ta nói A tương đương với B.
+ Phần bù của A trong S được gọi là biến cố đối của A , ký hiệu là A ’
Trang 7b) Tìm biến cố đối của B?
c) Hãy phát biểu bằng lời biến cố giao của A và B Hai biến cố A và B có xung khắc?
+ Biến cố A kéo theo biến cố B tức là A xảy ra thì B xảy ra
+ A = B tức là A xảy ra khi và chỉ khi B xảy ra
+ A’ là biến cố đối của A khi mà thực hiện phép thử thì chắc chắn là A hoặc A’ xảy ra nhưng không
thể xảy ra đồng thời
+ AB là biến cố xảy ra khi và chỉ khi A hoặc B xảy ra
+ AB là biến cố xảy ra khi và chỉ khi cả A và B đều xảy ra
Trang 8Giải
i) ABC là biến cố “cả ba xạ thủ đều bắn trúng”
A’B’C’ là biến cố “cả ba xạ thủ đều bắn trượt”
ABC = (AB)C = A(BC)
c) Phân phối A(B C) = ABAC
A(BC) = (AB)(AC)
d) Công thức De Morgan
(AB)’ = A’B’
(AB)’=A’B’
Ngoài ra (A’)’ = A AA’=S AA’ =
I.3 Định nghĩa xác suất của một biến cố
Theo những tài liệu lịch sử thì có lẽ sự thèm khát khôn nguôi của con người đối với các trò cờ bạc đã dẫn đến sự ra đời và phát triển của lý thuyết xác suất Nhằm làm tăng các chiến thắng, các con bạc đã nhờ các nhà toán học cung cấp chiến lược tốt nhất cho các trò chơi may rủi khác nhau Một số nhà toán học đã cung cấp các chiến lược là Pascal, Leibniz, Fermat, và James Bernuolli, những nhà toán học này được coi là những người khai sinh ra lý thuyết xác suất Sự phát triển của lý thuyết xác suất ở thời kỳ đầu cùng với những suy diễn thống kê, các dự đoán và sự khái quát hoá của nó đã vượt ra khỏi những trò chơi may rủi để bao hàm nhiều lĩnh vực khác có liên quan đến những sự xuất hiện ngẫu nhiên như chính trị, kinh doanh, dự báo thời tiết, và nghiên cứu khoa học Như vậy, để đưa ra những dự đoán và suy diễn thống kê có cơ sở ta cần phải có hiểu biết cơ bản về lý thuyết xác suất
Trong đời sống hàng ngày, ta có thể gặp những khẳng định như: “Tôi có 90% cơ hội thi qua môn xác suất và thông kê” hoặc “Cơ hội chiến thắng chia đều cho hai đội” hoặc “Đội tuyển bóng đá Việt Nam
có rất ít cơ hội giành chiến thắng trước đội tuyển Brazil”…Trong mỗi trường hợp, ta đều thấy đề cập đến một biến cố mà ta không chắc chắn có xảy ra hay không, nhưng bằng những thông tin từ quá khứ hoặc những hiểu biết về phép thử mà ta có mức độ tin tưởng nào đó vào khả năng đúng đắn của các khẳng định Có những biến cố thường xuyên xảy ra, cũng có những biến cố ít xảy ra,…Như vậy, vấn đề đặt ra là phải đo lường mức độ xảy ra của các biến cố Con số để đo lường mức độ xảy ra của một biến
cố được gọi là xác suất của nó
Trang 99 | P a g e
Dựa vào đặc điểm của không gian mẫu mà người ta đưa ra định nghĩa xác suất của biến cố cho phù hợp
Không gian mẫu gồm đếm được các điểm mẫu
Giả sử không gian mẫu của một phép thử là S = {s1, s2, s3,…} Từ đặc điểm của phép thử, ta gán cho
mỗi điểm mẫu si số thực pi với điều kiện pi [0; 1] và tổng các pi bằng 1, gọi pi là xác suất của si Tổng
xác suất của các điểm mẫu trong A được gọi là xác suất của A (the probability of A), ký hiệu P(A)
Định nghĩa
Cho phép thử với không gian mẫu S mà mỗi điểm mẫu đã được gán xác suất và A là một biến cố của phép thử Ta gọi tổng xác suất của các điểm mẫu trong A là xác suất của A
Như vậy 0 ≤ P(A) ≤ 1 P(S) = 1 và P() = 0
Ví dụ 1.7 Một con xúc xắc được đổ chì sao cho khả năng xuất hiện mặt chẵn chấm gấp đôi khả năng
xuất hiện mặt lẻ chấm Gieo con xúc xắc đó một lần Đặt A = “số chấm xuất hiện nhỏ hơn 4” B = “số chấm xuất hiện là chẵn” C = “số chấm xuất hiện chia hết cho 3”
a) Tính xác suất của biến cố A?
Không gian mẫu của phép thử là = {SS, SN, NS, NN} Do đồng xu là cân đối nên mỗi điểm mẫu
trong không gian có khả năng xuất hiện là như nhau, ta gán cho mỗi điểm mẫu một xác suất là p và phải thoả mãn 4p = 1 hay p = 1/4 Khi đó, A = “ít nhất một lần mặt ngửa xuất hiện” = {SN, NS, NN}
444 4
Trang 10Ta thường gặp trường hợp không gian biến cố sơ cấp có hữu hạn phần tử và đặc điểm của phép thử
yêu cầu ta phải gán cho mỗi điểm mẫu một xác suất bằng nhau Từ định nghĩa trên suy ra
Nếu một phép thử có N biến cố sơ cấp đồng khả năng và có đúng n biến cố sơ cấp trong biến cố A, thì
P(A) = n
N
Như vậy, để tính được biến cố A, trong trường hợp trên ta chỉ việc:
+ Đếm số biến cố sơ cấp của phép thử
+ Đếm số biến cố sơ cấp nằm trong A, mỗi biến cố sơ cấp(b.c.s.c) nằm trong A còn được gọi là b.c.s.c thuận lợi cho A
Ví dụ 1.9 Một đống kẹo trộn lẫn 6 chiếc bạc hà, 4 chiếc kẹo bơ, và 3 chiếc chocolate Nếu một
người chọn ngẫu nhiên một trong những chiếc kẹo này, hãy tìm xác suất để được
(a) một chiếc bạc hà; b)một chiếc kẹo bơ hoặc một chocolate
Giải
Đặt M, T và C biểu thị các biến cố chọn được,tương ứng, một chiếc bạc hà, kẹo bơ, hoặc chocolate
Tổng số kẹo bằng 13 và đều đồng khả năng được chọn
(a) Do 6 trong 13 chiếc là bạc hà, suy ra P(M) =
và bổ xung về phép đếm ở cuối Mục này
Ví dụ 1.10 Rút ngẫu nhiên 5 cây bài từ bộ bài 52 quân, hãy tìm xác suất để được 2 cây Át và 3 cây J
4
=
!2
!2
!4
= 6 và số cách lấy 3 cây từ 4 cây J là
4
=
!1
!3
!4
= 4
Theo quy tắc nhân, có n = (6)(4) = 24 kết quả có 2 Át và 3 J
Tổng số trường hợp rút được 5 cây bài, mà tất cả đều đồng khả năng, là
52
=
!47
!5
!52
4
trùng với ký hiệu 3
4
C
Trang 1111 | P a g e
Nếu không gian mẫu gồm vô hạn không đếm được các phần tử, các phần tử đồng khả
năng xuất hiện và có thể biểu diễn hình học không gian mẫu bởi miền S còn biến cố A
được biểu diễn bởi miền D nằm trong S, thì tỉ số giữa số đo miền hình học D và S được
gọi là xác suất của A
P(A) = sd miê`n
sd miê`n
D S
Ở đây, sd miền hình học hiểu là độ dài hoặc diện tích hoặc thể tích, tuỳ thuộc việc S được biểu diễn bởi
đoạn thằng, miền trên mặt phẳng hay hình khối trong không gian
Nếu không gian mẫu không thuộc hai loại trên, thì ta thực hiện phép thử n lần và gọi k là
số lần biến cố A xuất hiện Tỉ số k/n được gọi là tần suất của A Số phép thử tăng dần
mà tần suất của A dần đến số cố định p 0 thì ta gọi p 0 là xác suất của A
Đây là phương thức xác định xác suất được sử dụng rộng rãi và dùng nhiều trong khoa học kĩ thuật, y
Còn để xác định xác suất thắng trong một ván tennis, chúng ta phải dựa vào các trận đấu trước đó
cũng như khả năng của đối thủ và một yếu tố nào đó là niềm tin của chính mình Tương tự, để tìm xác
suất để một vận động viên về nhất trong cuộc đua marathon, chúng ta phải dựa vào các thành tích trước
đây của những vận động viên cùng tranh tài, thành tích đã đạt được trong luyện tập,…Sử dụng trực
giác, niềm tin của con người và các thông tin gián tiếp khác để gán xác suất cho các biến cố là định
nghĩa chủ quan của xác suất
Trong phần còn lại của chương này chủ yếu ta đề cập đến không gian mẫu gồm hữu hạn phần
tử
Nhắc lại và bổ xung về phép đếm
Nguyên lý cơ bản của phép đếm dựa vào quy tắc nhân, được phát biểu như sau:
Nếu một hành động có thể thực hiện theo n1 cách, và nếu đối với mỗi cách này hành động thứ hai có
thể thực hiện theo n2 cách, thì hai hành động này có thể thực hiện đồng thời theo n1n2 cách
Ví dụ Có bao nhiêu điểm mẫu trong không gian mẫu khi một cặp xúc xắc được gieo đồng thời?
Giải
Con xúc xắc thứ nhất có thể rơi bất kỳ theo một trong n1 = 6 cách Đối với mỗi cách này con xúc xắc
thứ hai cũng có thể rơi theo n2 = 6 cách Do đó cặp xúc xắc có thể rơi theo
n1n2 = (6)(6) = 36 cách
Trang 12Quy tắc nhân ở trên có thể mở rộng đến một số bất kỳ các hành động Quy tắc nhân tổng quát
có k hành động được khẳng định như sau:
Nếu một hành động có thể thực hiện theo n1 cách, và nếu đối với mỗi cách này một hành động thứ hai
có thể thực hiện theo n2 cách, và cứ với một cặp hành động một và hành động hai hành động ba có thể thực hiện theo n3 cách, vân vân, thì dãy k hành động có thể thực hiện theo n1 n2 n k cách
Ví dụ Có bao nhiêu cách lựa chọn bữa ăn gồm có xúp, sandwich, món tráng miệng, và một đồ uống từ
4 món xúp, 3 kiểu sandwich, 5 món tráng miệng, và 4 đồ uống?
Giải
Do n1 = 4, n2 = 3, n3 = 5 và n4 = 4, có
n1n2n3n4 = 4 3 5 4 = 240
cách khác nhau để chọn bữa ăn
Ví dụ Có bao nhiêu số chẵn có ba chữ số có thể tạo thành từ các chữ số 1, 2, 5, 6 và 9 nếu mỗi chữ số
có thể được sử dụng duy nhất một lần?
Giải
Do số phải là chẵn, ta chỉ có n1 = 2 cách chọn cho hàng đơn vị Đối với mỗi cách chọn này ta có n2 = 4
cách chọn cho hàng trăm và cuối cùng là n3 = 3 cách chọn cho hàng chục Do đó, ta có thể tạo ra tổng cộng là
n1n2n3 = (2)(4)(3) = 24
số chẵn có ba chữ số
Ta thường quan tâm đến không gian mẫu mà các phần tử là tất cả những cách sắp thứ tự hoặc sắp xếp có thể của một nhóm đối tượng Chẳng hạn, có thể ta muốn biết có bao nhiêu sắp xếp khác nhau cho 6 người ngồi quanh một cái bàn, hoặc có thể ta muốn tìm có bao nhiêu cách rút khác nhau về
thứ tự để lấy ra 2 trong 20 vé số Những sắp xếp khác nhau được gọi là các hoán vị
Định nghĩa
Một hoán vị là một sắp xếp của toàn bộ hoặc một bộ phận của một tập phần tử
Xét ba chữ cái a, b, và c Những hoán vị có thể là abc, acb, bac, bca, cab và cba Như vậy, ta thấy rằng
có 6 sắp xếp khác nhau Sử dụng Định lý 2.2 ta có thể trả lời là 6 mà không cần liệt kê ra các cách sắp
thứ tự khác nhau Có n1 = 3 cách chọn cho vị trí thứ nhất, tiếp theo có n2 = 2 cách chọn cho vị trí thứ
hai, rốt cuộc có đúng n3 = 1 cách chọn cho vị trí cuối cùng, cho tổng cộng gồm
Trang 13= (20)(19) = 380
Ví dụ Một đề tài nhánh của Hội Hóa học Mỹ có bao nhiêu cách bố trí 3 báo cáo viên cho 3 cuộc họp
khác nhau nếu họ đều có thể thu xếp được bất kỳ một trong 5 ngày?
Giải
Tổng số cách bố trí bằng
5P3 =
!2
!5
Ta có
Số những hoán vị của n phần tử phân biệt được sắp xếp theo một vòng tròn là (n-1)!.
Cho đến bây giờ ta đã xét hoán vị của những phần tử phân biệt Nghĩa là, tất cả các phần tử là khác
nhau hoàn toàn hoặc có thể phân biệt được Rõ ràng, nếu những chữ cái b và c đều bằng x, thì 6 hoán vị của những chữ cái a, b, c trở thành axx, axx, xax, xax, xxa, và xxa, mà chỉ có 3 hoán vị là phân biệt Do
đó với 3 chữ cái, 2 là giống nhau, ta có 3!/2! = 3 hoán vị khác nhau Với 4 chữ cái khác nhau a, b, c, và
Trang 14d ta có 24! hoán vị phân biệt Nếu ta cho a = b = x và c = d = y, ta chỉ có liệt kê sau đây: xxyy, xyxy,
yxxy, yyxx, xyyx, và yxyx Như vậy ta có 4!/(2!2!) = 6 hoán vị phân biệt
Số những hoán vị phân biệt của n phần tử mà trong đó n1 phần tử thuộc một kiểu, n2 phần tử thuộc
kiểu thứ hai, , nk phần tử thuộc kiểu thứ k là
!
!
!
! 2
!4
!3
!9
= 1260
Ta thường quan tâm đến số cách phân hoạch một tập gồm n phần tử thành r tập con được gọi là
các ngăn Một phân hoạch được hoàn thành khi giao của mọi cặp trong r tập con là tập rỗng và hợp
của tất cả những tập con là tập ban đầu Thứ tự của các phần tử bên trong một ngăn là không quan
trọng Xét tập {a, e, i, o, u} Tất cả những phân hoạch có hai ngăn mà ngăn đầu chứa 4 phần tử và ngăn
thứ hai chứa 1 phần tử là
{(a, e, i, o), (u)}, {(a, i, o, u), (e)},{(e, i, o, u), (a)},{(a, e, o, u), (i)}, {(a, e, i, u), (o)}
Ta thấy rằng có 5 con đường như vậy để phân hoạch một tập gồm 5 phần tử thành hai tập con hay ngăn
chứa 4 phần tử trong ngăn đầu và 1 phần tử trong ngăn thứ hai
Số những phân hoạch đối với ví dụ minh họa này được ký hiệu bởi
5
=
! 1
! 4
! 5
= 5,
Một cách tổng quát
Số cách phân hoạch một tập gồm n phần tử thành r ngăn mà có n1 phần tử trong ngăn thứ nhất, n2
phần tử trong ngăn thứ hai, , là
n
, ,, 21
7
=
! 2
! 2
! 3
! 7
= 210
Trang 1515 | P a g e
Trong nhiều bài toán ta quan tâm đến số cách chọn r phần tử từ n phần tử mà không quan tâm
đến thứ tự Những phép chọn này được gọi là các tổ hợp Một tổ hợp thực chất là một phân hoạch có
hai ngăn, một ngăn chứa r đối tượng được chọn còn ngăn kia chứa (n - r) đối tượng còn lại
Số những tổ hợp như vậy, được ký hiệu bởi
do số phần tử trong ngăn thứ hai là n - r
Số các tổ hợp của n phần tử phân biệt được tạo ra khi lấy r phần tử cùng một lúc là
4
=
! 2
! 2
! 4
ủy ban với 2 nhà hóa học và 1 nhà vật lí
I.4 Quy tắc cộng xác suất
Với hai biến cố A, B của cùng một phép thử, ta có biến cố A + B Vấn đề đặt ra là P(A + B) có thể biểu diễn qua P(A) và P(B) hay không? Nếu giải quyết được vấn đề này, thì việc tính xác suất của một
biến cố có thể được giải quyết bằng cách biểu thị biến cố đó thành tổng của các biến cố với xác suất dễ tính toán hơn Mục này tập trung vào trình bày những kết quả có liên quan đến vấn đề này
Trước tiên, hãy quan sát Biểu đồ Veen sau
Biểu đồ trên mô tả hai biến cố xung khắc, xác suất của A + B bằng tổng xác suất của các điểm mẫu trong A và các điểm mẫu trong B do hai biến cố không có điểm mẫu chung nên P(A + B) = P(A) +P(B)
Trang 16Biểu đồ sau đây mô tả hai biến cố không xung khắc
Trong trường hợp này, nếu tính tổng xác suất tại các điểm mẫu nằm trong A , tổng các điểm mẫu trong B rồi cộng lại thì các điểm mẫu nằm trong AB sẽ được tính hai lần nên
P(A+B) = P(A) + P(B) – P(AB)
Tóm lại ta được
Quy tắc cộng
Nếu A và B là hai biến cố bất kỳ của cùng một phép thử, thì
P(A+B) = P(A) + P(B) – P(AB)
Hệ quả
Nếu A, B, C là ba biến cố bất kỳ của cùng một phép thử, thì
P(A + B + C) = P(A) + P(B) + P(C) – P(AB) - P(BC) - P(CA) + P(ABC)
Tương tự, bằng quy nạp ta đưa ra công thức cho xác suất của tổng n biến cố, với n là số tự nhiên lớn
Ví dụ 1.11 Một lớp học có 100 sinh viên, trong đó có 54 sinh viên học toán, 69 sinh viên học lịch sử
và 35 sinh viên học cả lịch sử và toán Chọn ngẫu nhiên một sinh viên Tính xác suất để:
a) Sinh viên đó học cả toán và lịch sử
b) Sinh viên đó không học môn toán và không học lịch sử
Giải
Trang 1717 | P a g e
Phép thử này có không gian mẫu gồm 100 b.c.s.c đồng khả năng
a) Đặt A = “sinh viên được chọn, học cả toán và lịch sử” Khi đó số biến cố sơ cấp kéo theo A là 35
Nên P(A) = 35 7
100 20
b) Đặt B = “sinh viên được chọn không học môn toán và không học môn lịch sử”
E = “sinh viên được chọn, học toán” F = “sinh viên được chọn, học lịch sử”
Ta có B’ = “sinh viên được chọn, học ít nhất một môn” = E + F; EF = A
Nên P(B) = 1 – P(B’ ) = 1 – (P(E) + P(F) – P(EF))
Trong một vùng dân cư tỉ lệ người mắc bệnh tim là 9%, mắc huyết áp là 12% và cả hai
bệnh là 7% Chọn ngẫu nhiên một người trong vùng đó Tính xác suất để người đó không mắc cả hai bệnh nói trên?
Ví dụ 1.12 Cho A, B, C là các biến cố sao cho
P(A) = 0.5 P(B) = 0.7 P(C) = 0.6
P(AB) = 0.3 P(BC) = 0.4 P(CA) = 0.2 và P(ABC) = 0.1
a) Tính xác suất để cả ba biến cố đều không xảy ra;
b) Tính xác suất để có đúng hai biến cố trong ba biến cố xảy ra;
c) Tính xác suất để có đúng một trong ba biến cố xảy ra
Nên P(L) = P( ABC’) + P(AB’C) + P( A’BC)
Do ABC + ABC’ = AB suy ra P(ABC’) = 0.3 – 0.1 = 0.2 Tương tự P(AB’C) = 0.1 P( A’BC) =0.3 Như vậy P(L) = 0.6
c) Đặt M = “Chỉ có đúng một trong ba biến cố xảy ra” Ta có K, M, L, ABC là một phân hoạch của S Nên P(M) = 1 – (0 + 0.6 + 0.1) = 0.3
Những ý chính trong bài giảng tuần 1
Khái niệm phép thử, không gian mẫu và biến cố Mối quan hệ giữa các biến cố và phép toán biến cố
Định nghĩa xác suất của một biến cố
Quy tắc cộng xác suất P(A+B) = P(A) + P(B) – P(AB).
Trang 191 | P a g e
NGUYỄN VĂN ĐẮC
BÀI GIẢNG TOÁN 5
TUẦN 2
Trang 20I.5 Xác suất điều kiện
Trong một phép thử thì sự xuất hiện của biến cố này có thể làm thay đổi xác suất của biến cố khác, chẳng hạn như trong ví dụ sau đây:
Tung hai lần một đồng xu cân đối và đồng chất Không gian mẫu của phép thử là {SS, SN, NS, NN}
Xác suất của mỗi điểm mẫu là 1
4 Đặt B = “có ít nhất một mặt sấp xuất hiện” P(B) =
30.75
Nếu đã biết lần một mặt ngửa xuất hiện, tức là A = {NS, NN} đã xuất hiện, thì không gian mẫu bị
thu gọn chỉ còn hai phần tử là {NS, NN} Xác suất mỗi điểm mẫu bây giờ là 1
Nếu không gian mẫu S gồm N phần tử đồng khả năng, trong đó n phần tử nằm trong A, k phần tử nằm
trong B và l phần tử nằm trong AB, thì khi đã biết A xảy ra không gian mẫu bị thu gọn chỉ còn n phần
tử và xác suất của các điểm mẫu trong không gian thu gọn là 1/n Do đó xác suất của B là
/ ( )
n n N P A trong đó P(AB), P(A) được tính theo xác suất của các điểm mẫu trong không gian mẫu ban đầu S Tức
là ta có thể tính xác suất của B khi đã biết A xảy ra mà không cần quan tâm đến không gian mẫu thu
gọn Từ đó dẫn đến định nghĩa sau
Định nghĩa 1.5
Cho A, B là hai biến cố của phép thử và P(A) > 0 Xác suất của B trong điều kiện A đã xảy
ra được ký hiệu và xác định như sau
Ta gọi P(B/A) là xác suất của B với điều kiện A đã xảy ra hoặc xác suất điều kiện của B
khi A đã xảy ra
Ví dụ 1.13 Con xúc xắc được chế tạo sao cho khả năng xuất hiện mặt có số chấm là chẵn gấp hai lần
khả năng xuất hiện mặt có số chấm là số lẻ Gieo con xúc xắc đó một lần Đặt B = “nhận được số chính phương”, A = {4, 5, 6} Tính P(B/A)
1 + 9
2 = 5/9
Theo định nghĩa trên, ta được
P(B/A) =2 / 9 2
5 / 9 5
Trang 213 | P a g e
Ví dụ 1.14 Tung một con xúc sắc cân đối và đồng chất, có mặt chẵn sơn xanh còn mặt lẻ sơn đỏ
Tính xác suất của biến cố B = “mặt có số chấm xuất hiện nhỏ hơn 4” khi đã biết A =“mặt có sơn màu
xanh” xuất hiện?
Ví dụ 1.15 Xác suất để một chuyến bay khởi hành đúng giờ là P(D) = 0,83, xác suất để một chuyến
bay đến đúng giờ là P(A) = 0,82, xác suất để nó khởi hành và đến đều đúng giờ là P(D A)0,78 Tính xác suất để một chiếc máy bay:
(a) đến đúng giờ biết rằng nó đã khởi hành đúng giờ;
(b) khởi hành đúng giờ biết rằng nó đã đến đúng giờ;
(c) đến đúng giờ khi biết rằng nó đã khởi hành không đúng giờ
Khái niệm xác suất có điều kiện giúp ta có thể đánh giá lại xác suất của một biến cố khi biết
một biến cố khác đã xảy ra nên có thể nói xác suất P(A/B) là một sự “cập nhập” của P(A) trên cơ sở biết biến cố B đã xảy ra
Các biến cố độc lập
Trong các tình huống trên ta đều có P(B/A) ≠ P(B), điều này chỉ ra rằng xác suất của B phụ thuộc vào A Có những tình huống lại xảy ra P(B/A) =P(B) chẳng hạn, Rút ngẫu nhiên theo phương
thức có hoàn lại lần lượt hai sản phẩm từ một lô gồm 4 phế phẩm và 13 chính phẩm
Gọi A là biến cố “sản phẩm thứ nhất là phế phẩm” và B là biến cố “sản phẩm thứ hai là chính
phẩm” Do sản phẩm thứ nhất được hoàn lại nên cả lần lấy thứ nhất và lần lấy thứ hai đều lấy ra một sản phẩm từ lô gồm 17 sản phẩm với 4 phế phẩm và 13 chính phẩm Do đó:
13( )17
P B và ( / ) 13
17
P B A
Tức là, P(B/A) = P(B) Trong tình huống này sự xuất hiện biến cố A không làm thay đổi xác suất của
biến cố B, người ta gọi hai biến cố như thế là độc lập
Trang 22Nếu P(A) > 0, thì đẳng thức P(B/A) = P(B) được viết lại là ( ) ( )
ta nói A và B là hai biến cố độc lập Ngược lại thì gọi A và B là hai biến cố phụ thuộc
Từ định nghĩa suy ra:
Nếu P(A) > 0 và P(B) > 0, thì
A và B là hai biến cố độc lập tương đương với P(B/A) = P(B) hoặc P(A/B) = P(A)
Nghĩa là, sự xuất hiện của biến cố này không làm ảnh thay đổi xác suất của biến cố kia
Từ định nghĩa, ta dễ dàng chứng minh được các khẳng định sau đây là tương đương:
+ A, B độc lập;
+ A, B’ độc lập;
+ A’, B độc lập;
+ A’, B’ độc lập
Tổng quát, các biến cố A1, A2,…, An (n > 2) được gọi là độc lập nếu
P(AiAj…Ak) = P(Ai )P(Aj)…P(Ak)
, trong đó {i, j, , k} là một tập con bất kỳ của {1, 2,…, n}
Câu hỏi: Nếu các biến cố A1, A2,…, An (n > 2) đôi một độc lập, hỏi các biến cố đó có độc lập không?
Ví dụ 1.16 Có hai túi đựng các quả cầu Túi thứ nhất đựng 3 quả trắng, 7 quả xanh Túi thứ hai đựng 10 quả trắng và 15 quả xanh Từ mỗi túi ta chọn ngẫu nhiên một quả cầu Tính xác suất để hai quả cầu lấy
ra là cùng màu
Giải
Gọi A1 = “Quả rút ra từ túi thứ nhất là trắng”
A2 = “Quả rút ra từ túi thứ hai là trắng”
B1 = “Quả rút ra từ túi thứ nhất là xanh”
B2 = “Quả rút ra từ túi thứ hai là xanh”
A = “Hai quả lấy ra cùng màu”
Ta được A = A1A2 + B1B2 và A1A2 , B1B2 là hai biến cố xung khắc nên
Trang 23Tuy nhiên đối với đồng xu không cân bằng ta không thể giả sử xác suất của mỗi điểm mẫu là như
nhau Để tìm xác suất trước hết ta xét không gian mẫu S1= { N, S }, nó cho thấy các kết quả khi
đồng xu được tung một lần Giả sử ω và 2ω tương ứng là xác suất để nhận được một mặt sấp và một mặt ngửa, ta có 3ω = 1 hay ω =1/3 Do đó P(N) = 2/3 và P(S) = 1/3 Gọi A là biến cố nhận được hai lần sấp và một lần ngửa trong ba lần tung đồng xu ta có: A = { SSN, SNS, NSS }
Vì các kết quả trong mỗi lần tung độc lập nhau nên theo Định nghĩa về sự độc lập của các biến cố, ta
có
P( SSN ) = P(S) P(S) P(N) =
3
1 3
1 3
2 = 27
2
Tương tự P( SNS ) = P( NSS ) =
27
2
Do đó P(A) =
27
2 + 27
2 + 27
2 = 9
2
Quy tắc nhân cho ta biết có thể tính xác suất của biến cố tích theo xác suất của một biến cố thành phần và xác suất điều kiện của biến cố kia
Từ Định nghĩa 1.5, ta có
Quy tắc nhân
Cho A và B là hai biến cố của một phép thử với P(A) > 0, ta có
P(AB) = P(A) P(B/A)
Khi P(B) > 0 thì P(AB) = P(BA) = P(B)P(A/B)
Nếu A, B là độc lập thì P(AB) =P(A)P(B)
Ví dụ 1.18 Một thủ kho có một chùm chìa khoá gồm 8 chiếc với bề ngoài giống hệt nhau trong đó có
đúng hai chìa mở được cửa kho Do đãng trí, người này không còn nhớ chìa nào có thể mở được khoá cửa kho Ông ta thử ngẫu nhiên từng chìa, chìa nào không mở được thì bỏ ra Tính xác suất để chỉ sau hai lần thử, ông ta mở được cửa kho?
Giải
Đặt Ai = “mở được cửa kho lần thử thứ i”, i =1, ,9
A = “mở được cửa kho sau hai lần thử” Ta có A = (A1)’A2
Theo quy tắc nhân, thì P(A) = P((A1)’A2) = P((A1)’)P(A2/A1’) = 6 2 3
8 7 14
Trang 24Ở trong Ví dụ trên, nếu đặt ra câu hỏi là tính xác suất để sau ba lần thử ông ta mở được cửa kho, thì ta phải tính xác suất của biến cố là tích của ba biến cố Do vậy, một cách tự nhiên ta cần phải mở rộng quy tắc trên cho tích nhiều biến cố của cùng một phép thử Bằng quy nạp ta có
Quy tắc nhân tổng quát
Nếu trong một phép thử, các biến cố A1, A2,…,Akthoả mãn P(A1A2…Ak 1) > 0, thì
P(A1A2…Ak) = P(A1)P(A2/A1)…P(Ak/A1A2…Ak 1) Nếu trong một phép thử, các biến cố A1, A2,…,Ak độc lập, thì
P(A1A2…Ak) = P(A1)P(A2)…P(Ak)
Áp dụng quy tắc nhân tổng quát, ta có xác suất để người thủ kho mở được cửa sau ba lần thử là
p = P(A1’)P(A2’/A1’)P(A3/A’1A’2) = 6 5 2 5
8 7 6 28
Ví dụ 1.19 Lấy liên tiếp 3 con bài từ một bộ bài theo phương thức không hoàn lại Tìm xác suất để
biến cố tích A1A2A3 xảy ra , trong đó A1 là biến cố con bài thứ nhất là át đỏ, A2 là biến cố con bài
thứ hai là 10 hoặc J, còn A3 là biến cố con bài thứ ba có số lớn hơn 3 nhưng bé hơn 7
theo quy tắc nhân xác suất,
P(A1A2A3) = P(A1)P(A2/A1)P(A3/A1A2) =
52
2 51
8 50
12
= 5525
8
Giả sử trong một phép thử, ta đã biết các biến cố B 1 , B 2 , ,B k là một phân hoạch của không gian mẫu
S (hay còn gọi là hệ đầy đủ các biến cố) Công thức xác suất đầy đủ cho phép ta tính được xác suất của biến cố A nào đó của phép thử, nếu ta biết được P(B i ) và P(A/B i ), i =1,…,k Công thức Bayes được sử dụng để tính xác suất của biến cố B i khi đã biết A xảy ra
Ta bắt đầu với một ví dụ đơn giản
Ví dụ 1.20 Có hai hộp đựng bu- lông Hộp thứ nhất
chứa 60 chiếc loại một và 40 chiếc loại hai, hộp thứ hai
chứa 10 chiếc loại một và 20 chiếc loại hai Chọn ngẫu
nhiên một hộp và từ đó lấy ra một bu-lông Tính xác
suất để lấy được chiếc bu-lông loại một
Giải
Đặt B1 = “hộp thứ nhất được chọn”
không gian mẫu
B2 = “hộp thứ hai được chọn”,
A = “chiếc bu-lông lấy ra là bu-lông loại một”
A xảy ra khi và chỉ khi chọn được hộp thứ nhất và lấy từ hộp đó chiếc bu-lông loại một hoặc chọn
được hộp thứ hai và lấy được từ đó chiếc bu-lông loại một, tức là
B1
B2
A
Trang 257 | P a g e
A = AB1 + AB2
Mặt khác AB1, AB2 là hai biến cố xung khắc nên
P(A) = P(AB1) + P(AB2) = P(B1)P(A/B1) + P(B2)P(A/B2)
Tổng quát hoá ví dụ trên ta có bài toán sau
Bài toán: Cho phép thử với không gian mẫu S và các biến cố B1,B2, …, Bk là một phân hoạch của S thoả mãn P(Bi) 0 với mọi i = 1, 2, …, k A là biến cố bất kỳ của phép thử
Hãy tính P(A) theo P(Bi) và P(A/Bi)
Giải
Xét sơ đồ Venn trong hình
Phân hoạch không gian mẫu S Biến cố A bằng hợp của các biến cố xung khắc
B1A, B2 A, …, BkA tức là A = (B1A )( B2A ) … (BkA )
Do đó
P(A) = P[ (B1A)(B2 A) … ( BkA) ] = P( B1A ) + P (B2A) + …+ P(BkA)
=
1( )
k i i
P
1
)
|()
Trang 26Công thức xác suất đầy đủ
với A là biến cố bất kì của phép thử với không gian mẫu là S
Ví dụ 1.21 Trong một dây chuyền sản xuất, ba máy B1, B2, và B3 tạo ra 30%, 45%, và 25% sản phẩm tương ứng Biết rằng tỷ lệ phế phẩm của mỗi máy tương ứng là 2%, 3% và 2% Chọn ngẫu nhiên 1 sản phẩm Tính xác suất để nó là phế phẩm
Giải
Xét các biến cố sau:
A: sản phẩm được chọn là phế phẩm
B1: sản phẩm được làm bởi máy B1
B2: sản phẩm được làm bởi máy B2
B3 sản phẩm được làm bởi máy B3
Áp dụng định lý xác suất toàn phần ta có:
P(A) = P(B1)P(A|B1)+ P(B2)P(A|B 2 ) + P(B3)P(A|B3)
Từ giả thiết(để dễ hình dung, xem sơ đồ cây) ta có
Giả sử chọn ngẫu nhiên một sản phẩm và sản phẩm đó bị lỗi Xác suất để sản phẩm này
thuộc máy Bibằng bao nhiêu? Câu hỏi dạng này có thể trả lời nhờ Công thức Bayes
với biến cố A bất kì của phép thử với không gian mẫu là S và P(A) 0
Chứng minh Theo xác suất điều kiện ta có
Trang 27r r
B A P B P
B A P B P
1
)
|()(
)
|()(
Ví dụ 1.22 Quay về Ví dụ 1.21, nếu chọn ngẫu nhiên một sản phẩm và thấy nó bị lỗi, thì xác suất để
|()()
|()(
)
|()(
3 3
2 2
1 1
3 3
B A P B P B A P B P B A P B P
B A P B P
005,0
005,0 = 10 0.2
49
Kết quả này cho ta thấy nếu sản phẩm bị lỗi được chọn thì chắc nó không được làm bởi máy B3
Công thức Bayes có nhiều ứng dụng trong sản xuất công nghiệp, y học, xã hội học,…, sau đây là
một ví dụ
Ví dụ 23 Một người ốm được cho là mắc bệnh A hoặc bệnh B Thống kê tình hình mắc bệnh trong nhiều năm cho thấy xác suất mắc bệnh A cao gấp đôi xác suất mắc bệnh B Bệnh viện thực hiện hai xét nghiệm y học T1 và T2 một cách độc lập cho bệnh nhân Biết rằng nếu có bệnh A thì xét nghiệm T1 cho dương tính với xác suất 0.9, còn xét nghiệm T2 cho dương tính với xác suất 0.75 Nếu có bệnh B, xét nghiệm T1 cho dương tính với xác suất 0.05 và xét nghiệm T2 cho dương tính với xác suất 0.1.Giả sử cả
T1 và T2 đều cho dương tính Tìm xác suất người bệnh mắc bệnh A?
Kết quả: 0.996, tức là nếu T1 và T2 đều dương tính thì có tới 99,6% là mắc bệnh A
Các ý chính trong bài giảng tuần 2
Xác suất điều kiện: P(B/A) = P(AB):P(A), với P(A) > 0
Quy tắc nhân xác suất: P(AB) = P(A)P(B/A) với P(A)> 0
Công thức xác suất đầy đủ:
P(A) = P(B1)P(A/B1) + P(B2)P(A/B2) + …+ P(Bk)P(A/Bk) với
B1, B2,…, Bk là phân hoạch của không gian mẫu và P(Bi) > 0, i = 1, k Công thức Bayes:
P(Bk/A) = P(Bk)P(A/Bk): [ P(B1)P(A/B1) + P(B2)P(A/B2) + …+ P(Bk)P(A/Bk)] với P(A) > 0
Trang 28* Bài tập: 2.6 Xác suất có điều kiện,
1 Trong một vùng dân cư, tỉ lệ người nghiện thuốc lá và mắc chứng ung thư họng là 15% Có
25% số người nghiện thuốc nhưng không ung thư họng, 50% số người không nghiện thuốc và cũng không bị ung thư họng và có 10% số người không nghiện thuốc nhưng cũng bị ung thư họng Sử dụng số liệu thống kê trên để đưa ra kết luận về mối quan hệ giữa thói quen hút thuốc lá và bệnh ung thư họng trong vùng nói trên?
2 Ba xạ thủ A, B và C độc lập nhau cùng nổ súng vào một mục tiêu Xác suất bắn trúng của các
xạ thủ tương ứng là 0.4; 0.5 và 0.7
a) Tính xác suất để có duy nhất một xạ thủ bắn trúng;
b) Tính xác suất để có ít nhất một xạ thủ bắn trúng
Trang 29NGUYỄN VĂN ĐẮC
BÀI GIẢNG TOÁN 5
TUẦN 3
Trang 30BIẾN NGẪU NHIÊN
2.1 Khái niệm biến ngẫu nhiên một chiều
Trước tiên, ta xét các tình huống sau đây:
+ Trong một trò chơi may rủi, người ta đưa ra luật như sau: Tung một lần 3 đồng xu cân đối và đồng chất Nếu có đúng hai đồng xu xuất hiện mặt ngửa, thì người chơi được 10USD còn ngược lại thì người chơi mất 2USD
Trong tình huống này ta quan tâm đến số mặt ngửa xuất hiện Không gian mẫu của phép thử là
Ω= {SSS, SSN, SNS, NSS, SNN, NSN, NNS, NNN}
Sự tương ứng mỗi điểm mẫu của phép thử với số mặt ngửa xuất hiện được liệt kê như sau
Nếu quan tâm đến số tiền mà người chơi sẽ thu được sau một lần chơi, thì ta có
Trang 31+ Một lô hàng có cả sản phẩm tốt và sản phẩm xấu Một người mua hàng lấy ngẫu nhiên có hoàn lại 2 sản phẩm Nếu cả hai đều là sản phẩm tốt thì sẽ mua lô hàng đó Như vậy, ở đây ta quan tâm đến số sản phẩm tốt trong một lần lấy
Không gian mẫu là S = {TT, TX, XT, XX} Nếu gọi Y = số sản phẩm tốt, thì ta có
Các chữ hoa X, Y, Z,… được dùng ký hiệu biến ngẫu nhiên, còn các chữ thường x, y, z,…
được dùng ký hiệu cho giá trị của biến ngẫu nhiên Ví dụ: Trong tình huống đầu tiên ở trên, nếu
đặt X = số mặt ngửa, thì X là biến ngẫu nhiên
Rõ ràng biến ngẫu nhiên X phụ thuộc vào điểm mẫu s của không gian mẫu nên X ≡ X(s) Số thực x sao cho tồn tại điểm mẫu s để X(s) = x, được gọi là một giá trị của X Tập tất cả các giá trị
của X được gọi là tập giá trị của X Dựa vào đặc điểm tập giá trị của biến ngẫu nhiên, người ta
chia các biến ngẫu nhiên thành hai loại:
• Nếu tập giá trị của X là tập đếm được, thì ta gọi X là biến ngẫu nhiên rời rạc
• Nếu tập giá trị của X là tập không đếm được(các giá trị của X lấp đầy một khoảng
nào đó của trục số thực), thì ta gọi X là biến ngẫu nhiên liên tục
Ví dụ 2.1
+ Tung một đồng xu liên tiếp cho đến khi thu được 5 mặt ngửa thì dừng lại Đặt X = số
lần tung Do tập giá trị của X là đếm được, nên X là biến ngẫu nhiên rời rạc
+ X = tuổi thọ của một con đi-ốt
Y = quãng đường mà một chiếc ô tô đi được với 5 lít xăng có trong bình
Z = Chiều cao của một người
là các biến ngẫu nhiên liên tục
Nhận xét Với những biến ngẫu nhiên liên tục trong Ví dụ 2.1, tập giá trị của biến ngẫu nhiên trùng với không gian mẫu
Trang 322.2 Phân phối xác suất của biến ngẫu nhiên một chiều
Một quy tắc mà dựa vào nó ta tìm được xác suất để biến ngẫu nhiên X nhận giá trị trong một
khoảng đã cho nào đó của trục số thực, thì ta gọi quy tắc đó là phân phối xác suất của X
Hàm phân phối xác suất
Cho X là một biến ngẫu nhiên, biến cố (X ≤ x) ≡ {s ∈ S | X(s) ≤ x} là phụ thuộc vào x Do đó với
x∈R cho trước, thì P (X ≤ x) là một con số phụ thuộc vào x và số đó là duy nhất Vì thế ta có
hàm số
y = F(x) = P (X ≤ x),
được gọi nó là hàm phân phối tích luỹ của X hay gọi tắt là hàm phân phối
Nhận xét Giá trị F(x0) bằng xác suất để X nhận các giá trị từ -∞ cho đến x0, nó có tên gọi là hàm phân phối tích luỹ
Một số tính chất của hàm phân phối(ta thừa nhận):
• F(x) là một hàm không giảm, tức là t < u kéo theo F(t) ≤ F(u)
Trang 33F x
x x
Nhận xét Với biến ngẫu nhiên rời rạc X có tập giá trị là {x1, x2, x3,…, }, nếu ta biết được
P(X = xi) với mọi xi thuộc tập giá trị của X, thì ta có hàm phân phối xác suất của X là
Như vậy (xi, P(X = xi)) với mọi xi thuộc tập giá trị của X , cũng xác lập một quy luật phân phối
xác suất Sau đây ta bàn kỹ hơn về loại quy luật này
Trang 34Hàm xác suất của biến ngẫu nhiên rời rạc
f x =
c) f(xi) = P(X = xi)
Hàm xác suất có thể được cho ở dạng bảng, như sau
f(x) f(x1) f(x2) …
gọi là bảng phân phối xác suất (ta hiểu f(x) = 0 khi x ≠ 0), hoặc cho bởi công thức
Ví dụ 2.4 Một kiện hàng gồm 8 chiếc máy vi tính giống nhau trong đó có 3 chiếc bị lỗi Một
trường học mua ngẫu nhiên 2 trong những chiếc máy vi tính này, tìm hàm xác suất của số chiếc
bị lỗi Từ đó xây dựng hàm phân phối tích luỹ của số chiếc bị lỗi
CC
2 8
2 5 0
3 = , f(1) = P( X = 1 ) =
28
15C
CC
2 8
1 5 1
f(2) = P( X = 2 ) =
28
3C
CC
2 8
0 5 2
Từ phân phối xác suất ở trên, ta được hàm phân phối tích luỹ là:
10 28
F x
x x
Trang 35Ví dụ 2.5 Một đại lý ô tô bán một loại xe nhập ngoại trong đó có 50% được trang bị túi khí
a) Tìm hàm xác suất của số xe được trang bị túi khí trong 4 xe đã được bán ra
b) Tìm hàm phân phối của biến ngẫu nhiên trong a) Tính f(2) dựa vào hàm phân phối vừa thu
được
Giải
a) Gọi X là số xe được trang bị túi khí trong 4 xe đã bán Tập giá trị của X là {0, 1, 2, 3, 4}
Với x thuộc tập giá trị của X thì số xe không được trang bị túi khí trong 4 xe đã bán là 4 – x
Số điểm mẫu là 2.2.2.2 = 16 Do 50% xe có trang bị túi khí nên các điểm mẫu là đồng khả năng
Các xác suất đều có mẫu số là 16
Trong 4 xe đã bán, số cách bán được x chiếc có trang bị túi khí bằng số cách chọn ra x phần tử từ
tập gồm 4 phần tử Số cách bán được x chiếc có trang bị túi khí là C4x
Do đó hàm xác suất của X là f(x) được xác định bởi công thức:
43
khi 1615
32
khi 1611
2x1khi 165
10
khi 16
1 khi 0
)(
x x x
x x
x F
f(2) = F(2) – F(1) =
8
316
516
11
=
−
Trang 36Xem xét một phân phối xác suất ở dạng biểu đồ cũng rất có ích Ta có thể vẽ các điểm (x, f(x)) của Ví dụ 2.5 như trong Hình dưới đây Nối các điểm này đến trục Ox bởi một đường nét đứt
hoặc một đường liền nét ta được một biểu đồ hình cây Nhìn vào Hình vẽ, ta dễ dàng nhận thấy
giá trị của X tương ứng với xác suất lớn nhất và tính đối xứng của các điểm
Biểu đồ hình cây
Thay vì vẽ các điểm (x, f(x)), ta cũng có thể vẽ các hình chữ nhật như trong Hình dưới
đây Ở đây, các hình chữ nhật được vẽ sao cho đáy của chúng có bề rộng bằng một đơn vị dài và
mỗi giá trị x được đặt chính giữa đáy, còn chiều cao của chúng bằng xác suất tương ứng được cho bởi f(x), các đáy được vẽ sao cho không có khoảng trống giữa các hình chữ nhật Hình sau
đây được gọi là một biểu đồ xác suất.
Bi ểu đồ xác suất
Vì mỗi đáy trong Biểu đồ xác suất có bề rộng là 1 nên P(X = x) bằng diện tích hình chữ nhật có x nằm ở chính giữa đáy Thậm chí nếu đáy không có bề rộng là 1 ta cũng có thể điều chỉnh chiều cao của hình chữ nhật để diện tích của nó vẫn bằng xác suất để X nhận giá trị x Sử
dụng diện tích để mô tả xác suất là rất cần thiết khi ta nghiên cứu phân phối xác suất của biến ngẫu nhiên liên tục
Như vậy, khi X là biến ngẫu nhiên rời rạc ta có hai dạng của phân phối xác suất, đó là hàm
phân phối tích luỹ và hàm xác suất
Trang 37Sau đây, ta sẽ xây dựng một dạng phân phối xác suất của biến ngẫu nhiên liên tục tương tự như
hàm xác suất của biến ngẫu nhiên rời rạc
Hàm mật độ xác suất của biến ngẫu nhiên liên tục
Biến ngẫu nhiên liên tục có tập giá trị không thể liệt kê ra được Hơn nữa, xác suất để biến ngẫu
nhiên liên tục nhận một giá trị cụ thể trong tập giá trị của nó thì bằng 0 Điều này có vẻ lạ nhưng
thực tế thì đúng là như vậy khi xét mỗi tình huống cụ thể, chẳng hạn X là thời gian sống (tính
theo giây) của một con vi khuẩn 10(giây) là một số trong tập giá trị của X tuy vậy thời điểm này
trôi qua cực nhanh, đến mức không kịp xảy ra một sự kiện gì cả, do vậy không thể xảy ra biến cố
X = 10, tức là P(X = 10) = 0 Nhưng X nhận giá trị trong khoảng thời gian từ 9(giây) đến
11(giây) lại xảy ra với xác suất lớn hơn 0 Thế nên, với biến ngẫu nhiên liên tục việc xem xét xác
suất để biến ngẫu nhiên nhận giá trị cụ thể không giúp ta nắm được thông tin gì Ta tập trung vào
việc tìm xác suất để biến ngẫu nhiên nhận giá trị trong một khoảng nào đó của tập giá trị
Như phân tích ở trên, ta có
)
()()(
)
P < ≤ = < < + = = < <
Do đó việc có tính đến điểm cuối của đoạn hay không là không quan trọng Tuy nhiên khi X là
biến ngẫu nhiên rời rạc thì điều này không còn đúng nữa
Hãy để ý đến biểu đồ xác suất của biến ngẫu nhiên rời rạc! Ta thấy, có thể dùng diện tích
để mô tả được xác suất Một cách hợp lý là dùng diện tích giới hạn bởi một đường cong nằm
phía trên trục hoành, trục hoành, đường x = a, x = b, để mô tả phân phối xác suất của biến ngẫu
nhiên liên tục Ta sẽ gọi hàm số có đồ thị là đường cong nói trên là hàm mật độ xác suất
Một hàm mật độ xác suất được xây dựng sao cho phần hình phẳng được giới hạn bởi đồ
thị của nó, trục Ox và khoảng giá trị của X mà tại đó f(x) xác định có diện tích bằng 1 Khi tập giá
trị của X là một khoảng hữu hạn, ta mở rộng nó thành tập số thực bằng cách cho f(x) = 0 tại tất cả
các thuộc phần mở rộng Khi đó, xác suất để X nhận giá trị trong khoảng (a, b) là diện tích hình
phẳng giới hạn bởi đồ thị của hàm mật độ, trục Ox và các đường thẳng x = a, x = b, nó được tính
bởi tích phân sau P(a < X < b) = ∫b
a
dx x
f( )
Do đó, mà có định nghĩa sau
Định nghĩa 2.3
Cho X là một biến ngẫu nhiên liên tục, hàm f(x) xác định trên tập các số thực R và thoả
mãn các điều kiện sau
f( )
,thì được gọi là hàm mật độ xác suất của X hay đơn giản là hàm mật độ của X
Trang 38Từ định nghĩa, ta thấy hàm mật độ là một phân phối xác suất của X
Tính không duy nhất của hàm mật độ
Trong phần toán giải tích, ta đã biết giá trị của hàm số có thể bị thay đổi tại một số đếm được các điểm mà không ảnh hưởng đến giá trị của tích phân Do đó, từ định nghĩa suy ra hàm mật độ của biến ngẫu nhiên liên tục nói chung là không duy nhất Trong bài giảng này, ta thống nhất với
nhau: Nếu X là biến ngẫu nhiên liên tục, chúng ta chỉ đưa ra một hàm mật độ thích hợp của X và chỉ làm việc với nó, thường là liên tục trên toàn trục số hoặc gần như là liên tục trên toàn trục số
Các hình vẽ sau đây mô tả một số hàm mật độ điển hình
P(a < X < b)
Ví dụ 2.6 Giả sử sai số của nhiệt độ phản ứng (đơn vị 0C) trong một thí nghiệm là biến ngẫu
nhiên liên tục X có hàm mật độ xác suất
a) Chứng minh f(x) thỏa mãn điều kiện b) của Định nghĩa 2.3
b) Tìm P(0 < X ≤ 1)
Giải
a)
93
)
(
2 2
1
2
x dx
x dx
8+ =
b) P(0 < X ≤ 1) =
93
2 1
0
2
x dx
9
1
21
,3)(
2
x
x
x x f
Trang 39t dt t f
x x
19
Kết quả này giống với kết quả nhận được bằng cách sử dụng hàm mật độ trong Ví dụ 2.6
Hàm phân phối tích lũy F(x) được biểu diễn bằng đồ thị trong Hình dưới đây
Ví dụ 2.8 Cho X là biến ngẫu nhiên liên tục có hàm mật độ f(x) như sau
1 khi 0 ) (
x c
x x
f
Hãy xác định hằng số c và tính P(2 < X < 3)
Giải
Trang 40x
dx c dx x
• P(2 < X < 3) = ∫ =
3
2 2
a x
)(
b a x
b a x
2
1)
c x
F x
c x
f
+
=
2.3 Hàm của một biến ngẫu nhiên một chiều
Giả sử X là một biến ngẫu nhiên và y = u(x) là một hàm số xác định trên tập giá trị của X Xét biến ngẫu nhiên Y xác định bởi Y = u(X) Nếu X nhận giá trị là x, thì Y nhận giá trị là u(x)
Ví dụ 2.10 Nếu X là biến ngẫu nhiên, thì 2X – 1; sinX; e X là những biến ngẫu nhiên
Vấn đề đặt ra là: Nếu đã biết phân phối xác suất của X là f(x), thì phân phối xác suất của Y được xác định dựa vào u(x) và f(x) như thế nào?
Người ta đã chứng minh được các Định lý sau:
14
3)(
f
x
Tìm phân phối xác suất của biến Y = X2