Tên học phần: XÁC SUẤT VÀ THỐNG KÊ TOÁN Mã học phần: - Hướng dẫn các phương pháp, công thức tính toán xác suất của biến cố ngẫu nhiên, đại lượng ngẫu nhiên, các phương pháp ước lượng t
Trang 1TÀI LIỆU GIẢNG DẠY LỚP CHẤT LƯỢNG CAO
Trình độ đào tạo: ĐẠI HỌC
Chương trình đào tạo: ………
PHẦN 1: ĐỀ CƯƠNG CHI TIẾT HỌC PHẦN
1 Tên học phần: XÁC SUẤT VÀ THỐNG KÊ TOÁN Mã học phần:
- Hướng dẫn các phương pháp, công thức tính toán xác suất của biến cố ngẫu nhiên, đại lượng ngẫu nhiên, các phương pháp ước lượng tham số, kiểm định giả thiết thông qua các ví dụ và các bài toán điển hình
- Trình bày được một số các ứng dụng, các mối quan hệ cũng như các giải pháp của toán học thống kê hiện đại đối với các lĩnh vực quan trọng khác như kinh tế, khoa học kỹ thuật và đời sống
- Rèn luyện tư duy toán học, khả năng suy luận, phán đoán cũng như kỹ năng tính toán, đánh giá
và giải quyết các vấn đề có liên quan đến xác suất và thống kê trong các lĩnh vực kinh tế, kỹ thuật
* Kỹ năng:
Sau khi hoàn tất học phần người học có khả năng:
Trang 22
- Giải quyết được các dạng bài toán có liên quan đến về xác suất và thống kê toán học trong phạm
vi kiến thức đã được trang bị
- Thiết lập và tính toán được một số các mối quan hệ kinh tế - kỹ thuật, các quy luật cung - cầu trên cơ sở của các phép toán về xác suất và thống kê toán học
- Có thể ứng dụng xác suất và thống kê toán học vào thực tế cuộc sống và xã hội
* Thái độ:
Trong suốt quá trình học tập học phần, người học cần có:
- Thái độ học tập tích cực, tinh thần tự học cao, khả năng tự đào tạo và hoàn thiện kiến thức có hiệu quả
- Định hướng ứng dụng kiến thức vào thực tế cuộc sống
5 Phương pháp giảng dạy
Học phần có thể được giảng bằng nhiều phương pháp, trong đó gồm 3 phương pháp chủ đạo:
- Phương pháp diễn giảng
- Phương pháp thảo luận (nhóm)
- Phương pháp luyện tập (làm bài tập)
6 Phương pháp đánh giá
- Đánh giá quá trình (1): 30% , trong đó gồm:
+ Làm bài tập: 5%
+ Kiểm tra giữa kỳ: 20% , (Hình thức thi tự luận,thời gian thi 60 phút)
- Đánh giá cuối học phần (2): 70% , (Hình thức thi tự luận,thời gian thi 90 phút)
Điểm đánh giá học phần: 100% , thang điểm 10, là tổng của 2 mục (1) và (2) nêu trên
7 Nội dung (Các đề mục chi tiết) học phần
PHẦN LÝ THUYẾT XÁC SUẤT CHƯƠNG 1: CÁC KHÁI NIỆM CƠ BẢN CỦA XÁC XUẤT
1.1 MỘT SỐ CÔNG THỨC VỀ GIẢI TÍCH TỔ HỢP
1.1.1 Quy tắc nhân
Giả sử một công việc nào đó cần phải chia thành k giai đoạn để thực hiện Có n 1 cách thực
hiện giai đoạn một, n2 cách thực hiện giai đoạn hai, , n k cách thực hiện giai đoạn k Vậy có n cách
để thực hiện toàn bộ công việc, với:
Trang 3!152
Các số bắt đầu bằng chữ số 0 (0123, 0234, ) không phải là số có 4 chữ số
Chữ số đầu tiên phải chọn trong các chữ số 1,2,3,4,5 Do đó có 5 cách chọn chữ số đầu tiên
Ba chữ số kế tiếp có thể chọn tùy ý trong 5 chữ số còn lại Có A53cách chọn
Trang 4Định nghĩa 1.4: Tổ hợp chập k của n phần tử (k < n) là một nhóm (bộ) không phân biệt thứ tự,
gồm k phần tử khác nhau chọn từ n phần tử cho trước
Số tổ hợp chập k của n phần tử ký hiệu là C n k, với:
)!
(
!
k n k
.3.2.1
25.24.23.22
!21
!
4
!25)!
425(4
!254
Giải
Để xác định số cách chọn (cấu hình), có 3 bước:
Bước 1: Chọn 10 cổng có kết nối, có 8008
!6
!
10
!16
!
4
!6
4
Bước 3: Chọn 2 cổng không thể hoạt động, có C22 1 cách
Theo quy tắc nhân, có C1610.C64.C22 8008*15*1120.120 cách
1.1.6 Nhị thức Newton
Giá trị của các hệ số trong nhị thức Newton (tức trong khai triển của các hằng đẳng thức đáng nhớ) được xác định từ tam giác Pascal như sau:
Trang 5n n n n n n n n n
n n
n n
n n
b a C b
a C b a
C b
a C b a C b a C b
a
0
0 1
) 1 ( ) 1 ( 2
2 2 1 1 1 0 0
.)
(
(a, b là các số thực; n là số tự nhiên)
1.2 CÁC KHÁI NIỆM CƠ BẢN CỦA XÁC SUẤT
1.2.1 Phép thử – Biến cố – Không gian mẫu:
Phép thử: Khi quan sát một hiện tượng, làm một thí nghiệm, tiến hành một công việc mà có
quan tâm đến kết quả, tức là đã thực hiện một phép thử ngẫu nhiên, gọi tắt là phép thử (test), ký
hiệu là T
Vậy phép thử là một tập hợp các hành động, thao tác có khảo sát kết quả
Biến cố: Mỗi kết quả có thể xảy ra hoặc không xảy ra của một phép thử, gọi là một biến cố
ngẫu nhiên hay sự kiện ngẫu nhiên, gọi tắt là biến cố hay sự kiện, ký hiệu bởi các ký tự bất kỳ A,
B, C,…,X, Y, Z,….,Γ,Δ,Λ,Ψ,Φ,Σ,…
Không gian mẫu: Tập hợp tất cả các kết quả có thể xảy ra của một phép thử được gọi là
không gian các biến cố ngẫu nhiên của phép thử hay không gian mẫu, ký hiệu là
Vậy mỗi tập con A của không gian mẫu (A ) là một biến cố (hay sự kiện), và không gian
mẫu còn được gọi là không gian các biến cố (không gian các sự kiện)
Ví dụ 1.8: Tung một đồng xu là thực hiện một phép thử Kết quả mặt sấp xuất hiện hay mặt ngửa xuất hiện là những biến cố có thể xảy ra.
Bắn một viên đạn vào một mục tiêu là thực hiện một phép thử Sự kiện “viên đạn không trúng mục tiêu” là một biến cố
Trang 66
Biến cố không thể: Là biến cố không thể xảy ra khi thực hiện phép thử, ký hiệu Vậy biến cố
không thể, về bản chất, là một tập rỗng nên còn gọi là biến cố rỗng
Ví dụ 1.9: Thực hiện phép thử tung một viên xúc xắc (xí ngầu), khi đó:
Không gian mẫu của phép thử là: = {1, 2, 3, 4, 5, 6}
E = {7}: biến cố không thể xảy ra, tức là E =
Nếu mặt (1) xuất hiện, tức các biến cố {1}, A, C, D xảy ra
Nếu mặt (2) xuất hiện, tức các biến cố {2}, B, C, D xảy ra
* Chú ý: Mọi biến cố sơ cấp đều là biến cố ngẫu nhiên, ngược lại biến cố ngẫu nhiên nói chung
không là biến cố sơ cấp
1.2.3 Biến cố đồng khả năng – Số trường hợp đồng khả năng:
Hiện tượng hai hay nhiều biến cố trong một phép thử có khả năng xảy ra như nhau, được gọi
là hiện tượng đồng khả năng của các biến cố, khi đó các biến cố được gọi là các biến cố đồng khả năng
Trong một phép thử mà mọi biến cố sơ cấp đều đồng khả năng thì số phần tử của không gian mẫu được gọi là số trường hợp đồng khả năng của phép thử
Ví dụ 1.10: Trong phép thử một tung đồng xu (cân đối đồng chất), số trường hợp đồng khả năng
là 2 Còn trong phép thử gieo viên xúc xắc (cân đối đồng chất), số trường hợp đồng khả năng là
6
1.2.4 Các phép toán về biến cố:
Về mặt toán học, mỗi biến cố là một tập hợp, vì vậy cũng có các phép toán về biến cố như đối với các tập hợp
Cho các biến cố ngẫu nhiên A, B
a) Tổng (hợp hay phần hợp) của hai biến cố A và B là một biến cố, ký hiệu A+B, định bởi:
A+B xảy ra khi A xảy ra hoặc B xảy ra
b) Tích (giao hay phần giao) của hai biến cố A và B là một biến cố, ký hiệu A.B, định bởi:
A.B (hay AB) A.B xảy ra khi A và B đồng thời xảy ra
c) Hiệu (hay phần trừ) của biến cố A và biến cố B là một biến cố, ký hiệu A–B, định bởi:
A–B (hay A \ B)
A–B xảy ra khi A xảy ra và B không xảy ra
d) Phần bù của biến cố trong là một biến cố, ký hiệu A, định bởi:
A =\A={ A}
Trang 77
* Chú ý: Phần bù của một biến cố trong không gian mẫu chính là hiệu của với biến cố đó,
và khi đó còn được gọi là biến cố đối lập của biến cố đã cho (A là biến cố đối lập của A)
Ví dụ 1.11: Hai sinh viên X, Y cùng dự thi Gọi A là biến cố sinh viên X thi đạt, B là biến cố sinh viên Y thi đạt, C là biến cố có ít nhất một trong hai sinh viên thi đạt và D là biến cố cả X và Y cùng thi đạt Khi đó: C = A+B và D = A.B
Ví dụ 1.12: Kiểm tra n sản phẩm trong một lô sản phẩm S Gọi A là biến cố gặp sản phẩm thứ i i
là một phế phẩm, B là biến cố trong số n sản phẩm được kiểm tra có ít nhất một phế phẩm, C là biến cố tất cả các sản phẩm được kiểm tra đều là phế phẩm, D là biến cố tất cả các sản phẩm được kiểm tra đều là sản phẩm tốt (tức kiểm tra n sản phẩm không thấy có phế phẩm nào) Khi đó:
B = A1A2 A n
C = A1A2 A n
D =\B = B = A1 A2 A n A1.A2 A n
1.2.5 Tính chất của các phép toán về biến cố:
a) Tính lũy đẳng (phản hồi): A+A=A
B A B
1.2.6 Quan hệ giữa các biến cố:
Biến cố con: Cho hai biến cố A, B Biến cố A được gọi là con của biến cố B nếu A xảy ra thì B
xảy ra, ký hiệu: A B
Trong một phép thử, biến cố rỗng là con của mọi biến cố, và mọi biến cố ngẫu nhiên đều là con của biến cố chắc chắn
ATrong một phép thử, biến cố chắc chắn là tổng của mọi biến cố sơ cấp có thể xảy ra
Ví dụ 1.13: Gieo 1 viên xúc xắc Gọi A là biến cố xuất hiện mặt có 2 chấm, B là biến cố xuất hiện mặt có số chấm chẵn Khi đó:
A là một biến cố sơ cấp và là biến cố ngẫu nhiên
B là biến cố ngẫu nhiên (nhưng không là biến cố sơ cấp)
Trang 88
Biến cố tương đương: Hai biến cố A, B được gọi là tương đương nhau nếu A B và B A,
ký hiệu: AB hay BA
Biến cố xung khắc: Hai biến cố A và B được gọi là xung khắc nhau nếu biến cố này xảy ra thì
biến cố kia không xảy ra
Biến cố đối lập: Hai biến cố A và B được gọi là đối lập nhau nếu:
i) A, B xung khắc nhau: A.B =
ii) Có ít nhất một biến cố xảy ra: A+B =
Họ biến cố xung khắc: Họ các biến cố A1,A2, ,A n được gọi là họ biến cố xung khắc từng đôi (họ xung khắc từng đôi hay họ xung khắc) nếu có một biến cố bất kỳ trong họ xảy ra thì các biến cố còn lại không xảy ra
n
A A
Họ biến cố đầy đủ: Họ các biến cố A1,A2, ,A n được gọi là họ biến cố đầy đủ (hay họ đầy đủ) nếu:
ii) Có ít nhất một biến cố xảy ra: A1A2 A n =
Ví dụ 1.14: Trong phép thử tung viên xúc xắc Gọi A là biến cố mặt i xuất hiện (i=1,2,…,6) Khi i đó:
2 ,
1A
1 ,
1 A
4 2
1,A ,A
6 5 4 3 2
1,A ,A ,A ,A ,A
* Chú ý: Hai biến cố đối lập nhau thì xung khắc, điều ngược lại không chắc đúng
1.3 XÁC XUẤT CỦA BIẾN CỐ
Xác xuất xảy ra của một biến cố, gọi tắt là xác xuất của biến cố, là số đo khả năng xảy ra của biến cố đó Có nhiều cách định nghĩa
Định nghĩa 1.5: Định nghĩa xác xuất theo quan điểm cổ điển (classical):
Cho A , xác xuất của biến cố A, ký hiệu P(A) định bởi:
P(A) =
n m
n: số trường hợp đồng khả năng của phép thử
m: số trường hợp thuận lợi để biến cố A xảy ra
Ví dụ 1.15: Tung một đồng xu Xác xuất mặt sấp xuất hiện là: P(S) =
Trang 9Định nghĩa 1.6: Định nghĩa xác xuất theo quan điểm thống kê (statistics):
Khi thực hiện n lần một phép thử T và thấy biến cố A xuất hiện m lần, thì tỷ số
n
m A
f n( )
được gọi là tỷ lệ xuất hiện của biến cố A qua n phép thử
Nếu thực hiện phép thử T đến N lần (với N khá lớn) mà có M lần biến cố A xuất hiện, thì tỷ
số
N
M
A
f N( ) được gọi là tần suất của biến cố A
Tần suất của một biến cố nào đó hầu như luôn dao động quanh một trị số xác định, và theo quan điểm của thống kê học, trị số xác định đó là xác xuất để biến cố xảy ra
)(
Ví dụ 1.17: Tung 10 lần một đồng xu vênh góc, thấy 3 lần mặt sấp xuất hiện: f(S) =
10
3
= 0,3 Nếu tiếp tục tung 1000 lần thấy số lần mặt sấp xuất hiện vào khoảng từ 249 đến 251 lần, tức fn(S) dao động quanh giá trị 0,25 vậy xác suất mặt sấp xuất hiện là: P(S)=0,25
* Chú ý: Đối với những phép thử không có số trường hợp đồng khả năng, để xác định xác xuất
của một biến cố, phải dùng đến khái niệm tần suất và định nghĩa xác xuất theo quan điểm thống
kê
Định nghĩa 1.7: Định nghĩa xác xuất theo hệ tiên đề Kolmogorov:
Cho K là họ các tập con của không gian mẫu , K = {A A }, (tức K chứa ) và một
ánh xạ P: K [0, 1] thỏa 3 tiên đề sau:
(Tđ1): 0 P ( A) 1, A
(Tđ2): P() = 1
(Tđ3): P(A+B) = P(A) + P(B), nếu A.B =
Khi đó với A bất kỳ thuộc , giá trị P(A) được gọi là xác xuất của biến cố A
Định nghĩa 1.8: Định nghĩa xác xuất theo quan điểm độ đo (measurement):
Một phép thử T có vô hạn biến cố sơ cấp đồng khả năng A là biến cố bất kỳ trong phép thử
Nếu có thể biểu diễn:
- Miền M là tập hợp vô hạn của tất cả các biến cố sơ cấp trong phép thử T
- Miền m là tập hợp vô hạn của các biến cố sơ cấp thuận lợi cho A xảy ra
Thì xác suất để biến cố A xảy ra là:
P(A) =
).(
).(
M miên đo đô
m miên đo đô
Trong đó, khái niệm độ đo miền có thể là độ dài, diện tích, thể tích, khối lượng của miền đó
Ví dụ 1.18: Hai người X và Y hẹn gặp nhau tại một quán café trong khoảng từ 19 giờ đến 20 giờ tối, mỗi người có thể đến chỗ hẹn vào bất kỳ thời điểm nào trong khoảng thời gian này Đến gần
Trang 1010
giờ hẹn cả hai đều có việc đột xuất, nên giao hẹn lại rằng người nào đến trước sẽ chờ, quá thời gian 20 phút thì đi Tính xác suất hai người gặp nhau
Giải
Khoảng thời gian từ 19 giờ đến 20 giờ bằng 60 phút
Thời điểm đến chỗ hẹn của X là x (kể từ 19 giờ)
Thời điểm đến chỗ hẹn của Y là y (kể từ 19 giờ)
0x1
0 y1 Điều kiện hai người gặp nhau là: xy 20
Biểu diễn x, y trong hệ toạ độ Descartes, đơn vị là phút
2020
x y
x y y
x
y x y
40602
2 2
Trang 1111
i) Do 0 m n
n
n n
iii) A + B có m + r phần tử
Nên P(A + B) =
n
r n
m n
r m
Khi đó: P(A + B) = P(A) + P(B) – P(A.B)
Chứng minh: (Bằng phương pháp xác xuất cổ điển)
Gọi n là số phần tử của
Gọi m là số phần tử của A
Gọi r là số phần tử của B
Khi đó : A+B có (m +r) phần tử nếu A.B =
Và: A+B có (m +r – s) phần tử nếu A.B ≠ với s là số phần tử của A.B
Trang 12m
=
n
s n
r n
m
= P(A) + P(B) + P(A.B)
Ví dụ 1.20: Một lớp học có 100 học sinh, trong đó có 40 học sinh giỏi Toán, 50 học sinh giỏi Ngoại ngữ, 30 học sinh giỏi cả Toán lẫn Ngoại ngữ Chọn ngẫu nhiên một học sinh của lớp Tính xác suất để học sinh được chọn là học sinh giỏi ít nhất 1 môn
Giải
Gọi A là biến cố chọn được một học sinh giỏi Toán, B là biến cố chọn được một học sinh giỏi
Ngoại ngữ:
4,010
40)
P
5,010
50)
P
Thì A.B là biến cố chọn được học sinh giỏi cả Toán và Ngoại ngữ:
3,010
30)
P
Khi đó A+B chính là biến cố chọn được học sinh giỏi ít nhất một môn, theo công thức cộng:
6,03,05,04,0).()()()
Định nghĩa 1.9: Cho A, B có P(B) > 0 Xác xuất của biến cố A xảy ra trong điều kiện biến
cố B đã xảy ra, được gọi là xác xuất có điều kiện của biến cố A đối với biến cố B, ký hiệu P ( B A ), định bởi:
r
s B P
B A P B A
)(
).()(
Trong đó: r là số trường hợp thuận lợi để B xảy ra
s là số trường hợp thuận lợi để A.B xảy ra
Ví dụ 1.21: Tung 1 viên xúc xắc Tính xác suất:
1) Xuất hiện mặt 1 khi biết rằng đã xuất hiện mặt lẻ
2) Xuất hiện mặt lẻ khi biết rằng đã xuất hiện mặt 1
Giải
Gọi A là biến cố xuất hiện mặt 1, B là biến cố xuất hiện mặt lẻ, khi đó:
Trang 136
1})1({
)()
6/1)(
).()
B P
B A P B A
Và xác suất xuất hiện mặt lẻ khi biết rằng đã xuất hiện mặt 1:
16/1
6/1)(
).()
A P
A B P A B P
Định lý 1.4: (Công thức nhân xác xuất)
().()
(
).()
B P
B A P B
A
)()
().()
(
).()
A P
A B P A
B
Do: P(A.B)P(B.A), kết hợp (1) và (2) suy ra đpcm
Công thức cũng đúng trong trường hợp P(A) = 0 hay P(B) = 0
* Công thức nhân xác suất mở rộng với P(A), P(B), P(C) > 0
).(.)()
() (A B C P A P B A P C A B
* Trường hợp tổng quát với P(A 1 ), P(A 2 ),…, P(A n ) > 0
)
.(
).(.)()
()
Gọi A i là biến cố viên bi lấy lần thứ i là bi trắng,
F là biến cố cả 3 bi lấy được đều là bi trắng
Xác suất để lấy được cả 3 bi đều là bi trắng:
120
18
1.9
2.10
3).(.)()
() ()
Trang 1414
* Chú ý: - Cho A, B có P(B) >0
A, B độc lập nhau P ( B A ) = P(A)
- Các biến cố độc lập nhau, thông thường, thuộc về các không gian mẫu khác nhau
Ví dụ 1.23: Thực hiện phép thử tung một lúc 2 đồng xu Gọi Si là biến cố xuất hiện mặt sấp ở đồng xu i, (i=1,2) Chứng minh rằng S1, S 2 là 2 biến cố độc lập nhau
Giải
Không gian mẫu của phép thử tung 2 đồng xu là =(S,S),(S,N),(N,S),(N,N)
Trong đó các biến cố: S1 =(S,S),(S,N), S2 =(S,S),(N,S), S1 S2 = S1S2 ={(S,S)}
Nếu chỉ xét đồng xu 1 thì không gian mẫu là 1 = {S1, N1}
Nếu chỉ xét đồng xu 2 thì không gian mẫu là 2 = {S2, N2}
Vậy S1, S 2 lần lượt thuộc 1, 2 là những không gian mẫu đơn giản khác nhau
Trong không gian mẫu của phép thử tung 2 đồng xu, có:
1.2
Trang 15* Nhận xét: Khi 2 biến cố độc lập với nhau, sự xuất hiện hay không xuất hiện của biến cố này
không làm thay đổi xác suất của biến cố kia
Định nghĩa 1.11:
Họ biến cố độc lập từng đôi: Họ các biến cố A1,A2, A n được gọi là họ biến cố độc lập từng
đôi (hay họ độc lập từng đôi) nếumọi cặp biến cố bất kỳ trong họ đều độc lập với nhau, tức:
n
A A
A1, 2, , độc lập từng đôi PA i.A j P(A i).P(A j) i j,(i, j1,n)
Họ biến cố độc lập toàn phần: Họ các biến cố A1,A2, A n được gọi là họ biến cố độc lập
toàn phần (họ độc lập toàn phần (toàn thể) hay họ độc lập) nếu một biến cố bất kỳ của họ và tích của một số hữu hạn các biến cố còn lại của họ là độc lập với nhau, tức:
n
A A
n
i j j j
()
()
()
()
(A1A2 A n P A1 P A2A1 P A3A1A2 P A n A1A2 A n1
)()(A2 A1 P A2
)()(A3 A1A2 P A3
………
)()
(A n A1A2 A n1 P A n
Thay vào vế trái của (1) suy ra đpcm
Ví dụ 1.24: Có 3 người chơi bóng rổ, mỗi người ném rổ một quả Xác xuất ném trúng rổ lần lượt của mỗi người là 0,5; 0,6; 0,7 Tính xác xuất để:
a) Cả 3 người đều ném trúng rổ
b) Có ít nhất một người ném trúng rổ
Trang 16Gọi A i là biến cố người thứ i ném trúng rổ
Khi đó A1,A2,A3 là một họ độc lập toàn thể, nên:
1.5 CÔNG THỨC XÁC XUẤT TOÀN PHẦN
Định lý 1.8: (Công thức xác suất toàn phần)
n
A P A
F P A P A F P A P F
P
1 2
2 1
1) ( ) ( ) ( ) ( ) ( ) ( ) ( )(
Trang 17)()
()()
(A1 P F A1 P A2 P F A2 P A n P F A n
Ví dụ 1.25: Có 4 dây chuyền sản xuất ra cùng một loại sản phẩm trong đó:
Xác suất xuất hiện 1 phế phẩm của dây chuyền I là 0,04
Xác suất xuất hiện 1 phế phẩm của dây chuyền II là 0,03
Xác suất xuất hiện 1 phế phẩm của dây chuyền III là 0,05
Xác suất xuất hiện 1 phế phẩm của dây chuyền IV là 0,058
Từ một hộp đựng 8 sản phẩm của dây chuyền I, 12 sản phẩm của dây chuyền II, 10 sản phẩm của dây chuyền III và 5 sản phẩm của dây chuyền IV, lấy ngẫu nhiên ra 1 sản phẩm Tính xác suất để sản phẩm lấy ra là một phế phẩm
Giải
Gọi F là biến cố sản phẩm lấy ra là một phế phẩm
A1 , A2, A3, A4 lần lượt là các biến cố sản phẩm lấy ra được sản xuất bởi các dây chuyền I, II,
1005.035
1203.035
804
)()
()(
F P
A F P A P F A
Chứng minh:
Từ công thức nhân xác suất:
)()
()()
().(A F P A P F A P F P A F
Suy ra đpcm
Ví dụ 1.26: Cũng lấy từ các giả thiết của ví dụ 1.25 trên, nhưng với giả sử đã biết sản phẩm lấy ra
là một phế phẩm Hỏi xác suất sản phẩm đó được sản xuất bởi dây chuyền nào là lớn nhất?
Giải
Áp dụng công thức Bayes:
)(
)()
()(
F P
A F P A P F A
Trang 1818
Xác suất sản phẩm lấy ra được sản xuất bởi các dây chuyền I, II, III, IV lần lượt là:
2177,0042,035
804,0)
(
)()
()(
* 1
1
F P
A F P A P F A P
2449,0042,035
1203,0)
(
)()
()(
* 2
2
F P
A F P A P F A P
3401,0042,035
1005,0)
(
)()
()(
* 3
3
F P
A F P A P F A P
1973,0042,035
5058,0)
(
)()
()(
* 4
4
F P
A F P A P F A P
Vậy sản phẩm phế phẩm lấy ra đó được sản xuất bởi dây chuyền III với xác suất lớn nhất
Ví dụ 1.27: Có 5 bình đựng bi, trong đó có 2 bình loại 1 mỗi bình đựng 3 bi trắng 4 bi đỏ, 1 bình loại II đựng 3 bi trắng 2 bi đỏ và 2 bình loại III mỗi bình đựng 4 bi trắng 3 bi đỏ Chọn ngẫu nhiên một bình và từ bình đó chọn ngẫu nhiên một bi
4
*5
25
3
*5
17
3
*5
4
*52)
(
)()
()
F P
A F P A P F A P
Trang 1919
CHƯƠNG 2: ĐẠI LƯỢNG NGẪU NHIÊN
2.1 CÁC ĐỊNH NGHĨA VÀ ĐẶC TRƯNG CỦA ĐẠI LƯỢNG NGẪU NHIÊN 2.1.1 Đại lượng ngẫu nhiên:
Tập hợp X = X() ={X()R } được gọi là tập giá trị của ĐLNN X
Vậy ĐLNN (hay BNN) là một giá trị xác định nhận được từ một kết quả ngẫu nhiên của một phép thử, hoặc là một giá trị xác định gán cho một biến cố ngẫu nhiên có thể xảy ra của một phép thử
Ví dụ 2.1: Tung một đồng xu và quy ước nếu mặt sấp xuất hiện thì được hưởng 1 ngàn đồng, còn nếu mặt ngửa xuất hiện thì mất 1 ngàn đồng Gọi X là số tiền được hoặc mất sau mỗi lần tung, thì X là một ĐLNN
Xét ánh xạ: X: = {S, N} R
S X(S)= 1
N X(S)= -1
Tập giá trị: X = X() = {-1, 1} là tập hợp hữu hạn (có 2 phần tử) mà X có thể nhận được
Ví dụ 2.2: Xét phép thử bắn không hạn chế số viên đạn vào một bia ngắm cho đến khi bắn trúng bia thì dừng Gọi K là số viên đạn bắn không trúng bia, thì K là một ĐLNN
Gọi: T: biến cố bắn trúng bia
K: biến cố bắn không trúng bia
i : biến cố i lần bắn không trúng bia
Khi đó: = {T, KT, KKT, KKKT,……,KK…KT,… }
= {0, 1, 2, 3, ………, n, ….}
Xét ánh xạ: K: R
i K(i ) = i
Tập giá trị: K = K() = {0, 1, 2, ………, n,… } là tập vô hạn đếm được
Ví dụ 2.3: Đo chiều cao ngẫu nhiên của một cộng đồng người Gọi H là chiều cao của một người được chọn bất kỳ, thì H có thể nhận bất kỳ giá trị nào từ 0 đến , vậy H là một ĐLNN
Không gian mẫu: ={ h0h,hR}=[0, )
Xét ánh xạ: H: R
i H(i ) = i
Tập giá trị: H = H() [0, ) là tập vô hạn không đếm được
Trang 2020
Định nghĩa 2.2:
ĐLNN rời rạc: ĐLNN X được gọi là rời rạc nếu tập giá trị X() là tập hữu hạn hay đếm được
ĐLNN liên tục: ĐLNN X được gọi là liên tục nếu a,bR,ab: a,b X() (hay nói
cách khác, nếu các giá trị của X lấp đầy một khoảng thực nào đó)
Ví dụ 2.4: ĐLNN X trong ví dụ 2.1 và ĐLNN K trong ví dụ 2.2 là những ĐLNN rời rạc Còn ĐLNN H trong ví dụ 2.3 là ĐLNN liên tục
* Chú ý:
1) Khi X() = {x1, x2, ……., x n} là một tập hữu hạn hay đếm được, người ta quy định cách
liệt kê các phần tử x1, x2, ……., x n trong tập hợp theo thứ tự tăng dần: x1<x2<……<x n
2) Khi ĐLNN X nhận giá trị x, biểu diễn: (X = x) ={X()x}
Khi ĐLNN X nhận giá trị nhỏ hơn x, biểu diễn: (X < x) ={X()<x}
* Nhận xét: X là ĐLNN liên tục xR, P(X=x) = 0 (người đọc tự kiểm chứng)
2.1.2 Đại lƣợng ngẫu nhiên độc lập và không độc lập:
Khái niệm:
Nếu hai biến cố A và B độc lập thì có biểu thức của xác suất tích A.B là: P(A.B) =P(A).P(B)
Mở rộng khái niệm độc lập cho 2 ĐLNN rời rạc X và Y: (X=x i ), (Y=y j) bằng ký hiệu quy ước:
(X=x i , Y=y j ) = [(X=x i ).(Y=y j)]
và định nghĩa sau:
Định nghĩa 2.3:
Cho X, Y: R là hai ĐLNN rời rạc với X()=(x1, x2,…, x n ), Y()=(y1, y2, …, y n)
X, Y được gọi là độc lập nhauP(X=x i , Y=y j ) = P[(X=x i ).(Y=y j )] = P(X=x i ) P(Y=y j) ,i, j (*)
X, Y là không độc lập nhau nếu dấu bằng của biểu thức (*) không xảy ra
Ví dụ 2.5: Chọn ngẫu nhiên 1 người trong cộng đồng dân cư Gọi X, Y, Z lần lượt là ngày sinh (không tính tháng năm), chiều cao (đơn vị tính bằng cm) và trọng lượng (đơn vị tính bằng kg) của người được chọn Khi đó: X,Y,Z là những ĐLNN rời rạc
Y và Z không độc lập nhau, vì không thể có người cao hơn 180cm mà nặng 10kg
2.1.3 Các phép toán giữa các đại lƣợng ngẫu nhiên
Định nghĩa 2.4:
Cho X, Y: R là 2 ĐLNN
Tổng của X và Y, ký hiệu X + Y, định bởi:
(X+Y)() = X() +Y(),
Trang 21Giả sử các kết quả xảy ra là: 1 = (tôm, gà, cá), 2 = (cua, bầu, cua)
3 = (cua, cua, cua), 4 = (bầu, tôm, nai)
Khi đó tổng số tiền thu được của 2 người X và Y như sau:
được gọi là hàm phân phối xác xuất (Probability Distribution Function) của ĐLNN X
Vậy hàm phân phối xác suất của một ĐLNN X là hàm số có miền giá trị là miền của các xác suất
để ĐLNN X nhận giá trị nhỏ hơn x thực nào đó
Mệnh đề 1: Cho X là ĐLNN rời rạc, có X()={x1, x2,…, x n }, p i =P(X=x i), và hàm phân phối xác
p p
x x x p p
p
x x x
F
n n
i i
i
1
0)
(
2 1
1 2
1
1
Trang 22Vậy mệnh đề đã được chứng minh
Ví dụ 2.7: Xây dựng hàm phân phối xác xuất của đại lượng ngẫu nhiên số nút X xuất hiện khi thực hiện phép thử tung xúc xắc
Giải
Khi x1 thì F(x) = P(X<x) =P(X<1) = 0
Khi 1<x2 thì F(x) = P(X<x) =P(X<2) = P(X=1) =
61
Khi 2<x3 thì F(x)= P(X<x) =P(X<3)= P(X=1)+P(X=2) =
3
16
16
16
16
Khi 4<x5 thì F(x)= P(X<x)=P(X<5)=P(X=1)+P(X=2)+P(X=3)+P(X=4) =
3
26
16
16
16
16
16
16
16
66
16
16
16
16
16
65
6/5
54
3/2
43
2/1
32
3/1
21
6/1
10
)()(
x x x x x x x
x X P x F
Mệnh đề 2: Cho X là một ĐLNN liên tục có hàm phân phối xác xuất là F(x), khi đó:
Trang 2424
P(aX<b)=F(b) – F(a)
Mệnh đề 4: Cho X là ĐLNN liên tục có hàm phân phối xác xuất F(x) Khi đó:
P(aX<b) = P(a<X<b) = P(a<X b) = P(aX b) = F(b) – F(a)
Chứng minh:
Chứng minh tương tự mệnh đề 3, ta có:
P(aX<b) = F(b) – F(a)
Do : (aX<b) = (X=a)+ (a<X<b)
P(aX<b) = P(X=a) + P(a<X<b)
= P(a<X<b) (do: P(X=a) = 0 vì X liên tục)
Chứng minh tương tự cho các đẳng thức còn lại
được gọi là bảng phân phối xác xuất của ĐLNN rời rạc X
* Chú ý: Không thể thiết lập được bảng phân phối xác suất cho các ĐLNN liên tục (người đọc tự kiểm chứng)
Định nghĩa 2.7:
Cho X là một ĐLNN liên tục có hàm phân phối xác suất F(x), khi đó hàm:
f(x)=F’(x) , xR
được gọi là hàm mật độ xác xuất (Probability Density Function) của ĐLNN X, hay gọi tắt là hàm
mật độ (Density Function) của X
Trang 25f )(
iii) P(a<X<b) =b
a
dx x
f( ) = F(+) –F(–) =1–0 = 1
2.4 CÁC ĐẶC TRƢNG CỦA ĐẠI LƢỢNG NGẪU NHIÊN
2.4.1 Kỳ vọng (Expectation)
Định nghĩa 2.8:
Kỳ vọng của ĐLNN X, ký hiệu E(X), là một trị số xác định như sau:
- Nếu X là ĐLNN rời rạc có bảng phân phối xác xuất là
Ví dụ 2.8: Để kiểm tra thu nhập hàng năm của công nhân công ty A, người ta chọn ngẫu nhiên
400 công nhân ở các khâu làm việc của công ty để khảo sát và thu được số liệu cho ở bảng sau:
Trang 2626
Thu nhập (triệu đồng/năm) 30 40 50 60 70 80
Số công nhân 16 60 160 100 40 24 Tính thu nhập trung bình trong 1 năm của công nhân công ty A
Giải
Gọi X là thu nhập (triệu đồng /năm) của công nhân công ty A Khi đó X là một ĐLNN có bảng
phân phối xác xuất:
i p x
1
54400
24
*8040
*70100
*60160
*5060
*4016
*30)
i) E(C) = C, C hằng số hay C là ĐLNN hằng, bất biến
ii) E(X+Y) = E(X)+E(Y)
i ij n
i m
j ij m
j i n
i ij j m
j n
i ij i m
j n
i ij j i m
j
n
i
q y p x p
y p
x p
y p
x p
1 1 1 1
1 1
1 1
1 1
1
)(
Trang 27x E p x p
n
i i i n
1 1 1
1
j j m
j i i n
i j i j i m
j n
i ij j i m
j n
i
q y p
x q
p y x p
2.4.2 Phương sai (Differential, Variance)
Định nghĩa 2.9: Phương sai của ĐLNN X, ký hiệu D(X) hay V(X), là một giá trị được xác định
Độ lệch tiêu chuẩn (Standard Deviation): Hay còn gọi là độ lệch quân phương của ĐLNN X, ký
hiệu (X), là trị số căn bậc hai của phương sai D(X):
(X) = D ( X)
(X) luôn có cùng đơn vị đo với X
* Ý nghĩa của phương sai:
Trang 2828
Phương sai của ĐLNN X chính là kỳ vọng của bình phương độ chênh lệch giữa giá trị của X
và giá trị kỳ vọng E(X) của nó Hay nói cách khác, phương sai của ĐLNN X là độ phân tán của các giá trị mà X nhận được quanh giá trị kỳ vọng của nó
Ví dụ 2.9: Cho X, Y, Z, T là 4 ĐLNN lần lượt có các bảng phân phối xác xuất như sau:
1) Tính kỳ vọng và phương sai của 4 ĐLNN trên
2) So sánh các phương sai Hỏi trong 2 ĐLNN Z và T, ĐLNN nào có khả năng nhận giá trị cách xa kỳ vọng của nó hơn?
Giải:
1) Dễ dàng tính được các kỳ vọng: E(X) = E(Y) = E(Z) = E(T) = 0
Và các phương sai: D(X) = 0, D(Y) = 100, D(Z) = 3400, D(T) = 6700
2) Vậy: D(X) < D(Y) < D(Z) < D(T)
Do đó, có thể nhận thấy Y phân tán hơn X, Z phân tán hơn Y và T phân tán hơn Z
Vậy từ ví dụ 2.9, có thể nói phương sai của ĐLNN là độ phân tán của những giá trị mà ĐLNN
đó nhận được quanh kỳ vọng của nó
Định lý 2.4: (Tính chất của phương sai)
(C CE C 2 CC 2
D
ii) D(X)=E[(X – E(X))2]
=E(X2 – 2E(X).X + (E(X))2
)
Trang 291
2 1
2
.)(
).(.)
1
2 2
X D p
X E x p
X E x
n
i
i i
2
X D p X E x p
X E x
D
1
2
0.)()
= E{[X – E(X) + Y – E(Y)]2}
=E{[(X – E(X)]2 + [Y – E(Y)]2 + 2.[(X – E(X)].[(Y – E(Y)]}
=E{[(X – E(X)]2 + E[Y – E(Y)]2 + E{[2.(X – E(X)].[(Y – E(Y)]}}
=D(X) + D(Y) + E[2.(X – E(X)).(Y – E(Y))]
Do X và Y độc lập, nên X – E(X) và Y – E(Y) cũng độc lập nhau Và do đó:
E{2.[(X – E(X)].[(Y – E(Y)]} = 2.E[X – E(X)] E[Y – E(Y)] = 2 * 0 * 0 = 0
Vậy: D(X+Y) = D(X) + D(Y)
2.4.3 Mod (Mode)
Định nghĩa 2.10: Mod (hay Yếu vị) của ĐLNN X, ký hiệu Mod(X) (hay Mod X), là:
- Giá trị x i có xác suất p i lớn nhất nếu X là ĐLNN rời rạc có bảng phân phối xác xuất sau:
Trang 3030
X x1 x2 …… x n
P p1 p2 …… p n
- Giá trị x m tại đó hàm mật độ f(x) đạt cực đại nếu X là ĐLNN liên tục có hàm mật độ f(x)
Ví dụ 2.10: Cho ĐLNN rời rạc X có bảng phân phối xác suất:
Định nghĩa 2.11: Med (hay Trung vị) của ĐLNN X, ký hiệu Med(X) (hay Med X), là giá trị m mà
tại đó xác suất được chia phân phối thành 2 nửa xấp xỉ nhau, tức:
Ví dụ 2.11: Cũng với ví dụ 2.10 trên, thì Med(X)=4,
vì: P(X<4) = P(X=1) + P(X=2) + P(X=3) =
2
116
78
14
116
và: P(X>4) = P(X=5) + P(X=6) =
2
116
38
116
1
Vậy ở đây có ModX = MedX = 4
Ví dụ 2.12: Cho ĐLNN rời rạc Y có bảng phân phối xác suất:
Dễ dàng thấy Mod Y=1 và Mod Y= 2, do P(Y=1) = P(Y=2)=
83
Và do P(Y<1)= P(Y=0) =
8
1
2
1
, nên có Med Y = 1
nên Med Y = k với 1k 2
Hay Med Y [1, 2]
Ví dụ 2.13: Cho X là ĐLNN liên tục có hàm mật độ f(x) =
22
vậy Med X = 0
Trang 3131
* Chú ý:
i) Một ĐLNN có thể có nhiều Mod và Med (tức Mod và Med không có tính duy nhất)
ii) Nếu m 1 và m 2 cùng là Med của X m[m1,m2], m cũng là Med của X
2.4.5 Hiệp phương sai (Covariance)
Định nghĩa 2.12:
Cho 2 ĐLNN X, Y có E(X), E(Y) hữu hạn, khi đó hiệp phương sai hay Covariance của X và Y,
ký hiệu Cov(X, Y), là giá trị kỳ vọng xác định như sau:
Cov(X,Y) = E[(X – EX).(Y – EY)] = E[X.Y – E(X).E(Y)] = E(X.Y) – E(X).E(Y)
(
)()
().()()
(
),(
Y D X D
Y E X E Y X E Y X
Y X Cov
được gọi là hệ số tương quan của X và Y
* Các hình thức của hệ số tương quan:
Nếu r = 0: X, Y được gọi là không tương quan nhau
Nếu 0 < r < 1: X, Y tương quan thuận
Nếu r = 1: X, Y tương quan tuyến tính thuận
Nếu -1< r < 0: X, Y tương quan nghịch
Nếu r = -1: X, Y tương quan tuyến tính nghịch
* Nhận xét 1: X, Y độc lập nhau X, Y không tương quan
(
)()
().(
Y D X D
Y E X E Y X
Trong khi P(X=0, Y=0) =0
0 = P(X=0, Y=0) ≠ P(X=0) = P(Y=0) =
41
Vậy X, Y không độc lập nhau
* Bổ đề Cauchy: Cho X, Y là 2 ĐLNN Khi đó:
Trang 3232
i) [E(X.Y)]2 E(X2).E(Y2)
ii) [E(X.Y)]2 = E(X2).E(Y2) aR: X = aY
Khi đó ’ = 0, phương trình g() = 0 có nghiệm kép 1=2= a Vậy g(a) =E(X – aY)2
= 0 () (X – aY) = 0X = aY
i) Với a = E(X), b = E(Y)
Khi đó : E[(X – a)(Y – b)] = E(X.Y) – E(X).E(Y) (1)
Trang 33- Mỗi phép thử chỉ quan tâm đến kết quả A hay A xảy ra
- Xác xuất để A xảy ra trong mỗi phép thử là một hằng số (P(A)= const)
Ví dụ 3.1: Người ta thực hiện kiểm tra ngẫu nhiên 10 sản phẩm trong số 100 sản phẩm Hỏi 10 phép thử đó có thỏa lược đồ Bernoulli không, nếu:
a) Kiểm tra theo phương pháp chọn lặp
b) Kiểm tra theo phương pháp không chọn lặp
Trả lời:
3.1.2 Định nghĩa:
Gọi X là số lần biến cố A xuất hiện trong n phép thử thỏa lược đồ Bernoulli, thì X được gọi là
ĐLNN rời rạc có phân phối nhị thức (Binomial Distribution)
Ký hiệu: X ~ B(n, p), p = P(A)
n p q C k X
k
k k
k n k k
n p q C k
X k
Gọi X i là số lần biến cố A xuất hiện trong phép thử thứ i (trong n phép thử thỏa lược đồ
Bernoulli), bảng phân phối X i như sau:
Trang 34P(x=2) =
1 2 2 3
6
56
6
56
C
C C k X P
4 39 3
13.)3(
C
C C X
k n M N k M n
N
k n M N k M
C
C C X
E C
C C k
X
P
0)(
.)
C
C
n N
k n M N
k n M N k
M n
Trang 35n N M M
C C
n
N n N n
M n
C C
n M N n
1 ) 1 ( ) 1 ( 1
l
M
ii) Tính: E(X2)=
)1(
)1()
1(
)1)(
n n M N
nM N
N
n M nM
M n N
n N N
M n N
N
n n M
11
)1(
)1
2
3.2.3 Quan hệ giữa phân phối siêu bội và phân phối nhị thức:
Cho X ~ H(N, M, n), trong trường hợp N quá lớn và n rất nhỏ so với N (n « N), thì có thể xấp
xỉ về X B(n, p) với p =
N M
3.3 PHÂN PHỐI POISSON
k
e k X P
1) Gọi X là số tàu cập bến trong ngày, khi đó: X ~ P(5)
Tra bảng phân phối Poisson P(X=k) với =5 và k=3 => P(X=3) = 0,1404
2) Áp dụng P(XA) = 1 – P(X A)
Tra bảng phân phối Poisson P(Xk) với = 5 và k = 3 => P(X3) = 0,2650
Vậy P(X4) = 1 – P(X3) = 1 – 0,2650 = 0,7350
3.3.2 Các đặc trƣng
Trang 36k k
k k
e k k
3.3.3 Quan hệ giữa phân phối Poisson và phân phối nhị thức:
* Cho X ~ B(n, p) Khi n quá lớn và p khá bé, có thể xấp xỉ XP() với =np
Ví dụ 3.5: Một người tập bắn có xác xuất bắn trúng đích là p=0,001 Khi thực hiện đợt bắn 5000 phát Tính xác xuất để có ít nhất 2 phát trúng đích
Giải:
Gọi X là số phát bắn trúng đích trong 5000 phát bắn, khi đó:
X ~ B(5000; 0,001), vậy n = 5000 quá lớn và p = 0,001 khá bé
nên có thể xấp xỉ X P() với = np = 5000*0,001 = 5
P(X2) = 1 – P(X1) = 1 – 0,0404 = 0,9596 (tra bảng PP Poisson P(Xk) với =5 và k =1)
* X~B(n, p) Nếu n quá lớn và p cũng khá lớn (gần 1), cũng có thể dùng phân phối Poisson để tính
gần đúng P(X=k)
Thật vậy, nếu gọi Y là số lần A xuất hiện trong n phép thử
Do: P( A ) =1 – P(X=A) = 1– p = q, nên: Y ~ B(n, q)
Trang 3737
Ví dụ 3.7: Trong một hãng sản xuất đĩa nhạc, trung bình cứ sản xuất 1000 đĩa thì có một đĩa lỗi Tìm xác xuất để khi hãng đó sản xuất 6000 thì có không quá 7 đĩa lỗi
Giải:
Gọi X là số đĩa nhạc không bị lỗi khi sản xuất 6000 đĩa,
Và Y là số đĩa nhạc bị lỗi khi sản xuất 6000 đĩa
P(X>7) = P(Y7) = 0,744 (tra bảng PP Poisson P(Xk) với = 6, k=7)
3.4 PHÂN PHỐI CHUẨN
Khi X ~ N(0, 1), X được gọi là có phân phối chuẩn tắc (hay chuẩn hóa: Standard Normal Dist.)
Định lý 3.4: (Đưa phân phối chuẩn về phân phối chuẩn tắc)
Vậy: Z ~ N(0, 1)
Trang 382 2
2
2 2
e xe
Trang 39
(x), F(x) chính là hàm mật độ và hàm phân phối xác suất của ĐLNN X ~ N(0, 1)
Trang 40n
i i n
2
2 1