(NB) Tài liệu giảng dạy môn Xác suất thống kê y học cung cấp cho người học những kiến thức về: Xác suất - công thức tính xác suất; biến ngẫu nhiên, véc tơ ngẫu nhiên; mẫu ngẫu nhiên và các quy luật phân phối mẫu; ước lượng tham số tổng thể; kiểm định giả thiết thống kê; phân tích hồi quy và tương quan.Mời các bạn cùng tham khảo để biết thêm các nội dung chi tiết.
Trang 1TRƯỜNG ĐẠI HỌC TRÀ VINH
KHOA KHOA HỌC CƠ BẢN
BỘ MÔN TOÁN
TÀI LIỆU GIẢNG DẠY
MÔN XÁC SUẤT THỐNG KÊ
Y HỌC
GV biên soạn: Lý Thành Tiến
Trà vinh, năm 2015 Lưu hành nội bộ
Trang 3MỤC LỤC
Nội dung Trang
CHƯƠNG I: XÁC SUÁT- CÔNG THỨC TÍNH XÁC SUẤT 4
I SƠ LƯỢC VỀ LÝ THUYẾT TẬP HỢP, TỔ HỢP 4
1 Tập hợp 4
2 Giải tích tổ hợp 5
II ĐỊNH NGHĨA, CÔNG THỨC TÍNH XÁC SUẤT 6
1 Biến cố ngẫu nhiên và các phép toán trên biến cố ngẫu nhiên 6
2 Hệ đầy đủ các biến cố 8
3 Các định nghĩa xác suất 8
4 Các công thức tính xác suất 11
5 Xác suất trong chẩn đoán 14
Bài tập củng cố chương I 15
CHƯƠNG II: BIẾN NGẪU NHIÊN, VÉC TƠ NGẪU NHIÊN 19
I ĐỊNH NGHĨA VÀ HÀM PHÂN PHỐI XÁC SUẤT CỦA BIẾN NGẪU NHIÊN 19
1 Khái niệm biến ngẫu nhiên 19
2 Hàm phân phối xác suất của biến ngẫu nhiên 20
3 Các tính chất của hàm phân phối xác suất 21
II PHÂN PHỐI XÁC SUẤT RỜI RẠC VÀ PHÂN PHỐI XÁC SUẤT LIÊN TỤC 21
1 Phân phối xác suất rời rạc 21
2 Phân phối xác suất liên tục 24
III CÁC ĐẶC TRƯNG CỦA BIẾN NGẪU NHIÊN, HÀM ĐẶC TRƯNG 27
1 Kỳ vọng 27
2 Phương sai 28
3 Mod 28
4 Trung vị 28
5 Hàm đặc trưng của biến ngẫu nhiên 28
6 Các định lý 29
IV VÉC TƠ NGẪU NHIÊN 30
1 Định nghĩa véc tơ ngẫu nhiên 30
2 Phân phối xác suất của véc tơ ngẫu nhiên(X; Y) 30
Trang 43 Sự độc lập của các biến ngẫu nhiên 32
Bài tập củng cố chương II 33
CHƯƠNG III: MẪU NGẪU NHIÊN VÀ CÁC QUY LUẬT PHÂN PHỐI MẪU 37
I MẪU NGẪU NHIÊN VÀ CÁCH CHỌN MẪU 37
1 Đám đông(tổng thể) 37
2 Mẫu ngẫu nhiên 37
3 Các phương pháp chọn mẫu ngẫu nhiên 38
4 Cách ghi số liệu(mẫu quan sát) 38
5 Bản tần suất 39
6 Phân phối mẫu tích lũy 40
7 Định lý giới hạn trung tâm 40
II CÁC ĐẶC TRƯNG MẪU VÀ QUY LUẬT PHÂN PHỐI MẪU 41
1 Thống kê mô tả( các đặc trưng mẫu) 41
2 Trung bình mẫu và quy luật phân phối 41
3 Phương sai mẫu và quy luật phân phối 42
4 Một số thống kê khác 44
5 Phân vị chuẩn 45
Bài tập củng cố chương III 46
CHƯƠNG IV: ƯỚC LƯỢNG THAM SỐ TỔNG THỂ 48
I ƯỚC LƯỢNG ĐIỂM 48
1 Khái niệm về ước lượng điểm 48
2 Phương pháp ước lượng 49
II KHOẢNG ƯỚC LƯỢNG 49
1 Khoảng ước lượng( khoảng tin cậy) 50
2 Khoảng ước lượng cho trung bình 50
3 Khoảng ước lượng cho tỉ lệ p 51
4 Khoảng ước lượng cho phương sai của phân phối chuẩn 2 52
Bài tập củng cố chương IV 53
CHƯƠNG V: KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ 56
I KIỂM ĐỊNH GIẢ THIẾT THAM SỐ 56
1 Khái niệm về kiểm định giả thiết tham số tổng thể 56
2 Kiểm định trung bình () của tổng thể 57
3 Kiểm định tỉ lệ (p) của tổng thể 70
Trang 54 Kiểm định phương sai ( )của tổng thể 2 73
II KIỂM ĐỊNH GIẢ THIẾT PHI THAM SỐ 75
1 Kiểm định sự phù hợp của quy luật phân phối xác suất 75
2 Kiểm định sự độc lập của hai đặc tính 76
3 Kiểm định sự thuẩn nhất của luật phân phối 78
Bài tập củng cố chương V 80
CHƯƠNG VI: PHÂN TÍCH HỒI QUY VÀ TƯƠNG QUAN 84
I HỆ SỐ TƯƠNG QUAN VÀ PHƯƠNG TRÌNH HỒI QUY 86
1 Khái niệm tương quan và hồi quy 86
2 Hệ số tương quan 86
3 Phương trình hồi quy tuyến tính 87
II KIỂM ĐỊNH HỆ SỐ TƯƠNG QUAN VÀ SỰ PHÙ HỢP CỦA PHƯƠNG TRÌNH HỒI QUY 88
1 Kiểm định hệ số tương quan 88
2 Kiểm định sự phù hợp của phương trình hồi quy 89
3 Kiểm định giá trị của hệ số a 91
4 Khoảng ước ượng cho giá trị dự báo của phương trình hồi quy 91
Bài tập củng cố chương VI 92
Phụ lục 94
Tài liệu tham khảo 101
Trang 6
CHƯƠNG I XÁC SUẤT-CÔNG THỨC TÍNH XÁC SUẤT
Mục tiêu học tập: Sau khi học xong bài này, người học có thể:
* Tính được xác suất bằng định nghĩa
* Phân biệt được các công thức tính xác suất và vận dụng chúng phù hợp
* Phân tích và giải được bài toán xác suất trong chẩn đoán
I SƠ LƯỢC VỀ LÝ THUYẾT TẬP HỢP, TỔ HỢP
0362
x
nghiệm của hai bất phương trình x2360 và x7 0
Trang 7Phép hợp và phép giao trên tập hợp có một số tính chất cơ bản sau:
2.1 Hoán vị: Cho tập hợp gồm n phần tử (n>0), ta cần sắp xếp n phần tử vào n vị trí Mỗi một
cách (kết quả) sắp xếp gọi là một hoán vị Số hoán vị (kết quả sắp xếp): p(n)=n!=n.(n-1)…2.1
2.2 Chỉnh hợp không lặp: Cho tập hợp gồm n phần tử (n>0), ta sắp xếp các phần tử của tập
hợp vào k vị trí (0<k n) (Mỗi vị trí chứa một phần tử,mỗi phần tử chỉ xuất hiện một lần trong sắp xếp) Mỗi một cách (kết quả) sắp xếp gọi là một chỉnh hợp không lặp chập k của n phần tử
n
An k
2.3 Chỉnh hợp lặp: Cho tập hợp gồm n phần tử (n>0), ta sắp xếp các phần tử của tập hợp vào
k vị trí (0<k) (Mỗi vị trí chứa một phần tử,mỗi phần tử có thể xuất hiện nhiều lần trong sắp xếp) Mỗi một cách (kết quả) sắp xếp gọi là một chỉnh hợp lặp chập k của n phần tử Số chỉnh hợp (kết quả sắp xếp):
k k
n n
A ~
2.4 Tổ hợp: Cho tập hợp gồm n phần tử (n>0), lấy ra k phần tử (0<k n) Mỗi một cách (kết
quả) lấy gọi là một tổ hợp chập k của n phần tử Số tổ hợp (kết quả lấy):
)!
(
!
k n k
n
Cn k
2.5 Quy tắc nhân: Cho tập hợp gồm n phần tử (n > 0), ta sắp xếp các phần tử của tập hợp vào
k vị trí (0 < k) (Mỗi vị trí chứa một phần tử,mỗi phần tử có thể xuất hiện nhiều lần trong sắp xếp)
Trang 82.6 Quy tắc cộng: Giả sử một công việc có k trường hợp thực hiện khác nhau đều thỏa yêu cầu
Trường hợp 1 có n 1 cách thực hiện, trường hợp 2 có n 2 cách thực hiện, , trường hợp k có n k
cách thực hiện Khi đó, số cách thực hiện công việc là: n1 n2 nk
II ĐỊNH NGHĨA, CÔNG THỨC TÍNH XÁC SUẤT
1 Biến cố ngẫu nhiên và các phép toán trên biến cố ngẫu nhiên
1.1 Đặt vấn đề
Trong thực tế cho thấy có rất nhiều thí nghiệm khi tiến hành nhiều lần trong cùng điều kiện ban đầu nhưng không dẫn đến cùng kết quả Chẳng hạn khi tung một con xúc xắc xem như thực hiện một thí nghiệm, khi đó ta không thể đoán trước được chắc chắn kết quả xuất hiện là mặt mấy chấm
Những hiện tượng khi biết trước các điều kiện ban đầu mà ta không thể xác định chắc chắn kết quả xảy ra của nó gọi là hiện tượng ngẫu nhiên hay phép thử ngẫu nhiên
Ví dụ 1.4: Lượng mưa trong năm; đầu tư vào một dự án; tham gia một kỳ thi tuyển sinh;
kinh doanh một mặt hàng nào đó; điều trị cho một bệnh nhân;… là các hiện tượng ngẫu nhiên
1.2 Biến cố ngẫu nhiên, Không gian biến cố sơ cấp
* Không gian các biến cố sơ cấp ={e1; e2; e3; e4; e5;e6}
Ví dụ 1.6: Khi gieo một hạt giống Gọi N là kết quả nảy mầm; K là kết quả không nảy mầm
Khi đó: * Phép thử này có 2 biến cố sơ cấp : N; K
* Không gian các biến cố sơ cấp ={N; K}
1.2.2 Biến cố ngẫu nhiên(gọi tắt là biến cố)
Với một phép thử ngẫu nhiên, mỗi sự kiện mà ta không thể khẳng định chắc chắn nó xảy ra hay không xảy ra gọi là biến cố ngẫu nhiên Biến cố ngẫu nhiên thường kí hiệu: A, B, C, D, …
Ví dụ 1.7: Khi gieo một con xúc xắc Gọi A là sự kiện mặt chẵn xuất hiện; B là sự kiện mặt
lẻ xuất hiện; C là sự kiện mặt chia hết cho 3 xuất hiện; …
Khi đó: A, B, C, … là các biến cố ngẫu nhiên
Trang 9Chú ý: Cũng có thể hiểu biến cố ngẫu nhiên là tập hợp gồm một số biến cố sơ cấp Do đó
biến cố ngẫu nhiên là tập hợp con của
Ví dụ 1.8: Chọn các mệnh đề đúng trong các mệnh đề sau
a) Biến cố ngẫu nhiên là sự kiện luôn xảy ra trong phép thử ngẫu nhiên
b) Phép thử ngẫu nhiên là biến cố ngẫu nhiên
c) Biến cố sơ cấp là biến cố ngẫu nhiên
d) Biến cố ngẫu nhiên là phép thử ngẫu nhiên
1.2.3 Biến cố chắc chắn, biến cố không thể
Biến cố nào mà luôn xảy ra trong phép thử gọi là biến cố chắc chắn(kí hiệu ); Biến cố nào
mà không thể xảy ra trong phép thử gọi là biến cố không thể(Kí hiệu )
1.3 Các phép toán trên biến cố
1.3.1 Qan hệ giữa các biến cố
* Biến cố A được gọi là kéo theo biến cố B(kí hiệu A B) nếu A xảy ra kéo theo B cũng xảy ra
* Biến cố A và B được gọi là bằng nhau( kí hiệu AB) nếu A kéo theo B và B kéo theo A
Ví dụ 1.9: Hộp 1 gồm 10 viên bi, trong đó có 4 bi màu đỏ(D1, D2, D3, D4), 6 bi màu xanh(X1, X2, X3, X4, X5, X6); hộp 2 gồm 8 viên bi, trong đó có 3 bi màu đỏ(D1, D2, D3), 5 bi màu xanh(X1, X2, X3, X4, X5) Lấy ngẫu nhiên mỗi hộp ra 1 bi
Gọi A là biến cố lấy được bi đỏ ở H1, bi xanh ở H2; B là biến cố lấy được hai bi đỏ; C là biến cố lấy được hai bi cùng màu; D là biến cố lấy được hai bi khác màu
* Các kết quả sau, kết quả nào đúng :
a) Nếu A xảy ra thì D xảy ra b) Nếu D xảy ra thì A xảy ra c) Nếu B xảy ra thì C
1.3.2 Các phép toán: Cho A và B là hai biến cố ngẫu nhiên
a Phép cộng: Tổng của hai biến cố A và B, kí hiệu A B là biến cố xảy ra khi và chỉ khi ít
nhất một trong hai biến cố A, B xảy ra
b Phép nhân: Tích của hai biến cố A và B, kí hiệu A B là biến cố xảy ra khi và chỉ khi
hai biến cố A, B đồng thời xảy ra
Trang 10c Phép trừ: Hiệu của hai biến cố A và B, kí hiệu A\B là biến cố xảy ra khi và chỉ khi biến
cố A xảy ra mà biến cố B không xảy ra
1.3.3 Định nghĩa :
* Ta gọi A = \ A là biến cố đối lập của biến cố A
* Hai biến cố A, B được gọi là xung khắc nếu A B=(A, B không đồng thời xảy ra)
Chú ý: Những tính chất của phép cộng, nhân và trừ giống như các tính chất của phép hợp,
giao và hiệu của lý thuyết tập hợp
Ví dụ 1.10: Hộp 1 gồm 10 lọ thuốc, trong đó có 2 lọ không đạt chuẩn, 8 lọ tốt; hộp 2 gồm
10 lọ thuốc, trong đó có 1 lọ không đạt chuẩn, 9 lọ tốt Lấy ngẫu nhiên mỗi hộp ra 1 lọ thuốc
Gọi A1 là biến cố lấy được lọ tốt ở H1, A2 là biến cố lấy được lọ tốt ở H2; A là biến cố lấy được 2 lọ tốt; B là biến cố lấy được 1 lọ tốt, 1 lọ kém phẩm chất
Đáp án nào đúng, đáp án nào sai:
Ví dụ 1.11: Gieo đồng thời 2 đồng tiền gồm hai mặt S, N
Gọi NN là biến cố hai đồng tiền xuất hiện mặt ngữa
SS là biến cố hai đồng tiền xuất hiện mặt sấp
SN là biến cố đồng tiền thứ nhất xuất hiện mặt sấp, đồng tiền thứ 2 xuất hiện mặt ngữa
NS là biến cố đồng tiền thứ nhất xuất hiện mặt ngữa, đồng tiền thứ 2 xuất hiện mặt sấp
3.1 Định nghĩa xác suất cổ điển
Định nghĩa: Với không gian biến cố sơ cấp hữu hạn phần tử, các biến cố sơ cấp đồng khả năng A là một biến cố trong không gian Khi đó xác suất (khả năng) biến cố A xảy ra
được xác định : P(A)=
)(
)(
n A n
Trang 11Trong đó:
* n ( A ) là số biến cố sơ cấp (kết quả) có trong A( Số kết quả thuận lợi cho A xảy ra)
* n ( ) là số biến cố sơ cấp (kết quả) của không gian (Số kết quả có thể xảy ra của phép thử)
Ví dụ 1.12: Tung một con xúc xắc cân đối và đồng chất
Gọi ei là biến cố xuất hiện mặt i chấm(i=1,2,…, 6)
A là biến cố xuất hiện mặt chẵn
B là biến cố xuất hiện mặt chia hết cho 3
* A={e2, e4, e6}: có 3 kết quả (biến cố sơ cấp) thuận lợi cho A xảy ra
* B={e3, e6}: có 2 kết quả (biến cố sơ cấp) thuận lợi cho B xảy ra
* ={e1; e2; e3; e4; e5;e6}: Có 6 kết quả (biến cố sơ cấp) có thể xảy ra
6
3)(
)()
6
2)(
)()
Ví dụ 1.13:
1) Một đợt xổ số phát hành 106 vé số, trong đó có 1 giải đặc biệt (6 số); 10 giải nhất(5 số),
10 giải nhì(5 số), 20 giải ba(5 số); 70 giải tư(5 số); 100 giải năm(4 số); 300 giải sáu(4 số); 1000 Giải bảy(3 số); 10000 giải tám(2 số); 9 giải phụ đặc biết và 45 giải khuyến khích Một người mua ngẫu nhiên một tờ vé số Tìm xác suất để người đó:
a) Trúng giải đặc biệt; giải nhất; giải tư; giải tám
b) trúng số
2) Khi lai hai cây đậu có kiểu gen Aa Tính xác suất để thế hệ con mang kiểu gen:
a) aa b) AA c) Dị hợp tử d) đồng hợp tử
3) Một hộp gồm 5 bi trắng, 4 bi đỏ Từ hộp đó lấy ngẫu nhiên cùng ra 2 bi
a) Không gian biến cố sơ cấp có bao nhiêu phần tử
b) Gọi B là biến cố lấy được hai bi đỏ Tìm P(B)
c) Gọi C là biến cố lấy được hai bi khác màu Tìm P(C)
d) Gọi D là biến cố lấy được hai bi cùng màu Tìm P(D)
3.2 Định nghĩa xác suất tần suất
Qua định nghĩa ở mục 3.1 ta thấy nó đòi hỏi không gian biến cố sơ cấp hữu hạn phần tử
và lại đồng khả năng Vì vậy để khắc phục nhược điểm đó ta xét định nghĩa sau:
Trang 12Giả sử một phép thử có thể lặp lại n lần độc lập, trong đó biến cố A xuất hiện m lần trong n lần thực hiện phép thử Khi đó ta gọi f =
n
m là tần suất xuất hiện biến cố A Người ta kiểm
chứng được khi số lần lặp n càng lớn thì tỉ số
n
m tiến về một giá trị cố định p nào đó,
Ví dụ 1.14: Nhà toán học Pearson và Buffon đã làm thực nghiệm gieo nhiều lần một đồng
tiền cân đối và đồng chất kết quả được ghi lại như sau:
Người làm thí nghiệm Số lần gieo Số lần xuất hiện mặt ngữa
f=
n m
Với bảng thực nghiệm trên cho thấy xác suất để mặt ngữa xuất hiện là p = 0.5
Định nghĩa: Khi số lần lặp n của phép thử càng lớn, tần suất
Ví dụ 1.15: Để biết xác suât bắn trúng mục tiêu của một xạ thủ là bao nhiêu, người ta tiến
hành cho xạ thủ đó bắn n viên đủ lớn(mỗi lần bắn xem như thực hiện một phép thử), sau đó ghi nhận số viên đạn trúng mục tiêu (giả sử m viên trúng mục tiêu)
* Nếu là đường cong hay đường thẳng thì độ đo của là chiều dài
* Nếu là hình phẳng thì độ đo của là diện tích
* Nếu là hình khối thì độ đo của là thể tích
Trang 13Ví dụ 1.16: 1) Cho đường tròn (C) ngoại tiếp tam giác đều ABC cạnh a lấy ngẫu nhiên một
điểm M rơi vào hình tròn Tìm xác suất điểm M rơi vào miền trong tam giác ABC
2) Hai người hẹn gặp nhau tại một địa điểm từ 7 giờ đến 7 giờ 30 phút Với quy ước người đến trước đợi người đến sau 5 phút, nếu quá 5 phút mà người thứ hai chưa đến thì người đến trước bỏ đi, cuộc hẹn thất bại Tính xác suất cuộc hẹn thành công
Giải 1) Gọi A là biến cố điểm M rơi vào miền trong tam giá ABC
2
2 ( )
34( ) 0, 4135
3.3
ABC C
a S
2) Gọi x, y lần lượt là thời điểm của người thứ nhất, người thứ hai đến điểm hẹn
Gọi A là biến cố cuộc hẹn thành công
()1(
)(
)(
)()
1 1
1 1
n n
n l j k
l j k n
j k
j k n
k k n
k n
k
k P A A
P
1 1
)()
(
* Với hai biến cố A, B: P(A B)=P(A)+P(B)-P(A B)
P(A B)=P(A)+P(B), (Với A, B xung khắc)
* Với ba biến cố A, B, C:
P(A B C)=P(A)+P(B)+P(C)-P(A B)-(A C)-P(B C)+P(A B C)
P(A B C)=P(A)+P(B)+P(C), (Với A, B, C đôi một xung khắc)
Ví dụ 1.17: Từ một hộp gồm 3 bi trắng, 5 bi đỏ lấy ngẫu nhiên cùng lúc ra 3 bi
Gọi A là biến cố lấy được 2 đỏ, 1 trắng; B là biến cố lấy được 2 trắng, 1 đỏ
Tìm P(A), P(B), P(A B)
Trang 14Giải
* P(A) = 0,5357; P(B) = 0,2679; P(A B) = P(A) + P(B) = 0,8036 (A, B xung khắc)
4.2 Xác suất có điều kiện, công thức nhân
4.2.1 Xác suất điều kiện
Ví dụ 1.18: Từ bộ bài Lutukhơ(52 lá), rút ngẫu nhiên ra 1 lá
Gọi A là biến cố rút được lá hai; B là biến cố rút được lá màu đỏ
4
, P(B) =
2
152
26
26
152
2)
(
)(
)
B n
B A n B A
P
* Ta gọi P ( B A ) là xác suất của biến cố A với điều kiện biến cố B đã xảy ra và nó được tính
bởi công thức:
)(
)(
)(
)(
)(
B P
B A P B
n
B A n B A
k
A P
1 1
) ( )
Chú ý: * Nếu hai biến cố A, B xung khắc thì ta có thể sử dụng kí hiệu A+B thay cho
A B
* Nếu hai biến cố A, B độc lập ta có thể sử dụng kí hiệu A.B thay cho A B
4.3 Công thức xác suất đầy đủ và công thức Bayes
Trong không gian cho hệ đầy đủ các biến cố A1, A2,…, An , A là một biến cố bất
kỳ của , Khi đó ta có:
Trang 15a) P ( A ) P ( A1) P ( A A1) P ( A2) P ( A A2) P ( An) P ( A An)
(Công thức xác suất đầy đủ)
b) Nếu P(A)0 thì
)(
)()()(
A P
A A P A P A A
Chứng minh a) Ta có:
b) Ta có:
)(
)()()
(
)(
)(
A P
A A P A P A
P
A A P A A
Ví dụ 1.19: 1) Từ một hộp gồm 10 bi trắng, 5 bi đỏ, lấy lần lượt không hoàn lại ra 2 bi
a) Tính xác suất 2 bi lấy ra cùng màu đỏ
b) Tính xác suất 2 bi lấy ra khác màu nhau
2) Có hai lô sản phẩm, lô 1 có 100 sản phẩm trong đó có 10 phế phẩm; lô 2 có 90 sản phẩm trong đó có 5 phế phẩm
a) Lấy ngẫu nhiên mỗi lô 1 sản phẩm Tìm xác suất trong 2 sản phẩm lấy ra có 1 phế phẩm
b) Chọn ngẫu nhiên 1 lô, rồi từ lô đó lấy ngẫu nhiên ra 2 sản phẩm Tìm xác suất trong 2 sản phẩm lấy ra có 1 phế phẩm
Giải 1) a) Gọi A là biến cố lấy được hai bi cùng màu
Ai là biến cố lấy được bi trắng ở lần thứ i(i=1,2)
2) a) Gọi A là biến cố lấy được một phế phẩm trong hai sản phẩm lấy ra
Ai là biến cố lấy được phế phẩm từ lô thứ i(i=1,2)
( ) ( ) ( ) ( ) ( ) ( )
P A P A A A A P A P A P A P A =0,14444
Trang 16b) Bi là biến cố 2 sản phẩm lấy ra thuộc lô thứ i(i=1,2)
( ) ( ) ( ) ( ) ( ) 0,14397
P A P B P A B P B P A B
4.4 Công thức xác suất nhị thức(công thức Bernoulli)
Cho n phép thử độc lập(kết quả xảy ra hay không xảy ra của phép thử này không ảnh hưởng đến kết quả xảy ra hay không xảy ra của phép thử khác), mỗi phép thử ta chỉ quan tâm đến hai biến cố A và A và P(A) =p (không đổi với mỗi phép thử)
Xác suất để biến cố A xuất hiện k lần trong n lần thực hiện phép thử được xác định:
Pn(k; A)=C n k p k(1 )p nk , k = 0, 1, 2, …,n
Chứng minh Gọi B là biến cố trong n lần thực hiện phép thử có k lần biến cố A xảy ra
([)]
([)]
([)
k n k
k
n p p C
5 Xác suất trong chẩn đoán
Định nghĩa: Giả sử T là một xét nghiệm, T+: dương tính; T-: âm tính; B: mắc bệnh
* Độ nhạy của xét nghiệm: Độ nhạy của xét nghiệm là xác suất xét nghiệm T cho kết quả dương tính đối với người mắc bệnh: P T( B)
* Độ chuyên( độ đặc hiệu) của xét nghiệm: Là xác suất xét nghiệm T cho kết quả âm tính
đối với người không mắc bệnh: (P T B)
* Xác suất tiên nghiệm: Là xác suất chẩn đoán người xét nghiệm có bệnh (không có bệnh)
khi kết quả xét nghiệm T cho dương tính(âm tính ): P B T( ); P B T( )
Trang 17+ P B T( ): Còn gọi là giá trị đúng của phản ứng dương tính
+ P B T( ): Còn gọi là giá trị đúng của phản ứng âm tính
* Giá trị đúng của phản ứng(XN): là xác suất chẩn đoán đúng sau khi xét nghiệm cho kết
quả dương tính hay âm tính: P(Đ)= ( ) ( P B P T B)P B P T( ) ( B)
………
Bài Tập củng cố chương I
***************
1) Một phòng điều trị cho 3 bệnh nhân nặng A, B, C Trong 1 giờ xác suất để bệnh nhân A,
B, C cấp cứu tương ứng là 0,6; 0,7; 0,8 Tìm xác suất sao cho trong 1 giờ:
a) Cho ông A làm XN T, kết quả dương tính Tính khả năng ông A bị bệnh tiểu đường
b) Cho ông A làm tiếp xét nghiệm T/ (phương pháp thử máu), với độ nhạy 80%; độ chuyên 96%, kết quả cũng dương tính, khả năng ông A bị bệnh tiểu đường là bao nhiêu
3) Xác suất sinh con trai bằng 0,514 Ai có khả năng thực hiện mong muốn của mình hơn: a) Phụ nữ A mong muốn sinh bằng được con gái
b) Phụ nữ B mong muốn sinh bằng được con trai
4) Tại một bệnh viện , tỉ lệ mắc bệnh B là 0,1 để chẩn đoán xác định, người ta làm phản ứng miễn dịch, nếu khẳng định có bệnh thì đúng 50%, nếu người không bị bệnh thì sai 10%
a) Tìm xác suất dương tính của nhóm bị bệnh
b) Tìm giá trị đúng của chẩn đoán miễn dịch
5) Khi chẩn đoán bệnh B, một phản ứng có xác suất dương tính là 75% Nếu phản ứng dương tính thì đúng 9/10 trường hợp Giá trị của phản ứng âm tính là 50% Một người được chẩn đoán đúng Khả năng người đó bị bệnh là bao nhiêu; Tìm xác suất người đó kết quả XN
âm tính
6) Khám bệnh ngoài da cho các cháu tại một nhà trẻ, các bác sĩ thấy 70% trẻ mắc bệnh A, 50% trẻ mắc bệnh B
Trang 18Dùng thuốc T1 chữa trị, xác suất khỏi bệnh A là 80%; bệnh B là 50%; cả 2 bệnh là 35%
Dùng thuốc T2 chữa trị, xác suất khỏi bệnh A là 60%; bệnh B là 80%; cả 2 bệnh là 30%
Biết rằng giá thuốc và khối lượng thuốc chữa trị là như nhau Nên dùng thuốc thế nào để chữa trị cho các cháu
7) Một Xét nghiệm T(phân tích nước tiểu) dùng để chẩn đoán bệnh tiểu đường Để xác định
độ nhạy và độ chuyên của xét nghiệm T này, người ta tiến hành làm một bảng test kết quả như sau: Trong 150 người bị bệnh tiểu đường cho làm xét nghiệm T thì thấy có 138 người cho kết quả dương tính; Trong 200 người không bị bệnh tiểu đường cho làm xét nghiệm T thì có 30 người cho kết quả dương tính(dương giả)
a) Xác định độ nhạy; độ chuyên và giá trị đúng của xét nghiệm dương tính, âm tính
b) Bằng phương pháp thử máu T/ có độ nhạy 0,8; độ chuyên 0,96 đem áp dụng cho hai nhóm trên thì giá trị đúng của xét nghiệm âm tính, dương tính là bao nhiêu
c) Một người đến làm xét nghiệm T có kết quả dương tính, và tiếp tục làm xét nghiệm T/cũng cho kết quả dương tính Vậy khả năng người này bị tiểu đường là bao nhiêu %
8) Tỉ lệ mắc bệnh X của lô chuột thứ nhất (LI) là 0,1; Ở lô chuột thứ hai(LII) là 0,07
a) Bắt ngẫu nhiên 3 con chuột ở LI, tính xác suất có ít nhất một con bị mắc bệnh X; Phải bắt
ít nhất mấy con của LI để xác suất có ít nhất một con bị mắc bệnh X lớn hơn 0,9
b) Bắt ngẫu nhiên mỗi lô một con chuột, tính xác suất có ít nhất một con mắc bệnh X
c) Chọn ngẫu nhiên một lô, rồi từ lô đó bắt ngẫu nhiên ra hai con chuột, tính xác suất cả hai con đều mắc bệnh X
9) Bệnh A có 3 thể A1, A2, A3 với tỷ lệ 1/2; 1/6; 1/3 trong dân số, để chẩn đóan bệnh A ta dùng xét nghiệm E E cho dương tính 10% nếu là A1; 20% nếu là A2, 90% nếu là A3
a) Khi một người bị bệnh A đến khám thì khả năng E cho dương tính là bao nhiêu
b) Một người bị bệnh A khi dùng xét nghiệm E cho kết quả dương tính thì khả năng người này mắc bệnh A1; A2; A3 tương ứng là bao nhiêu %
10) Tỉ lệ viên thuốc bị sứt mẻ của máy dập A là 10%, lấy ngẫu nhiên 5 viên thuốc từ máy dập đó tính xác suất có ít nhất 1 viên bị sứt mẻ; Quan sát tối thiểu mấy viên để xác suất có ít nhất một viên bị sứt mẻ không dưới 95%
11)Có hai xét nghiệm(XN) để chẩn đoán bệnh K- vú T1(độ nhạy 90%; độ chuyên 80%),
T2(độ nhạy 80%; độ chuyên 90%)
a) Bà A đến khám bệnh, bác sĩ đánh giá khả năng bà A bị K- vú là 5% Cho bà A làm XN T1
có kết quả âm tính Sau đó cho bà A làm tiếp XN T2, kết quả cũng âm tính Nếu chẩn đoán bà
A không bị K- vú, khả năng đúng là bao nhiêu %?
Trang 19b) Bà B đến khám bệnh, bác sĩ đánh giá khả năng bà B bị K- vú là 10% Cho bà A làm XN
T1 có kết quả dương tính Sau đó cho bà B làm tiếp XN T2, kết quả cũng dương tính Nếu chẩn đoán bà B bị K- vú, khả năng đúng là bao nhiêu %?
12) Có hai xét nghiệm T1 và T2 dùng để chẩn đoán bệnh B; T1 có độ nhạy 93% và độ chuyên 95%; T2 có độ nhạy 97% và độ chuyên 90% T1 dùng để sàn lọc những người có nguy
cơ bị bệnh B; T2 dùng để chẩn đoán bệnh này trên những người mà T1 cho kết quả dương tính Một người đến từ dân số có tỷ lệ bệnh B là 0,001,
a) Cho người này làm xét nghiệm T1, kết quả T+ Tính xác suất người này mắc bệnh B
b) Cho làm tiếp xét nghiệm T2 cũng thấy dương tính Tính xác suất người này mắc bệnh B
13 Một bác sĩ chữa bệnh B, có xác suất chữa khỏi bệnh là 0,8 Có người cho rằng, cứ 5
người mắc bệnh B đến chữa thì chắc chắn có 4 người khỏi bệnh; người khác cho rằng cứ 10 người bị bệnh B đến chữa thì chắc chắn có 8 người khỏi bệnh Ai đúng, ai sai Tính hai xác suất trên
14 Người có nhóm máu AB có thể nhận bất kỳ nhóm máu nào Người có nhóm máu còn lại
có thể nhận máu của người có cùng nhóm máu với mình hoặc của người có nhóm máu O Tỉ lệ các nhóm máu O; A; B; AB của người Ê ĐÊ tương ứng bằng 0,24; 0,29; 0,32; 0,15 Chọn ngẫu nhiên một người nhận máu và một người cho máu của dân tộc trên Tính xác suất để sự truyền máu được thực hiện
15 Một phản ứng có độ nhạy bằng 0,7, giá trị âm tính bằng 0,875 và xác suất âm tính của nhóm sai bằng 0,25 Dùng phản ứng để chẩn đoán bệnh, tìm tỉ lệ bị bệnh
16 Cho biết xác suất sinh được con trai trong mỗi lần sinh là 0,514
a) Tính xác suất sinh được con trai trong 4 lần sinh Số lần sinh ít nhất bao nhiêu để xác suất sinh được con trai không nhỏ hơn 99%
b) Tỉ lệ cặp vợ chồng đã có 2 con không sinh nữa chiếm 70% Khảo sát ngẫu nhiên 30 cặp
vợ chồng đã có 2 con, Tính xác suất có 20 cặp không sinh nữa; 25 cặp không sinh nữa
17 Gọi E1 là sự kiện sinh đôi thật(hai trẻ luôn cùng giới); E2 là sự kiện sinh đôi giả(hai trẻ cùng giới hoặc khác giới) Nếu sinh đôi giả xác suất cùng giới 50%; tỉ lệ sinh đôi thật bằng p a) Tìm xác suất sinh đôi thật của nhóm cùng giới
b) Nếu 2 trẻ sinh đôi khác giới thì xác suất sinh đôi giả là bao nhiêu
18 Tỉ lệ X-quang cho dương tính là 20%, giá trị của X-quang dương tính là 25% Biết tỉ lệ
bị bệnh trong nhóm X- quang âm tính bằng 0,0125 Dùng X-quang chẩn đoán bệnh Tìm độ nhạy, độ đặc hiệu của X- quang
Trang 2019 Một người nghi mắc 1 trong 3 bệnh B1, B2, B3 Tỉ lệ mắc các bệnh B1, B2, B3 tương ứng bằng 0,4; 0,2; 0,4 Để chẩn đoán bệnh làm XN 3 lần: Nếu XN 2 lần dương tính, người ta chẩn đoán là B3; nếu XN 3 lần dương tính người ta chẩn đoán là B1 Hãy chứng tỏ rằng các chẩn đoán trên có xác suất đúng là lớn nhất Biết rằng xác suất dương tính đối với bệnh B1, B2, B3
tương ứng bằng 90%; 80%; 70%
**************************
Trang 21CHƯƠNG II BIẾN NGẪU NHIÊN, VÉCTƠ NGẪU NHIÊN
Mục tiêu học tập: Sau khi học xong bài này, người học có thể:
* Phân biệt được biến ngẫu nhiên với biến số thực
* Vận dụng được các quy luật phân phối xác suất để tính xác suất
* Áp dụng được các công thức tính kỳ vọng, phương sai, hệ số tương quan
* Giải được các bài toán liên quan đến biến ngẫu nhiên
I ĐỊNH NGHĨA VÀ HÀM PHÂN PHỐI XÁC SUẤT CỦA BIẾN NGẪU NHIÊN
1 Khái niệm biến ngẫu nhiên:
Ví dụ 2.1 : Tung 3 lần một đồng tiền cân đối và đồng chất Khi đó ta có = { NNN, NNS, NSN, SNN, NSS, SSN, SSS}
Trong đó: N là biến cố xuất hiện mặt ngửa trong mỗi lần tung
S là biến cố xuất hiện mặt sấp trong mỗi lần tung
Trên không gian ta xác định một hàm X lấy giá trị trên R như sau:
Như vậy tập giá trị của X ( ) : { 0, 1, 2, 3}
Trong ví dụ trên X được gọi là biến ngẫu nhiên và ta cũng thấy rằng:
Trang 22Định nghĩa: Biến ngẫu nhiên X là một hàm xác định trên không gian biến cố sơ cấp và nhận giá trị trong R sao cho xR tồn tại biến cố ngẫu nhiên A sao cho A = { : X ( ) < x}
* Biến ngẫu nhiên thường kí hiệu: X, Y, Z,…
* Giá trị của biến ngẫu nhiên kí hiệu: x, y, z, …
* Nếu không có gì nhầm lẫn thì X ( ) = x, đôi khi ta viết X = x
Ta có thể hiểu biến ngẫu nhiên là đại lượng nhận giá trị trong tập số thực R, phụ thuộc vào kết quả của phép thử
Ví dụ 2.2: Ta có X (SSS) = 0, ta có thể viết: X = 0, còn A = { : X ( ) < x}{ : X ( ) <
x} ta viết A = ( X < x)
Chú ý: Người ta chứng minh được rằng:
* Nếu X, Y là các biến ngẫu nhiên thì X - Y, X.Y, kX ( k là hằng số),
Y
X
cũng là các biến ngẫu nhiên
* Hơn nữa, một đa thức của biến ngẫu nhiên X: a x(a0,a1), hàm liên tục h (X) của biến ngẫu nhiên X cũng là biến ngẫu nhiên
Ví dụ 2.3: Hãy xác định các biến ngẫu nhiên cho các ví dụ sau; tìm miền giá trị của nó và
tính xác suất ứng với từng giá trị của nó
a) Bắn không hạn chế vào mục tiêu, bắn cho tới khi nào trúng mục tiêu thì dừng lại
b) Từ một hộp có 7 bi đỏ, 3 bi xanh và 10 bi vàng lấy lần lượt có hoàn lại 4 viên bi
2 Hàm phân phối xác suất của biến ngẫu nhiên:
Định nghĩa: Cho X là biến ngẫu nhiên, khi đó luôn tồn tại P(X < x), x R và ta gọi
F(x) = P(X < x) : là hàm phân phối xác suất của biến ngẫu nhiên X
Ví dụ 2.4: Bắn 3 viên đạn độc lập vào mục tiêu Gọi X là số vên đạn trúng đích Xác suất bắn
trúng mỗi viên là 0,6
+ X là biến ngẫu nhiên, tập giá trị: {0,1,2,3}
+ Không gian biến cố sơ cấp = A A A, A A A, A A A, A A A, A AA, A A A, AA , A AAA} (Trong đó A là biến cố bắn trúng đích)
Trang 23),2()1()0(
21
),1()0(
10
),0(
0),(
x X
P X
P X
P X
P X
P
x X
P X
P X
P
x X
P X
P
x X
3 Các tính chất hàm phân phối xác suất:
3.1 Tính chất 1: Hàm phân phối là hàm đơn điệu tăng
Chứng minh Vận dụng định nghĩa hàm số đơn điệu trên khoảng (a,b) để chứng minh
* Qua việc chứng minh tính chất 1, ta suy ra được: P( a X < b) = F(b) – F(a)
3.2 Tính chất 2: Hàm phân phối F(x) liên tục trái, nghĩa là lim
Chú ý: Người ta chứng minh được rằng: Nếu hàm F(x) nào đó có ba tính chất trên thì tồn tại
một biến ngẫu nhiên X nhận hàm F(x) làm hàm phân phối
Ví dụ 2.5: Giả sử X có hàm phân phối: F(x) =
10
,
0,0
x
x x
II) Phân phối xác suất rời rạc và phân phối xác suất liên tục:
1 Phân phối xác suất rời rạc: Biến ngẫu nhiên X được gọi là biến ngẫu nhiên rời rạc nếu tập
giá trị của X hữu hạn hoặc vô hạn đếm được
1.1.Bảng phân phối xác suất
Trang 24Cho X là biến ngẫu nhiên rời rạc nhận các giá trị: x1,x2, ,x n, với xác suất tương ứng như sau:
X x 1 x … 2 x … n
P(X = x ) i P 1 P … 2 P … n
Trong đó: P +1 P + … +2 P +… = 1 n
* Bảng trên được gọi là bảng phân phối xác suất của X
* Nếu x1< x2<…< xn<… thì hàm phân phối của X có dạng:
Ví dụ 2.6: Một gia đình có ba người con, giả sử xác suất sinh con trai là 0,514 Gọi X là số
con trai của gia đình đó Tìm bảng phân phối xác suất và hàm phân phối xác suất của X
Cho X là biến ngẫu nhiên rời rạc nhận các giá trị: x1,x2, ,x n, , hàm số f(x) được định
nghĩa: f(x) = P(X=x), x = x1, x2, …,xn, … được gọi là hàm mật độ xác suất của X
Chú ý: Bảng phân phối xác suất còn gọi là hàm mật độ xác suất cùa X dưới dạng bảng
00,115( ) 0, 479
0,8641
Trang 25Ví dụ 2.7: Bắn 5 viên đạn độc lập vào một mục tiêu (điều kiện như nhau), xác suất bắn
trúng mục tiêu của mỗi lần bắn là như nhau và bằng 0,2 Gọi X là số viên đạn bắn trúng mục
tiêu
a) Tìm bảng phân phối xác suất của X
b) Mục tiêu bị phá hủy nếu có ít nhất 3 viên đạn bắn trúng Tìm xác suất để mục tiêu bị phá hủy
1.3 Một số dạng phân phối rời rạc thông dụng
1.3.1 Phân phối nhị thức: Biến ngẫu nhiên X được gọi là có phân phối nhị thức nếu hàm mật
độ xác suất của nó có dạng: f(x)P(X x)C n x p x(1 p)nx,x0,1, ,n
Kí hiệu: X~B(n,p), n và p gọi là hai tham số của phân phối nhị thức
* Đặc biệt: Nếu n = 1 thì phân phối B(1,p) gọi là phân phối Bernouli
Chú ý: Khi tiến hành quan sát n phần tử, X là số phần tử có dấu hiệu A(với xác suất xảy ra
dấu hiệu A của mỗi phần tử là p) Khi đó X là biến ngẫu nhiên có luật phân phối Nhị thức
1.3.2 Phân phối poisson: Biến ngẫu nhiên X được gọi là có phân phối Poisson nếu hàm mật
độ xác suất của nó có dạng:
!)(
)
x e x x X P x f
x
, >0
Kí hiệu: X~P( ), gọi là tham số của phân phối Poisson
1.3.3 Mối liên hệ giữa phân phối nhị thức và phân phối Poisson
Định lý: Cho X có phân phối nhị thức B(n,p)
Nếu np n , pn 0 thì P(X x)C n x p x(1p)nx n
e x
x
!Chứng minh
x n x
x n
n n
x
x n n
n p
p C x X P
1()
1()
n P(X x) x!lim
x
n n
x n n
1(
x n
!
1
Trang 26* Như vậy khi n khá lớn, p khá nhỏ thì ta xấp xỉ
P(X x)C n x p x(1 p)n x
e x
a) Tìm phân phối xác suất của X, cho biết X thuộc dạng phân phối nào?
b) muốn mục tiêu bị phá hủy phải có ít nhất 3 viên đạn trúng mục tiêu Tìm xác suất để mục tiêu bị phá hủy
2) Một lô bóng đèn điện tử gồm 10000 bóng, xác suất để mỗi bong hỏng là 0,001 gọi X là
số bóng đèn hỏng của lô hàng
a) Xác định dạng phân phối xác suất của X
b) Tìm xác suất trong lô có đúng 3 bóng hỏng; ít nhất 4 bóng hỏng
2 Phân phối xác suất liên tục:
Biến ngẫu nhiên X được gọi là liên tục nếu tập giá trị của X là khoảng (a,b), a có thể là ,
b có thể là
2.1 Hàm mật độ xác suất
Cho X là biến ngẫu nhiên liên tục có hàm phân phối xác suất F(x) Hàm số f (x) được gọi
là hàm mật độ xác suất của X nếu nó thỏa mãn: F(x)=
x dt t
f( ) , x R
+ Tại những điểm x làm cho f(x) liên tục thì F ’ (x)=f(x)
+ Hàm mật độ xác suất của X tồn tại là duy nhất
Trang 27a) Tìm tham số m
b) Tìm hàm phân phối xác suất của X và tính P(0<X<1)
2.3 Một số dạng phân phối liên tục thông dụng
2.3.1 Phân phối chuẩn
Biến ngẫu nhiên X được gọi là có phân phối chuẩn nếu hàm mật độ xác suất của nó có dạng:
2 2 2 ) (
2
1)
Kí hiệu: X~N(,2), với ,2 gọi là hai tham số của phân phối chuẩn
* Đặc biệt: nếu 0,2 1 thì phân phối N(0;1) gọi là phân phối chuẩn tắc
2
2
1)(
x e x
Trang 281( )
1( )
Ví dụ 2.10: Điều tra ngẫu nhiên 10000 trẻ sơ sinh, xác suất sinh con trai bằng 0,514 Gọi X
là số trẻ trai.Tính xác suất để X thuộc khoảng 5000 đến 6000
Giải
* P(5000X 6000)0,5(2,8)0,50, 49740,9974
2.3.2 Phân phối Gamma và khi bình phương
Hàm Gamma: Hàm gamma được xác định:
* Áp dụng phương pháp tích phân từng phần ta có: (t1)t.(t), với t >0
Phân phối Gamma: Biến ngẫu nhiên X được gọi là có phân phối Gamma nếu hàm mật độ
x e x x
1)
Kí hiệu: X~G(,), với , gọi là hai tham số của phân phối Gamma
2.3.3 Phân phối khi bình phương: Phân phối khi bình phương là phân phối Gamma G(,),
1)
(
x r
r x e r
Trang 29Định lý: Nếu X~ 2(r), Y~ 2(s) và X, Y là hai biến ngẫu nhiên độc lập thì 2 XY là biến ngẫu nhiên có phân phối 2(r s)
Định lý: Nếu X1, X2, …, Xn là n biến ngẫu nhiên độc lập có phân phối N(0;1) thì
2 X12 + X22+ …+ Xn2 là biến ngẫu nhiên có phân phối 2(n)
2.3.4 Phân phối Student: Cho hai biến ngẫu nhiên độc lập X~N(0;1), Y~ 2(n), khi đó phân
phối của biến ngẫu nhiên T=
n Y
X
được gọi là phân phối Student
2 1 2
) 1 (
1 ) 2 (
) 2
1 ( )
n
n x
f
Kí hiệu: X~T(n), với n gọi là tham số(bậc tự do) của phân phối Student
2.3.5 Phân phối Fisher
Cho hai biến ngẫu nhiên độc lập X~ 2(m), Y~2(n), khi đó phân phối của biến ngẫu
nhiên F =
n Y m
)1(
.).(
)2()
2(
)2
()
n n
m n
x m
n n m
n m x
Kí hiệu: X~F(m,n), với m, n gọi là hai tham số(bậc tự do) của phân phối Fisher
III Các đặc trưng của biến ngẫu nhiên, hàm đặc trưng của biến ngẫu nhiên
1 Kỳ vọng(trung bình) : Đặc trưng cho giá trị trung tâm của biến ngẫu nhiên
Trang 30xf( ) , X liên tục
Tính chất: * E(C) = C, (C hằng số)
* E(CX) = CE(X)
* Nếu X, Y có kỳ vọng thì E(X+Y) = E(X)+E(Y)
* Nếu X, Y độc lập và có kỳ vọng thì E(XY) = E(X)E(Y)
2 Phương sai: Phương sai là đại lượng đặc trưng cho mức độ phân tán của các giá trị của X
/
)()(
)
Var
h k
x2 ( ) , X liên tục
Tính chất: * Var(C) = 0, (C hằng số)
* Var(CX) = C2Var(X)
* Nếu X, Y độc lập và có phương sai thì Var(X+Y) = Var(X)+Var(Y)
3 Mod: Mod là giá trị của X(kí hiệu xmod) mà tại đó hàm mật độ đạt giá trị lớn nhất
* Trường hợp biến ngẫu nhiên rời rạc thì P(X=xmod) là lớn nhất
* xmod có thể có duy nhất một giá trị cũng có thể có nhiều hơn một giá trị
4 Trung vị: Trung vị (Median) là giá trị của biến ngẫu nhiên X (kí hiệu x Me) sao cho:
1( ) ( )
2
P X x P X x
* Trung vị không phải luôn tồn tại, cũng có khi chỉ có một giá trị hoặc nhiều hơn một giá trị
Ví dụ 2.11: Cho X có hàm phân phối xác suất
0 , x0 1 , 0 x 1 E(X) = 1/2
F(x) = x , 0 x1 f (x) Var(X) = 1/12
1 , x1 0 , x0x1 XMod = [0;1]; XMe = ½
5 Hàm đặc trưng của biến ngẫu nhiên
Cho X là biến ngẫu nhiên, khi đó hàm đặc trưng của X được xác định:
i i
x
i tx
x X P
( ))
(t E e tX M
e tx ( ) , X liên tục
* Hàm đặc trưng của X tồn tại là duy nhất
Trang 31* Ta có thể ứng dụng hàm đặc trưng để tính kỳ vọng và phương sai
)0()(X M
E , E(X2)M (0) 2
)]
0([)0()
(X M M Var
Chứng minh Giả sử X là biến ngẫu nhiên rời rạc( với X liên tục ta chỉ thay ký hiệu tổng bằng kí hiệu tích phân)
i i i
i
x
i tx
i x
i tx
x X P e x t
M x
X P
M (0) ( ) ( )
i i
x
i tx
i e P X x x
M (0) 2 ( ) ( 2)
2)]
0([)0()
Var
6 Các định lý:
* Nếu X~B(n,p) thì E(X) = np; Var(X) =np(1-p); mod(X)=[(n+1)p]
* Nếu X~P( ) thì E(X) = ; Var(X) = ;mod(X)=[ -1]
* Nếu X~N(,2) thì E(X) = ; Var(X) = 2
Trang 32c) Nếu X~N( ,2) thì M(t) 2
t t e
1
r t
IV VÉC TƠ NGẪU NHIÊN
1 Định nghĩa véc tơ ngẫu nhiên
Véc tơ ngẫu nhiên n chiều là một bộ phận gồm n biến ngẫu nhiên (X1, X2, …, Xn), Xi (i =1,
2, …, n) là biến ngẫu nhiên của không gian
Trong thực tế có nhiều bài toán đòi hỏi ta cần phải xét nhiều biến ngẫu nhiên trên mỗi phần
tử của ( chẳng hạn:Khi nghiên cứu về giống lúa ta cần quan tâm đến năng suất(X), chất lượng hạt gạo(Y) ,…; Khi nghiên cứu về tình trạng sức khỏe ta cần quan tâm đến chiều cao(X), trọng lượng(Y),…
Để đơn giản trong phần này ta chỉ nghiên cứu vec tơ chứa hai biến ngẫu nhiên cùng loại( cùng rời rạc hoặc cùng liên tục)
2 Phân phối xác suất của véc tơ ngẫu nhiên (X, Y)
2.1 V éc tơ ngẫu nhiên loại rời
2.1.1 Bảng phân phối xác suất của véc tơ ngẫu nhiên
…
Trang 33
y Y P
y Y x X P y Y x X P
),()(
x X P
y Y x X P x X y Y P
* Bảng phân phối xác suất của Y với điều kiện X = x 1
)(Y y X x1
* Các bảng phân phối biên:
* Bảng phân phối xác suất của X với điều kiện Y = y
f X (x)=P(X=x) 0,6 0,4
f Y (y)=P(Y=y) 0,2 0,5 0,3
Trang 34X 0 1
) 0 (X Y x
) 1 (X Y x
)2(X Y x
* Bảng phân phối xác suất của Y với điều kiện X = x
)0(Y y X
)1(Y y X
2.2 V éc tơ ngẫu nhiên loại liên tục
2.2.1 Hàm mật độ xác suất của véc tơ ngẫu nhiên
Hàm số f(x,y) gọi là hàm mật độ xác suất của vec tơ (X,Y) nếu thỏa mãn hai tính chất sau :
,(x y dxdy f
f Y( ) ( , )
2.2.2 Hàm mật độ xác suất điều kiện
* Hàm mật độ xác suất của X với điều kiện Y=y:
) (
) , ( )
(
y
y x f y
x
* Hàm mật độ xác suất của y với điều kiện X=x:
)(
),()(
x f
y x f x y f
X
3 Sự độc lập của các biến ngẫu nhiên
Hai biến ngẫu nhiên X, Y độc lập với nhau khi và chỉ khi f(x,y)= f X (x) f Y ( y)
Ví dụ 2.14: Cho véc tơ ngẫu nhiên (X,Y) có hàm mật độ:
myx2, 0 x,y1
),(x y
0 , miền khác
a) Xác định m
Trang 35b) Tìm các hàm mật độ biên; cho biết X, Y có độc lập không?
Ví dụ 2.15: Cho véc tơ ngẫu nhiên (X,Y) có hàm mật độ:
1) Cho hai biến ngẫu nhiên X, Y độc lập, X~B(n;p); Y~Bm;p) Đặt Z =X+Y.Tìm hàm mật
độ xác suất của Z và cho biết dạng phân phối của Z
2) Cho hai biến ngẫu nhiên X, Y độc lập, X~P( ); Y~P(1 ) Đặt Z =X+Y.Tìm hàm mật độ 2
xác suất của Z và cho biết dạng phân phối của Z
3) Cho hai biến ngẫu nhiên X, Y độc lập, X~N(1,12); Y~N(2,22).Đặt Z =X+Y Tìm hàm mật độ xác suất của Z và cho biết dạng phân phối của Z
4)Cho hai biến ngẫu nhiên X, Y độc lập, X~2(r1); Y~2(r2) Đặt Z =X+Y.Tìm hàm mật
độ xác suất của Z và cho biết dạng phân phối của Z
………
Bài tập củng cố chương II
***********************
1 Một xạ thủ có 4 viên đạn, anh ta bắn lần lượt từng viên cho đến khi trúng mục tiêu hoặc hết
cả 4 viên thì thôi Tìm phân phối xác suất của viên đạn đã bắn? Biết xác suất bắn trúng mục tiêu của mỗi viên là 0,7
2 Khi một người đi thi lấy bằng lái xe, nếu không đạt anh ta lại đăng ký thi lại cho đến khi đạt
mới thôi, biết rằng khả năng thi đỗ của anh ta là 0,65 Gọi X là số lần anh ta dự thi
a Tìm hàm mật độ xác suất của X
b Hãy dự đoán xem trong 243 người dự thi ( mỗi người có xác suất thi đỗ là 0,65) có bao nhiêu người thi đạt ngay lần đầu, thi đạt ở lần thứ hai, phải thi ít nhất 4 lần
3 Qua nhiều năm khảo sát, người ta xác định được trọng lượng của trẻ sơ sinh có phân phối
chuẩn, với trọng lượng trung bình là 3,2kg; độ lệch chuẩn 0,4kg Một trẻ sơ sinh được gọi là bình thường nếu có trọng lượng từ 2,688kg đến 3,721kg
a) Tìm tỉ lệ trẻ sơ sinh bình thường
b) Đo trọng lượng một cách ngẫu nhiên 100 trẻ sơ sinh Tính xác suất có trên 85 trẻ bình thường
Trang 364 Tỷ lệ sản phẩm loại I của máy thứ nhất là 90%; của máy thứ hai là 85% Cho mỗi máy sản
suất 1 sản phẩm Gọi X là số sản phẩm loại I có trong 2 sản phẩm được sản xuất ra
a) Lập bảng phân phối xác suất của X; tính E(X), Var(X)
b) Số tiền lời khi bán mỗi sản phẩm loại I là 30000 đồng; mỗi sản phẩm không phải loại I là
15000 đồng Tìm số tiền lời trung bình khi bán 2 sản phẩm trên
5 Từ một lô hàng gồm 10.000 sản phẩm ( trong đó có 8000 sản phẩm loại A) người ta ngẫu
nhiên ra 100 sản phẩm để kiểm tra Nếu thấy có ít nhất 84 sản phẩm loại A trong 100 sản phẩm kiểm tra thì mua lô hàng đó Tìm xác suất để lô hàng được mua ( tính gần đúng bằng công thức tích phân Lapplace)
6 Cho biết trọng lượng viên thuốc sản xuất tại một xí nghiệp là độc lập và có phân phối chuấn
với trung bình 250mg, phương sai 9,0mg Thuốc được đóng thành vĩ, mỗi vĩ 10 viên Mỗi vĩ gọi là đúng tiêu chuẩn khi trọng lượng từ 2490mg đến 2500mg(đã trừ bao bì)
a) Tìm tỉ lệ tỉ lệ vĩ thuốc đúng tiêu chuẩn của xí nghiệp
b) Lấy ngẫu nhiên 100 vĩ để kiểm tra Tính xác suất có trên 80 vĩ đạt chuẩn
7 Một người đến khám vì ho ra máu Theo tổng kết của phòng khám thì những bệnh nhân như
vậy là có thể do: Lao phổi 40%; K phổi 30%; dãn phế quản 20%; còn lại là do các bệnh khác.a) Làm xét nghiệm K(IDR), thấy người này có kết quả dương tính Theo tổng kết của phòng xét nghiệm thì tỷ lệ IDR dương tính trong các bệnh trên theo thứ tự là: 0,8; 0,4; 0,2; 0,1 Tính khả năng người này bị lao phổi
b) Nếu làm xét nghiệm K(IDR) cho 50 người như vậy đều cho kết quả dương tính, và giả thiết như câu a) Hỏi khả năng có từ 10 đến 30 người bị lao phổi là bao nhiêu %
8 Cho biến ngẫu nhiên X ( đv: tháng) là tuổi thọ của một loại thiết bị có hàm mật độ xác suất:
f (x) 2
x cxe x > 0
0 x 0
a) Tìm c Tìm hàm phân phối xác suất của X
b) Tìm E(X); var(X)
c) Tìm xác suất để trong 6 thiết bị này hoạt động độc lập có 3 thiết bị thọ ít nhất 5 tháng
9 Tỉ lệ mắc bệnh B1, B2 (B1 và B2 là độc lập)tại cộng đồng tương ứng bằng 0,2; 0,3 Tiến hành khám ngẫu nhiên cho 100 người Tìm xác suất sao cho:
a) Có không quá 3 người mắc cả hai loại bệnh
b) Có ít nhất 10 người bị mắc bệnh
c) Tìm xác suất sao cho có 3 người mắc bệnh B1 và 7 người mắc bệnh B2
Trang 3710 Tỉ lệ trị khỏi bệnh của một bác sĩ là 0,9 Gọi A là biến cố trị bệnh cho 100 người có ít nhất
m người khỏi bệnh Tìm m sao cho xác suất của A không nhỏ hơn 95% Nêu ý nghĩa của giá trị
m vừa tìm được
11 Khảo sát một lô thuốc viên, trọng lượng trung bình của một viên thuốc là 252,6mg và độ
lệch chuẩn 4,2mg, trọng lượng viên thuốc có phân phối chuẩn
a) Tìm tỉ lệ viên thuốc có trọng lượng lớn hơn 260mg
b) Những viên thuốc có trọng lượng sai lệch so với trọng lượng trung bình không vượt quá 5mg được xem như đạt chuẩn Tìm tỉ lệ viên thuốc đạt chuẩn
c) Cần quy định độ sai lệch về trọng lượng là bao nhiêu so với trung bình để có trên 90%
viên thuốc đạt chuẩn
12 Đo nồng độ Na+ trong một mẫu huyết thanh bằng quang kế ngọn lửa, lặp đi lặp lại nhiều lần phép đo, ta ghi nhận có 20% kết quả trên 143mEq/l và 30% kết quả dưới 141mEq/l Tính nồng độ trung bình của Na+ và độ lệch chuẩn của phép đo
13) Dùng thuốc mới chữa thử bệnh B có tỉ lệ khỏi bệnh là p Trước khi đưa ra sử dụng chính thức, người ta điều trị thử cho 100 người bị bệnh B Thuốc được chấp nhận đưa ra sử dụng với xác suất 100% nếu có trên 80 người khỏi bệnh; với xác suất 70% nếu có từ 60 người đến 80 người khỏi bệnh và với xác suất 0% nếu có dưới 60 người khỏi bệnh Tìm xác suất thuốc được chấp nhận sử dụng với:
a) p = 0,8
b) p = 0,6
14 Xác suất chẩn đoán đúng của một bác sĩ là 0,8 bác sĩ này chẩn đoán cho 100 người Tìm m sao cho xác suất có ít nhất 100-m người được chẩn đoán đúng không nhỏ hơn 0,96 nêu ý nghĩa của giá trị m vừa tìm được
15 Một lô thuốc viên A có trọng lượng trung bình là biến ngẫu nhiên có luật phân phối chuẩn, với trọng lượng trung bình = 250,5mg; độ lệch chuẩn = 4,3mg
a) Tìm x0 sao cho có 25% viên thuốc của lô A có trọng lượng nặng hơn x0
b) Tìm x0 lớn nhất sao cho có ít nhất 70% viên thuốc của lô A có trọng lượng nặng hơn x0 c) Tìm tỉ lệ viên thuốc có trọng lượng thuộc: (-0,25; + 0,25); ( - ; + );
( - 2 ; + 2 ); ( - 3 ; + 3 )
16 Bệnh M chỉ có hai loại M1; M2 có tỉ lệ tương ứng bằng 0,49 và 0,51 Để chẩn đoán xác định bệnh M2 người ta dùng một XN T T cho dương tính khi X > 2; T cho âm tính khi X 2 X là lượng Cholesteron trong máu của những người mắc bệnh M, đối với người mắc bệnh M1 thì X~ N(1,65; 0,5); đối với người mắc bệnh M2 thì X~ N(2,5; 0,5)
Trang 38a) Xác định độ nhạy: P(T M2 ); độ chuyên P(T M2)
b) Một người mắc bệnh M vào xét nghiệm, khả năng T cho dương tính là bao nhiêu
c) Nếu kết quả XN là dương tính thì khả năng người này mắc bệnh M2 là bao nhiêu
d) Nếu kết quả XN là âm tính thì chẩn đoán không mắc bệnh M2, khả năng đúng là bao nhiêu
17 Trọng lượng của trẻ sơ sinh là biến ngẫu nhiên X(kg) có phân phối chuẩn, với trung bình là 3kg; độ lệch chuẩn 0,5kg Một trẻ sơ sinh được gọi là bình thường nếu trọng lượng từ 2,2kg –đến 3,8kg
a) Tìm tỉ lệ trẻ bình thường trong dân số
b) Quan sát ngẫu nhiên 10 trẻ sơ sinh tính xác suất có ít nhất 7 trẻ bình thường
c) Quan sát ngẫu nhiên 20 trẻ sơ sinh, tìm m để xác suất có ít nhất m trẻ bình thường không nhỏ hơn 95% Nêu ý nghĩa số m tìm được
18 Tỉ lệ sốt rét tại một địa phương bằng 10% Xét nghiệm(XN) ký sinh trùng sốt rét cho 5000 người tại địa phương trên Mỗi lần lấy máu 5 người trộn đều XN một lần, nếu âm tính trả lời kết quả cho từng người; nếu dương tính, làm XN cho từng người rồi trả lời kết quả Hỏi số XN trung bình cần làm là bao nhiêu?
19 Xác suất khỏi khi điều trị bệnh B là 90% Xác suất có 15 người khỏi và 18 người khỏi tương ứng bằng 0,079803 và 0,28518 Biết xác suất có nhiều nhất m người khỏi không lớn hơn 0,05 Tìm m và nêu ý nghĩa
20 Một phương pháp chẩn đoán, xác suất chẩn đoán sai bằng 0,15 Dùng PP trên chẩn đoán cho 50 người tìm xác suất sao cho có nhiều nhất m người chần đoán sai Biết rằng m là số mốt
Trang 39
CHƯƠNG III MẪU NGẪU NHIÊN VÀ CÁC QUY LUẬT PHÂN PHỐI
Mục tiêu học tập: Sau khi học xong bài này, người học có thể:
* Vận dụng được các phương pháp thu thập dữ liệu
* Tính được các đặc trưng mẫu
* Giải được các bài toán cơ bản về thống kê mô tả
* Tìm được phân vị của luật phân phối xác suất thông dụng
I MẪU NGẪU NHIÊN VÀ CÁCH CHỌN MẪU
Trong phần xác suất, nếu ta biết trước quy luật phân phối của biến ngẫu nhiên thì ta có thể xác định được một số đại lượng liên quan, chẳng hạn: trung bình, phương sai, xác suất,…
Tuy nhiên, trong thực tế khi nghiên cứu về biến ngẫu nhiên ta không thể xác định chính xác quy luật phân phối của nó, chẳng hạn: nghiên cứu về X: là số người đến trạm bưu điện trong một ngày; Y: trọng lượng của người Việt Nam; Z: năng suất của một giống lúa; T là số người khỏi bệnh khi điều trị…Vì các đối tượng quan sát rất lớn nên ta không thể quan sát hết các đối tượng đó Do đó không thể xác định được các đại lượng trung bình, phương sai, xác suất,…
Và ta có một phương pháp rất hữu hiệu để giải quyết vấn đề trên, gọi là phương pháp thống
kê, có thể mô tả như sau: Ta quan sát một số hữu hạn các đối tượng và ghi lại số liệu của chúng Trên cơ sở các số liệu quan sát được, thông qua các mô hình ước lượng hay kiểm định
ta có thể đưa ra kết luận cho luật phân phối, kỳ vọng, phương sai, xác suất,…của biến ngẫu nhiên mà ta khảo sát
1 Đám đông(tổng thể)
Trong thống kê toán học, ta hiểu đám đông là tập hợp toàn bộ các đối tượng mà ta quan tâm nghiên cứu Chẳng hạn: các sản phẩm làm ra trong môt ca làm việc; các trái cây trong một vụ thu hoạch ở nông trường; các sinh viên trong một trường đại học nào đó; các cửa hàng trong một thành phố nào đó; …
Kí hiệu đám đông(tổng thể): ; còn , là cá thể (phần tử) của tổng thể
Với mỗi đám đông ta có thể xác định một đặc tính định lượng X- là biến ngẫu nhiên Chẳng hạn: X là độ bền của sản phẩm; X là lượng đường có trong một loại trái cây; X là điểm học tập của sinh viên tại một trường đại học; X là doanh thu của cửa hàng trong một thành phố nào đó;…
2 Mẫu ngẫu nhiên
Trang 40Giả sử X là đặc tính cần nghiên cứu của đám đông Tiến hành chọn ngẫu nhiên n phần
tử từ đám đông để nghiên cứu về đặc tính X Ta gọi:
X1 là giá trị của X trên phần tử thứ nhất
X2 là giá trị của X trên phần tử thứ hai
Xn là giá trị của X trên phần tử thứ n
Và ta gọi bộ gồm n đại lượng (X1, X2, …, Xn) là mẫu ngẫu nhiên
3 Các phương pháp chọn mẫu ngẫu nhiên
Trong thống kê các kết luận cho tổng thể thường dựa trên mẫu ngẫu nhiên, chính vì vậy cần đảm bảo tính khách quan trong phương pháp lấy mẫu
* Mẫu ngẫu nhiên có hoàn lại : Mỗi phần tử vừa quan sát xong, bỏ trở vào tổng thể trước khi quan sát phần tử tiếp theo
* Mẫu ngẫu nhiên không hoàn lại: Mỗi phần tử vừa quan sát xong, ta không bỏ trở vào tổng thể trước khi quan sát phần tử tiếp theo
Chú ý: Nếu số phần tử của tổng thể lớn thì hai phương pháp lấy mẫu trên được xem là như
nhau Và mẫu ngẫu nhiên lấy được gọi là mẫu ngẫu nhiên độc lập
* Mẫu cơ học: Ta đánh số tất cả các phần tử của đám đông, ấn định kích thước n của mẫu, rồi dùng bảng số ngẫu nhiên(phần mềm) để chọn
* Mẫu ngẫu nhiên đặc trưng: Ta chia đám đông thành các nhóm( chia theo địa lý; chủng loại; tính chất; …), rồi ấn định tỉ lệ phần trăm cho các nhóm, sau đó chọn ngẫu nhiên các phần
tử của nhóm theo tỉ lệ đã định
4 Cách ghi mẫu quan sát(số liệu)
Sau khi tiến hành quan sát đặc tính X trên n phần tử của tổng thể, ta có được số liệu(mẫu quan sát) được ghi lại dưới 3 hình thức:
a) Nếu cỡ mẫu khá nhỏ thì số liệu được ghi: X: x 1 x 2 … x n
b) Nếu cỡ mẫu khá lớn thì số liệu được ghi dưới dạng bảng tần số:
X x 1 x 2 … x m
Số phần tử n 1 n 2 … n m