BIẾN CỐ Trong thực tế ta thường gặp những hành động mà các kết quả không thể xác định trước được, chẳng hạn như làm một thí nghiệm hay quan sát một hiện tượng nào đó.. Ta có thể hình d
Trang 2Chương I
BIẾN CỐ VÀ XÁC SUẤT CỦA CÁC BIẾN CỐ
I BIẾN CỐ
Trong thực tế ta thường gặp những hành động mà các kết quả không thể xác định trước
được, chẳng hạn như làm một thí nghiệm hay quan sát một hiện tượng nào đó
Ta gọi những hành động mà các kết quả không thể xác định trước là các phép thử (hay phép thử ngẫu nhiên)
Ta gọi mỗi kết quả ( kết cục hay trường hợp) xãy ra hoặc có thể xãy ra sau phép thử là một
biến cố (hay biến cố ngẫu nhiên)
Các biến cố đơn giản nhất là các biến cố sơ cấp
Biến cố không thể xảy ra khi phép thử được thực hiện gọi là biến cố không thể,ký hiệu biến
cố
Biến cố luôn xảy ra khi phép thử được thực hiên gọi là biến cố chắc chắn, ký hiệu biến cố
Ω
Ví dụ 1
Thực hiện phép thử: quan sát tình hình hoạt động của một dây chuyền máy móc
Ta có các biến cố: dây chuyền hoạt động tốt, biến cố: dây chuyền hỏng
Ví dụ 2
Thực hiện phép thử: gieo con xúc sắc và quan sát số nốt xuất hiện trên mặt của con xúc sắc (+)Các biến cố xuất hiện mặt 1, xuất hiện mặt 2, xuất hiện mặt 3, xuất hiện mặt 4, xuất hiện mặt 5, xuất hiện mặt 6 là các biến cố đơn giản nhất Đây là các biến cố sơ cấp
(+)Biến cố xuất hiện mặt lẻ là biến cố xuất hiện mặt 1, 3 hoặc 5 Ta có thể ký hiệu biến cố { 1,
Thực hiện phép thử: kiểm tra 3 sản phẩm
Biến cố có không quá 3 sản phẩm tốt là biến cố chắc chắn (biến cố )
Biến cố có 4 phế phẩm là biến cố không thể ( biến cố )
Biến cố có 2 sản phẩm tốt là một biến cố ngẫu nhiên
Ví dụ 4 Thực hiện phép thử: đo nhiệt độ ngoài trời
Sự kiện nhiệt độ ngoài trời đo được 20oC là một biến cố…
II.XÁC XUẤT CỦA CÁC BIẾN CỐ
Ta có thể hình dung Xác suất của một biến cố là một trị số p([0,1]) biểu thị khả năng xảy
ra biến cố đó khi thực hiện phép thử; p càng gần 0, khả năng xãy ra biến cố càng nhỏ; p càng gần 1, khả năng xãy ra biến cố càng lớn
2.1 Định nghĩa cổ điển về xác suất
Xét phép thử có chỉ hữu hạn biến cố (sơ cấp) đồng khả năng
Ta định nghĩa xác suất của biến cố A là trị số P(A) =
Trang 3Số trường hợp thuận lợi mA = 500
(Xác suất để sinh viên ngẫu nhiên của trường giỏi Anh văn là 25%)
(Tỉ lệ giỏi Anh văn của sinh viên trong trường là 25%)
Ví dụ Tung một con xúc sắc cân đối và đồng chất Tìm xác suất để
a)Được mặt lẻ b)Được mặt 4 hoặc 5
Xác suất biến cố không thể là P()=0
Khi chọn ngẫu nhiên k phần tử từ một tập hợp gồm n phần tử, để tính số trường hợp có thể xảy ra khi thực hiện phép thử và số trường hợp thuận lợi ta thường sử dụng các khái niệm tổ hợp, chỉnh hợp, …
n C
n
A n k
Ví dụ 1 Một túi đựng 10 quả cầu, trong đó có 6 quả màu xanh và 4 quả màu vàng Lấy ngẫu
nhiên (không hoàn lại) từ túi ra 3 quả cầu Tính xác suất để có 2 quả cầu xanh trong 3 quả cầu lấy ra từ túi
Gọi A là biến cố có 2 quả cầu màu xanh trong 3 quả cầu lấy ra
Số trường hợp đồng khả năng (số nhóm không thứ tự gồm 3 quả lấy từ 10 quả)
3
10 120
nC 6 xanh 4 vàng
Trang 4Số trường hợp thuận lợi cho A (là số nhóm không thứ tự gồm 3 quả, trong đó có 2 quả xanh
lấy từ 6 quả xanh và 1 quả vàng lấy từ 4 quả vàng)
Gieo đồng thời 3 con xúc sắc được chế tạo cân đối, đồng chất Tính xác suất để xãy ra biến cố
A : tổng số nốt xuất hiện của 3 con xúc sắc là 4
Trường hợp các con xúc sắc thứ 1, 2, 3 có số nốt trên các mặt lần lượt a, b, c được ký hiệu
a)3 sinh viên cùng vào một quán;
b)2 sinh viên cùng vào một quán, còn người kia thì vào quán khác
Ta đánh số ba quán cơm là 1, 2,3
Trường hợp A, B, C chọn các quán cơm a, b, c được ký hiệu là bộ ba (a, b, c) ( với a, b, c
{1, 2, 3})
Số trường hợp đồng khả năng là 3
Gọi A là biến cố 3 sinh viên cùng vào một quán
Các trường hợp thuận lợi cho A là (1,1,1), (2,2,2) và (3,3,3)
27 9
Gọi B là biến cố 2 sinh viên cùng vào một quán, còn sinh viên kia thì vào quán khác
Các trường hợp thuận lợi cho B là:
(1,1,2) và 2 hoán vị khác của nó; (1,1,3) và 2 hoán vị khác của nó;
(2,2,1) và 2 hoán vị khác của nó; (2,2,3) và 2 hoán vị khác của nó;
(3,3,1) và 2 hoán vị khác của nó; (3,3,2) và 2 hoán vị khác của nó;
Số trường hợp thuận lợi cho B là 6.3=18
Vậy ( ) 18 2
27 3
Ví dụ 4
Một người gọi điện thoại quên mất hai số cuối của số điện thoại cần gọi và chỉ nhớ là hai số
đó khác nhau Tìm xác suất để quay ngẫu nhiên một lần thì trúng ngay số điện thoại đó
Gọi A là biến cố người đó gọi đúng số điện thoại cần gọi ở lần đầu
Số trường hợp đồng khả năng (bằng số trường hợp lấy theo thứ tự hai chữ số khác nhau trong
10 chữ số 0, 1, 2,…, 9) bằng 10×9, và số trường hợp thuận lợi cho A bằng 1
Từ bộ bài gồm 52 con bài, rút ngẫu nhiên ra 5 con bài Tìm xác suất để xãy ra biến cố C là có
2 con màu đỏ, 3 con màu đen trong 5 con rút ra
Trang 5Số trường hợp đồng khả năng n = C525
Trong bộ bài có 26 con bài màu đỏ và 26 con bài màu đen
Suy ra số trường hợp thuận lợi cho C là mC = C262 C263
P(C) =
2 3
26 26 5 52
.
C =0,3251
Nhận xét
Hạn chế của định nghĩa xác suất dạng cổ điển là chỉ xét cho các phép thử thỏa 2 yêu cầu
i)Số lượng các biến cố sơ cấp là hữu hạn
ii)Các biến cố sơ cấp phải đồng khả năng
Đó là yêu cầu mà nhiều phép thử không thỏa.Chẳng hạn với phép thử là tung một con xúc sắc
không cân đối và không đồng chất, các biến cố sơ cấp xuất hiện mặt 1, 2, 3, 4, 5, 6 là không
đồng khả năng
2.2.Định nghĩa xác suất theo thống kê
Xét A là biến cố của một phép thử ngẫu nhiên Ta lặp lại phép thử này n lần độc lập Khi đó:
Số lần A xuất hiện biến cố A trong n phép thử được gọi là tần số xuất hiện A
Tỉ số A
n
được gọi là tần suất f n (A) xuất hiện A trong n phép thử
Tồn tại số thực p [0,1] để trong thực tế, khi số phép thử n đủ lớn, ta có tần suất f n (A) p
và tần suất f n(A) càng gần p nếu số phép thử n đạt mức càng lớn
Ta gọi số thực p đó là xác suất xãy ra biến cố A
Ví dụ
Từ định nghĩa cổ điển, ta suy ra xác suất xuất hiện mặt sấp khi tung đồng xu cân đối và đồng
chất là p = 0,5
Để nghiên cứu khả năng xuất hiện mặt sấp khi tung đồng xu, người ta tiến hành tung đồng xu
nhiều lần và thu được kết quả sau:
Từ thí nghiệm trên ta thấy khi số phép thử đủ lớn, tần suất xuất hiện mặt sấp xấp xỉ p = 0,5 và
khi số phép thử càng lớn, tần suất xuất hiện mặt sấp càng gần p = 0,5
Vậy xét trong ví dụ này, định nghĩa xác suất theo thống kê là phù hợp với thực tế
Ví dụ
Khi thống kê ngẫu nhiên chẳng hạn khoảng 1000 lần bắn trong số nhiều lần bắn của một xạ
thủ và có khoảng 800 viên trúng đích, có thể nói xác suất xạ thủ đó bắn trúng bia khoảng
80%
Nhận xét
Định nghĩa xác suất dạng thống kê chỉ cho ta giá trị xấp xỉ của xác suất Và độ chính xác của
sự xấp xỉ nói chung phụ thuộc vào mức độ đủ lớn của số lần thực hiện phép thử
2.3.Xác suất hình học
Giả sử có một miền Ta đưa ra các định nghĩa sau:
Cả miền được xem như là biến cố chắc chắn
Mỗi điểm của miền được xem như một biến cố sơ cấp
Mỗi miền con A ( ) được xem như một biến cố ngẫu nhiên
Tập rỗng không có điểm nào là biến cố không thể
Trang 6c
1 b2 c = 0
A
O 1 b
Bây giờ ta cho một chất điểm rơi ngẫu nhiên vào trong miền
Nếu chất điểm rơi trúng vào biến cố nào thì xem như biến cố đó xảy ra Một cách tự nhiên, ta định nghĩa xác suất của một biến cố bằng tỉ lệ diện tích biến cố đó và diện tích miền
Tuy nhiên, khi một chất điểm rơi vào trong miền thì chất điểm đó vẫn có thể rơi vào trúng
điểm B, tức là B vẫn có thể xảy ra
Như vậy,tồn tại các biến cố có xác suất bằng 0 và vẩn có thể xảy ra
Khả năng điểm đó không rơi vào B (tức là rơi vào điểm B) vẫn tồn tại Do đó tồn tại các biến cố
có xác suất bằng 1 và vẫn có thể không xảy ra
Ví dụ 1
Có hai người bạn thỏa thuận hẹn gặp nhau ở một địa điểm nào đó trong khoảng từ 0h đến 1h Giả
sử mỗi người đến địa điểm một cách ngẫu nhiên và lúc đến của mỗi người không ảnh hưởng đến lúc đến của người kia Người đến trước sẽ đợi người kia trong 1/3 giờ Nếu người kia không đến thì anh ta bỏ đi Tìm xác suất để hai ngươi bạn đó gặp nhau
Gọi x, y lần lượt là thời điểm đến của hai người bạn và A là biến cố hai người đó gặp nhau
x, y [0, 1], coi (x, y) là biến cố hai người bạn thứ 1 và thứ 2 đến điểm hẹn lần lượt tại thời điểm x, y
Ta có thể biểu diễn các biến cố ở dạng tập hợp như sau:
Gọi A là biến cố phương trình với
cặp hệ số (b, c) được chọn là giải được
III.CÁC CÔNG THỨC TÍNH XÁC SUẤT
Cho A và B là các biến cố trong cùng phép thử
Trang 7Hợp của hai biến cố A và B ( ký hiệu là AB hoặc A B ) là biến cố mà nó xãy ra khi và
chỉ khi A xãy ra hay B xảy ra
Tích của hai biến cố A và B (ký hiệu là A.B hoặc AB) là biến cố mà nó xảy ra khi và chỉ
khi A xãy ra và B xãy ra
Biến cố đối của biến cố A là biến cố A mà nó xảy ra khi và chỉ khi A không xảy ra
Ví dụ
Xét phép thử: quan sát hai xạ thủ cùng bắn vào một bia
Gọi A là biến cố “xạ thủ thứ nhất bắn trúng bia” và B là biến cố “xạ thủ thứ hai bắn trúng
bia”
Gọi C là biến cố “ bia trúng đạn”
NX C xãy ra A xãy ra hay là B xãy ra
Do đó C AB
C là biến cố “ bia không trúng đạn”
NX.C xãy ra A xãy ra và B xãy ra
Do đó C A B
Hợp các biến cố A 1, A 2 ,…, A n là biến cố A mà nó xảy ra khi và chỉ khi xãy ra biến cố A i nào đó của hệ biến cố A 1, A 2 ,…, A n.
Ký hiệu AA1A2 A n
Tích các biến cố A 1,A 2 ,…,A n là biến cố A mà nó xảy ra khi và chỉ khi tất cả các biến cố A 1,
A 2 ,…,A n đều xảy ra Ký hiệu A A A1 .2 A n
Ta có A và A là 2 biến cố xung khắc nhau
A và C là 2 biến cố xung khắc nhau
Hai biến cố đối lập thì xung khắc nhau nhưng ngược lại thì chưa chắc
Ví dụ Thực hiện kiểm tra 5 sản phẩm Biến cố “có 1 phế phẩm” và biến cố ”có 2 phế phẩm”
là hai biến cố xung khắc nhau
Định lý Nếu A và B là hai biến cố bất kỳ thì
P(A B) = P(A) + P(B) P(A.B)
i)Nhận xét rằng AB là biến cố không thể P(AB) = 0 đpcm
ii)Ta có P(AA)P( ) 1 Nhận xét rằng A và A là xung khắc
Suy ra P(AA)P(A) P(A) 1 đpcm
Công thức cộng xác suất mở rộng
Trang 8P(A B C) = P(A) + P(B) + P(C) P(AB) P(AC) P(BC)
Một hộp có 10 sản phẩm (trong đó có 2 phế phẩm).Lấy ngẫu nhiên từ hộp ra 6 sản
phẩm.Tính xác suất để có ít nhất 1 phế phẩm trong 6 sản phẩm lấy ra
Gọi A là biến cố có ít nhất 1 phế phẩm trong 6 sản phẩm lấy ra
A là biến cố không có phế phẩm nào trong 6 sản phẩm lấy ra
Ta có P( A ) =
6 8 6 10
215
Gọi A là biến cố trong 3 sản phẩm lấy ra có ít nhất một chính phẩm
A= A1A2 A3 và hệ biến cố A1, A2 , A3 xung khắc từng đôi 10 chính phẩm
Giả sử vùng dân cư khoảng 100.000 người Số người không mắc bệnh nào trong 2 bệnh
khoảng chừng bao nhiêu ?
Gọi A là biến cố người đó mắc bệnh tim và B là biến cố người đó mắc bệnh huyết áp
Ta có P A 0, 09,P B 0,12,P AB 0, 07
N:biến cố người đó không mắc bệnh nào trong 2 bệnh
Ta có N : biến cố người đó mắc bệnh tim hay bệnh huyết áp
P N P A BP A P B P AB
= 0.09 + 0.12 0.07 = 0.14
Vậy P N 1 P N 1 0.140.86
Tỉ lệ người không mắc bệnh nào trong 2 bệnh là 86%
Số người không mắc bệnh nào trong 2 bệnh khoảng 86.000 người
Ví dụ 4
Trang 9Biết trong lớp 100 học sinh có 20 em giỏi môn toán và 25 em giỏi Ngoại ngữ, trong đó có 10
em giỏi cả Toán lẫn Ngoại ngữ Quy định giỏi ít nhất một môn thì được thưởng Chọn ngẫu nhiên một em trong lớp Tính xác suất để em đó được thưởng
Suy ra tỉ lệ học sinh được thưởng của lớp
Gọi A là biến cố chọn được em giỏi môn Toán
B là biến cố chọn được em giỏi môn Ngoại ngữ
C là biến cố em đó được thưởng
100 100 100 100
Suy ra tỉ lệ học sinh được thưởnglà 35%
3.2 Công thức nhân xác suất Xác suất có điều kiện
Xét phép thử với biến cố B đã xãy ra Xác suất của biến cố A được tính với điều kiện biến cố
B đã xãy ra, ký hiệu P(A/B), được gọi là xác suất xãy ra A với điều kiện B đã xãy ra
Công thức xác suất có điều kiện
Ghi chú Hai biến cố A và B là độc lập nếu việc xãy ra hay không xãy ra biến cố này không
ảnh hưởng tới khả năng xãy ra biến cố kia
Công thức nhân xác suất mở rộng
( n) ( ) ( / ) ( / ) ( n/ n )
Nếu các biến cố A 1 , …, A n độc lập với nhau thì
P(A1…An) = P(A1)…P(An)
Ví dụ 1 Một túi đựng 5 quả cầu, trong đó có 2 quả màu trắng Lấy ngẫu nhiên từ túi ra 2 quả
cầu
a)Tính xác suất để lần thứ 2 được quả cầu trắng biết rằng lần 1 lấy được quả cầu trắng b)Tìm xác suất lấy được 2 quả cầu trắng
Gọi A là biến cố lần thứ hai lấy được quả cầu trắng
B là biến cố lần thứ nhất lấy được quả cầu trắng
54 10= 0,1
Ví dụ 2
Một phân xưởng có 3 máy hoạt động độc lập Xác suất các máy 1, 2, 3 bị hỏng trong ngày tương ứng là 0,1; 0,2 và 0,15 Tính các xác suất sau đây:
a)Tìm xác suất để chỉ có một máy bị hỏng trong ngày
b) Tìm xác suất để có ít nhất một máy bị hỏng trong ngày
c)Biết chỉ có một máy hỏng Tìm xác suất để đó là máy 2
Gọi A A A tương ứng là các biến cố máy thứ nhất, thứ hai, thứ ba bị hỏng trong ngày 1, 2, 3
Trang 10b)Gọi B là biến cố “có ít nhất một máy bị hỏng trong ngày”
B là biến cố “cả ba máy đều tốt” B A A A1 2 3 Suy ra
Gọi A là biến cố cần tính xác suất 6 bài tập 4 lý thuyết
và A A A lần lượt là các biến cố sinh viên thứ 1 gặp đề bài tập, sinh viên thứ 2 gặp lý 1, 2, 3
IV.CÔNG THỨC BERNOULLI (BECNULI)
Giả sử thực hiện n phép thử độc lập và xác suất xuất hiện biến cố A trong mỗi phép thử đều cùng bằng hằng số p
Ta gọi n phép thử này là n phép thử Bernoulli
Khi đó xác suất để k lần xuất hiện biến cố A trong n phép thử Bernoulli là
Pk = C p q n k k n k , k = 0, 1,…, n, với q=1 p
Chứng minh Thực hiện n phép thử Bernoulli và quan sát
Gọi Ai là sự kiện xãy ra biến cố A trong phép thử Bernoulli thứ i
Và ta luôn có P(Ai) = p và P A = 1p = q i
Bk là sự kiện có k lần biến cố A xãy ra trong n phép thử Becnoulli
Bk là hợp các biến cố xung khắc nhau dạng k 1 n
A A A A , Trong đó {i1, i2, , ik } là tập con k phần tử khác nhau từ tập hợp gồm n số tự nhiên {1, 2,
Trang 11Một người chơi bóng rỗ có khả năng ném lọt rỗ với xác suất p = 0,6 Cho anh ta ném bóng 5
Cho một lô hạt giống với tỉ lệ hạt nẩy mầm là 95% Lấy một mẫu để kiểm tra Để xác suất
mẫu có ít nhất một hạt lép không bé hơn 0,95, cần lấy một mẫu cỡ bao nhiêu hạt?
Giả sử phải lấy mẫu gồm n hạt giống
Coi việc kiểm tra n hạt là n phép thử Bernoulli với xác suất hạt nẩy mầm trong mỗi phép thử
V CÔNG THỨC XÁC SUẤT ĐẦY ĐỦ
Hệ biến cố A A1, 2, ,A là đầy đủ nếu n A1A2 A n (hợp của chúng là biến cố chắc
chắn) tức là trong phép thử, chắc chắn phải xãy ra biến cố A i nào đó của hệ
Hệ biến cố A A1, 2, ,A gọi là xung khắc từng đôi nếu các cặp biến cố khác nhau đều xung n
khắc tức là trong phép thử, chỉ có thể xãy ra không quá một biến cố của hệ
Hệ các biến cố A A1, 2, ,A là đầy đủ và xung khắc từng đôi nếu trong phép thử, chắc chắn n
phải xãy ra một và chỉ một biến cố Ai nào đó trong hệ biến cố đó
Ví dụ
Kiểm tra 3 sản phẩm, gọi A A A A tương ứng là các biến cố có 0,1,2,3 sản phẩm tốt 0, 1, 2, 3
trong 3 sản phẩm kiểm tra Hệ các biến cố trên là một hệ đầy đủ và xung khắc từng đôi
Hệ quả
Nếu hệA A1, 2, ,A là đầy đủ và xung khắc từng đôi thì n
P(A1)+P(A2)+…+P(A n )=1
Chứng minh
Ta có P A 1A2 A nP( ) =1 ( do hệ A A1, 2, ,A là đầy đủ) n
Trang 12Mặt khác hệA A1, 2, ,A là xung khắc từng đôi n
nênP A 1A2 A =P(A n 1)+P(A2)+…+P(A n )= 1
Công thức xác suất đầy đủ
Cho hệ biến cố A1,…, An là đầy đủ và xung khắc từng đôi, B là biến cố bất kỳ trong cùng
Do tính xung khắc của các biến cố AiB, ta có
P(B) = P(A1B)+P(A2B)+ …+P(AnB)
Dùng công thức tích xác suất, ta suy ra đpcm
Ví dụ
Một cơ sở sản xuất mũ gồm có 3 tổ cùng sản xuất mũ (độc lập nhau) với tỉ lệ sản phẩm trong tổng số sản phẩm lần lượt là 20%, 30% và 50%, trong đó trong tổ 1, 2, 3 có tỉ lệ phế phẩm tương ứng là 5%, 2% và 1% Tất cả sản phẩm làm ra được xếp chung vào một kho
Lấy ngẫu nhiên một sản phẩm từ kho
Tìm xác suất để sản phẩm đó là phế phẩm
Hỏi tỉ lệ phế phẩm của kho là bao nhiêu?
Gọi B: biến cố mũ lấy được là phế phẩm
Xác suất P(B) cũng chính là tỉ lệ phế phẩm của kho
Gọi A là biến cố mũ lấy ra do tổ i sản xuất (i = 1, 2, 3) i
Ta có hệ biến cố A1, A2, A3 là hệ đầy đủ và xung khắc từng đôi
Và P(A1) = 0,2 , P(A2) = 0,3 , P(A3) = 0,5
P(B / A1) = 0,05; P(B /A2) = 0,02; P(B /A3) = 0,01
Áp dụng công thức xác suất đầy đủ ta có:
P(B) = P(A1).P(B / A1) + P(A2).P(B /A2) + P(A3).P(B /A3) =
= 0,20,05 + 0,30,02 + 0,50,01 = 0,021= 2,1%
VI CÔNG THỨC BAYÈS
Cho hệ biến cố A1,…, An là đầy đủ và xung khắc từng đôi, B là biến cố bất kỳ trong cùng
Trang 13Hai máy tiện cùng sản xuất ra một loại trục xe đạp Các trục xe được đóng chung vào một kiện
Năng suất của máy tiện thứ hai gấp đôi năng suất của máy tiện thứ nhất Máy tiện thứ nhất sản xuất được 64% trục loại tốt, còn máy tiện thứ hai được 80% trục loại tốt
Lấy ngẫu nhiên từ kiện ra một trục để kiểm tra thì được trục loại tốt
Tìm xác suất để trục đó do máy tiện thứ nhất sản xuất và xác suất để trục đó do máy tiện thứ
2 sản xuất
Gọi A A tương ứng là các biến cố trục lấy được do máy thứ nhất và máy thứ hai sản xuất 1, 2
Ta có hệ biến cố A1, A2 là hệ đầy đủ và xung khắc
( 1) 1; ( 2) 2;
P A P A và P B A( / 1)0, 64; ( /P B A2)0,8
Gọi B là biến cố trục đó là trục loại tốt
Theo công thức xác suất đầy đủ, ta có
P(B) = P(A1).P(B / A1) + P(A2).P(B / A2)
P(B) = 0,8
3
264,03
a)Giả sử người đó viêm họng Tìm xác suất để người đó nghiện thuốc
b)Giả sử người đó không viêm họng Tìm xác suất để người đó nghiện thuốc
Gọi A1:biến cố người đó nghiện thuốc lá và A2 = A 1
Gọi B: biến cố người đó viêm họng
Ta có hệ biến cố A1 và A2 là đầy đủ và xung khắc
Trang 14Lấy ngẫu nhiên 1 sản phẩm ở hộp thứ 1 bỏ vào hộp thứ 2 rồi sau đó từ hộp thứ 2 lấy ngẫu nhiên ra một sản phẩm thì được sản phẩm tốt
Tính xác suất để sản phẩm lấy ra từ hộp thứ 2 là sản phẩm của hộp thứ nhất bỏ vào
Gọi A1: biến cố sản phẩm lấy ra lần đầu là tốt;
A2:biến cố sản phẩm lấy ra lần đầu là xấu
Hệ biến cố A1, A2 là đầy đủ và xung khắc;
và P(A1) = 6/10= 0,6 ; P(A2) = 4/10 = 0,4
Gọi B: biến cố sản phẩm lấy ra từ hộp hai là sản phẩm tốt
C: biến cố sản phẩm lấy ở hộp hai là sản phẩm đã lấy ở hộp thứ nhất bỏ vào
(NX:TH: A1 xãy ra hộp thứ hai : 6 tốt 4 xấu ;
Trang 15Chương II ĐẠI LƯỢNG NGẪU NHIÊN
VÀ CÁC QUI LUẬT PHÂN PHỐI XÁC SUẤT
I ĐẠI LƯỢNG NGẪU NHIÊN
1.1 Các định nghĩa
Giả sử sau phép thử, đại lượng X sẽ nhận giá trị nào đó
Nếu giá trị của đại lượng X là ngẫu nhiên, không thể xác định được trước khi thực hiện phép
thử thì ta gọi X là đại lượng ngẫu nhiên (hoặc biến ngẫu nhiên )
Ví dụ Cho phép thử là kiểm tra 3 sản phẩm để biết số phế phẩm
Gọi X là số phế phẩm
Ta có X là ĐLNN vì trước khi thực hiên phép thử, ta không xác định được giá trị của X mà chỉ biết X sẽ nhận là một trong các giá trị:0,1,2,3
Một ĐLNN được gọi là rời rạc nếu tập các giá trị mà nó nhận là tập hữu hạn hoặc vô hạn
đếm được ( gồm các trị rời nhau)
Một ĐLNN được gọi là liên tục nếu tập các giá trị mà nó nhận là một khoảng nào đó trên trục
số
Ví dụ Cho phép thử là gieo một con xúc sắc
Gọi X là số nốt xuất hiện trên con xúc sắc
Ta có X là ĐLNN rời rạc vì X chỉ có thể nhận các trị {1,2,3,4,5,6}
Ví dụ Chiều cao của trẻ em lứa tuổi 15, khối lượng một loại hoa quả… là những ĐLNN liên tục
Ta thường ký hiệu các ĐLNN bởi các chữ X, Y, Z, … và các chữ nhỏ x, y, z, …là các giá trị
mà X, Y, Z, … nhận
Ví dụ Sau phép thử, ta có (X nhận trị 3,5)
Sau phép thử, ta có (X = 3,5)
Sau phép thử, ta có ( x = 3,5)
1.2 Qui luật phân phối xác suất của ĐLNN
Để xác định một đại lượng ngẫu nhiên ta phải biết đại lượng ngẫu nhiên ấy có thể nhận giá trị
nào và nó nhận giá trị ấy với xác suất tương ứng bao nhiêu
Một hệ thức hay qui tắc cho phép biểu diển mối quan hệ giữa các giá trị có thể nhận của ĐLNN với các xác suất tương ứng gọi là qui luật phân phối xác suất của ĐLNN
Để xác định một ĐLNN, ta có thể dùng: bảng phân phối xác suất, hàm phân phối xác suất hoặc hàm mật độ xác suất
Trang 16Một xạ thủ được phép bắn 3 viên đạn vào mục tiêu với xác suất trúng mục tiêu là 0,6 Anh ta bắn
cho tới khi hết đạn hoặc trúng mục tiêu thì thôi
Gọi X là số viên đạn bắn ra Lập bảng phân phối xác suất của X
Trong hộp có 10 sản phẩm, trong đó có 6 chính phẩm Lấy ngẫu nhiên không hoàn lại từ hộp ra 2
sản phẩm.Lập bảng phân phối xác suất của số chính phẩm được lấy ra
Gọi X là số chính phẩm được lấy ra từ hộp X là ĐLNN rời rạc, có thể nhận các trị 0, 1, 2 (6 chính phẩm 4 phế phẩm)
2 4
2
10
20
81
2
10
52
Trang 17Có hai chuồng gà nằm cạnh nhau Chuồng thứ nhất có 6 gà trống và 4 gà mái Chuồng thứ hai có
4 gà trống và 4 gà mái Buổi tối nọ, có 2 con gà chuồng 1 bay qua chuồng 2 Người ta bắt 2 con
gà chuồng 2 bỏ qua chuồng 1 Gọi X1 là số gà trống trong 2 con gà bay qua chuồng 2, X2 là số gà trống trong 2 con gà người ta bỏ lại chuồng 1
Tìm bảng phân phối xác suất của X1 và X2
Tương tự ví dụ trên suy ra bảng phân phối xác suất của ĐLNN X1 là
KL: Bảng phân phối xác suất của ĐLNN X2 là
1.2.2 Hàm phân phối xác suất
Hàm phân phối dùng để xác định qui luật phân phối xác suất của cả ĐLNN rời rạc và liên tục
Trang 180 1 2 x
Cho đại lượng ngẫu nhiên X
Hàm ( ) :F x P X( x)gọi là hàm phân phối(xác suất) của ĐLNN X
Ví dụ
Tìm hàm phân phối của ĐLNN X có bảng phân phối xác suất
Ta có hàm phân phối của ĐLNN X là
2
x 1khi 10/15
1
x 0khi 2/15
0
x khi 0
Trang 19y y=f(x)
a O b x
y y=F(x) 1
a O b x
Hàm f(x)= F’(x) gọi là hàm mật độ (xác suất) của X
Trong đó F(x) là hàm phân phối xác suất của X
Để đơn giản, trong bài giảng này chỉ xét các hàm mật độ là hàm liên tục trên R hoặc chỉ gián đoạn tại hữu hạn điểm
Cho xo là điểm liên tục của f(x)
Xác suất để X nhận trị thuộc lân cận đủ bé (x o, x o +) của x o xấp xỉ tích f(x o )2 (với 2 là
độ dài của lân cận)
Trang 20Do đó xét trong các lân cận có cùng độ dài đủ bé như nhau, tại điểm x=xo nào có trị f(xo) lớn
hơn thì xác suất X nhận trị ở lân cận của điểm đó lớn hơn
II.Các đặc trưng số của đại lượng ngẫu nhiên
Khi ta xác định được qui luật phân phối xác suất của đại lượng ngẫu nhiên thì ta nắm được
toàn bộ thông tin về đại lượng ngẫu nhiên đó Tuy nhiên trong thực tế chúng ta thường quan tâm đến những thông tin quan trọng nhất phản ánh đầy đủ các đặc trưng cơ bản của đại
lượng ngẫu nhiên
2.1 Giá trị trung bình theo xác suất (kỳ vọng toán)
iii) E(X+Y) = E(X) + E(Y)
iv) Nếu X, Y là các ĐLNN độc lập thì E(X.Y) = E(X).E(Y)
Ghi chú
X, Y là 2 ĐLNN độc lập nếu việc nhận trị của ĐLNN này không ảnh hưởng đến ĐLNN kia
và ngược lại
Trang 21E(X) chính là giá trị trung bình của ĐLNN X
Nếu X là khối lượng con tôm sú (ngẫu nhiên) cùng độ tuổi thì E(X) là khối lượng trung bình của các con tôm sú này
Trong sản suất công nghiệp, giá trị trung bình ( theo xác suất) của kích thước các sản phẩm là kích thước qui định của sản phẩm( trọng lượng qui định, đường kính qui định,…)
D(X) chỉ độ phân tán các giá trị của ĐLNN X xung quanh giá trị trung bình E(X)
Trong sản xuất công nghiệp, phương sai thường biểu thị độ chính xác của sản xuất
Trong chăn nuôi, phương sai thường biểu thị mức độ đồng đều của gia súc
Trong trồng trọt, phương sai thường biểu thị mức độ đồng đều của năng suất cây trồng, … Đặt = E(X) Ta có D(X) = E([X]2) =E(X22X+2)
=E(X2)2E(X)+2 = E(X2)2
Ta suy ra công thức thường dùng để tính phương sai của X
D X( )E X( 2)E X( )2
Trang 22
i)Ta có D(C) = E(C2) [E(C)]2 = C2 C2 = 0
ii)Ta có D(X) = E(2X2) [ E(X)]2 = 2E(X2) 2.[E(X)]2
= 2[ E(X2) [E(X)]2]= 2.D(X)
iii)D(X±Y) = E[X2 +Y2 ±2XY] [ E(X) ± E(Y) ]2
= E(X2) +E(Y2)±2E(XY) {[E(X)]2 +[E(Y)]2
Phương sai D(X) bất tiện ở chổ không có cùng đơn vị với X
Ta định nghĩa ( )X D X( ) là độ lệch (hay độ lệch chuẩn) của ĐLNN X
Độ lệch (X) cũng biểu thị mức độ phân tán các giá trị của X xung quanh giá trị trung bình
E(X) Tuy nhiên có điểm thuận tiện hơn là độ lệch (X) có cùng đơn vị với X và E(X)
2.3 Giá trị tin chắc nhất
Định nghĩa
Giá trị tin chắc nhất của ĐLNN rời rạc X, ký hiệu là Mod(X) là giá trị X nhận với xác suất lớn
nhất trong bảng phân phối xác suất
Nếu X là ĐLNN liên tục có hàm mật độ xác suất f(x) thì Mod(X) là giá trị X nhận mà tại
đó hàm mật độ f(x) đạt giá trị lớn nhất
Nhận xét
Mod(X) chính là giá trị có khả năng nhiều nhất trong các giá trị mà X có thể nhận
Ví dụ Cho ĐLNN X có qui luật phân phối xác suất như sau:
X 1 2 3 4
P 0.2 0.4 0.3 0.1
Trang 23k k n k n
Trang 24Trong một thành phố có 65% gia đình có máy giặt
Chọn ngẫu nhiên 12 gia đình và gọi X là số gia đình có máy giặt
a)Tìm phân phối của ĐLNN X
b)Tính xác suất để có đúng 5 gia đình có máy giặt
c)Tính xác suất để có ít nhất 2 gia đình có máy giặt
Coi việc điều tra 12 gia đinh là 12 phép thử Becnoulli với (xác suất có máy giặt trong mỗi
Tìm số phế phẩm trung bình và số phế phẩm tin chắc nhất của máy đó trong một ngày
Biết chi phí sản xuất một sản phẩm là 1 (đô), giá bán một chính phẩm là 2 (đô) và phế phẩm
bị loại bỏ Trung bình lợi nhuận từ một máy trong một ngày là bao nhiêu?
Coi việc kiểm tra 200 sản phẩm là thực hiện 200 phép thử Bernoulli với (xác suất gặp phế phẩm trong mỗi phép thử là) p=0,053
Gọi X là số phế phẩm trong 200 phép thử Becnoulli X ~B(200; 0, 053)
Trang 25Trung bình lợi nhuận trong một ngày từ một máy:
E(Z) = E(2002X) = 200 2E(X) = 2002×10,6 = 178,8 (đô)
3.2 Phân phối Poisson
Cho X là ĐLNN rời rạc nhận trị N và
P(X = k) =
k
ek!
, k = 0, 1, 2, …
Ta nói ĐLNN X có phân phối Poisson với tham số ,
ký hiệu X ~ ()
Người ta chứng minh được
Cho ĐLNN X~B(n, p) với n rất lớn, p rất nhỏ (p << 0,1 )
Khi đó
Có thể coi X có phân phối Poisson ( ) với =np=E(X)
Để tiện trong thực hành, có một cách phát biểu khác
Cho ĐLNN X là số lần xuất hiện biến cố hiếm trong một đơn vị thời gian ( hay không gian ) với số lần xuất hiện trung bình là
Khi đó có thể coi X có phân phối Poisson ( )
P(X = k) =
k
ek!
, k = 0, 1, 2, …
Trang 26Ta có chuỗi Mac Laurin
k x
k 0
xek!
a)Tìm xác suất để có không quá 3 chai bị vỡ khi vận chuyển
b)Khả năng cao nhất số chai vỡ trong chuyến vận chuyển là bao nhiêu?
Gọi X là số chai vỡ trong chuyến vận chuyển
( X là số lần xuất hiện biến cố hiếm trong 1 đơn vị không gian với số lần trung bình là 4)
40!e
+
1 4
41!e
+
2 4
42!e
+
3 4
43!e
Vậy có khả năng cao nhất số chai Coca bị vỡ là 3 hoặc 4 chai trong mỗi chuyến vận chuyển
Ví dụ
Trong lô hàng lớn, trung bình trong mỗi thùng kẹo cùng qui cách (gồm hàng trăm viên), có 2,5 viên kẹo sai qui cách Chọn một thùng ngẫu nhiên
Trang 27a)Tìm xác suất để có hơn 2 viên kẹo sai qui cách trong thùng
b)Khả năng cao nhất số lượng viên kẹo sai qui cách trong thùng ?
Gọi X (viên) là số viên kẹo sai qui cách trong thùng
(X là số lần xuất hiện biến cố hiếm trong một đơn vị không gian với số lần TB là 2,5.)
Coi X có phân phối Poisson với =2,5
3.3 Phân phối siêu bội
Cho một tổng thể gồm N phần tử, trong đó có M phần tử có tính chất A
Lấy ngẫu nhiên không hoàn lại n phần tử
Cho X là số phần tử có tính chất A trong mẫu n phần tử (không hoàn lại)
k n k
n N
Ví dụ
Chọn ngẫu nhiên 7 lá bài từ một bộ bài có 52 lá.Gọi X là số lá rô trong 7 lá bài được chọn ra Xác định phân phối của X Tính xác suất để có 3 lá rô
Bộ bài 52 con; trong đó có 13 lá rô
X là số con rô trong mẫu nhỏ 7 con bài (không hoàn lại)
nên X~H52,13, 7
Trang 28Ta có 13 39
7 52
+Cho X là số phần tử có tính chất A trong mẫu n phần tử có hoàn lại
Ta có X có phân phối nhị thức B(n, p) với p = M/N
+Cho X là số phần tử có tính chất A trong mẫu n phần tử (không hoàn lại)
Ta có X có phân phối siêu bội H(N, M, n)
Tuy nhiên khi tổng thể là rất lớn ( N rất lớn và cụ thể hơn M và N M rất lớn so với n)
Coi ĐLNN X này có phân phối nhị thức B(n, p) với p=M/N
Ví dụ
Một công ty nhập về một lô hàng có 10000 sản phẩm, trong đó có 8000 sản phẩm loại A Lấy
ngẫu nhiên từ lô hàng ra 10 sản phẩm để kiểm tra Gọi X là số sản phẩm loại A ( trong 10 sản phẩm đó)
a)Chỉ ra phân phối xác suất của ĐLNN X
b)Tìm xác suất để có ít nhất 8 sản phẩm loại A
Cách 1
a)Lô hàng có 10000 sản phẩm và trong đó có 8000 sản phẩm loại A
X là số sản phẩm loại A có trong mẫu 10 sản phẩm
X có phân phối siêu bội H(1000, 800, 10)
Coi lấy 10 sản phẩm là 10 phép thử Bernoulli với p = 0,8
X có phân phối nhị thức B(n, p) với n = 10; p = 0,8
b) P(X ≥ 8) = P8 + P9 +P10 =
C108.0,8 0, 28 2C109.0,8 0, 29 C1010.0,810= 0,6778
Trang 29y
1 / 2
P(<Z<) y=f(z)
O z
3.4 Phân phối chuẩn
Phân phối chuẩn tắc
ĐLNN liên tục Z nhận giá trị trong R được gọi là ĐLNN có phân phối chuẩn tắc ( ký hiệu
z
e
( Hàm f(z) trên gọi là hàm Gauss)
Đồ thị hàm mật độ phân phối chuẩn tắc
Các tính chất
Cho ĐLNN Z có phân phối chuẩn tắc ( Z ~ N(0, 1) )
Khi đó E(Z) = 0, D(Z) = 1, Mod(Z) = 0
1φ( )
2
t z
= 1 ( do f(z) là hàm mật độ phân phối chuẩn tắc)
+Dễ chứng minh hàm mật độ chuẩn tắc f(z) đạt GTLN tại z = 0
Trang 30Phân phối chuẩn y
Cho ĐLNN liên tục X nhận giá trị trong R
có hàm mật độ
g(x) =
2 1 2
z
e
là hàm Gauss
Phân phối chuẩn do nhà toán học Gauss tìm ra năm 1809 nên còn gọi là phân phối Gauss
Ứng dụng của phân phối chuẩn
Qui luật phân phối chuẩn có ứng dụng rộng rãi trong thực tế:
Xét trong tổng thể có qui mô lớn,
+Trong kinh tế, nhu cầu tiêu thụ một mặt hàng nào đó, …
+Trong nông nghiệp, năng suất của một loại cây trồng, trọng lượng của gia súc cùng độ tuổi
và cùng điều kiện chăm sóc,…, trong điều kiện bình ổn,
+Trong công nghiệp, kích thước của các chi tiết máy, trọng lượng của những sản phẩm cùng loại với quá trình sản xuất diễn ra bình thường,
Thường là những ĐLNN phân phối chuẩn
Các giá trị trung bình, giá trị qui định (trong hoạt động kinh doanh, sản xuất,…) của các
ĐLNN đó chính là các hệ số của phân phối chuẩn của chúng
Người ta chứng minh được:
Nếu các ĐLNN độc lập X1 và X2 có phân phối chuẩn thì các ĐLNN X1 ± X2, X ± , .X1 ( , là các hằng số thực) cũng có phân phối chuẩn
Trang 31Với các biến cố có xác suất đủ bé, người ta coi như chúng có xác suất bằng 0 và coi như
thực tế chúng không xãy ra
Đưa đến qui tắc thường dùng
Qui tắc 3
Cho ĐLNN X có phân phối chuẩn N(, 2)
Tỉ lệ quan sát X nhận trị (3, +3) là 99,74%
Thực tế thường có thể coi X chỉ nhận trị thuộc ( µ 3 , µ + 3)
Và coi biến cố X nhận trị ( ∞ , µ 3] [µ+3 , +∞) có xác suất bằng 0
Ví dụ Cho ĐLNN X ~ N(10; 0, 25)với µ = 10 và = 0,5
Trang 32Áp dụng qui tắc 3, ta coi như
Ví dụ 3
Đường kính của một trục máy do một nhà máy sản xuất là ĐLNN phân phối theo qui luật chuẩn với đường kính trung bình (theo thiết kế) là = 20 (mm) và độ lệch chuẩn = 0,04 (mm)
Trục máy gọi là đạt tiêu chuẩn kỷ thuật nếu đường kính của nó sai lệch so với đường kính thiết kế không quá 0,072 (mm)
Tìm tỷ lệ trục máy đạt tiêu chuẩn kỹ thuật của nhà máy?
Gọi X (mm) là đường kính của trục máy
Ví dụ 4
Trọng lượng X (g) của gói đường ( ngẫu nhiên ) do nhà máy sản xuất có phân phối chuẩn Tỉ
lệ gói đường có trọng lượng lớn hơn 1015 (g) là 0,07 Hãy tìm tỉ lệ gói đường có trọng lượng
ít hơn 1008(g), biết rằng trọng lượng trung bình của các gói đường là 1012 (g)
Trang 33= (1,968)+0,5
= 0,50,4755= 0,0245
Tỉ lệ các gói đường có trọng lượng < 1008(g) là 0,0245
Quan hệ phân phối nhị thức và phân phối chuẩn
Cho X là ĐLNN có phân phối nhị thức B(n, p), với n đủ lớn, đồng thời np > 5 và n(1p) > 5
Trang 34Sau khi X cũ được xấp xỉ ĐLNN mới X có phân phối chuẩn, để có kết quả chính xác hơn, ta
sẽ điều chỉnh thành các xác suất tương ứng
P( k 0,5 < X < l+ 0,5), P( X > k 0,5), P( X < l+0,5)
Bây giờ ta thử giải lại ví dụ trên với X ~ B( 300; 0,48)
Dùng phần mêm EXCEL để tính, ta có kết quả coi là chính xác như sau
Các kết quả tính tay ở ví dụ trên có sai lệch đáng kể so với các kết quả chính xác
Để giảm bớt sai lệch trong ví dụ, ta điều chỉnh lại như sau
Kết quả này trùng với kết quả chính xác
Quan hệ phân phối Poisson và phân phối chuẩn
Cho X là ĐLNN có phân phối Poisson tham số > 5
Khi thực tế có thể coi X có phân phối chuẩn N( , )
Ghi chú Một số tác giả yêu cầu > 20
Cách hiểu quan hệ ĐLNN rời rạc X và ĐLNN liên tục phân phối chuẩn Xmới cũng tương tự như ở phần trên
Gọi X là lượng khách hàng giao dịch tại điểm đặt ATM này vào một ngày ngẫu nhiên
Ta có X có phân phối Poisson tham số = 64
NX = 64 > 5 coi X có phân phối chuẩn N( 64, 64) với µ = 64 và = 8
A : biến cố lượng khách giao dịch tại điểm đặt ATM ít nhất là 61
Dùng phần mềm EXCEL để tính, ta có kết quả coi là chính xác như sau
P(A) = 1P(X ≤ 60) = 1POISSON( 60, 64, 1)
= 0,6630
Để chính xác hơn cách tính tay ở trên, ta điều chỉnh như sau
Trang 35y y=f(x)
Ta có X+Y có phân phối chuẩn N( 7; 0.52)
IV Một số qui luật phân phối khác
4.1 Giới thiệu phân phối đều
ĐLNN X gọi là có phân phối đều trên (a, b)
( ký hiệu X ~ U(a, b) ) nếu X có hàm mật độ
Nếu X ~ U(a, b) thì E(X) = (ba)/2 và D(X) = (ba)2/12
Ở đây ta hiểu X nhận các trị (a, b) với khả năng như nhau
Trang 36y
f 2(x)
|
12 2 x
|
+Cho Y là số lần xuất hiện biến cố hiếm trong 1 đơn vị thời gian với số lần trung bình
Khi đó coi Y có phân phối Poisson tham số
+ Cho X là khoảng thời gian giữa 2 lần liên tiếp xuất hiện biến cố hiếm với thời gian trung bình là 1/
Khi đó coi X có phân phối mũ với tham số
Trong thực tế nhiều ĐLNN , chẳng hạn thời gian giữa các cuộc điện thoại, thời gian giữa những lần khách vào quán bia, ở hiệu uốn tóc,quầy giao dịch, ATM,…, thời gian sống của bóng đèn
điện, thời gian phục vụ của một dụng cụ điện tử, … với thời gian trung bình t o có thể coi là các
ĐLNN có phân phối mũ với tham số .= 1/ t o
Ví dụ
Một loại bóng đèn điện tử có thời gian sống trung bình là 2000 giờ Tìm tỉ lệ bóng đèn điện tử
có thời gian sống dưới 3000 giờ
Gọi X (giờ) là thời gian sống của các bóng đèn điện tử loại đó
X là ĐLNN có phân phối mũ với tham số = 1/2000
Tỉ lệ bóng đèn điện tử có thời gian sống dưới 3000 giờ là
P( 0 < X < 3000) = F(3000) F(0) = 1 e 3000/2000 0 1 e1,5
= 0,7769 = 77,69%
Ví dụ
Biết trung bình mỗi giờ làm việc có 10 khách đến giao dịch tại 1 ATM Tìm xác suất để
khoảng thời gian giữa 2 khách hàng liên tiếp là không tới 12 ph
Gọi X(giờ) là khoảng thời gian giữa 2 khách hàng liên tiếp
(NX X là khoảng thời gian giữa 2 lần liên tiếp xuất hiện biến cố hiếm với thời gian trung
bình 0,1(giờ))
coi X có phân phối mũ với = 1/0,1 = 10
12 (ph) = 0,2 (giờ)
Ta có P( 0< X < 0,2) = F(0,2) F(0) = 1e10.0,2 0 = 0,8647
Giả sử X i (I = 1,2, …,k) là các ĐLNN độc lập và có phân phối chuẩn tắc(X i ~N(0, 1 ))
Với bậc tự do n đủ lớn, qui luật 2 xấp xỉ qui luật chuẩn
4.4 Giới thiệu phân phối Student
Trang 37y
fT(t)
| |
t t t
y
f F (x)
|
V n
phân phối theo qui luật Student với n bậc tự do, ký hiệu T n
Với n > 2, T là ĐLNN liên tục có hàm mật độ f T (x) với dạng
Khi n đủ lớn,có thể dùng phân phối chuẩn tắc thay cho phân phối Student
4.5 Giới thiệu phân phối FisherSnedecor
Cho U, V là hai ĐLNN độc lập và U có phân phối 2 (m)với m bậc tự do, V có phân phối
2 (n) với n bậc tự do Khi đó
Trang 38Chương III
I.LÝ THUYẾT MẪU
1.1.TỔNG THỂ VÀ MẪU NGẪU NHIÊN
1.1.1 Tổng thể (tập hợp chính)
Tập hợp các phần tử mà ta cần khảo sát về một hay một số dấu hiệu nào đó gọi là một tổng thể
Chẳng hạn, ta cần nghiên cứu chiều cao của các cây bạch đàn trên một vùng đất
Dấu hiệu nghiên cứu là chiều cao
Tổng thể nghiên cứu là tập hợp các cây bạch đàn trên vùng đất đó
Gọi X(m) là chiều cao mỗi cây bạch đàn (chọn ngẫu nhiên) trong vùng
X là một ĐLNN
Ta có thể coi việc nghiên cứu chiều cao của các cây này là nghiên cứu ĐLNN X trên tổng thể Bài toán nghiên cứu dấu hiệu trên tổng thể thường đưa đến bài toán nghiên cứu ĐLNN X trên tổng thể
1.1.2 Phương pháp mẫu
Thường tổng thể cần nghiên cứu là rất lớn Trong thực tế nói chung người ta không nghiên cứu toàn bộ các phần tử của tổng thể vì
+Tốn kém nhiều (về thời gian, nhân lực, tiền bạc, …)
+Việc quan sát, kiểm tra có thể mang tính hủy hoại các phần tử tổng thể (chẳng hạn kiểm tra hàm lượng các chất trong các hộp sữa, trong các hộp thuốc, …)
+Có nhiều trường hợp không thể xác định toàn bộ các phần tử của tổng thể (chẳng hạn kiểm tra các bệnh nhân HIV, chiều cao một loài cây, …)
Do đó người ta thường sử dụng phương pháp mẫu, đại khái như sau:
Giả sử cần nghiên cứu một dấu hiệu trên một tổng thể gồm N phần tử
Người ta chọn ngẫu nhiên có hoàn lại n phần tử Ta gọi đó là một mẫu kích thước n (nói chung n là nhỏ so với N)
Lần lượt nghiên cứu dấu hiệu trên các phần tử cụ thể của mẫu và rồi bằng các phương pháp khoa học, rút ra kết luận về dấu hiệu trên tổng thể đó
Tuy nhiên, nhiều khi do thực tế không thể làm như trên hay do tổng thể là không xác định, nhiều trường hợp khó lấy được mẫu mang tính đại diện cho tổng thể
Thường người ta yêu cầu
+Người lấy mẫu là các chuyên gia được đào tạo bài bản và có kinh nghiệm với các dạng tổng thể cần lấy mẫu
+Các dụng cụ, máy móc để cân đo và ghi dữ liệu phải được chọn lựa và tinh chỉnh để có độ chính xác đạt mức chấp nhận được
Ngoài ra số phần tử n trong mẫu không được quá bé ( Chẳng hạn, tác giả Calvin Dytham đề
Trang 39Phương pháp lấy mẫu sẽ được các chuyên gia lựa chọn phù hợp với các dạng tổng thể phải lấy mẫu và phù hợp với thực tế Điều này sẽ được trình bày cụ thể hơn trong các giáo trình của thống kê ứng dụng
Trong khuôn khổ bài giảng này, những ví dụ và các bài tập chỉ đơn giản mang tính minh họa cho lý thuyết thống kê toán, nên ta chỉ xét các tổng thể cho phép giả định mẫu thỏa yêu cầu bảo đảm tính ngẫu nhiên và tính đại diện cho tổng thể
1.1.3 Mẫu ngẫu nhiên kích thước n của ĐLNN
Giả sử xét ĐLNN X trên một tổng thể
Ta sẽ n lần thực hiện thao tác sau: lấy ngẫu nhiên phần tử của tổng thể, “đo” giá trị X rồi hoàn lại
Giá trị X sẽ “đo” được trên phần tử thứ i được gán là trị của Xi , i= 1, 2, …, n
Khi chưa có trị cụ thể, các đại lượng X1, X2, …, Xn là các ĐLNN độc lập; chúng là các bản sao của X và có cùng qui luật phân phối xác suất với X
Ta gọi bộ thứ tự n ĐLNN (X1, X2, …, Xn) là mẫu ngẫu nhiên (kích thước n) của ĐLNN X
Giả sử sau khi thực hiện xong cụ thể n lần lấy và “đo”, ta được mẫu số liệu cụ thể
(x1,x2,…,xn) Ta gọi mẫu số liệu này là một mẫu cụ thể của ĐLNN X và mẫu số liệu này cũng
là một giá trị cụ thể của mẫu ngẫu nhiên (X1,X2,…,Xn)
n
X X
F là tỉ lệ có t/c A trong mẫu
n phần tử sẽ lấy ngẫu nhiên
Trang 40*Ta định nghĩa phương sai mẫu không hiệu chỉnh 2 2 2 2
có n(n1) số hạng và E(Xi)E(Xj) = E(X).E(X)
Suy ra (n1)E(S2) = nE( X2 ) [ nE(X2) +n(n1)[E(X)]2 ]/n
= 2 2
(n 1)E X (n 1) E(X)
Ta có E(S2) = E(X2) [ E(X)]2 = D(X)
iii)Gọi Y là số phần tử có tính chất A trong mẫu n phần tử (có hoàn lại)
Khi kích thước mẫu n đủ lớn, thực tế coi
Trung bình mẫu X E X( ): trung bình tổng thể
Phương sai mẫu 2 2
( )
S D X : phương sai tổng thể