Đề cương ôn tập môn sác xuất thống kê và xử lý dữ liệu. Bộ đề cương bao gồm các dạng câu hỏi thường gặp khi thi môn sác xuất thống kê và xử lý dữ liệu. Bao gồm các dạng thức tính toán, các ví dụ tính, ví dụ thực tế và công thức tính xác xuất thống kê.
Trang 1CHƯƠNG I: XÁC SUẤT CỦA BIẾN CỐ VÀ CÁC PHÉP TÍNH XÁC SUẤT
1 Phép thử
- là tập hợp tất cả các khả năng có thể có của một phép thử gọi là không gian
mẫu- không gian biến cố
- kí hiệu: Ω
2 Biến cố
- Là một tập hợp của không gian mẫu
3 Định nghĩa cổ điển về xác suất
Gọi A là biến cố xảy ra: P(A) = m/n với m (A) là số phần tử của A, n(Ω) là số phần tử của Ω
NOTE: Dùng định nghĩa cổ điển với các kết quả đồng khả năng ( khả năng xảy ra đều nhau) và tính được số các kết quả có thể có của phép thử
Định nghĩa về thống kê
a) Thực hiện n phép thử thấy rằng m lần xuất hiện kết quả (A) => xác suất của
biến cố A là
P(A) = Lim m/n ~~ m/n ( n => +∞)
VD1 Trong các biến cố sau, biến cố nào dùng định nghĩa cổ điển:
A Ngày noel năm nay trời nắng
Trang 24 Các phép tính về xác suất
Quan hệ giữa các biến cố
- Giao của A và B là biến cố A.B : gồm tất cả các kết quả chung của biến cố A
và B
- Hợp của 2 biến cố A và B là biến cố A hợp B
- 2 biến cố gọi là xung khắc nếu A giao B = rỗng
- 2 biến cố gọi là độc lập nếu kết quả xảy ra của biến cố này không làm ảnh hưởng đến kết quả xảy ra của biến cố kia ( Vd sinh con gái không có nghĩa là lần sau sinh con trai) , biến cố đối của A là ⩜
- 2 biến cố gọi là đối lập nếu: A ᴒ B = rỗng ; A hợp B= Ω
Phép toán giữa các biến cố
VD1 Xác suất đi từ nhà đến trường gặp đèn đỏ ở 2 ngã tư là 0,6 và 0,3 Một
sinh viên đi từ nhà đến trường tính xác suất để người đó:
c) Gọi X2 là biến cố gặp đèn đỏ 2 lần => X2= A1.A2
Vì A1, A2 độc lập = P(X2)= P(A1.A2) P(A1) P(A2) = 0,6 0,3 = 0,18
Trang 3d) Gọi X3 là biến cố gặp đèn đỏ ít nhất 1 lần
X ngang3 là biến cố không gặp đèn đỏ lần nào => P(X3) = 1- P(Xngang3) = 1- 0,28 = 0,72
VD3 1 đề cương ôn tập có 10 câu 1 sinh viên chỉ thuộc 7 câu 1 đề thi gồm 3
câu trong đề cương Tính xác suất để:
a) Sinh viên không thuộc câu nào trong đề thi
b) Sinh viên thuộc 1 câu
c) Sinh viên thuộc 2 câu
d) Sinh viên thuộc 3 câu
Bài giải
Gọi : Ω = chọn 3 câu trong 10 câu => n (Ω) = C3/10 ( Ω là không gian mẫu, n
là số phần tử của không gian mẫu)
a) Gọi X0 là biến cố sinh viên không thuộc câu nào => n(X0) = C0.3= 1
Phép thử: gọi là phép thử Bernoulli nếu trong trong phép thử đó chỉ có 2 khả
năng xảy ra ( xảy ra hoặc không)
Thực hiện liên tiếp n phép thử Bernoulli một cách độc lập, thấy xác suất để K
lần xuất hiện biến cố A là:
Pn(K) = Ck/n P^k ( 1-p)^ n-k với p = P(A), trong đó P là xác suất của A
VD4 Theo điều tra xã hội học, tỉ lệ các cặp vợ chồng li hôn trong 5 năm đầu
sau khi kết hôn là 20% Chọn ngẫu nhiên 3 cặp vợ chồng đã kết hôn trong 5 năm Tính xác suất để
a) Không cặp nào ly hôn
b) 1 cặp ly hôn
c) 2 cặp ly hôn
d) 3 cặp ly hôn
Bài giải
Mỗi cặp vợ chồng được chọn là một phép thử Bernoulli => P= 20%
a) Xác suất để không cặp nào ly hôn trong 3 cặp là:
P3(0) = C0/3 0,2^0 (1-20%) mũ 3-0
Trang 4a) Tính xác suất để 3 sinh viên chọn ra có cùng giới tính
b) Tính xác suất để 3 sinh viên chọn ra không có sinh viên nữ
c) Tính xác suất để 3 sinh viên chọn ra có 1 sinh viên nữ
d) Tính xác suất để 3 sinh viên chọn ra có 2 sinh viên nữ
e) Tính xác suất để 3 sinh viên chọn ra có 3 sinh viên nữ
Bài giải
Có Ω = chọn 3 sinh viên trong 10 sinh viên => Ω = C3/10
a) Gọi A là biến cố: “ 3 sv chọn ra có cùng giới tính”
A1 là biến cố “ 3 sinh viên chọn ra là nam”
A2 là biến cố “ 3 sinh viên chọn ra là nữ”
Ta có A= A1+A2, do A1, A2 xung khắc nhau
P(A) = P(A1) + P(A2) = n(A1)/n + n(A2)/n
VD6 Theo điều tra xã hội học, tỷ lệ sinh viên học đúng nghề là 80% Khảo sát
3 sinh viên đang theo học gọi X là số sinh viên học đúng nghề mà họ yêu thích tính xác suất để
a) X = 0
Trang 5b) X= 1
c) X=2
d) X=3
Bài giải
Mỗi sinh viên được chọn là một phép thử Bernoulli => P= 80%
a) Xác suất để không có sinh viên nào làm đúng nghề mà họ yêu thích là
VD7 1 phòng làm việc có 2 máy điện thoại hoạt động độc lập xác suất hỏng
trong 1 tháng của từng máy là 0,1; 0,2 Gọi X là số máy bị hỏng trong tháng Tính xs để
a) X=0
b) X=1
c) X=2
d) Để không quá 1 máy bị hỏng trong 1 tháng ( X≤1)
e) Giá để sửa 1 máy là 750k tính trung bình tiền sửa đt 1 tháng
vì A1 ⩜2 và ⩜1A2 là xung khắc, A1⩜2 và ⩜1A2 là độc lập
a) Gọi X0 là xác suất không có máy nào hỏng trong tháng
Trang 61 Biến ngẫu nhiên
- Là đại lượng có thể lấy bất kỳ 1 trong các giá trị có thể của nó với một xác
suất tương ứng xác định
- BNN được ký kiệu bằng chữ cái in hoa
- Các giá trị của BNN được biết bằng chữ thường
- Biến cố “ Biến ngẫu nhiên X nhận giá trị xi” được viết là (X= xi)
Xác suất của biến cố ( X= xi) kí hiệu là pi
pi= P(X= xi)
- Vd: gieo 1 con xúc xắc cân đối và đồng chất gọi X là : số chấm xuất hiện trên
con xúc xắc” => X là biến ngẫu nhiên
- Phân loại biến ngẫu nhiên
BNN rời rạc: nếu tập hợp các giá trị mà nó có thể nhận là một tập hợp hữu hạnhoặc vô hạn đếm được
BNN liên tục
2 Quy luật phân phối xác suất của BNN
1 Bảng phân phối xác suất
VD1 Theo điều tra xhh, tỷ lệ sinh viên ra trường không tìm được việc làm sau
1 năm tốt nghiệp là 40% Chọn ngẫu nhiên 3 sv đã tốt nghiệp được 1 năm Gọi
X là số sinh viên chưa có việc làm trong 3 sinh viên trên Hãy lập bảng phân phối xác suất của X
Trang 7VD2 1 đề cương ôn tập có 10 câu 1 sinh viên đi thi chi thuộc 7 câu 1 đề thi
gồm 3 câu được rút ngẫu nhiên trong đề cương Gọi X là số câu sinh viên thuộc trong đề Hãy lập bảng phân phối xs của X
Ta có bảng phân phối xác suất
2 Hàm phân phối xác suất
- Của BNN X là hàm của x, kí hiệu F(x), được xác định như sau
Trang 8 Kì vọng toán của tổng của 2 BNN = tổng kì vọng toán thành phần
E( X+Y) = E(X) + E(Y)
Nếu X, Y là BNN, a; b là hằng số
E(aX + bY) = aE(X) + bE(Y)
VD3.( đề 2+6+10) Cho X là lợi nhuận của công ty A trong 1 năm (tỷ đồng), X
có bảng phân phối xác suất như sau
a) Tính xác suất để sinh viên này thuộc ít nhất 2 câu trong đề
b) Nếu sinh viên đó thuộc 1 câu trong đề thì được 3 điểm
c) Nếu sv đó thuộc 2 câu trong đề thì được 7 điểm
d) Nếu sinh viên đó thuộc 3 câu trong đề thì được 10 điểm
e) Tính số điểm mà sinh viên đó kỳ vọng nhận được
c) Xác suất để sinh viên thuộc 2 câu trong đề thi được 7 điểm là: 7 0,525 =3,675
d) Xác suất để sinh viên thuộc 3 câu trong đề thi được 10 điểm là: 10 0,2917=
Trang 9- Trong lĩnh vực kinh doanh, phương sai đặc trưng cho mức độ rủi ro
VD6 1 tổ có 10 sinh viên, trong đó 3 sinh viên có học lực giỏi, 4 sinh viên có
học lực khá, còn lại có học lực trung bình Chọn ngẫn nhiên 3 sinh viên từ tổ đó
a) Tính xác suất để 3 sinh viên chọn ra có cùng loại học lực
b) Gọi X là số sv có học lực giỏi trong 3 sv chọn ra Hãy lập bảng phân phối xs
- X là BNN => Độ lệch chuẩn của X kí hiệu là Ϭ(X) = √ V ( X )
- MODE của X là giá trị của BNN ứng với xác suất lớn nhất
d) MỘT SỐ QUY LUẬT PHÂN PHỐI XÁC SUẤT
Trang 10 Quy luật nhị thức ( giống bernoulli)
BNN rời rạc X được gọi là tuân theo quy luật nhị thức với 2 tham số n và p, kíhiệu
X~ B( n,p) nếu X nhận các giá trị có thể có là 0,1,2,… n và các xác suất tương
ứng được tính theo công thức Bernoulli
VD7 Theo điều tra xhh, tỷ lệ sinh viên ra trường không có việc làm sau 1 năm
tốt nghiệp là 40% Điều tra ngẫu nhiên 100 sv đã tốt nghiệp được 1 năm thì trung bình có bao nhiêu sinh viên chưa có việc làm? Số sinh viên chưa có việclàm có khả năng xảy ra nhiều nhất là bao nhiêu?
QUY LUẬT PHÂN PHỐI CHUẨN
- BNN liên tục X nhận giá trị trong khoảng ( -∞ ; +∞) gọi là tuân theo quy luật phân phối chuẩn với 2 tham số m và σ ², kí hiệu X~N ( m, σ ²), nếu hàm mật
- Hàm mật độ xác suất của phân phối chuẩn tắc, kí hiệu φ (u), có dạng
φ (u)= 1/ √ 2 π e^ => hàm φ (u) được gọi là Gauss
- Hàm phân phối xác suất của phân phối chuẩn tắc, kí hiệu θ (u), có dạng
θ (u)= 1/ √ 2 π ∫ u , −∞ e ^ u²/2 du
- Công thức quan trọng:
Trang 11 θ (u) = 0,5 + θ o (u)
θ (u) là hàm lẻ, tức là θ o (−u) = - θ o (u)
θ o (u) là hàm tăng, nhưng nó tăng tăng không đáng kể với u >5 => trong thực tế, nếu u>5 ta có thể cho
θ o (u) xấp xỉ=θ o(5)
- CT TÍNH XÁC SUẤT THEO PHÂN PHỐI CHUẨN
Nếu X~N ( m, σ ²) thì
P (a <X< b) = θ.( b-m/σ) – θ ( a-m/ σ)
Vì θ (u) = θo (u) + 0,5 nên
P (a <X< b) = θo ( b-m/σ) - θo ( a-m/ σ)
VD8 ? Chiều cao của thanh niên nam trưởng thành ở 1 quốc gia lập thành
biến ngẫu nhiên X có phân phối chuẩn với chiều cao trung bình bằng 162cm
và độ lệch chuẩn bằng bằng 7cm
a) Tính tỷ lệ thanh niên nam ở quốc gia đó có chiều cao >172cm
b) Chọn ngẫu nhiên ra 50 thanh niên nam ở vùng đó thì trung bình có bao nhiêu
thanh niên có chiều cao >172cm và khả năng xảy ra nhiều nhất là bao nhiêu?
Bài giải
a) Theo đề bài, X có phân phối chuẩn với m = 162,
σ= 7 Tỷ lệ tn nam ở quốc gia đó có chiều cao > 172cm là
b) Gọi Y là số tn có chiều cao trên 172cm trong 50 tn nam được chọn ngẫu nhiên
ở vùng đó Y có phân phối nhị thức với n = 50 và p = 0,1764
Số thanh niên trung bình có chiều cao > 172cm trong 50 thanh niên là
Trang 120,25
0,1c)
X3
15
0,15
0,3
0,20
0,15
d)
X4
15
0,25
0,2
0,25
0,15CHỌN C?
BT2 Chọn ngẫu nhiên 3 đứa trẻ từ một nhóm gồm 6 bé trai và 4 bé gái Gọi X
là số bé gái trong nhóm Lập bảng phân phối xác suất của X
Bài làm
Gọi X là số bé gái trong nhóm X là biến ngẫn nhiên rời rạc => X= 0, 1, 2, 3
Ta có X = 0 là biến cố “ trong 3 đứa trẻ không có bé gái nào”
BT3 ĐỀ O8: Theo điều tra xhh thì tỷ lệ các sinh viên học đúng nghề mà họ
yêu thích là 80% Khảo sát ngẫu nhiên 3 sinh viên đang theo học ở một trường
Trang 13đại học gọi X là số sinh viên học đúng nghề mà họ yêu thích trong 3 sinh viênchọn ra Lập bảng phân phối xác suất của X.
Bài giải
Gọi X là số sinh viên học đúng nghề mà họ yêu thích
X là biến ngẫu nhiên => X= 0,1,2,3
P(X=0)= C0/3 0,8^0 0,2^3 ? = 0,008
P(X=1)= C1/3 0,8^1 0,2^2 = 0,096
P(X=2)= C2/3 0,8^2 0,2^1 =0,384
P(X=3)= C3/3 0,8^3 0,2^0 = 0,512
Có bảng phân phối xác suất
BT4 Một xí nghiệp có 2 ô tô vận tải xác suất bị hỏng trong thời gian t của 2 ô
tô tương ứng là 0,1 và 0,2 Gọi X là số ô tô bị hỏng trong thời gian t hãy lập bảng phân phối xác suất và tính hàm phân phối xác suất của X
BT1 Đề 07 Một tổ có 10 sinh viên, trong đó có 4 sinh viên nam và 6 sinh
viên nữ chọn ngẫu nhiên ra 3 sinh viên từ tổ đó Gọi X là số sinh viên nữ trong 3 sinh viên chọn ra
a) Hãy lập bảng phân phối xác suất của X.
Trang 14Phương sai của X là
d) Gọi X1 là xác suất để 3 sinh viên chọn ra có cùng giới tính
P(X1) = C3/4+ C3/6 : C3/10 = 0,2 (sao không là nhân)
BT2 ĐỀ 04 Theo điều tra xã hội học thì tỷ lệ các cặp vợ chồng ly hôn trong
năm đầu sau kết hôn là 20% Khảo sát ngẫu nhiên 3 cặp vợ chồng đã kết hôn trong 5 năm
a) Hãy lập bảng phân phối xác suất của X
b) Tính E(2X- 5) và V( 3-2X)
c) Điều tra ngẫu nhiên 50 cặp vợ chồng đã kết hôn được 5 năm thì trung bình có
bao nhiêu cặp ly hôn? Số cặp ly hôn có khả năng nhất là bao nhiêu
Trang 1550.0,2 + 0,2-1 ≤ Mode Y ≤ 50.0,2 + 0,2
9,2 ≤ Mode Y ≤ 10,2 => Mode y= 10 ?
BT3 Theo điều tra xã hội học thì tỷ lệ các sinh viên học đúng nghề mà họ yêu
thích là 80% Khảo sát ngẫu nhiên 3 sinh viên đang theo học ở một trường đại học Gọi X là số sinh viên học đúng nghề mà học yêu thích trong 3 sinh viên chọn ra,
a) Lập bảng phân phối xác suất của X
b) Tính E(3X-4) và V(3-4X)
c) Nếu khảo sát ngẫu nhiên 50 sinh viên học đúng nghề mà họ yêu thích có khả
năng nhiều nhất là bao nhiêu?
Bài giải
a) NX: Mỗi một sinh viên chọn ra là một phép thử Bernoulli, => p= 0,8
Gọi X là số sinh viên học đúng nghề mà họ yêu thích => X= 0,1,2,3
Y là biến ngẫu nhiên có phân phối nhị thức n= 50 và p= 0,8
Số sinh viên học đúng nghề khi ra trường là
BT4 (NHĐ.02+NHĐ.10) Theo nhận định của cơ quan quản lý chất lượng
thực phẩm tại thành phố A thì chỉ có 60% số cơ sở kinh doanh thực phẩm tại thành phố này là đạt tiêu chuẩn vệ sinh an toàn thực phẩm Nhân tháng "Vệ sinh an toàn thực phẩm", cơ quan này sẽ kiểm tra ngẫu nhiên 3 cơ sở kinh
Trang 16doanh thực phẩm tại một chợ Gọi X là số cơ sở không đạt tiêu chuẩn vệ sinh
an toàn thực phẩm trong 3 cơ sở kiểm tra
a) Lập bảng phân phối xác suất của X
b) Tính E(2X −5) và V (3−2X) c) Điều tra ngẫu nhiên 100 cơ sở kinh doanh thực phẩm tại thành phố đó thì trung bình có bao nhiêu cơ sở không đạt tiêu chuẩn vệ sinh an toàn thực phẩm? Số cơ sở không đạt tiêu chuẩn vệ sinh an toàn thực phẩm có khả năng xảy ra nhiều nhất là bao nhiêu?
E(2X-5)= E(2X) – E(5)= 2(EX)-5 = 2.1,8-5= -1,4
Phương sai của X là
V(X)= E(X)² - [E(X)]² = 3,96- (1,8)² = 0,72
V(3-2X)= V(3) + V(-2X)= 0 + 4.V(X)= 0+ 0,72= 2,88
d) Gọi Y là số cơ sở không đạt tiêu chuẩn VSATTP trong 100 cơ sở => Y là biếnngẫu nhiên có phân phối nhị thức n= 100 và p=0,6
Số cơ sở không đạt tiêu chuẩn là: E(Y)= 100.0,6= 60
Số cơ sở không đạt tiêu chuẩn VDATTP có khả năng nhiều nhất là
100.0,6+ 0,6-1 ≤ Mode Y ≤ 100.0,6 + 0,6
59,6 ≤ Mode Y ≤ 60,6
Mode Y= 60
BT5 (NHĐ.03) Một sinh viên đi từ nhà đến trường phải đi qua 2 ngã tư Xác
suất gặp đèn đỏ ở các ngã tư lần lượt là 0,3; 0,4
a) Gọi X là số ngã tư mà sinh viên đó gặp đèn đỏ khi đi từ nhà đến trường Lập bảng phân phối xác suất của X
b) Tính E(5X −2) và V (4−3X)
c) Biến ngẫu nhiên và quy luật phân phối xác suất 06/04/2016
c) Nếu mỗi ngã tư gặp đèn đỏ phải chờ khoảng 50 giây, thì thời gian trung bình mà sinh viên đó phải dừng trên đường khi gặp đèn đỏ là bao nhiêu?
Bài giải
Trang 17a) Gọi X là số ngã tư sinh viên đó gặp đèn đỏ khi đi từ nhà đến trường => X= 0,1,2
Gọi A1 là biến cố gặp đèn đỏ ở ngã tư 1=> P(A1)= 0,3
Gọi Angang1 là biến cố không gặp đèn đỏ ở ngã tư 1
=>> P(Angang1) = 1- 0,3 = 0,7
A2 là biến cố gặp đèn đỏ ở ngã tư 2 => P(A2) = 0,4
Gọi Angang2 là biến cố không gặp đèn đỏ ở ngã tư 2
=>> P(Angang2) = 1- 0,4= 0,6
Vì Angang1 và Angang2 độc lập
P(X=0)= P(Angang1 Angang2)
= P(Angang1) P(Angang2)= 0,7.0,6= 0,42
Vì A1, Angang1 và A2, Angang2 là độc lập, Angang1, Angang2 xung khắc
Có P(X=1) = P(A1.Angang2) + P(Angang1 A2)
= P(A1) P(Angang2) + P(Angang1) P(A2)
= 0,3.0,6 + 0,7 0,4 = 0,46
Có P(X=2)= P(A1.A2)= P(A1) P(A2)= 0,3.0,4= 0,12
Ta có bảng phân phối xác suất
BT6 (NHĐ.05) Một đề cương ôn tập một môn học có 10 câu Một sinh viên
đi thi chỉ thuộc 7 câu Một đề thi gồm 3 câu được rút ngẫu nhiên trong đề cương Gọi X là số câu sinh viên đó thuộc trong đề Tính kỳ vọng và phương sai của X
Bài giải
Gọi Ω = chọn 3 câu trong 10 câu => n(Ω)= C3/10
Gọi X0 = sinh viên đó không thuộc câu nào
n(X0)= C0/3 C3/7= 35=> P(X0) =35: C3/10= 0,2917
Gọi X1= sinh viên thuộc 1 câu, không thuộc 2 câu
Trang 18- phương sai của X là: V(X)= 2,7583
BT7 (NHĐ.08) Theo điều tra xã hội học thì tỷ lệ các sinh viên học đúng nghề
mà họ yêu thích là 80% Khảo sát ngẫu nhiên 3 sinh viên đang theo học ở một trường đại học Gọi X là số sinh viên học đúng nghề mà họ yêu thích trong 3 sinh viên chọn ra Tính kỳ vọng và độ lệch chuẩn của X
BT8 (NHĐ.04+NHĐ.05) Có 4 phương án đầu tư vào một vùng kinh tế Lãi
suất (triệu USD) của các phương án là các biến ngẫu nhiên X1, X2, X3, X4 có
kỳ vọng và phương sai như sau: Phương án nào là tốt nhất?
a) E(X1) = 150; V (X1) = 2500
b) E(X2) = 180; V (X2) = 1600 ???
c) E(X3) = 180; V (X3) = 2500
d) E(X4) = 150; V (X4) = 1600
BT9 (NHĐ.03) Có 4 phương án đầu tư vào một vùng kinh tế Lãi suất (triệu
USD) của các phương án là các biến ngẫu nhiên X1, X2, X3, X4 có kỳ vọng
và phương sai như sau: Phương án nào là tốt nhất?
a) E(X1) = 150; V (X1) = 2500
b) E(X2) = 180; V (X2) = 3600
c) E(X3) = 150; V (X3) = 3600
d) E(X4) = 180; V (X4) = 2500 ???