Giá trị tin chắc nhất của đại lượng ngẫu nhiên rời rạc X [ký hiệu là ModX] là giá trị của X ứng với xác suất lớn nhất ưong bảng phân phối xác suất.. Nếu X là đại lượng ngẫu nhiên liên tụ
Trang 1TRƯỜNG ĐẠI HỌC NGÂN HÀNG TPHCM
BỘ MÔN TOÁN KINH TẾ
BÀI TIỂU LUẬN
HỌC PHẦN
LÝ THUYẾT XÁC XUẤT VÀ THỐNG KÊ TOÁN HỌC
Sinh viên thực hiện : Nguyễn Đào Lan Anh
TP Thủ Đức, ngày 14 tháng 11 năm 2021
Trang 2Phần I: XÁC SUẤT.
1 Xác xuất điều kiện
- Định nghĩa: Xác suất có điều kiện là xác suất của một biến cố A nào đó, biết rằng một biến cố B khác xảy ra
Ký hiệu: P(A|B), và đọc là "xác suất của A, biết B"
- Công thức: P(A|B) = P(AB)P(B) , P(B) > 0
- Tính chất:
+ P(A|B) ≥ 0
+ P(Ω|B) = P(B|B) = 1
+ Nếu A1, A2, , An(n ≥ 2) là các biến cố xung khắc từng đôi một, nghĩa là AiAj =
∅ với mọi i ≠ j, ta có:
P
i=1
n
Ai |B =
i=1
n
P(Ai|B)
1 Cộng xác suất
- Công thức: P(A+B) = P(A) + P(B) - P(AB), với A và B là hai biến cố bất kỳ
- Công thức tổng quát: P(A1 + A2+ + An) = -(-1)n-1P(A1.A2 An)
- Hệ quả: Nếu A và � là hai biến cố đối lập với nhau thì: P(A) = 1 - P (�)
2 Nhân xác suất
- Công thức: P(A.B) = P(A).P(B|A) = P(B).P(B|A) với P(A) > 0, P(B) > 0
- Công thức tổng quát:
P(A1+ A2+ + An) = P(A1)P(A2|A)P(A3|A1A2) P(An|A1A2 An-1)
với P(A1+ A2+ + An-1) > 0
3 Công thức đầu đủ
Trang 3- Hệ đầy đủ các biến cố:
Hệ các biến cố {B1,B2,…,Bn} được gọi là đầy đủ nếu thỏa mãn đồng thời hai điều kiện:
+ B1, B2,…,Bnlà các biến cố xung khắc từng đôi một, nghĩa là BiBj= ∅ với mọi i ≠ j, + Ω = B1∪B2∪ ∪Bn
Nhận xét rằng, hệ {B, �} là một hệ đầy đủ, trong đó B là một biến cố bất kỳ
- Công thức:
Giả sử {B1,B2,…,Bn} là hệ đầy đủ các biến cố với P(Bi) > 0,∀i = 1,2,…,n Khi đó với bất kỳ biến cố A, ta có
P(A)=P(B1)P(A|B1)+P(B2)P(A|B2)+ +P(Bn)P(A|Bn)
4 Công thức Bayes - Định lý Bayes
Giả sử P(A) > 0 và {B1,B2,…,Bn} là hệ đầy đủ các biến cố với P(Bk) > 0 với mọi
k = 1,2,…,n Khi đó với mọi k = 1,2,…,n, ta có
P(Bk|A) = P(Bk)P(A|Bk)P(B1)P(A|B1) + P(B2)P(A|B2) + +P(Bn)P(A|Bn)
5 Kỳ vọng
- Kỳ vọng của biến ngẫu nhiên là trung bình của biến ngẫu nhiên Kỳ vọng của biến ngẫu nhiên X được kí hiệu là E X :
E X = ∀i
xipi
−∞
∞
xf(x)dx
- Kỳ vọng có một số tính chất như sau:
E(c) = c với c là hằng số
E(cX) = cE(X) với c là hằng số
Trang 4 E[aX+b] = aE[X]+b với a, b là các hằng số
E[X+Y] = E[X]+E[Y]
E[XY] = E[X]E[Y] với X, Y là độc lập
E g(X) = ∀ig(xi)pX(xi)
−∞
∞
g(x)f(x)dx
6 Phương sai
- Phương sai Var(X) là trung bình của bình phương khoảng cách từ biến ngẫu nhiên X tới giá trị trung bình: Var(X)=E[(X-E[X])2]
- Việc tính toán dựa vào công thức này khá phức tạp, nên trong thực tế người ta thường
sử dụng công thức tương đương sau:Var(X)=E[X2]-E2[X]
- Phương sai có một số tính chất sau:
Var(c) = 0 với c là hằng số
Var(cX) = c2Var(X) với c là hằng số
Var(aX+b) = a2Var(X) với a, b là các hằng số
Var(X+Y) = Var(X)+Var(Y) với X, Y là độc lập
7 Mod
Giá trị tin chắc nhất của đại lượng ngẫu nhiên rời rạc X [ký hiệu là Mod(X)] là giá trị của X ứng với xác suất lớn nhất ưong bảng phân phối xác suất
Nếu X là đại lượng ngẫu nhiên liên tục có hàm mật độ xác suất f(x) thì Mod(X) là giá trị của X mà tại đó hàm mật độ đạt giá trị cực đại
Chú ý: Mod(X) có thể nhận nhiều giá trị khác nhau
Trang 58 Trung vị
Trung vị (median) là điểm chia đều xác suất thành 2 phần giống nhau, kí hiệu
là med(X): P(X < med(X)) = P(X ≥ med(X)) = 0.5
Như vậy trung vị là nghiệm của phương trình hàm tích lũy xác suất: FX(x) = 0.5
9 Luật phân phối của biến ngẫu nhiên
- Quy luật phân phối chuẩn
+ Định nghĩa:
Biến ngẫu nhiên liên tục X nhận các giá trị trong khoảng ( − ∞; + ∞) gọi là phân phối theo quy luật chuẩn với các tham số μ và �2, nếu hàm mật độ xác suất của nó
có dạng:
f(x) = 1
σ 2π�
−(�−�)2 2�2
Nếu tiến hành khảo sát hàm số trên và vẽ đồ thị của nó ta sẽ thu được các kết luận sau đây:
‒ Hàm số xác định trên toàn trục Ox
‒ Với mọi giá trị của x, hàm số luôn luôn dương, như vậy, đồ thị của nó luôn nằm cao hơn trục Ox
‒ Khi x →± ∞ thì f(x) → 0, tức trục Ox là đường tiệm cận ngang
‒ Ta tìm đạo hàm bậc nhất: f'(x) = −σx−μ3 2πe−(x−μ)22σ2
Dễ dàng thấy
rằng: f'(x) = 0 khi x = μ, f'(x) > 0 khi x < μ, f'(x) < 0 khi x > μ Như vậy, khi x = μ, hàm số có cực đại bằng� 2�1
‒ Hiệu x − μ trong biểu thức của hàm f(x) nằm trong dạng bình phương, tức là hàm số đối xứng qua đường thẳng x = μ
Trang 6‒ Ta tìm đạo hàm bậc hai: f''(x) = −σ312πe−(x−μ)22σ2 1 −(x−μ)σ2 2
Dễ dàng thấy rằng: khi x = μ + σ và x = μ − σ, đạo hàm bậc hai bằng 0 và đi qua hai điểm đó nó đổi dấu Tại cả hai điểm đó, hàm số đều bằng� 2��1 Như vậy,
hàm có các điểm uốn là: μ + σ;� 2��1 và μ − σ;� 2��1
Đồ thị hàm f (x) và đồ thị sự thay đổi của f(x) theo σ:
Hai tham số μ và σ có ý nghĩa quan trọng trong phân phối chuẩn Khi μ và σ thay đổi, dạng đồ thị của hàm mật độ xác suất f(x) cũng thay đổi như sau: Khi μ thay đổi thì dạng của đường cong f(x) không thay đổi, song nó sẽ chuyển dịch sang phải hoặc sang trái theo trục Ox Khi μ tăng lên thì đồ thị sẽ dịch sang phải, còn
khi μ giảm thì đồ thị sẽ dịch sang trái Trái lại, khi σ thay đổi, dạng của đồ thị sẽ thay đổi theo Nếu σ tăng lên thì đồ thị sẽ thấp xuống và phình ra, còn khi σ giảm thì đồ thị sẽ cao lên và nhọn thêm
Hàm phân phối xác suất của biến ngẫu nhiên X phân phối theo quy luật chuẩn:
F(X) = 1
� 2��−∞
�
�−(�−�)
2
2� 2 ��
2 Các tham số đặc trưng của quy luật chuẩn:
– Kỳ vọng toán: E(X) = μ
– Phương sai: V(X) = σ2
– Độ lệch chuẩn: ��= �
Phân phối chuẩn được ký hiệu là N(μ, σ2) Có liên quan mật thiết với phân phối chuẩn là quy luật phân phối chuẩn hóa Giả sử biến ngẫu nhiên X phân phối chuẩn với kỳ vọng toán μ và độ lệch chuẩn � Xét biến ngẫu nhiên: U = X−μσ
- Quy luật nhị thức:
+ Định nghĩa:
Trang 7Biến ngẫu nhiên rời rạc X nhận một trong các giá trị có thể có x = 0, 1, 2, , n với các xác suất tương ứng được tính bằng công thức (2) gọi là phân phối theo quy luật nhị thức với các tham số là n và p
Quy luật nhị thức được ký hiệu là B(n,p) Bảng phân phối xác suất của biến ngẫu nhiên X phân phối theo quy luật nhị thức có dạng:
Với �0 = ��0�0��; �1 = ��1�1��−1; , �� = �������−�, , �� = ������0
Trong thực tế, đôi khi ta phải tính xác suất để biến ngẫu nhiên X phân phối theo quy luật nhị thức nhận giá trị trong một khoảng [x, x + h], trong đó h là một số nguyên dương (h ≤ n − x) Lúc đó, ta có thể tính xác suất này theo công thức:
P(x ≤ X ≤ x + h) = Px+ Px+1+ + Px+h Trong đó: ��, ��+1, , ��+ℎ được tính bằng công thức (2)
Ngoài ra, xuất phát từ công thức (2), ta cũng có được mối liên hệ truy chứng giữa các xác suất �� và ��−1như sau:
�� =�(� − � + 1)�� ��−1
+ Các tham số đặc trưng của quy luật nhị thức:
– Kỳ vọng toán: E(X) = np
– Phương sai: V(X) = npq
– Độ lệch chuẩn: �� = ���
Ngoài kỳ vọng toán, phương sai và độ lệch chuẩn, trong quy luật nhị thức, tham số mode cũng hay được dùng Nếu X phân phối theo quy luật nhị thức thì mode m0có thể được tìm trực tiếp từ bảng phân phối xác suất bằng cách tìm trong số các giá trị
có thể có của X giá trị tương ứng với xác suất lớn nhất Tuy nhiên, có thể tìm mode
Trang 8mà không cần phải xây dựng bảng phân phối xác suất Nó được xác định bằng công thức sau đây:np − q ≤ m0 ≤ np + p
Ta chú ý rằng, vì trong quy luật nhị thức mode phải là giá trị nguyên, do đó có thể xảy ra hai trường hợp: Nếu np + p là một số nguyên thì np − q cũng là một số nguyên, lúc đó mode sẽ cùng một lúc nhận hai giá trị: m0= np + p và m0= np − q Còn nếu np + p là một số thập phân thì mode sẽ là giá trị nguyên nằm trong khoảng hai số thập phân là np − q và np + p
10 Liên hệ giữa các luật phân phối
- Chuyển từ phân phối siêu bội sang phân phối nhị thức
p = NA/N
q = 1 − p
N > 20 n
- Chuyển từ phân phối nhị thức sang phân phối Poison
λ = np
� ≥ 30
�� < 5
� ≤ 0.1
- Chuyển từ phân phối nhị thức sang phân phối chuẩn
� ≥ 30
0.1 < � < 0.9
�� ≥ 5 ∧ �� ≥ 5
μ = np
σ = npq
P(X = k) ≈1σf(k − μσ )
P(a ≤ X < b) ≈ φ b − μσ − φ a − μσ
Trang 911 Ví dụ.
1 Xác suất bắn trúng đích mỗi lần của một thiện xạ là 0,8 Xạ thủ bắn 5 lần độc lập Tính xác suất:
a Cả 5 lần đều trúng đích
b 3 lần đầu trúng đích, 2 lần sau trượt
c Có 3 lần trúng đích
d Có ít nhất 1 lần trúng đích
Lời giải
Gọi Ailà “lần thứ i xạ thủ bắn trúng đích” i=1,2,3,4,5
a Gọi B “Cả 5 lần đều trúng đích”
P(B) = A1.A2.A3.A4.A5 = 0,8 0,8 0,8 0,8 0,8 = 0,32768
b Gọi C “3 lần đầu trúng đích, 2 lần sau trượt”
P(C) = A1 A2 A3 A4 A5 = 0,8 0,8 0,8 0,2 0,2 = 0,02048
c Gọi D “Có 3 lần trúng đích”
P(D) = C53 Ai Ai Ai Ai Ai = C53 0,8 0,8 0,8 0,2 0,2 = 0,2048
d Gọi E “Có ít nhất 1 lần trúng đích”
E “Không lần nào trúng đích”
P(E) = Ai Ai Ai Ai Ai = 0,2 0,2 0,2 0,2 0,2 = 0,00032
P(E) = 1 − P(E) = 1 − 0,00032 = 0,99968
2 Cho biến ngẫu nhiên X có phân phối xác suất:
8
1 4
1 4
1 4
1 8
Trang 10Và Y = 2X - 1 Tính P{Y<4}; EY, VY.
Giải
Bảng phân phối xác suất:
8
1 4
1 4
1 4
1 8
Ta có: P{Y<4} = P(Y=-1)+P(Y=1)+P(Y=3) =18+14+14 =58
EY = − 1.18 + 1.14 + 3.14 + 5.14 + 7.18 = 3
VY = ( − 1)21
8 + 12
1
4 + 32
1
4 + 52
1
4 + 72
1
8 − −1
1
8 + 1
1
4 + 3
1
4 + 5
1
4 + 7
1 8
= 6
3 Một đề thi trắc nghiệm gồm 10 câu hỏi độc lập Trong mỗi câu hỏi có 4 cách trả lời trong đó chỉ có 1 cách đúng Giả sử mỗi câu trả lời đúng được 5 điểm và mỗi câu trả lời sai bị trừ 1 điểm Một thí sinh không học hành gì, đi thi với tinh thần giao lưu
cọ xát lấy kinh nghiệm, làm bài bằng “nhân phẩm” Tìm số điểm có khả năng nhất Giải
X là số câu đúng ⇒ X~B(n = 10; p = 0,25)
Y là điểm số đạt được ⇒ Y = 5X − 1 (10 − X) = 6X − 10
Với xibất kì, ta có: X = xi ⇒ Y = xi− 10
⇒ P(X = xi) = P(Y = 6xi− 10)
Để P(X) lớn nhất thì �� = �0(�) (1)
Để P(Y) lớn nhất thì 6xi− 10 = m0(Y) (2)
Trang 11Thế (1) vào (2) ta được: 6m0(X) − 10 = m0(Y) (3)
Theo phân phối Nhị thức ta có:
(10 + 1) 0,25 − 1 ≤ m0(X) ≤ (10 + 1) 0,25
1,75 ≤ m0(X) ≤ 2,75
⇒ m0(X) = 2 (4)
Thay (4) vào (3), ta được: 6.2 − 10 = 2 = m0(Y)
Vậy điểm số có khả năng nhất là 2
4 Lãi suất đầu tư vào một công ty là biến ngẫu nhiên phân phối chuẩn Biết xác suất để đạt được lãi suất trên 20% một năm là 0,2 và dưới 10% một năm là 0,1 Tìm xác suất để đầu tư vào công ty đó sẽ được lãi ít nhất 14%/năm
Gọi X là lãi suất khi đầu tư vào công ty (%)⇒ X~N(μ; σ2)
Theo đề bài ta có: P(X > 20) =0,2
⇒ 1 − ϕ 20 − μσ = 0,2
⇒ ϕ 20 − μσ = 0,8
⇒ ϕ 20 − μσ = ϕ 0,84
⇒20 − μσ = 0,84
⇒ 20 − μ = 0,84σ (1)
Tương tự, ta cũng có: P(X > 10) =0,1
⇒ ϕ 10−μσ = 0,1
⇒ ϕ 10−μσ = 0,1
Trang 12⇒ ϕ 10 − μσ = ϕ −1,28
⇒10 − μσ =− 1,28
⇒ 10 − μ =− 1,28σ (2)
Kết hợp (1) và (2), ta được:
20 − μ = 0,84σ
20 − μ =− 1,28σ ⇒ � = 16,04� = 4,72
Theo yêu cầu bài toán, ta cần tính:
P(X > 14) = 1 − ϕ 14 − 16,044,72 = 1 − ϕ( − 0,43)
= 1 − 0,3336 = 0,6664
Phần 2: THỐNG KÊ
1 Trong một đợt kiểm tra cây cùng loại và cùng độ tuổi trong một vườn ươm,
người ta chọn được một mẫu gồm số cây và chiều cao cho trong bảng
Chiều cao (cm) 230 - 240 220 - 230 210 - 220 200 - 210 180 - 200
a Hãy ước lượng chiều cao trung bình của cây trong vườn ươm với độ tin cậy 96%
b Với độ tin cậy 97% hãy ước lượng tỉ lệ cây không đạt tiêu chuẩn trong vườn ươm Biết rằng tỉ lệ cây đạt tiêu chuẩn có chiều cao lớn hơn 210 cm
c Với độ tin cậy 95% hãy ước lượng phương sai của cây trong vườn ươm
d Có người cho rằng chiều cao trung bình của cây trong vườn ươm là 225 cm Cho nhận xét về ý kiến đó với mức ý nghĩa 5%
e Có người cho rằng tỉ lệ cây không đạt tiêu chuẩn có chiều cao lớn hơn 210 cm 20% Cho nhận xét về ý kiến đó với mức ý nghĩa 5%
Giải
Trang 13Ta có: n = 120; x = 219,5833; s = 13,1983; m=25; f=0,2083
a Gọi µ là chiều cao trung bình của cây trong vườn ươm Ta có:
Giá trị giới hạn:
1 − α = 0,96 ⇒ φ(zα
2) = 1 − α2 = 0,48 ⇒ zα = 2.05
Độ chính xác: ε = zα
2
s
n= 2,47 Khoảng ước lượng trung bình: μ ∈ (217,1089; 222,0578)
b Gọi ρ là tỷ lệ cây không đạt tiêu chuẩn Ta có:
Giá trị giới hạn:
1 − α = 0,97 ⇒ φ(zα
2) = 1 − α2 = 0,485 ⇒ zα
2 = 2.17
Độ chính xác: ε = zα
2
f(1−f)
n = 0.0804 Khoảng ước lượng tỷ lệ: ρ ∈ (0,1279; 0,2887)
c.χ 2(n − 1)s2
(n−1;α/2) ≤ σ2 ≤χ 2(n − 1)s 2
(n−1;1−α/2)
⇔6218754566 ≤σ2 ≤62187527471
⇔ 136,1969 ≤ σ2 ≤ 226,1969
d Gọi µ là chiều cao trung bình của cây trong vườn ươm
Giả thiết �0: �0 = 225 và �1: �0 ≠ 225
Mức ý nghĩa: ∝= 0,05 ⇒ zα
2 = 2,17 Giá trị tiêu chuẩn kiểm định: z = x−μ0
s n =− 4.4957
Do |z| = 4.4957 > zα
2 ⇒ Bác bỏ H0 Tức là bác bỏ tuyên bố trên trên với mức ý nghĩa 5%
Trang 14e Gọi ρ là tỷ lệ cây không đạt tiêu chuẩn.
Giả thiết �0: ρ0 = 0,2 và �1: ρ0 ≠ 0,2
Mức ý nghĩa: ∝= 0,05 ⇒ zα
2 = 2,17 Giá trị tiêu chuẩn kiểm định: z = f−ρ0
ρ0(1−ρ0) n =0,2282
Do |z| = 4.4957 < zα
2 ⇒ Chấp nhận H0 Tức là chưa có cơ sở bác bỏ tuyên bố trên trên với mức ý nghĩa 5%
2 Để so sánh hiệu quả của hai loại phân A và B đối với năng suất cà chua, người ta điều tra năng suất cà chua (đơn vị: quả) khi bón A, B cho kết quả:
Loại phân Số cây Năng suất trung
bình
Độ lệch tiêu chuẩn
Với mức ý nghĩa 5%, hãy cho biết loại phân A có hiệu quả hơn loại phân B không?
Ta có: n1 = 41; n2 = 61; x1 = 32,2; x2 = 28,4; s1 = 8,5 và s2 = 9,3
Gọi µ1, µ2 lần lượt là năng suất trung bình của phân bón A và B.
Giả thiết: H0 : µ1 = µ2 và H1 : µ1 > µ2
Mức ý nghĩa: α = 0.05 =⇒ z α = 1.65
Giá trị của tiêu chuẩn kiểm định:
z = x1 −x2
s12
n1+n2s22
= 2,1309
Do z = 2,1309 > z α = 1.65 =⇒Bác bỏ H0 Tức là đủ cơ sở để cho rằng hiệu quả của phân bón A cao hơn B với mức ý nghĩa 5%