1. Trang chủ
  2. » Giáo Dục - Đào Tạo

BÀI TIỂU LUẬN HỌC PHẦN LÝ THUYẾT XÁC XUẤT VÀ THỐNG KÊ TOÁN HỌC

14 9 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Bài Tiểu Luận Học Phần Lý Thuyết Xác Xuất Và Thống Kê Toán Học
Tác giả Nguyễn Đào Lan Anh
Trường học Trường Đại Học Ngân Hàng TP.HCM
Chuyên ngành Khoa học Dữ liệu và Thống kê
Thể loại bài tiểu luận
Năm xuất bản 2021
Thành phố TP Thủ Đức
Định dạng
Số trang 14
Dung lượng 1,23 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Giá trị tin chắc nhất của đại lượng ngẫu nhiên rời rạc X [ký hiệu là ModX] là giá trị của X ứng với xác suất lớn nhất ưong bảng phân phối xác suất.. Nếu X là đại lượng ngẫu nhiên liên tụ

Trang 1

TRƯỜNG ĐẠI HỌC NGÂN HÀNG TPHCM

BỘ MÔN TOÁN KINH TẾ

 BÀI TIỂU LUẬN

HỌC PHẦN

LÝ THUYẾT XÁC XUẤT VÀ THỐNG KÊ TOÁN HỌC

Sinh viên thực hiện : Nguyễn Đào Lan Anh

TP Thủ Đức, ngày 14 tháng 11 năm 2021

Trang 2

Phần I: XÁC SUẤT.

1 Xác xuất điều kiện

- Định nghĩa: Xác suất có điều kiện là xác suất của một biến cố A nào đó, biết rằng một biến cố B khác xảy ra

Ký hiệu: P(A|B), và đọc là "xác suất của A, biết B"

- Công thức: P(A|B) = P(AB)P(B) , P(B) > 0

- Tính chất:

+ P(A|B) ≥ 0

+ P(Ω|B) = P(B|B) = 1

+ Nếu A1, A2, , An(n ≥ 2) là các biến cố xung khắc từng đôi một, nghĩa là AiAj =

∅ với mọi i ≠ j, ta có:

P

i=1

n

Ai |B =

i=1

n

P(Ai|B)

1 Cộng xác suất

- Công thức: P(A+B) = P(A) + P(B) - P(AB), với A và B là hai biến cố bất kỳ

- Công thức tổng quát: P(A1 + A2+ + An) = -(-1)n-1P(A1.A2 An)

- Hệ quả: Nếu A và � là hai biến cố đối lập với nhau thì: P(A) = 1 - P (�)

2 Nhân xác suất

- Công thức: P(A.B) = P(A).P(B|A) = P(B).P(B|A) với P(A) > 0, P(B) > 0

- Công thức tổng quát:

P(A1+ A2+ + An) = P(A1)P(A2|A)P(A3|A1A2) P(An|A1A2 An-1)

với P(A1+ A2+ + An-1) > 0

3 Công thức đầu đủ

Trang 3

- Hệ đầy đủ các biến cố:

Hệ các biến cố {B1,B2,…,Bn} được gọi là đầy đủ nếu thỏa mãn đồng thời hai điều kiện:

+ B1, B2,…,Bnlà các biến cố xung khắc từng đôi một, nghĩa là BiBj= ∅ với mọi i ≠ j, + Ω = B1∪B2∪ ∪Bn

Nhận xét rằng, hệ {B, �} là một hệ đầy đủ, trong đó B là một biến cố bất kỳ

- Công thức:

Giả sử {B1,B2,…,Bn} là hệ đầy đủ các biến cố với P(Bi) > 0,∀i = 1,2,…,n Khi đó với bất kỳ biến cố A, ta có

P(A)=P(B1)P(A|B1)+P(B2)P(A|B2)+ +P(Bn)P(A|Bn)

4 Công thức Bayes - Định lý Bayes

Giả sử P(A) > 0 và {B1,B2,…,Bn} là hệ đầy đủ các biến cố với P(Bk) > 0 với mọi

k = 1,2,…,n Khi đó với mọi k = 1,2,…,n, ta có

P(Bk|A) = P(Bk)P(A|Bk)P(B1)P(A|B1) + P(B2)P(A|B2) + +P(Bn)P(A|Bn)

5 Kỳ vọng

- Kỳ vọng của biến ngẫu nhiên là trung bình của biến ngẫu nhiên Kỳ vọng của biến ngẫu nhiên X được kí hiệu là E X :

E X = ∀i

xipi

−∞

xf(x)dx

- Kỳ vọng có một số tính chất như sau:

 E(c) = c với c là hằng số

 E(cX) = cE(X) với c là hằng số

Trang 4

 E[aX+b] = aE[X]+b với a, b là các hằng số

 E[X+Y] = E[X]+E[Y]

 E[XY] = E[X]E[Y] với X, Y là độc lập

 E g(X) = ∀ig(xi)pX(xi)

−∞

g(x)f(x)dx​

6 Phương sai

- Phương sai Var(X) là trung bình của bình phương khoảng cách từ biến ngẫu nhiên X tới giá trị trung bình: Var(X)=E[(X-E[X])2]

- Việc tính toán dựa vào công thức này khá phức tạp, nên trong thực tế người ta thường

sử dụng công thức tương đương sau:Var(X)=E[X2]-E2[X]

- Phương sai có một số tính chất sau:

 Var(c) = 0 với c là hằng số

 Var(cX) = c2Var(X) với c là hằng số

 Var(aX+b) = a2Var(X) với a, b là các hằng số

 Var(X+Y) = Var(X)+Var(Y) với X, Y là độc lập

7 Mod

Giá trị tin chắc nhất của đại lượng ngẫu nhiên rời rạc X [ký hiệu là Mod(X)] là giá trị của X ứng với xác suất lớn nhất ưong bảng phân phối xác suất

Nếu X là đại lượng ngẫu nhiên liên tục có hàm mật độ xác suất f(x) thì Mod(X) là giá trị của X mà tại đó hàm mật độ đạt giá trị cực đại

Chú ý: Mod(X) có thể nhận nhiều giá trị khác nhau

Trang 5

8 Trung vị

Trung vị (median) là điểm chia đều xác suất thành 2 phần giống nhau, kí hiệu

là med(X): P(X < med(X)) = P(X ≥ med(X)) = 0.5

Như vậy trung vị là nghiệm của phương trình hàm tích lũy xác suất: FX(x) = 0.5

9 Luật phân phối của biến ngẫu nhiên

- Quy luật phân phối chuẩn

+ Định nghĩa:

Biến ngẫu nhiên liên tục X nhận các giá trị trong khoảng ( − ∞; + ∞) gọi là phân phối theo quy luật chuẩn với các tham số μ và �2, nếu hàm mật độ xác suất của nó

có dạng:

f(x) = 1

σ 2π�

−(�−�)2 2�2

Nếu tiến hành khảo sát hàm số trên và vẽ đồ thị của nó ta sẽ thu được các kết luận sau đây:

‒ Hàm số xác định trên toàn trục Ox

‒ Với mọi giá trị của x, hàm số luôn luôn dương, như vậy, đồ thị của nó luôn nằm cao hơn trục Ox

‒ Khi x →± ∞ thì f(x) → 0, tức trục Ox là đường tiệm cận ngang

‒ Ta tìm đạo hàm bậc nhất: f'(x) = −σx−μ3 2πe−(x−μ)22σ2

Dễ dàng thấy

rằng: f'(x) = 0 khi x = μ, f'(x) > 0 khi x < μ, f'(x) < 0 khi x > μ Như vậy, khi x = μ, hàm số có cực đại bằng� 2�1

‒ Hiệu x − μ trong biểu thức của hàm f(x) nằm trong dạng bình phương, tức là hàm số đối xứng qua đường thẳng x = μ

Trang 6

‒ Ta tìm đạo hàm bậc hai: f''(x) = −σ312πe−(x−μ)22σ2 1 −(x−μ)σ2 2

Dễ dàng thấy rằng: khi x = μ + σ và x = μ − σ, đạo hàm bậc hai bằng 0 và đi qua hai điểm đó nó đổi dấu Tại cả hai điểm đó, hàm số đều bằng� 2��1 Như vậy,

hàm có các điểm uốn là: μ + σ;� 2��1 và μ − σ;� 2��1

Đồ thị hàm f (x) và đồ thị sự thay đổi của f(x) theo σ:

Hai tham số μ và σ có ý nghĩa quan trọng trong phân phối chuẩn Khi μ và σ thay đổi, dạng đồ thị của hàm mật độ xác suất f(x) cũng thay đổi như sau: Khi μ thay đổi thì dạng của đường cong f(x) không thay đổi, song nó sẽ chuyển dịch sang phải hoặc sang trái theo trục Ox Khi μ tăng lên thì đồ thị sẽ dịch sang phải, còn

khi μ giảm thì đồ thị sẽ dịch sang trái Trái lại, khi σ thay đổi, dạng của đồ thị sẽ thay đổi theo Nếu σ tăng lên thì đồ thị sẽ thấp xuống và phình ra, còn khi σ giảm thì đồ thị sẽ cao lên và nhọn thêm

Hàm phân phối xác suất của biến ngẫu nhiên X phân phối theo quy luật chuẩn:

F(X) = 1

� 2��−∞

�−(�−�)

2

2� 2 ��

2 Các tham số đặc trưng của quy luật chuẩn:

– Kỳ vọng toán: E(X) = μ

– Phương sai: V(X) = σ2

– Độ lệch chuẩn: ��= �

Phân phối chuẩn được ký hiệu là N(μ, σ2) Có liên quan mật thiết với phân phối chuẩn là quy luật phân phối chuẩn hóa Giả sử biến ngẫu nhiên X phân phối chuẩn với kỳ vọng toán μ và độ lệch chuẩn � Xét biến ngẫu nhiên: U = X−μσ

- Quy luật nhị thức:

+ Định nghĩa:

Trang 7

Biến ngẫu nhiên rời rạc X nhận một trong các giá trị có thể có x = 0, 1, 2, , n với các xác suất tương ứng được tính bằng công thức (2) gọi là phân phối theo quy luật nhị thức với các tham số là n và p

Quy luật nhị thức được ký hiệu là B(n,p) Bảng phân phối xác suất của biến ngẫu nhiên X phân phối theo quy luật nhị thức có dạng:

Với �0 = ��0�0��; �1 = ��1�1��−1; , �� = �������−�, , �� = ������0

Trong thực tế, đôi khi ta phải tính xác suất để biến ngẫu nhiên X phân phối theo quy luật nhị thức nhận giá trị trong một khoảng [x, x + h], trong đó h là một số nguyên dương (h ≤ n − x) Lúc đó, ta có thể tính xác suất này theo công thức:

P(x ≤ X ≤ x + h) = Px+ Px+1+ + Px+h Trong đó: ��, ��+1, , ��+ℎ được tính bằng công thức (2)

Ngoài ra, xuất phát từ công thức (2), ta cũng có được mối liên hệ truy chứng giữa các xác suất �� và ��−1như sau:

�� =�(� − � + 1)�� ��−1

+ Các tham số đặc trưng của quy luật nhị thức:

– Kỳ vọng toán: E(X) = np

– Phương sai: V(X) = npq

– Độ lệch chuẩn: �� = ���

Ngoài kỳ vọng toán, phương sai và độ lệch chuẩn, trong quy luật nhị thức, tham số mode cũng hay được dùng Nếu X phân phối theo quy luật nhị thức thì mode m0có thể được tìm trực tiếp từ bảng phân phối xác suất bằng cách tìm trong số các giá trị

có thể có của X giá trị tương ứng với xác suất lớn nhất Tuy nhiên, có thể tìm mode

Trang 8

mà không cần phải xây dựng bảng phân phối xác suất Nó được xác định bằng công thức sau đây:np − q ≤ m0 ≤ np + p

Ta chú ý rằng, vì trong quy luật nhị thức mode phải là giá trị nguyên, do đó có thể xảy ra hai trường hợp: Nếu np + p là một số nguyên thì np − q cũng là một số nguyên, lúc đó mode sẽ cùng một lúc nhận hai giá trị: m0= np + p và m0= np − q Còn nếu np + p là một số thập phân thì mode sẽ là giá trị nguyên nằm trong khoảng hai số thập phân là np − q và np + p

10 Liên hệ giữa các luật phân phối

- Chuyển từ phân phối siêu bội sang phân phối nhị thức

p = NA/N

q = 1 − p

N > 20 n

- Chuyển từ phân phối nhị thức sang phân phối Poison

λ = np

� ≥ 30

�� < 5

� ≤ 0.1

- Chuyển từ phân phối nhị thức sang phân phối chuẩn

� ≥ 30

0.1 < � < 0.9

�� ≥ 5 ∧ �� ≥ 5

μ = np

σ = npq

P(X = k) ≈1σf(k − μσ )

P(a ≤ X < b) ≈ φ b − μσ − φ a − μσ

Trang 9

11 Ví dụ.

1 Xác suất bắn trúng đích mỗi lần của một thiện xạ là 0,8 Xạ thủ bắn 5 lần độc lập Tính xác suất:

a Cả 5 lần đều trúng đích

b 3 lần đầu trúng đích, 2 lần sau trượt

c Có 3 lần trúng đích

d Có ít nhất 1 lần trúng đích

Lời giải

Gọi Ailà “lần thứ i xạ thủ bắn trúng đích” i=1,2,3,4,5

a Gọi B “Cả 5 lần đều trúng đích”

P(B) = A1.A2.A3.A4.A5 = 0,8 0,8 0,8 0,8 0,8 = 0,32768

b Gọi C “3 lần đầu trúng đích, 2 lần sau trượt”

P(C) = A1 A2 A3 A4 A5 = 0,8 0,8 0,8 0,2 0,2 = 0,02048

c Gọi D “Có 3 lần trúng đích”

P(D) = C53 Ai Ai Ai Ai Ai = C53 0,8 0,8 0,8 0,2 0,2 = 0,2048

d Gọi E “Có ít nhất 1 lần trúng đích”

E “Không lần nào trúng đích”

P(E) = Ai Ai Ai Ai Ai = 0,2 0,2 0,2 0,2 0,2 = 0,00032

P(E) = 1 − P(E) = 1 − 0,00032 = 0,99968

2 Cho biến ngẫu nhiên X có phân phối xác suất:

8

1 4

1 4

1 4

1 8

Trang 10

Và Y = 2X - 1 Tính P{Y<4}; EY, VY.

Giải

Bảng phân phối xác suất:

8

1 4

1 4

1 4

1 8

Ta có: P{Y<4} = P(Y=-1)+P(Y=1)+P(Y=3) =18+14+14 =58

EY = − 1.18 + 1.14 + 3.14 + 5.14 + 7.18 = 3

VY = ( − 1)21

8 + 12

1

4 + 32

1

4 + 52

1

4 + 72

1

8 − −1

1

8 + 1

1

4 + 3

1

4 + 5

1

4 + 7

1 8

= 6

3 Một đề thi trắc nghiệm gồm 10 câu hỏi độc lập Trong mỗi câu hỏi có 4 cách trả lời trong đó chỉ có 1 cách đúng Giả sử mỗi câu trả lời đúng được 5 điểm và mỗi câu trả lời sai bị trừ 1 điểm Một thí sinh không học hành gì, đi thi với tinh thần giao lưu

cọ xát lấy kinh nghiệm, làm bài bằng “nhân phẩm” Tìm số điểm có khả năng nhất Giải

X là số câu đúng ⇒ X~B(n = 10; p = 0,25)

Y là điểm số đạt được ⇒ Y = 5X − 1 (10 − X) = 6X − 10

Với xibất kì, ta có: X = xi ⇒ Y = xi− 10

⇒ P(X = xi) = P(Y = 6xi− 10)

Để P(X) lớn nhất thì �� = �0(�) (1)

Để P(Y) lớn nhất thì 6xi− 10 = m0(Y) (2)

Trang 11

Thế (1) vào (2) ta được: 6m0(X) − 10 = m0(Y) (3)

Theo phân phối Nhị thức ta có:

(10 + 1) 0,25 − 1 ≤ m0(X) ≤ (10 + 1) 0,25

1,75 ≤ m0(X) ≤ 2,75

⇒ m0(X) = 2 (4)

Thay (4) vào (3), ta được: 6.2 − 10 = 2 = m0(Y)

Vậy điểm số có khả năng nhất là 2

4 Lãi suất đầu tư vào một công ty là biến ngẫu nhiên phân phối chuẩn Biết xác suất để đạt được lãi suất trên 20% một năm là 0,2 và dưới 10% một năm là 0,1 Tìm xác suất để đầu tư vào công ty đó sẽ được lãi ít nhất 14%/năm

Gọi X là lãi suất khi đầu tư vào công ty (%)⇒ X~N(μ; σ2)

Theo đề bài ta có: P(X > 20) =0,2

⇒ 1 − ϕ 20 − μσ = 0,2

⇒ ϕ 20 − μσ = 0,8

⇒ ϕ 20 − μσ = ϕ 0,84

⇒20 − μσ = 0,84

⇒ 20 − μ = 0,84σ (1)

Tương tự, ta cũng có: P(X > 10) =0,1

⇒ ϕ 10−μσ = 0,1

⇒ ϕ 10−μσ = 0,1

Trang 12

⇒ ϕ 10 − μσ = ϕ −1,28

⇒10 − μσ =− 1,28

⇒ 10 − μ =− 1,28σ (2)

Kết hợp (1) và (2), ta được:

20 − μ = 0,84σ

20 − μ =− 1,28σ ⇒ � = 16,04� = 4,72

Theo yêu cầu bài toán, ta cần tính:

P(X > 14) = 1 − ϕ 14 − 16,044,72 = 1 − ϕ( − 0,43)

= 1 − 0,3336 = 0,6664

Phần 2: THỐNG KÊ

1 Trong một đợt kiểm tra cây cùng loại và cùng độ tuổi trong một vườn ươm,

người ta chọn được một mẫu gồm số cây và chiều cao cho trong bảng

Chiều cao (cm) 230 - 240 220 - 230 210 - 220 200 - 210 180 - 200

a Hãy ước lượng chiều cao trung bình của cây trong vườn ươm với độ tin cậy 96%

b Với độ tin cậy 97% hãy ước lượng tỉ lệ cây không đạt tiêu chuẩn trong vườn ươm Biết rằng tỉ lệ cây đạt tiêu chuẩn có chiều cao lớn hơn 210 cm

c Với độ tin cậy 95% hãy ước lượng phương sai của cây trong vườn ươm

d Có người cho rằng chiều cao trung bình của cây trong vườn ươm là 225 cm Cho nhận xét về ý kiến đó với mức ý nghĩa 5%

e Có người cho rằng tỉ lệ cây không đạt tiêu chuẩn có chiều cao lớn hơn 210 cm 20% Cho nhận xét về ý kiến đó với mức ý nghĩa 5%

Giải

Trang 13

Ta có: n = 120; x = 219,5833; s = 13,1983; m=25; f=0,2083

a Gọi µ là chiều cao trung bình của cây trong vườn ươm Ta có:

Giá trị giới hạn:

1 − α = 0,96 ⇒ φ(zα

2) = 1 − α2 = 0,48 ⇒ zα = 2.05

Độ chính xác: ε = zα

2

s

n= 2,47 Khoảng ước lượng trung bình: μ ∈ (217,1089; 222,0578)

b Gọi ρ là tỷ lệ cây không đạt tiêu chuẩn Ta có:

Giá trị giới hạn:

1 − α = 0,97 ⇒ φ(zα

2) = 1 − α2 = 0,485 ⇒ zα

2 = 2.17

Độ chính xác: ε = zα

2

f(1−f)

n = 0.0804 Khoảng ước lượng tỷ lệ: ρ ∈ (0,1279; 0,2887)

c.χ 2(n − 1)s2

(n−1;α/2) ≤ σ2 ≤χ 2(n − 1)s 2

(n−1;1−α/2)

⇔6218754566 ≤σ2 ≤62187527471

⇔ 136,1969 ≤ σ2 ≤ 226,1969

d Gọi µ là chiều cao trung bình của cây trong vườn ươm

Giả thiết �0: �0 = 225 và �1: �0 ≠ 225

Mức ý nghĩa: ∝= 0,05 ⇒ zα

2 = 2,17 Giá trị tiêu chuẩn kiểm định: z = x−μ0

s n =− 4.4957

Do |z| = 4.4957 > zα

2 ⇒ Bác bỏ H0 Tức là bác bỏ tuyên bố trên trên với mức ý nghĩa 5%

Trang 14

e Gọi ρ là tỷ lệ cây không đạt tiêu chuẩn.

Giả thiết �0: ρ0 = 0,2 và �1: ρ0 ≠ 0,2

Mức ý nghĩa: ∝= 0,05 ⇒ zα

2 = 2,17 Giá trị tiêu chuẩn kiểm định: z = f−ρ0

ρ0(1−ρ0) n =0,2282

Do |z| = 4.4957 < zα

2 ⇒ Chấp nhận H0 Tức là chưa có cơ sở bác bỏ tuyên bố trên trên với mức ý nghĩa 5%

2 Để so sánh hiệu quả của hai loại phân A và B đối với năng suất cà chua, người ta điều tra năng suất cà chua (đơn vị: quả) khi bón A, B cho kết quả:

Loại phân Số cây Năng suất trung

bình

Độ lệch tiêu chuẩn

Với mức ý nghĩa 5%, hãy cho biết loại phân A có hiệu quả hơn loại phân B không?

Ta có: n1 = 41; n2 = 61; x1 = 32,2; x2 = 28,4; s1 = 8,5 và s2 = 9,3

Gọi µ1, µ2 lần lượt là năng suất trung bình của phân bón A và B.

Giả thiết: H0 : µ1 = µ2 và H1 : µ1 > µ2

Mức ý nghĩa: α = 0.05 =z α = 1.65

Giá trị của tiêu chuẩn kiểm định:

z = x1 −x2

s12

n1+n2s22

= 2,1309

Do z = 2,1309 > z α = 1.65 =⇒Bác bỏ H0 Tức là đủ cơ sở để cho rằng hiệu quả của phân bón A cao hơn B với mức ý nghĩa 5%

Ngày đăng: 19/01/2023, 14:46

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w