Chap 5-1 Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc.Biến rời rạc và phân phối xác suất Chương 5 Statistics for Business and Economics, 6e © 2007 Pearson Educ
Trang 1Chap 5-1 Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc.
Biến rời rạc và phân phối xác suất Chương 5
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 5-2
Mục tiêu chương
Sau khi hoàn thành chương này, bạn sẽ có
thể:
Giải thích giá trị trung bình và độ lệch chuẩn cho
một biến ngẫu nhiên rời rạc
Sử dụng phân phối xác suất nhị thức để tìm xác
suất
Mô tả khi nào nên áp dụng phân phối nhị thức
Sử dụng phân phối xác suất rời rạc và Poisson
để tìm xác suất
Giải thích hiệp phương sai và tương quan cho
các biến ngẫu nhiên rời rạc phân phối kết hợp
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 5-3
Giới thiệu về phân phối xác suất
Biểu diễn giá trị bằng số có thể có từ một thí
nghiệm ngẫu nhiên
Biến ngẫunhiênBiến ngẫu nhiên rời rạc Biến ngẫu nhiênliên tục
Trang 2Biến ngẫu nhiên
Một biến ngẫu nhiên được ký hiệu là X,
Chữ thường x biểu thị một giá trị có thể có
VD: một cửa hàng có 5 máy tính trên kệ Từ
kinh nghiệm trong quá khứ, xác suất bán từ 1
đến 5 máy tính là bằng nhau.
Đặt X là biến ngẫu nhiên đại diện cho số lượng máy
tính được bán
X có thể nhận các giá trị cụ thể: x = 1, x = 2, …, x =
5 Mỗi giá trị có xác suất xuất hiện là 0,2
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 5-4
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 5-5
Biến ngẫu nhiên rời rạc
Có thể chỉ nhận một giá trị là số đếm
Ví dụ:
Gieo một hột
xí ngầu hai lầnGọi X là số lần số 4 xuất hiện
(vậy thì X có thể là 0, 1, hoặc 2 lần)
Xoay một đồng xu 5 lần
Gọi X là số lần mặt ngửa xuất hiện
(vậy, X = 0, 1, 2, 3, 4, or 5)
Các biến ngẫu nhiên rời rạc: ví dụ
Đặt X là biến ngẫu nhiên đại diện cho số lượng
Trang 3Biến ngẫu nhiên liên tục
Hãy xem xét một biến ngẫu nhiên: lợi nhuận
hàng tháng của một công ty.
Nó được đo lường liên tục - doanh số hàng tháng có
thể nhận bất kỳ giá trị nào trong một khoảng nhất định
Nó được gọi là liên tục
Một biến ngẫu nhiên liên tục có thể nhận bất
kỳ giá trị nào trong một khoảng giá trị.
Chúng ta chỉ có thể gán xác suất cho một khoảng
Pr(2 triệu USD < X < 3 triệu USD)
Xác suất gắn liền với một giá trị cụ thể gần như bằng
không
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 5-7
Biến ngẫu nhiên liên tục: ví dụ
Ví dụ về biến ngẫu nhiên liên tục:
Thu nhập hàng năm cho một gia đình
Lượng dầu nhập vào Việt Nam trong một tháng
Sự thay đổi giá của một cổ phiếu của cổ phiếu IBM
trong một tháng
Thời gian trôi qua giữa quá trình cài đặt một thành
phần mới và sự thất bại của nó
Tỷ lệ tạp chất trong một lô hóa chất
.v.v
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 5-8
Phân phối xác suất cho các biến ngẫu
nhiên rời rạc
Giả sử X là một biến ngẫu nhiên rời rạc và x là
một trong những giá trị có thể có của nó.
Xác suất X lấy một giá trị cụ thể x được ký hiệu
Trang 4Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 5-10
Thí nghiệm: Xoay 2 đồng xu Gọi X = # mặt hình.
Biểu diễn P(x) , tức là, P(X = x) , cho mọi giá trị của x:
Phân phối xác suất rời rạc: Ví dụ
0.4 0.3
0 0.1 0.2 0.3 0.4 0.5
x (số lần bán)
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 5-12
1 P(x) 0 với mọi giá trị của x
Tổng xác suất của các giá trị bằng 1 ;
Sự kiện “X = x”, đối với mọi giá trị có thể có của x,
là loại trừ lẫn nhau và đầy đủ
Phân phối xác suất Thuộc tính cần thiết
x
1 P(x)
Trang 5Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 5-13
Hàm xác suất tích lũy
Hàm xác suất tích lũy (c.d.f), ký hiệuF(x0), biểu
diễn xác suất mà X nhỏ hơn hay bằng x0
Tức là: hàm c.d.f được tính tại x 0
Nói cách khác,
) x P(X )
Các nhà quản lý một đại lý xe hơi ở một thị trấn nhỏ, dựa trên phân
tích về lịch sử bán hàng của mình, biết rằng vào bất kỳ ngày nào, số
lượng xe Prius được bán có thể thay đổi từ 0 đến 5 Hàm phân phối
xác suất trong Bảng sau có thể được sử dụng để lập kế hoạch tồn
kho như thế nào? Cho biết hàm phân phối xác suất cho bán ô tô:
Hàm tích lũy xác suất có thể được dùng để hoạch định tồn kho VD,
nếu chỉ có 4 xe trong kho, cửa hàng có thể thỏa mãn 95% nhu cầu
khách hàng trong ngày Nhưng nếu chỉ có 2 xe thì có đến 35% nhu
cầu không được thỏa mãn.
Trang 6Thuộc tính phát sinh của c.d.f
Đặt X là biến ngẫu nhiên rời rạc với c.d.f ,
F(x0), vậy thì,
1 0 F(x0) 1 với mọi giá trị của x0, và
2 Nếu x0 và x1 là 2 giá trị với x0 < x1, vậy thì,
F(x0) F(x1)
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 5-16
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 5-17
Thuộc tính của biến ngẫu nhiên rời rạc
Giá trị kỳ vọng (hay trung bình) của một phân
phối rời rạc(trung bình có trọng số)
Ví dụ: xoay 2 đồng xu,
x = # mặt hình , tính kỳ vọng của x:
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 5-18
Phương sai và độ lệch chuẩn
Phương saicủa một biến ngẫu nhiên rời rạc X
2 (x μ) P(x) σ
2 E(X μ) (x μ) P(x) σ
Trang 7Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 5-19
Ví dụ độ lệch chuẩn
Ví dụ:Tung 2 đồng xu, X = # mặt hình,
tính độ lệch chuẩn(nhớ rằng E(x) = 1)
.707.50(.25)1)(2(.50)1)(1(.25)1)(0
Ví dụ phương sai
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 5-20
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 5-21
Các hàm số của biến ngẫu nhiên
Nếu P(x) là hàm xác suất của biến ngẫu nhiên X rời
rạc và g(X) là một hàm số nào đó của X, thì giá trị kỳ
vọng của hàm g là
Lưu ý: nhìn chung, E[g(x)] g(x)
Đặt Y là hàm tuyến tính của một biến ngẫu nhiên X,
Y = a + bXtrong đó a và b là các hằng số
x
g(x)P(x) E[g(X)]
Trang 8Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 5-22
Hàm tuyến tính của biến ngẫu nhiên
Gọi a và b là bất kỳ hằng số nào.
a)
nghĩa là, nếu một biến ngẫu nhiên luôn nhận giá trị
a, nó sẽ có trung bình là a và phương sai là 0
b)
nghĩa là, giá trị kỳ vọng của b·X là b·E(x)
0 Var(a) and
a
2 X 2
bμ
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 5-23
Hàm tuyến tính của biến ngẫu nhiên
Cho biến X có trung bình µxvà phương sai σ2
Đặt a và b là các hằng số
Cho Y = a + bX
Vậy thì, trung bình và phương sai của Y là
Do vậy độ lệch chuẩn củaY là
X
Y E(a bX) a bμ
X 2 2 Y
Một nhà thầu quan tâm đến tổng chi phí của một dự án mà cô dự
định đấu thầu Cô ước tính rằng chi phí vật liệu sẽ là 25.000 đô la
và lao động là 900 đô la/ngày Nếu dự án mất X ngày để hoàn
thành, tổng chi phí lao động sẽ là 900X đô la và tổng chi phí của dự
án (tính bằng đô la) sẽ như sau: C = 25.000 + 900X.
Sử dụng kinh nghiệm của mình, nhà thầu hình thành xác suất
(Bảng 4.4) về thời gian hoàn thành của dự án.
a Tìm giá trị trung bình và phương sai cho thời gian hoàn thành X.
b Tìm giá trị trung bình, phương sai và độ lệch chuẩn cho tổng chi
phí C.
Thời gian hoàn thành (ngày) 10 11 12 13 14
Xác suất 0,1 0,3 0,3 0,2 0,1
Trang 9tính của biến ngẫu
nhiên X, được cho:
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 5-27
Phân phối xác suất
Phân phối xác suấtliên tụcNhị thức
HypergeometricPoisson
Phân phối xácsuấtPhân phối
xác suất rời rạc
Đều (uniform)Chuẩn
Mũ (exponential)
Trang 10Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 5-28
Phân phối nhị thức
Nhị thứcHypergeometricPoisson
Phân phốixác suấtPhân phối
xác suấtrời rạc
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 5-29
Phân phối Bernoulli
Xem xét chỉ hai kết quả: “thành công” or “thất bại”
GọiPlà xác suất của thành công
và1 – P là xác suất của thất bại
Định nghĩa biến ngẫu nhiên X:
x = 1 if thành công, x = 0 if thất bại
Vậy thì, hàm xác suất Bernoulli là
P P(1) and P) (1
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 5-30
Phân phối Bernoulli Trung bình và Phương sai
Trung bình là µ = P
Phương sai là σ2= P(1 – P)
P(1)PP)(0)(1P(x)xE(X)μ
P(x) μ) (x ] μ) E[(X σ
2 2
X 2 2
Trang 11Phân phối Bernoulli: ví dụ
Một nhà môi giới bảo hiểm tin rằng đối với một
liên hệ cụ thể, xác suất bán hàng là 0,4.
Đặt X là biến ngẫu nhiên, lấy giá trị 1 nếu bán
được thực hiện và 0, nếu không.
X có phân phối Bernoulli với P(1) = 0,4 và P(0) =
0,6
Giá trị trung bình của phân phối là E(X) = P = 0,4
Phương sai: var(X) = P(1 - P) = 0,4 x 0,6 = 0,24
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 5-31
Chuỗi x lần thành công trong n lần
thử nghiệm
Mỗi thử nghiệm có thể có 2 kết quả:
Thành công với xác suất P, và
Thất bại với xác suất 1 – P
n phép thử độc lập được thực hiện
Kết quả của một thử nghiệm này cũng không ảnh
hưởng đến kết quả của bất kỳ thử nghiệm khác
Gọi X là số lần thành công, từ n lần thử
nghiệm
X có thể nhận các giá trị từ 0, 1, …, n
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 5-32
Chuỗi x lần thành công trong n lần
thử nghiệm
Chúng ta quan tâm đến việc thu được giá trị
chính xác X = x.
Giả sử nhà môi giới thực hiện 4 liên hệ và
chúng ta muốn tính xác suất bán được 3 lần.
Một chuỗi kết hợp có thể [T, T, T, B]
Cho trước mỗi khách hàng là độc lập
Xác suất của mỗi sự kiện cụ thể này là:
Trang 12Chuỗi x lần thành công trong n lần
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 5-35
Chuỗi x lần thành công trong n lần
n!
Cn
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 5-36
Phân phối xác suất nhị thức
Một số lượng quan sát cố định, n
ví dụ: 15 lần tung đồng xu; mười bóng đèn lấy từ một nhà kho
Hai sự kiện loại trừ lẫn nhau và đầy đủ
ví dụ: mặt hình hoặc chữ trong mỗi lần tung đồng xu; bóng đèn
bị lỗi hoặc không bị lỗi
Thường được gọi là “thành công” và “thất bại”
Xác suất thành công là P, xác suất thất bại là 1 - P
Xác suất không đổi cho mỗi quan sát
ví dụ: Xác suất nhận được mặt hình là như nhau mỗi lần chúng
ta tung đồng xu
Các quan sát là độc lập
Kết quả của một quan sát không ảnh hưởng đến kết quả của
quan sát khác
Trang 13Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 5-37
Các khuôn mẫu phân phối nhị
thức có thể
Một nhà máy sản xuất dán nhãn các mặt hàng
là “ khiếm khuyết ” hoặc “ chấp nhận được ”.
Đấu thầu công ty cho các hợp đồng sẽ có
được hợp đồng hay không
Một công ty nghiên cứu tiếp thị nhận được câu
trả lời khảo sát về “ vâng, tôi sẽ mua ” hay
“không, tôi không mua”.
Người xin việc mới chấp nhận lời đề nghị hoặc
từ chối nó.
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 5-38
P(x) = xác suất của x lần thành công trong n lần
thử, với xác suất thành công P trong mỗi lần thử
x = số lần ‘thành công’ trong mẫu,
(x = 0, 1, 2, , n )
n = cỡ mẫu (số lần thử hay số quan sát)
P = xác suất của “thành công”
n = 4
P = 0,5
1 - P = (1 – 0,5) = 0,5
x = 0, 1, 2, 3, 4Công thức phân phối nhị thức
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 5-39
Ví dụ:
Tính xác suất nhị thứcXác suất 1 lần thành công trong năm quan sát là
bao nhiêu nếu xác suất thành công là 0,1?
x = 1, n = 5, and P = 0,1
.32805.9)(5)(0.1)(0
0.1)(1(0.1)1)!
(51!
5!
P)(1Px)!
(nx!
n!
1)P(x
4
1 1
X n X
Trang 14Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 5-40
n = 5 P = 0,1
n = 5 P = 0,5
Mean
0 2 4 6
0 1 2 3 4 5
x P(x)
.2 4 6
0 1 2 3 4 5
x P(x)
Phương sai và Độ lệch chuẩn
nP E(x)
P) nP(1-
P) nP(1-
Trong đó: n = cỡ mẫu
P = xác suất thành công (1 – P) = xác suất thất bại
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 5-42
n = 5 P = 0,1
n = 5 P = 0,5
Mean
0 2 4 6
0 1 2 3 4 5
x P(x)
.2 4 6
0 1 2 3 4 5
x P(x)
0
0.5(5)(0.1)nP
0.6708
0.1)(5)(0.1)(1P)
1.118
0.5)(5)(0.5)(1P)
Trang 15Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 5-43
Sử dụng Bảng nhị thức
N x … p=.20 p=.25 p=.30 p=.35 p=.40 p=.45 p=.50
2 4 6 8
0.0563 0.2816 0.1460 0.0162 0.0004 0.0000
0.0282 0.2335 0.2001 0.0368 0.0014 0.0000
0.0135 0.1757 0.2377 0.0689 0.0043 0.0000
0.0060 0.1209 0.2508 0.1115 0.0425 0.0016
0.0025 0.0763 0.2384 0.1596 0.0229 0.0003
0.0010 0.0439 0.2051 0.2051 0.0439 0.0010
Ví dụ:
n = 10, x = 3, P = 0,35: P(x = 3|n =10, p = 0,35) = 0,2522
n = 10, x = 8, P = 0,45: P(x = 8|n =10, p = 0,45) = 0,0229
Phân phối nhị thức: Ví dụ
Một đại lý bất động sản, Jeanette Nelson, có 5
liên hệ Xác suất bán hàng từ một liên hệ là 0,4.
a Tìm xác suất mà cô ấy được tối đa 1 lần bán
b Tìm xác suất để cô ấy thực hiện từ 2 đến 4 lần bán
hàng (đã bao gồm)
c Vẽ đồ thị hàm phân phối xác suất
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 5-44
1 4
5!
(1) 0,4 0,6 0,259 1!4!
Trang 16• Ở các thái cực (0 hoặc 5 lần bán), xác suất khá nhỏ.
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 5-47
Sử dụng PHStat
Chọn PHStat / Probability & Prob Distributions / Binomial…
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 5-48
Sử dụng PHStat
Nhập các giá trị mong muốn trong hộp thoại
Ở đây:n = 10
p = 0,35Kết quả cho x = 0
đến x = 10 sẽ được tạo ra
trên PHStat
Optional check boxes
for additional output
(continued)
Trang 17Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 5-49
P(x = 3 | n = 10, P = 35) = 2522
PHStat Output
P(x > 5 | n = 10, P = 35) = 0949
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 5-50
Phân phối Poisson
Nhị thứcHypergeometricPoisson
Phân phốixác suấtPhân phối
xác suấtrời rạc
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 5-51
Phân phối Poisson
Một số ứng dụng:
Số lượng lỗi trong một hệ thống máy tính lớn trong
một ngày nhất định
Số lượng đơn đặt hàng thay thế cho một phụ tùng
được nhận bởi một công ty trong một tháng nhất định
Số lượng tàu đến một cơ sở bốc hàng trong thời gian
tải 6 giờ
Số lượng xe tải giao hàng đến một nhà kho trung tâm
trong một giờ
Số lượng khách hàng đến một lối đi thanh toán trong
cửa hàng tạp hóa địa phương của bạn trong một
khoảng thời gian cụ thể
Trang 18Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 5-52
Giả định về phân phối Poisson
Áp dụng phân phối Poisson khi:
Bạn muốn đếm số lần một sự kiện xảy ra trong một
khoảng thời gian liên tục nhất định
Xác suất xảy ra một sự kiện trong một khoảng thời
gian là rất nhỏ và giống nhau cho tất cả các khoảng
thời gian
Số lượng sự kiện xảy ra trong một khoảng thời gian
không phụ thuộc vào số lượng sự kiện xảy ra trong
các khoảng thời gian khác
Không thể có nhiều hơn một lần xuất hiện trong mỗi
khoảng thời gian
Số sự kiện trung bình trong một đơn vịlà (lambda)
Phân phối Poisson
Các xác suất Poisson có thể được lấy từ phân
phối xác suất nhị thức,
Lấy các giới hạn toán học khi P 0 và n
Với các giới hạn, tham số = nP là hằng số chỉ
định số lần xuất hiện trung bình trong một thời
gian và /hoặc không gian cụ thể.
Phân phối Poisson là một trường hợp đặc biệt
của phân phối nhị thức.
Các chứng minh toán học nằm ngoài phạm vi của
khóa học
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 5-53
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 5-54
Công thức phân phối Poisson
Trong đó:
x = số lượng thành công trên mỗi đơn vị
= số lượng thành công kỳ vọng trên mỗi đơn vị
e = cơ số của logarit tự nhiên (2,71828 )
x!
λ e P(x)
xλ