Nhưng v ề mặt lý thuyết, bất đ ẳng thức Chebyshev có ý nghĩa rất lớn, nó được sử dụng đ ể chứng minh các định lý của luật số lớn... íịiáú trình lự thuyết xòe..[r]
Trang 1íỳiáty trinh Lị thuyết xúc tuất oà tỊỊúutạ kê toán
C h ư ơ n g 5
H À M C Á C Đ Ạ I L Ư Ợ N G N G Ẫ U N H I Ê N
V À L U Ậ T S Ố L Ớ N
I- Hàm của các đại lượng ngẫu nhiên
Trong thực t ế , ta thường gặp trường hợp một đ ạ i lượng ngẫu nhiên là h à m số của một hay nhiều đ ạ i lượng ngẫu nhiên k h á c K h i
đó n ế u biết được qui luật phân„phối xác suất của các đ ố i số thì ta có thể tìm được qui luật phân phối xác suất của c á c h à m số tương ứng Ì- Qui luật phân phối xác suất của hàm một đại lượng ngẫu
n h i ê n
N ế u v ớ i m ỗ i giá trị có th ể GÒ của đ ạ i lượng ngẫu nhiê n X , qua
h à m f ( X ) , ta xác định được một giá trị của đ ạ i lượng ngẫu n h i ê n Y thì Y được g ọ i là h à m của đ ạ i lượng ngẫu nhiên X :
Y = f(X)
a- Trường, hợp X là đại lượng ngẫu nhiên rời rạc và ứng với các giá
trị khác nhau của X ía có các giá trị khác nhau của Y
Trường hợp này, ứng với mỗi giá trị có thể nhận của X ta chỉ có
một giá trị có thể nhận của Y , tức:
(X=xi) = [Y=f(xi) = yi] (Vi)
Suy ra:
' P(X= Xi) = P(Y= yo ( V i )
Trang 2ŨhưỞ4UỊ 5: Jốàni của eáe đại lượng, ngẫu nhiên oà luật IJỐ lởn
Thí dụ ỉ: Đ ạ i lượng ngẫu n h i ê n X có bang p h â n phối x á c suất n h ư
sau:
2
T ì m qui luật p h â n p h ố i x á c suất của Y = X
Giải: Các giá trị mà Y có thể nhận là:
yi = 22 = 4; y2 = 32 = 9; y3 = 42 = 16
P(X= 2) = P(Y= 4) = 0,3; P(X= 3) = P(Y= 9) = 0,5;
P(X= 4) = P(Ỷ= 16) = 0,2;
Vậy phân phối xác suất của Y như sau:
b- Nếu tương ứng với hai (hay nhiều hơn 2) giá trị của X ta có một giá trị của Y
Chẳng hạn ứng với 2 giá trị có t h ể nhận của X ta chỉ có m ộ t giá trị
có t h ể nhận của Y, tức:
(Y=yk) = (X=xt)u(X=Xj)
Do các biến cố (X= Xt) và (X= Xj) xung khắc, áp dụng công thức
cộng x á c suất ta có:
P(Y=yk) = P(X= xt) + P(X=Xj)
Thí dụ 2: Đại lượng ngẫu nhiên X có bảng phân phối xác suất như
sau:
Trang 3éịiáữ trình bị tluiụẾt xòe, mủi tui thống, kè toán
T i m qui luật p h â n phối x á c suất của Y = X
Giải: Ta có:
khi X = - 2 thì Y = ( - 2 )2 = 4; khi x = Ì thì Y = Ì2 = Ì;
K h i X = 2 thì Y = 4 ;
N h ư vậy:
( Y = 4 ) = [ ( X = - 2 ) U ( X = 2 ) ]
Do đó:
P ( \ = 4) = P(X= - 2 ) + P(X= 2) = 0,6 Và: P(Y= 1) = P(X= ì) = 0,4
V ậ y qui luật p h â n phối x á c suất của Y như sau:
c- Trường hợp X tò đại lượng ngẫu nhiên liên tục
Giả sử đ ạ i lượng ngẫu n h i ê n X liên tục v ớ i h à m mật độ x á c suất f(x) đã biết và Y la ham số của X : Y = f ( X )
Có thể chứng minh được rằng: Nếu Y = f(X) là hàm khả vi, đơn
đ i ệ u tăng hoặc đơn đ i ệ u g i ả m , có h à m ngược là X = *F(y) thì hàm mật độ x á c suất (p(y) của đ ạ i lượng ngẫu nhiên Y được x á c định bằng b i ể u thức:
9(y) = f [vĩ ' ( y ) ] | T ' ( y ) | 2- Qui luật phân phối xác suất của hàm hai đại lượng ngẫu
n h i ê n
Trang 4thường 5: Vỗàm cùa các đại lưựnạ ngẫu nhiên oà luật iế lán
N ế u ứng v ớ i m ỗ i cặp giá trị c ó th ể nhậ n của hai đ ạ i lượng ngẫ u nhiêri X và z có một giá trị có thể nhận của đ ạ i lượng ngẫu n h i ê n Y thì Y được g ọ i là h à m của 2 đ ạ i lượng ngẫu nhiên X và z
Y = q>(X, Z) Nếu biết được qui luật phân phối xác suất của X và z, ta có
t h ể t ì m đ ư ợ c q u i l u ậ t p h â n p h ố i x á c suất của Y = (p(X, Z)
Để tìm các giá trị mà Y có thể nhận và tính các xác suất tương ứng
của Y n g ư ờ i ta thường t i ế n h à n h lập bảng, Đ ể biết c á c h lập bảng n à y
la x é t m ộ t thí dụ sau đ â y :
Thí dạ: Có 2 máy cùng sản suất một loại sản phẩm, tỷ lệ sản phẩm
l o ạ i A của m á y thứ nhất là 0,8; của m á y thứ hai là 0, 7; L ấ y 3 sản
p h ẩ m do m á y thứ nhất sản xuất và Ì sản p h ẩ m do m á y thứ hai sản xuất đ ể k i ể m tra T i m quy luật p h â n phối x á c suất của số sản p h ẩ m
l o ạ i A có trong 4 sản phẩm l ấ y ra từ hai m á y đ ể k i ể m tra ?
Giải: Gọi X là số sản phẩm loại A có trong 3 sản phẩm lấy ra từ máy
thứ nhất đ ể k i ể m tra D ễ thấy rằng X ~ B(3; 0,8) N ê n ta d ễ d à n g tìm được bảng p h â n phối x á c suất của X như sau:
G ọ i z là số sản phẩm l o ạ i A có trong Ì sản p h ẩ m l ấ y ra từ m á y t h ứ hai đ ể k i ể m tra z ~ B ( l ; 0,7) Bảng p h â n p h ố i x á c suất của z n h ư sau:
G ọ i Y là số sán phẩm l o ạ i A có ư ơ n g 4 sản phẩm l ấ y ra từ hai m á y
đ ể k i ể m ư a thì:
Y = x + Z
Trang 5íịiáo trình, lý thuyết xòe, mất oà thống, kẻ toán ì
tức Y là h à m của hai đ ạ i lượng ngẫu n h i ê n X và z
Để tìm qui luật phân phối xác suất của Y, trước hết ta tìm các giá
trị mà Y có t h ể nhận M u ố n v ậ y ta lập bảng n h ư sau:
z \
Trong bảng trên dòng X ta ghi c á c giá trị mà X có thể nhận (trong thí dụ ta đ a n g xét, X có thể nhận c á c giá trị 0, Ì, 2, 3)
Cột z ghi cạc giá trị mà z có thể nhận Trong thí dụ này, z'chỉ có
thể nhận một trong hai giá trị: 0 hoặc 1;
Các ô còn lại ta ghi các giá trị mà Y có thể nhận Để xác định các
giá trị n à y ta c ă n cứ v à o b i ể u thức của h à m b i ể u đ i ể n m ố i quan hệ giữa Y v ớ i X và z , trong thí dụ ta đ a n g x é t b i ể u thức h à m n à y có dạng: Y = X + z , đồng thời c ă n cứ v à o giá trị của X và z ở cột và dòng tương ứng
Chẳng hạn: Y nhận giá trị 0 khi X = 0 đồng thời z = 0;
Y = l khi x = 0 đồng thời z = Ì hoặc X = Ì đồng thời z = 0
(tương ứng v ớ i hai ừường hợp này trên bảng có hai ô ghi số 1)
Vậy các giá trị mà Y có thể nhận là: 0, Ì, 2, 3, 4
Ta có thể biểu diễn việc phân tích ề Xiên dưới dạng tổng và tích các
b i ế n c ố nh ư sau:
( Y = 0) = [ ( X = 0)(Z = 0)]
( Y = 1) = [(X = 0)(Z = 1)] u [ ( X = 1)(Z = 0)]
( Y = 2) = [ ( X = 2)(Z = 0)] u [ ( X = 1)(Z = 1)]
Trang 6(Phương 5: 7Càm eủa eáe đại /ưựttạ ngẫu nhiên g ã luật tố lởn
( Y = 3) = [(X = 2)(Z = 1)] u Ĩ ( X = 3)(Z = 0)]
( Y = 4 ) = [ ( X = 3 ) ( Z = 1 ) ]
Á p dụn g côn g thức cộng x á c suất và côn g thức nhân xá c suất, ta tính
c á c x á c suất tương ứng v ớ i các giá trị của Y như sau:
P(Y = 0) = P(X = 0).P(Z = 0) = 0,08 0,3 = 0,0024
• P(Y = 1) = P(X = 0).P(Z = 1) + P(X = 1).P(Z = 0)
= 0,008 0,7 + 0,096 0,3 = 0,0344 P(Y = 2) = P(X = 2).P(Z = 0) + P(X = 1).P(Z = 1)
= 0,384 0,3 + 0,096 0,7 = 0,1824 P(Y = 3) = P(X = 2).P(Z = 1) + P(X = 3).P(Z = 0)
= 0,384 0,7 + 0,512 0,3 = 0,4224 P(Y = 4) = P(X = 3).P(Z = 1) = 0,512 0,7 = 0,3584
V ậ y ta có qui luật p h â n p h ố i x á c suất của Y như sau:
p 0,0024 0,0344 0,1824 0,4224 0,3584
• Trường hợp X, z là các đại lượng ngẫu nhiên liên tục
C ó t h ể chứng (ninh được rằng: h à m mật độ x á c suất (p(y) của Y (Y = X + Z) được x á c định theo công thức:
y ' y
cp(y)= J f1( x ) fỉ( y - x ) d x Hoặc: Ịf, (y - z ) f2 (z)dz
f ị và Ỉ2 là các h à m mật độ xác suất của X và z tương ứng
[với đ i ề u k i ệ n là khi một trong 2 h à m n à y x á c định trong khoảng (-00, +oo) bằng một b i ể u thức]
Trang 7íịiá& trịnh dị t/uiụết xác xuất MÌ thống, kê toán
3- C á c t h a m s ố đ ặ c t r ư n g c ủ a h à m c á c đ ạ i l ư ợ n g n g ẫ u n h i ê n Giả sử đ ạ i lượng ngẫu nhiên r ờ i rạc X có p h â n phối x á c suất như sau:
Ta cần tìm kỳ vọng toán và phương sai của đ ạ i lượng ngẫu nhiên Y [Y = (p(X)] C á c tham số đặc trưng này được xác định bằng c á c công thức sau:
E(Y) = E[(p(X)]=ịọ(xi)pi
Var(Y) = Var[<p(X)] = £<p2(x,)Pl -[E(Y)]2
i = l
* Nêu X là đại lượng ngẫu nhiên liên tục với hàm mật độ xác suất là
f(x) thì kỳ vọng toán và phương sai của đ ạ i lượng ngẫu nhiên
Y = (p(X) được xác định bằng công thức:
•KO E(Y) = E [ Ọ ( X ) ] = J(p(x)f(x)dx
-co +00
V a r ( Y ) = Var[(p(X)] = J(p2 ( x ) f ( x ) d x - [ E ( Y ) ]2
-00 li- Luật số lớn
Như ta đã thấy ở các phần trước, không thể dự đoán trước một cách
chắc chắn đ ạ i lượng ngẫu nhiên sẽ nhận giá trị n à o trong c á c giá trị
có thể nhận của nó khi thực h i ệ n p h é p thử, vì điều đó phụ thuộc v à o rất nhiều nguyên nhân m à ta không thể tính hết được Nhưng n ế u ta
Trang 8thường 5: 7õàtii của các đại lường Iiạẫii nhiều oà luật tá' lân
xét đồng thời một số lớn các đại lượng ngẫu nhiên thì tính "ngẫu
n h i ê n " của h i ệ n tượng mất đi và qui luật tất nhiên của nó được thể
h i ệ n
Đối với thực tiễn thì điều quan trọng là phải xác định các điều
k i ệ n trong đó tác động đồng thời của nhiều nguyên nhàn niiẫn nhiên
sẽ dẫ n đ ế n k ế t quả gầ n như khôn g phụ thuộc gì và o cá c y ế u tô ngẫu
n h i ê n nữa và khi đó ta có thể dự đoán được tiến ưình của h i ệ n tượng C á c đ i ề u k i ệ n n à y được chỉ ra trong các định lý có tên là luật
số lớn Định lý Chebyshev là định lý tổng quát nhấí của luật số lớn,
c ò n định lý Bernoulli là định lý đơn giằn nhất
Để chứng minh' các định lý này ta sử dụng bất đẳng thức
Chebyshev
Ì- Bất đẳng thức Chebyshev
C ó t h ể chứng minh được rằng: N ế u X là đ ạ i lượng ngẫu nhiên có
kỳ vọng toán và phương sai hữu hạn thì v ớ i m ọ i số dương s bé tùy ý,
ta đ ề u có:
V a r ( X )
P ( | X E ( X ) 1 < £ ) > 1
-E2
B ấ t dẳng thức Chebyshev còn được b i ể u d i ễ n dưới dạng k h á c như sau:
V a r ( X )
P ( | X - E ( X ) ị > 8 ) <
s2
v ề m ặ t thực t i ễ n , bấ t đ ẳ n g thức Chebyshev ít có ý nghĩa vì nó chỉ cho p h é p đánh giá cận trên hoặc cận d ư ớ i x á c suất đ ể đ ạ i lượng ngẫu nhiên X nhận giá trị sai lệch so v ớ i kỳ vọng toán của nó b é hơn hoặc nhỏ hơn một số dương s bé tùy ý chơ trước nào đó Nhưng v ề mặt lý thuyết, bất đẳng thức Chebyshev có ý nghĩa rất lớn, nó được
sử dụng đ ể chứng minh các định lý của luật số lớn
Trang 9íịiấ trình lự thuyết xòe Mất OĂ tkếttạ kẻ toân
Thí dụ: Thu nhập trung bình của c â c hộ gia đình ở một vùng lă 900
U S D / n ă m vă độ lệch chuẩn lă 120 USD H ê y x â c định khoảng thu nhập xung quanh giâ trị trung bình của ít nhất 95% hộ gia đình ô vùng đó
Giải: Gọi X lă thu nhập của một hô gia đình ở vùng năy thì X lă đại
lượng ngẫu nhiín với qui luật p h đ n phối chưa biết, nhưng E(X) = 900
vă ax = 120.'Do đó theo bất đẳng thức Chebyshev, ta có:
p(jx-E(X)|.<e)>l-^^ y
6 ì = > P ( ị x - 9 0 0 | < e ) > l - ^ y - = 0,95
£
Từ đó ta tìm được s = 536,656
Vậy ít nhất 95% hộ gia đình ở vùng đó có thu nhập hăng năm nằm
trong khoảng (900 - 536,656; 90Ọ + 536,656) tức thu nhập của câc
hộ gia đình trong khoảng (363,344;• 1436,656) U S D / n ă m
2- Định lý Chebyshev
Nếu câc đại lượng ngẫu nhiín X[, X2 , xn độc lập từng đôi,
có kỳ vọng toân hữu hạn vă câc phương sai đ ề u bị chặn trín b ở i hằng số c [Var(Xị) < c ; V i = thì Ve > 0 b ĩ tùy ý cho trước ta luôn có:
Lim P(|-ẳXi-lẳE(Xi)|<6) = l
li t i n t i
Ị n
Chứng minh: X ĩ t đai lương ngẫu nhiín: X = - Y x
n t r
Ta có:
Trang 10@hưư4iạ 5: Jôàm của oán đại tường, ngẫu nhiều oà luật- úi lứt Ị
E ( X ) = E
Ị n \ Ị n
\ n t í ) n t í
Ì X2- 1 T2
Var( X ) = Var
Áp dụng bất đẳng thức Chebyshev cho đại lượng ngẫu nhiên X ta
có:
, , V a r ( X ) , X V a ( X i )
< £ ) > ! - - ^ 7 ^ = 1 - — Ì ;
P ( | X - E ( X ) |
n2 e2
Theo giả thiết: Var(Xị) < c (V i = 1,«) Do đó, trong b i ể u thức trên,
n ế u ta thay m ỗ i Var(Xi ) ( i = 1,«) bằng c thì bấ t đ ẳ n g thức sẽ chỉ mạnh t h ê m
P ( | X - E ( X ) | < s ) * l - - ~ 5 - = l - - £ r
n e n.e
L ấ y g i ớ i hạn cả hai v ế khi n - » 00 ta có:
L i m P ( l X - E ( X ) I < e ) > L i m ( l - -—J) = Ì
n-»oo n-»« n_g
Ta chú ý rằng, x á c suất của b i ế n c ố không thể lớn hơn 1 Do đ ó :
L i m P | x - E ( X ) | < e ) = l
Đó là điều cầaphải chứng minh
• Trường hợp riêng của định lý Chebyshev
N ế u X i , X2, , xn là c á c đ ạ i lượng ngẫu nhiê n độc lậ p từng đôi ,
có c ù n ể kỳ vọng toán, [E(Xị) = a ( V i = Ị , H ) ] thì Ve > 0 b é tùy ý
ta-luôn c ó :
Trang 11L i m P n—>00
ì JQ_
ni*' < 6 = 1
• Bản chất của định lý Chebyshev
I •!.!•; r i u In vhcv Jã chứng tỏ sự ổ n định của ư u n g bình số học của một số lớn các đ ạ i lượng ngẫu nhiên xung quanh trung bình số học các kỳ vọng toán của các đ ạ i lượng ngẫu nhiên ấy
Như vậy, mặc dù từng đ ạ i lượng ngẫu nhiên độc lập có thể nhận giá trị sai khác nhiều so với kỳ vọng toán của chúng, nhưng trung bình sù học của một số lớn c á c đ ạ i lượng ngẫu nhiên l ạ i nhận giá trị gần bằng trung bình số học của các kỳ vọng toán của chúng v ớ i xác suất rất lớn' Đ i ề u đó cho p h é p dự đ o á n giá trị giá trị trung bình số học của đ ạ i lượng ngẫu nhiên
Trong thực tế, định lý Chebyshev được ứng dụng rộng rãi trong
n h i ề u lĩnh vực Chẳng hạn, trường hợp r i ê n g của n ó là cơ sở cho phương p h á p đo lường trong vật lý N h ư chúng ta đ ề u b i ế t , đ ể xác định một đ ạ i lượng n à o đ ó , người ta thường t i ế n h à n h đo nhiều lần
và l ấ y ừung bình số học của c á c k ế t quả đo ấy l à m giá trị thực của
đ ạ i lượng cần đo
Thật vậy: ta có thể coi kết quả của n lần đo là các đại lượng ngẫu
nhiên Xị, X2, , Xn C á c đ ạ i lương n à y độc l ậ p từng đôi, có cùng
kỳ vọng toán (kỳ vọng toán của c ác đ ạ i lượng ngẫu nhiên n à y chính
là giá trị thực của đ ạ i lượng cần đo) và phương sai của chúng đ ề u bị chặn trên bởi chính độ chính x á c của thiết bị dùng đ ể đo Vì t h ế theo trường hợp riên g của định lý Chebyshev thì trung bìn h số học của các k ế t quả đo sẽ sai lệeh rất ít so với giá trị thực của đ ạ i lượng cần đo và điều đó xảy ra v ớ i x á c suất gần bằng 1
Định lý Chebyshev còn là cơ sở cho một phương pháp được áp
dụng rộng rãi trong thống kê là phương p h á p mẫu mà thực chất là
Trang 12(?ilười UI 5: JCtưn cua eáe đai Ixíđ4iạ ngẫu nhiên oà Lưu lơ lởn
dựa v à o một mẫu khá nhỏ ta có thể k ế t luận về toàn bộ tập hợp các
đ ố i tượng cần nghiên cứu
Chẳng hạn để đánh giá năng suất cây trồng ở một vùng nào đó
người ta k h ô n g cần phải điều tra toàn bộ diện tích trồng l o ạ i cây này
mà chỉ cần dựa v à o k ế t quả thu hoa ch cửa một mẫu mà v ẫ n đưa ra được các k ế t luận đủ chính x á c v ề năng suất cây trồng của vùng đó 3- Định lý Bernoulỉi
Nếu Fn là tần suất xuất hiện biến cố A trong n phép thử độc lập và
p là x á c suất xuất h i ệ n b i ế n c ố trong m ỗ i p h é p thử đó thì v ớ i m ọ i e dương b é tùy ý, ta luôn luôn có:
Lim p(| Fn - p I < E) = Ì
Chứng minh: Gọi X là số lần xuất hiện biến cô A trong n phép thử
độc lập X i (ỉ = ỉ,n) là số l ầ n xuất hiện b i ế n cố A trong p h é p thử thứ
I I >0 thú > M ne X j có p h â n phối xác suất như sau:
Trong dỏ
q = Ì - p , Tri thấy: X li
i = l
V i=l .2
iu \ n
£ x i = £ E ( X , ) = n p
) i=i E(Xi) = o.q + l.p = p => E(X) = E
Var(Xị) = E( X?) - [E(Xi)]2 = p - p2 = p(l - p) = p.q
í n ^ "
=> Var(X) = Var X x = L V a ( X ) = 'nP(l
i=i
Trang 13íịiáữ trình tụ thuyết xòe, mất oà tháng, kê tơón
X é t đ ạ i lượng ngẫu nhiên Fn = — Ta thấy Fn chính là tần suất
n xuất h i ệ n b i ế n c ố A ương n p h é p thử độc l ậ p '
E Í Fn) = E - = - E ( X ) = - n p = p X Ì Ì
v n j n n
Var(Fn) = Var 1 V a r ( X ) = ^ U H
n n n
Á p đụng bất đẳng thức Chebyshcv cho đai lưrtng ngẫu n h i ê n Fn ta có:
P ( | F n- p | < e ) > l - - £ ị
n.£^
L ấ y giới hạn cả 2 v ế khi n - > 00 ta có:
L i m P ( | Fn- p | < s ) > L i m ( Ì - ^ 4 ) = Ì
ne
M ặ t khác, vì xác suất k h ô n g thể lớn hơn Ì, do đó:
Lim P(| fn - p| < e) = Ì
* Ý nghĩa:
Định lý Bernoulli chứng minh sự h ộ i tụ theo x á c suất của t ầ n suất xuất hiện biến c ố trong n p h é p thử độc lập v ề x á c suất xuất h i ệ n
b i ế n c ố đó trong m ỗ i p h é p thử khi số p h é p thử tăn g l ê n v ô hạn N ó chứng tỏ sự ổ n định của tần suất xung quanh giá trị x á c suất của b i ế n
c ố đ ó Định lý Bernoulli là cơ sở lý thuyết cho định nghĩa thống k ê của xác suất, do đó nó cũng là cơ sở cho m ọ i á p dụng định nghĩa thống kê của xác suất trong thực t ế