Để tìm qui luật phân phối xác suất của Y, trước hết ta tìm các giá Cột z ghi cạc giá trị mà z có thể nhận.. Đối với tổng thể, ta sử dụng một số khái niệm và ký hiệu sau đây: • N: Số phần
Trang 1íỳiáty trinh Lị thuyết xúc tuất oà tỊỊúutạ kê toán
C h ư ơ n g 5
H À M C Á C Đ Ạ I L Ư Ợ N G N G Ẫ U N H I Ê N
V À L U Ậ T S Ố L Ớ N
I- Hàm của các đại lượng ngẫu nhiên
Trong thực t ế , ta thường gặp trường hợp một đ ạ i lượng ngẫu nhiên là h à m số của một hay nhiều đ ạ i lượng ngẫu nhiên k h á c K h i
đó n ế u biết được qui luật phân„phối xác suất của các đ ố i số thì ta có thể tìm được qui luật phân phối xác suất của c á c h à m số tương ứng Ì- Qui luật phân phối xác suất của hàm một đại lượng ngẫu
n h i ê n
N ế u v ớ i m ỗ i giá trị có th ể GÒ của đ ạ i lượng ngẫu nhiê n X , qua
h à m f ( X ) , ta xác định được một giá trị của đ ạ i lượng ngẫu n h i ê n Y thì Y được g ọ i là h à m của đ ạ i lượng ngẫu nhiên X :
Y = f(X)
a- Trường, hợp X là đại lượng ngẫu nhiên rời rạc và ứng với các giá
trị khác nhau của X ía có các giá trị khác nhau của Y
Trường hợp này, ứng với mỗi giá trị có thể nhận của X ta chỉ có
một giá trị có thể nhận của Y , tức:
(X=xi) = [Y=f(xi) = yi] (Vi)
Suy ra:
' P(X= Xi) = P(Y= yo ( V i )
Trang 2ŨhưỞ4UỊ 5: Jốàni của eáe đại lượng, ngẫu nhiên oà luật IJỐ lởn
Thí dụ ỉ: Đ ạ i lượng ngẫu n h i ê n X có bang p h â n phối x á c suất n h ư
Trang 3éịiáữ trình bị tluiụẾt xòe, mủi tui thống, kè toán
V ậ y qui luật p h â n phối x á c suất của Y như sau:
c- Trường hợp X tò đại lượng ngẫu nhiên liên tục
Giả sử đ ạ i lượng ngẫu n h i ê n X liên tục v ớ i h à m mật độ x á c suất f(x) đã biết và Y la ham số của X : Y = f ( X )
Có thể chứng minh được rằng: Nếu Y = f(X) là hàm khả vi, đơn
đ i ệ u tăng hoặc đơn đ i ệ u g i ả m , có h à m ngược là X = *F(y) thì hàm mật độ x á c suất (p(y) của đ ạ i lượng ngẫu nhiên Y được x á c định bằng b i ể u thức:
9(y) = f [vĩ ' ( y ) ] | T ' ( y ) |
2- Qui luật phân phối xác suất của hàm hai đại lượng ngẫu
n h i ê n
Trang 4thường 5: Vỗàm cùa các đại lưựnạ ngẫu nhiên oà luật iế lán
N ế u ứng v ớ i m ỗ i cặp giá trị c ó th ể nhậ n của hai đ ạ i lượng ngẫ u nhiêri X và z có một giá trị có thể nhận của đ ạ i lượng ngẫu n h i ê n Y thì Y được g ọ i là h à m của 2 đ ạ i lượng ngẫu nhiên X và z
Y = q>(X, Z) Nếu biết được qui luật phân phối xác suất của X và z, ta có
t h ể t ì m đ ư ợ c q u i l u ậ t p h â n p h ố i x á c suất của Y = (p(X, Z)
Để tìm các giá trị mà Y có thể nhận và tính các xác suất tương ứng
của Y n g ư ờ i ta thường t i ế n h à n h lập bảng, Đ ể biết c á c h lập bảng n à y
la x é t m ộ t thí dụ sau đ â y :
Thí dạ: Có 2 máy cùng sản suất một loại sản phẩm, tỷ lệ sản phẩm
l o ạ i A của m á y thứ nhất là 0,8; của m á y thứ hai là 0, 7; L ấ y 3 sản
p h ẩ m do m á y thứ nhất sản xuất và Ì sản p h ẩ m do m á y thứ hai sản xuất đ ể k i ể m tra T i m quy luật p h â n phối x á c suất của số sản p h ẩ m
l o ạ i A có trong 4 sản phẩm l ấ y ra từ hai m á y đ ể k i ể m tra ?
Giải: Gọi X là số sản phẩm loại A có trong 3 sản phẩm lấy ra từ máy
thứ nhất đ ể k i ể m tra D ễ thấy rằng X ~ B(3; 0,8) N ê n ta d ễ d à n g tìm được bảng p h â n phối x á c suất của X như sau:
G ọ i z là số sản phẩm l o ạ i A có trong Ì sản p h ẩ m l ấ y ra từ m á y t h ứ hai đ ể k i ể m tra z ~ B ( l ; 0,7) Bảng p h â n p h ố i x á c suất của z n h ư sau:
G ọ i Y là số sán phẩm l o ạ i A có ư ơ n g 4 sản phẩm l ấ y ra từ hai m á y
đ ể k i ể m ư a thì:
Trang 5íịiáo trình, lý thuyết xòe, mất oà thống, kẻ toán ì
tức Y là h à m của hai đ ạ i lượng ngẫu n h i ê n X và z
Để tìm qui luật phân phối xác suất của Y, trước hết ta tìm các giá
Cột z ghi cạc giá trị mà z có thể nhận Trong thí dụ này, z'chỉ có
thể nhận một trong hai giá trị: 0 hoặc 1;
Các ô còn lại ta ghi các giá trị mà Y có thể nhận Để xác định các
giá trị n à y ta c ă n cứ v à o b i ể u thức của h à m b i ể u đ i ể n m ố i quan hệ giữa Y v ớ i X và z , trong thí dụ ta đ a n g x é t b i ể u thức h à m n à y có dạng: Y = X + z , đồng thời c ă n cứ v à o giá trị của X và z ở cột và dòng tương ứng
Chẳng hạn: Y nhận giá trị 0 khi X = 0 đồng thời z = 0;
Y = l khi x = 0 đồng thời z = Ì hoặc X = Ì đồng thời z = 0
(tương ứng v ớ i hai ừường hợp này trên bảng có hai ô ghi số 1)
Trang 6(Phương 5: 7Càm eủa eáe đại /ưựttạ ngẫu nhiên g ã luật tố lởn
( Y = 3) = [(X = 2)(Z = 1)] u Ĩ ( X = 3)(Z = 0)]
( Y = 4 ) = [ ( X = 3 ) ( Z = 1 ) ]
Á p dụn g côn g thức cộng x á c suất và côn g thức nhân xá c suất, ta tính
c á c x á c suất tương ứng v ớ i các giá trị của Y như sau:
P(Y = 0) = P(X = 0).P(Z = 0) = 0,08 0,3 = 0,0024
• P(Y = 1) = P(X = 0).P(Z = 1) + P(X = 1).P(Z = 0)
= 0,008 0,7 + 0,096 0,3 = 0,0344 P(Y = 2) = P(X = 2).P(Z = 0) + P(X = 1).P(Z = 1)
= 0,384 0,3 + 0,096 0,7 = 0,1824 P(Y = 3) = P(X = 2).P(Z = 1) + P(X = 3).P(Z = 0)
= 0,384 0,7 + 0,512 0,3 = 0,4224 P(Y = 4) = P(X = 3).P(Z = 1) = 0,512 0,7 = 0,3584
V ậ y ta có qui luật p h â n p h ố i x á c suất của Y như sau:
• Trường hợp X, z là các đại lượng ngẫu nhiên liên tục
C ó t h ể chứng (ninh được rằng: h à m mật độ x á c suất (p(y) của Y (Y = X + Z) được x á c định theo công thức:
y ' y
cp(y)= J f1( x ) fỉ( y - x ) d x Hoặc: Ịf, (y - z ) f2 (z)dz
f ị và Ỉ2 là các h à m mật độ xác suất của X và z tương ứng
[với đ i ề u k i ệ n là khi một trong 2 h à m n à y x á c định trong khoảng (-00, +oo) bằng một b i ể u thức]
Trang 7íịiá& trịnh dị t/uiụết xác xuất MÌ thống, kê toán
3- C á c t h a m s ố đ ặ c t r ư n g c ủ a h à m c á c đ ạ i l ư ợ n g n g ẫ u n h i ê n Giả sử đ ạ i lượng ngẫu nhiên r ờ i rạc X có p h â n phối x á c suất như sau:
Ta cần tìm kỳ vọng toán và phương sai của đ ạ i lượng ngẫu nhiên Y [Y = (p(X)] C á c tham số đặc trưng này được xác định bằng c á c công thức sau:
E(Y) = E[(p(X)]=ịọ(xi)pi
Var(Y) = Var[<p(X)] = £<p2(x,)Pl -[E(Y)]2
i = l
* Nêu X là đại lượng ngẫu nhiên liên tục với hàm mật độ xác suất là
f(x) thì kỳ vọng toán và phương sai của đ ạ i lượng ngẫu nhiên
Y = (p(X) được xác định bằng công thức:
•KO E(Y) = E [ Ọ ( X ) ] = J(p(x)f(x)dx
-co +00
V a r ( Y ) = Var[(p(X)] = J(p2 ( x ) f ( x ) d x - [ E ( Y ) ]2
-00 li- Luật số lớn
Như ta đã thấy ở các phần trước, không thể dự đoán trước một cách
chắc chắn đ ạ i lượng ngẫu nhiên sẽ nhận giá trị n à o trong c á c giá trị
có thể nhận của nó khi thực h i ệ n p h é p thử, vì điều đó phụ thuộc v à o rất nhiều nguyên nhân m à ta không thể tính hết được Nhưng n ế u ta
Trang 8thường 5: 7õàtii của các đại lường Iiạẫii nhiều oà luật tá' lân
xét đồng thời một số lớn các đại lượng ngẫu nhiên thì tính "ngẫu
n h i ê n " của h i ệ n tượng mất đi và qui luật tất nhiên của nó được thể
h i ệ n
Đối với thực tiễn thì điều quan trọng là phải xác định các điều
k i ệ n trong đó tác động đồng thời của nhiều nguyên nhàn niiẫn nhiên
sẽ dẫ n đ ế n k ế t quả gầ n như khôn g phụ thuộc gì và o cá c y ế u tô ngẫu
n h i ê n nữa và khi đó ta có thể dự đoán được tiến ưình của h i ệ n tượng C á c đ i ề u k i ệ n n à y được chỉ ra trong các định lý có tên là luật
số lớn Định lý Chebyshev là định lý tổng quát nhấí của luật số lớn,
c ò n định lý Bernoulli là định lý đơn giằn nhất
Để chứng minh' các định lý này ta sử dụng bất đẳng thức
Chebyshev
Ì- Bất đẳng thức Chebyshev
C ó t h ể chứng minh được rằng: N ế u X là đ ạ i lượng ngẫu nhiên có
kỳ vọng toán và phương sai hữu hạn thì v ớ i m ọ i số dương s bé tùy ý,
Trang 9íịiấ trình lự thuyết xòe Mất OĂ tkếttạ kẻ toân
Thí dụ: Thu nhập trung bình của c â c hộ gia đình ở một vùng lă 900
U S D / n ă m vă độ lệch chuẩn lă 120 USD H ê y x â c định khoảng thu nhập xung quanh giâ trị trung bình của ít nhất 95% hộ gia đình ô vùng đó
Giải: Gọi X lă thu nhập của một hô gia đình ở vùng năy thì X lă đại
lượng ngẫu nhiín với qui luật p h đ n phối chưa biết, nhưng E(X) = 900
p(jx-E(X)|.<e)>l-^^ y
6 ì = > P ( ị x - 9 0 0 | < e ) > l - ^ y - = 0,95
£
Từ đó ta tìm được s = 536,656
Vậy ít nhất 95% hộ gia đình ở vùng đó có thu nhập hăng năm nằm
trong khoảng (900 - 536,656; 90Ọ + 536,656) tức thu nhập của câc
hộ gia đình trong khoảng (363,344;• 1436,656) U S D / n ă m
2- Định lý Chebyshev
Nếu câc đại lượng ngẫu nhiín X[, X2 , xn độc lập từng đôi,
có kỳ vọng toân hữu hạn vă câc phương sai đ ề u bị chặn trín b ở i hằng số c [Var(Xị) < c ; V i = thì Ve > 0 b ĩ tùy ý cho trước ta luôn có:
Trang 10@hưư4iạ 5: Jôàm của oán đại tường, ngẫu nhiều oà luật- úi lứt Ị
Áp dụng bất đẳng thức Chebyshev cho đại lượng ngẫu nhiên X ta
n ế u ta thay m ỗ i Var(Xi ) ( i = 1,«) bằng c thì bấ t đ ẳ n g thức sẽ chỉ mạnh t h ê m
Đó là điều cầaphải chứng minh
• Trường hợp riêng của định lý Chebyshev
N ế u X i , X2, , xn là c á c đ ạ i lượng ngẫu nhiê n độc lậ p từng đôi ,
có c ù n ể kỳ vọng toán, [E(Xị) = a ( V i = Ị , H ) ] thì Ve > 0 b é tùy ý
ta-luôn c ó :
Trang 11L i m P n—>00
ì JQ_
• Bản chất của định lý Chebyshev
I •!.!•; r i u In vhcv Jã chứng tỏ sự ổ n định của ư u n g bình số học của một số lớn các đ ạ i lượng ngẫu nhiên xung quanh trung bình số học các kỳ vọng toán của các đ ạ i lượng ngẫu nhiên ấy
Như vậy, mặc dù từng đ ạ i lượng ngẫu nhiên độc lập có thể nhận giá trị sai khác nhiều so với kỳ vọng toán của chúng, nhưng trung bình sù học của một số lớn c á c đ ạ i lượng ngẫu nhiên l ạ i nhận giá trị gần bằng trung bình số học của các kỳ vọng toán của chúng v ớ i xác suất rất lớn' Đ i ề u đó cho p h é p dự đ o á n giá trị giá trị trung bình số học của đ ạ i lượng ngẫu nhiên
Trong thực tế, định lý Chebyshev được ứng dụng rộng rãi trong
n h i ề u lĩnh vực Chẳng hạn, trường hợp r i ê n g của n ó là cơ sở cho phương p h á p đo lường trong vật lý N h ư chúng ta đ ề u b i ế t , đ ể xác định một đ ạ i lượng n à o đ ó , người ta thường t i ế n h à n h đo nhiều lần
và l ấ y ừung bình số học của c á c k ế t quả đo ấy l à m giá trị thực của
đ ạ i lượng cần đo
Thật vậy: ta có thể coi kết quả của n lần đo là các đại lượng ngẫu
nhiên Xị, X2, , Xn C á c đ ạ i lương n à y độc l ậ p từng đôi, có cùng
kỳ vọng toán (kỳ vọng toán của c ác đ ạ i lượng ngẫu nhiên n à y chính
là giá trị thực của đ ạ i lượng cần đo) và phương sai của chúng đ ề u bị chặn trên bởi chính độ chính x á c của thiết bị dùng đ ể đo Vì t h ế theo trường hợp riên g của định lý Chebyshev thì trung bìn h số học của các k ế t quả đo sẽ sai lệeh rất ít so với giá trị thực của đ ạ i lượng cần đo và điều đó xảy ra v ớ i x á c suất gần bằng 1
Định lý Chebyshev còn là cơ sở cho một phương pháp được áp
dụng rộng rãi trong thống kê là phương p h á p mẫu mà thực chất là
118
Trang 12(?ilười UI 5: JCtưn cua eáe đai Ixíđ4iạ ngẫu nhiên oà Lưu lơ lởn
dựa v à o một mẫu khá nhỏ ta có thể k ế t luận về toàn bộ tập hợp các
đ ố i tượng cần nghiên cứu
Chẳng hạn để đánh giá năng suất cây trồng ở một vùng nào đó
người ta k h ô n g cần phải điều tra toàn bộ diện tích trồng l o ạ i cây này
mà chỉ cần dựa v à o k ế t quả thu hoa ch cửa một mẫu mà v ẫ n đưa ra được các k ế t luận đủ chính x á c v ề năng suất cây trồng của vùng đó 3- Định lý Bernoulỉi
Nếu Fn là tần suất xuất hiện biến cố A trong n phép thử độc lập và
p là x á c suất xuất h i ệ n b i ế n c ố trong m ỗ i p h é p thử đó thì v ớ i m ọ i e dương b é tùy ý, ta luôn luôn có:
Lim p(| Fn - p I < E) = Ì
Chứng minh: Gọi X là số lần xuất hiện biến cô A trong n phép thử
độc lập X i (ỉ = ỉ,n) là số l ầ n xuất hiện b i ế n cố A trong p h é p thử thứ
I I >0 thú > M ne X j có p h â n phối xác suất như sau:
iu \ n
) i=i E(Xi) = o.q + l.p = p => E(X) = E
Var(Xị) = E( X?) - [E(Xi)]2 = p - p2 = p(l - p) = p.q
í n ^ "
=> Var(X) = Var X x = L V a ( X ) = 'nP(l
Trang 13íịiáữ trình tụ thuyết xòe, mất oà tháng, kê tơón
X é t đ ạ i lượng ngẫu nhiên Fn = — Ta thấy Fn chính là tần suất
n xuất h i ệ n b i ế n c ố A ương n p h é p thử độc l ậ p '
Trang 14&uứfrtạ ó: Mẫu ngẫu nhiên
P h ầ n 2
T H Ô N G K Ê T O Á N
Thống kê toán là bộ môn toán học nghiên cứu qui luật của các hiện
tượng ngẫu n h i ê n có tính chất số lớn trên cơ sở thu thập và xử lý c á c
số l i ệ u thống k ê - các k ế t quả quan sát Như vậy nội dung chủ y ế u của thống kê toán là x â y dựng các phương p h á p thu thập và xử lý
c á c số1 l i ệ u thống k ê nhằm rút ra các k ế t luận khoa học C á c phương
p h á p thống k ê toán là công cụ đ ể giải quyết nhiều vấn đề khoa học
và thực t i ễ n nảy sinh trong c á c lĩnh vực khác nhau của tự nhiên và kinh t ế xã h ộ i
số dấu hiệu định tính hay định lượng n à o đó C á c dấu hiệu n à y thể
h i ệ n trên nhiều phần tử k h á c nhau T ậ p hợp tất cả các phần tử chứa đựng thông tin về các dấu hiệu ta cần nghiên cứu được g ọ i là tập
hợp chính hay tổng thể ~ >
Chẳng hạn, một doanh nghiệp cần nghiên cứu tập hợp các khách
Trang 15QiáA trình bị ưuujẤ't xác uiất nả thấtig kê toán
hàng của mình theo các dấu h i ệ u như: mức độ hài lòng của khách
h à n g v ề sản phẩm hay dịch vụ của doanh nghiệp (dấu h i ệ u định tính) hoặc nghiên cứu theo dấu hiệu định lượng là nhu cầu của khách hàng về số lượng sản phẩm của doanh nghiệp Trong trường hợp này thì tạp hợp gồm tất cả các k h á c h h à n g của doanh nghiệp là tổng thể Đối với tổng thể, ta sử dụng một số khái niệm và ký hiệu sau đây:
• N: Số phần tử của tổng thể và được gọi là kích thước của tổng thề
Kích thước của tổng thể phụ thuộc v à o vấ n đ ề và phạ m v i nghiên cứu
• X* : Dấu hiệu ta cần khảo sát, nghiên cứu (trong kinh tế thường gọi
là chỉ tiêu) Dấu hiệu nghiên cứu có thể là định tính hoặc định lượng Cần nhấn mạnh rằng, khi nói nghiên cứu một tổng thể có nghĩa là ta
n g h i ê n cứu dấu hiệ u X* được th ể h i ệ n trê n cá c phầ n tử của tổng thể
• Xi (i = 1,2, k) là các giá trị của dấu hiệu X* đo được trên các
phần tử của tổng thể Xi là những thông tin cần thiết đ ể ta nghiên cứu
v ề dấu hiệ u x \ còn cá c phần tử của tổng th ể là những đ ố i tượng mang thông tin
Trang 16&UÌƯIUỊ ó: MÂU IUỊỖU nhiều
Ta cũng có.thể mô tả tổng thể bằng bảng phân phối tần suất Dạng
tổng q u á t của bảng n à y như sau:
Về hình thức, bảng phân phối tần suất của tổng thể tương tự như
bảng p h â n phối xác suất của đ ạ i lượng ngẫu nhiên rời rạc N ó phản
á n h cơ cấu của tổng thể
Trang 17cịiáo trình Lị thuyết xác mất oà tlÚHtọ kê tữáiL
2- Phương sai của tổng thể
Phương sai của tổng thể (ký hiệu là ơ2) được xác định theo công
gọi tắt là tỷ lệ tổng thể), p cũng chính là xác suất lấy được phần tử
có tính chất A khi lấy ngẫu nhiên một phần tử từ tổng thể
Thí dụ: Ngành cao su có 500.000 công nhân Để nghiên cứu mức
sống của họ, người tá khảo'sát chỉ tiêu X* :" Thu nhập thực tế của
công nhân ngành cao su" và giả sử thu được các số l i ệ u cho ở bảng
sau:
Trang 18ót lứtfi tạ ó: Mẫu ngẫu nhiên
• Độ lệch chuẩn của thu nhập (độ lệch chuẩn của tổng thể):
ơ = V23100 = 151,987
• T ỷ l ệ công nhân có thu nhập cao của n g à n h cao su (tỷ l ệ tổng thể):
N ế u ta coi những côn g n h â n có mức thu nhập từ 1000 (ngà n đồng) -trở l ê n là những người có thu nhập cao thì tỷ l ệ công n h â n có thu
Trang 194ỳiá& bình bị tluiụết xác tuất oà tliếnạ kê tơÓMi
30000 + 25000 _
n = •— = 0,11 hay 1 1 %
li- Khái niệm mẫu
Đ ể nghiên cứu tổng thể theo m ộ t hay một số dấu hiệu n à o đó ta cần nghiên cứu toàn bộ các phần tử của tổng thể, tức là thống kê toàn bộ táp hợp và phân tích từng phần tử của nó theo dấu hiệu nghiên cứu Chẳng hạn đ ể nghiên cứu d â n số của một nước theo các dấu hiệu như: giới tính, độ tuổi, nghề nghiệp, trình độ học v ấ n , nơi
cư trú, ta phải t i ế n hành tổng điều tra dân sô và p h â n tích từng người theo các dấu hiệu trên sau đó tổng hợp cho toàn bộ d â n số của
cả nước Tuy nhiên trong thực t ế cách l à m này gặp phải những khó khăn sau đây:
• N ế u kích thước của tổng thể quá lớn thì việc nghiên cứu toàn bộ phải chịu chi phí lớn về t i ề n của, thời gian, nhân lực, phương t i ệ n , dễ xảy ra sai sót trong quá trình thu thập thông tin ban đầu, hạn c h ế
độ chính xác của k ế t quả p h â n tích
• Nếu các phần tử của tập hợp lại bị phá hủy trong quá trình điều
tra thì phương phá p nghiê n cứu toà n bộ trở thàn h vô nghĩa Chẳng hạn: đ ể k i ể m tra chất lượng của các hộp sữa do một h ã n g sản xuất thì ta không thể mở tất cả các hộp sữa do hãng này sản xuất đ ể k i ể m tra được
• Có những trường hợp ta không thể x á c định được )àn bộ các phần tử của tổng thể Trường hợp này thường xảy ra trong việc điều tra c á c vấn đ ề thuộc về lĩnh vực xã h ộ i học Chẳng hạn: đ i ề u tra những người nghiện ma túy, những người n h i ễ m H I V , những trẻ vị thành niên phạm pháp Trong các trường hợp đó ta cũng không thể t i ế n hành điều tra toàn bộ được vì cùn một bộ phận khá lớn chưa phát h i ệ n được nên không thể xác định được toàn bộ số phần tử của tổng thể
Trang 20CHuùttiq ó: Mẫu ngẫu nhiên
Vì vậy, từ t h ế kỷ 17, phương p h á p nghiên cứu mẫu đã ra đ ờ i , ngày càng phát triển và được sử dụng rộng rãi trong nhiều lĩnh vực T ư tưởng cơ bản của phương p h á p mẫu như'sau:
T ừ tổng-thể ta l ấ y ra n phần tử và đo lường giá trị của dấu hiệu X* trên chúng, n phần tử n à y lập n ê n một mẫu s ố phần tử của mẫu (n)
được g ọ i là kích thước mẫu thông thường kích thước của mẫu nhỏ
hơn nhiều so với kích thước của tổng thể Vì vậy ta có khả năng thực
t ế đ ể thu thập, x ử lý và khai thá c thôn g tin mẫ u mộ t các h nhanh chóng, toàn d i ệ n hơn Sử dụng các phương p h á p toán học (đặc b i ệ t
là lý thuyết xác suất), người ta t i ế n h à n h suy rộng k ế t quả nghiên cứu trên m ẫ u cho toàn bộ tổng t h ể , đó là mục đích cuối cùng của phương p h á p mẫu
Để đạt được mục đích trên thì mẫu phải đại diện cho tổng thể
M u ố n vậy, khi lấy mẫu phải đ ả m bảo tính ngẫu nhiên, không chọn
m ẫ u theo một tiêu chuẩn chủ quan đã định trước
Trong thực t ế có nhiều cách lấy mẫu:
Ì- Lấy mẫu ngẫu nhiên:!
2- Chọn mẫu cơ giới:
C á c phần tử của tổng thể được đưa v à o mẫu cách nhau một khoảng
x á c định Chẳng hạn, trên một dây chuyền sản xuất, cứ sau một khoảng thời gian t n à o đó l ạ i lấy ra một sản phẩm đ ể đưa v à o mẫu
Trang 214ịỉá& trình lự thuyết xác Mất oà tìt éhiạ UẾ IOÚML
Ta chia tổng thể thành một số lớp theo một chỉ tiêu phụ nào đó,
sao cho các phần tử trong m ỗ i lớp đồng đ ề u hơn Sau đó mới lấy ngẫu nhiên từ m ỗ i lớp một số phần tử đ ể đưa v à o mẫu C á c h chọn mẫu này thường được á p dụng khi phạm vi nghiên cứu rộng, số lượng phần tử của tổng thể quá lớn
Việc lấy mẫu được tiến hành chủ yếu theo 2 phương thức:
a- Lấy mẫu có hoàn lại (có lặp)
Phương p h á p này được á p dụng khi tập hợp chính có ít phần tử Theo phương thức này, m ỗ i lần l ấ y vào mẫu chỉ một pịiần tử Sau khi đã được nghiên cứu ta trả l ạ i phần tử đỏ v à o tập hợp chính trước khi lấy phần tử tiếp theo
Như vậy, v ớ i cách l ấ y n à y , một phần tử có thể xuất h i ệ n nhiều lần trong mẫu
b- Lấy mẫu không hoàn lại (không lặp)
Theo cách l ấ y này, phần tử được l ấ y ra nghiên cứu sẽ bị l o ạ i hẳn
ra khỏi tạp hợp chính
Trong thực tế, nếu kích thước của tổng thể khá lổn thì phương thức
lây mẫu có hoàn l ạ i và k h ô n g hoàn l ạ i cho ta k ế t quả sai lệch nhau không đáng k ể Đặc biệt khi kích thước của tổng thể là vô hạn CÒIL-kích thước của mẫu là hữu hạn thì không có sự k h á c b i ệ t giữa hai phương thức lấy mẫu Lúc đó có thể chọn mẫu theo phương thức không hoàn l ạ i mà vẫn xem như mẫu được chọn theo phương thức có hoàn l ạ i
Việc lựa chọn phương pháp lấy mẫu phụ thuộc vào mục đích, đối
tuỢng.nghiên cứu và điều k i ệ n t i ế n hành Trong giáo trình n à y , để thuận tiện cho việc mô hình hoa ta giả thiết mẫu được thành lập theo phương thức có lặp
Trang 22&uỉđti(Ị Ó: Mẫu ngầu /thiền
H I - M ô h ì n h x á c s u ấ t c ủ a t ổ n g t h ể v à m ẫ u
Ta có thể dùng công cụ toán học để mô tả và khái quát các khái
n i ệ m : tổng t h ể , dấu h i ệ u n g h i ê n cứu và m ẫ u đã nêu ở phần trên Tức
là x â y dựng m ô hình toán học của chúng
Ì- Đại lượng ngẫu nhiên góc và qui luật phân phối gốc
Từ bảng 6.1 (hoặc 6.2) ta thấy có thể mô hình hoa dấu hiệu X*
bằng m ộ t đ ạ i lượng ngẫu nhiên
T h ậ t vậy, n ế u lấy ngẫu n h i ê n từ tổng thể ra một phần tử và g ọ i X
là giá trị của dấu hiệu X* đo được ư ê n phần tử lấy ra đó thì X là đ ạ i lượng ngẫu nhiên có p h â n p h ố i x á c suất như sau
Bảng 6.7
N h ư v ậ y dấu h i ệ u mà ta nghiên cứu (X*) được mô hình hóa bởi
đ ạ i lượng ngẫu nhiên X Qui luật phân phối x á c suất của X được g ọ i
, , ì
là qui luật p h â n phôi góc
2- Các tham số của đại lượng ngẫu nhiên gốc
a- Kỳ vọng toán: Với qui luật phàn phối xác suất (6.7) của X
Theo định nghĩa, kỳ vọng toán của X sẽ là:
E(X) = £xiPi
i = l
So sánh với (6.3) ta thấy trung bình của tổng thể chính là kỳ
vọng toán của đại lượng ngẫu nhiên gốc X: ịx = E(X)
b- Phương sai: Theo định nghĩa của phương sai ta có:
Trang 23(ịiáữ trình bị thuyết xát Mất ó điếng, kê tơáit
V a r ( X ) = Ề [ X i - E ( X ) ] 2 P ;
i = l Nhưng E(X) = li, Do đ ĩ :
V a r ( X ) = Ề ( x , - | i ) 2 p?
i=I
So s á n h vớ i (6.4) ta thấy phương sai của tổng thể chính là
2
phương sai của đại lượng ngẫu nhiên gốc X: ơ = V a r ( X )
3- Mầu ngẫu nhiên
Giả sử lấy ra n phần tử từ tổng t h ể , tạo n ê n một m ẫ u cĩ kích thước
n theo phương-pháp cĩ h o à n l ạ i G ọ i X j là giá trị của dấu h i ệ u X đo được trên phần tử thứ i ( i = Ì, 2, , n) Vì các phần tử được lấy ra theo phương thức cĩ hồrt l ạ i n ê n X i , %2, , x „ là các đ ạ i lượng ngẫu nhiêiTđộc lập, cĩ qui luật p h â n phối xác suất giống v ớ i qui luật p h â n phối xác suất của X
V ậ y n phần tử thuộc mẫu, nếu gạt bỏ c á c hình thức cụ t h ể , được
mơ tả bằng n đ ạ i lượng ngẫu nhiên: X i , X2, , xn Do đĩ ta cĩ thể khái quát đ ể định nghĩa mẫu ngẫu nhiên như sau:
Cho đại lượng ngẫu nhiên X vơi qui luật phân phối xác suất nào
đĩ Một mẫu ngẫu nhiên kích thước n được thành lập từ đại lượng ngẫu nhiên X là n đại lượng ngẫu nhiên độc lập, cĩ cùng phân phối xác suất với đại lượng ngẫu nhiên X
Ký h i ệ u mẫu ngẫu nhiên kích thước n được xây dựng từ đ ạ i lượng ngẫu nhiên X là: Wx = ( X i , X2, , xn)
Thực hiện một p h é p thử đơ'i v ớ i m ẫ u ngẫu nhiên Wx, tức là thực
h i ệ n một p h é p thử đ ố i v ớ i m ỗ i thành phần (Xi) của mẫu (trong thực
t ế thường là lấ y ra n phần tử cụ th ể từ tổng thể) G i ả sử X i nhậ n giá trị Xi ( i = Ì, 2, , n) C á c giá trị X i , x2, , xn tạo thành một giá
Trang 24()li ương ó: Jtlẫu ngẫu nhiên
trị của m ẫ u ngẫu nhiên, hay còn được g ọ i là một m ẫ u cụ t h ể Ký
ngẫu nhiên (có hoàn l ạ i ) 5 sinh viên của lớp Giả sử đ i ể m thi của
sinh viên thứ nhất là ỉ ; của s/v thứ hai là 9 ; của h/s thứ ba là 5 ; của
h/s thứ tư là 7 và của h/s thứ n ă m là 4, thì ta có một mẫu cụ t h ể là:
wx = ( 5 , 9 , 5 , 7 , 4 ) Thực hiện một phép thử khác đối với wx (tức chon 5 s/v khác của
Trang 25cịiáo trình lự thuyết xác mất OÀ tỉtốttạ kê toái!
w x = (4, 7, 9, 9, 5) Nếu kích thước mẫu lớn, việc trình bầy một cách cụ thể kết quả
quan sát như trên là không thuận tiện Trong trường hợp n à y ta sử dụng các khái n i ệ m : giá trị cua dấu h i ệ u X (Xi); tần suất của Xi (Pi)
đã nêu ở phần trên đ ể trình bầy mẫu cụ I h ể dưới dạng bảng
Đ ể phân biệt với các ký hiệu của tổng thể Đ ố i v ớ i m ẫ u ta dùng các ký hiệu sau đây:
ni: Tần số của Xj; fi = — : Tần suất của Xi
n
Thí dụ 2: T ừ bảng (6.6) ta thấy thu nhập của công nhân n g à n h cao su
có thể mô hĩnh hoa bởi đ ạ i lượng ngẫu n h i ê n X với bảng p h â n phối xác suât như sau:
Gọi Xi là "Thu nhập của công nhân thứ i được đưa vào mẫu"
x5()(), độc lập, có cùng p h â n phối xác suất v ớ i X Tức ta có m ẫ u ngẫu nhiên: w x = ( X | , x2 X500) được x â y dựng từ đ ạ i lượng ngẫu nhiên gốc X
Thực hiện một phép thử đối với mẫu wx, tức điều ưa thu nhập
của 500 công nhân cụ thể Giả sử k ế t quả đ i ề u tra cho ở bảng sau:
Trang 26Qhươnạ ó: Mầu tiạẫu nhiên
Nếu điều tra thu nhập của 500 cồng nhân khác ta lại có một mẫu
cụ t h ể k h á c (một giá trị khác) của mẫu ngẫu nhiên W x
Như vậy, mẫu ngẫu nhiên có thể phản ánh được kết quả điều tra
thực nghiệm B ở i vì các k ế t quả này được coi là một giá trị của nó Tức là khái quát được thực nghiệm Quan hệ giữa mẫu ngẫu nhiên
và m ẫ u cụ thể (hay một giá trị của nó) tươne tự như quan hệ giữa đ ạ i lượng ngẫu nhiên và một giá trị có thể nhận của nó
4- Các phương pháp mô tả số liệu mẫu
a- Mô tả mẫu bằng bảng phân phối tần số thực nghiệm:
Bảng 6 ì 3
Trang 27ựịiáơ trình lý thuụểt xòe, mạt oà thống, kê toán
trong đó: f j = — ; Đ ố i v ớ i bảng trên, ta luôn có: 2 / 1 = 1
n i=i
p
c- Đ ể mô tả số l i ệ u mẫu một cách rõ r à n g1 Hơn cho p h é p ta đ ư a * a
những nhận x é t sơ bộ ban đầu v ề tổng thể người ta còn x â y dựng các
l o ạ i đồ thị k h á c nhau của p h â n phối thực nghiệm
o Đa giác tần số: là một đường gãy khúc nối các điểm (Xi, ni);
© Biểu đố tần số: Khi dấu hiệu nghiên cứu có phân phối liên tục
thì nên xây dựng biểu đồ tần số hoặc biểu đồ tần suất Đ ể làm điều
Trang 28&iươtiạ ó: Jtlmi ngẫu nhiên
đó khoảng chứa tất cả các giá trị quan sát được của m ẫ u được chia
thành một số khoảng có chiều dài bằng h và ứng với mỗi khoảng ta
tính số quan sát của mẫu thuộc khoảng này, tức là tính tần số (ni)
tương ứng với từng khoảng Biểu đồ tần số là biểu đồ dạng bậc
thang tạo nên bởi nhiều hình chữ nhật có đáy bằng h và chiều cao
bằng — Lúc đó diên tích của hình chữ nhát thứ i bằng h — = ni
h h Vậy diện tích tất cả các hình chữ nhật sẽ bằng kích thước mẫu n
"Ểơng tự biểu đồ tần suất là biểu đồ dạng bậc thang tạo nên bởi
5 , f
nhiêu hình chữ nhát có đáy bằng h và chiều cao bằng — L ú c đó
h diện tích của hình chư nhật thứ i bằng h — = fj và diện tích tất cả các
h hình chữ nhật sẽ bằng 1
Thí dụ: Vẽ biểu đồ tần số của phân phối thực nghiệm cho ở bảng
Trang 29Lịláo trình ỉ lị thuyết xác mối oà Miếng, kê toán
© Biểu đồ hình bánh xe: Đ ố i với các dấu hiệu định tính thì người ta
thường m ô tả số liệu mẫu bằng b i ể u đổ hình b á n h xe Đ ó là một hình tròn được chia thành các phần tương ứng v ớ i tỷ l ệ của các bộ phận trong mẫu
Thí dụ: Điều tra ngẫu nhiên 100 khách hàng của một doanh nghiệp
thì thấy các khách hàng được p h â n theo tỷ l ệ sau v ề tầng lớp xã hội
Trang 30& tươi KỊ ó: Mẫn ít í/tí li ít hiền
N ô n g
d â n 40%
T r i X
t h ứ c / \
• \<ò°ỉ/ T h ư ơ n g / n h â n 15%
C ô n g nhân 35%
Đ ồ ứiị của p h â n p h ố i m ẫ u có t h ể v ẽ d ễ dàng n ế u ta sử dùng c á c phần m ề m thống k ê n h ư E x c e l , SPSS, S t a t a ,
IV- Các tham số đặc trưng của mẫu
K h i nghiên cứu m ẫ u , người ta thường quan t â m đ ế n c á c tham số đặc trưng sau đ â y :
Ì - T r u n g b ì n h m ẫ u
a- Định nghĩa: Cho m ẫ u ngẫu nhiên kích thước n, được xây dựng
từ đ ạ i lượng ngẫu nhiên X : W x = ( X | , x2 ) - , xn)
Trung bình mẫu ngẫu nhiên (ký hiệu là X) được định nghĩa:
i n
x n?xi
n j_i
(6.10)
Do X ị , X2, , x „ là c á c đ ạ i lượng ngẫu nhiên , theo định nghĩa
t r ê n thì X là h à m của n đ ạ i lượng ngẫu nhiê n X i , X2, , xn n ê n
X ũ m g là m ộ t đ ạ i lượng ngẫu nhiên
Trang 31(ịiéuy trinh, lý thuyết xán suất oà thống, kè lơảỉi
E ( X ) = M- và V a r ( X ) = ơ / n Thật vậy, theo tính chất của kỳ vọng toán, ta có :
E(X) = EÍ Ì V Xj ì = 1Ỳ E(X,) = i nụ = n
Như vậy, bất kể ^ui luật phân phối xác suất của đại lượng ngẫu
nhiên gốc như t h ế n ã o , thống kê X cũng có kỳ vọng toán bằng kỳ
Trang 32ẽhưtùtạ ó: jỊỊẫu Iiạẫu nhiên
vọng_của đ ạ i lượng ngẫu' nhiên gốc [E(X) = E ( X ) J Còn phương sai của X nhỏ hơn phương sai của đ ạ i lượng ngẫu nhiên gốc n lần Nghĩa là c á c giá trị có th ể có của X ổ n định quanh kỳ vọng hơn cá c giá trị có thể có của X
Nếu lấy căn bậc hai của Var( X) ta được độ lệch chuẩn ơ( X ) Độ
lệch chuẩn này của X được dùng đ ể phẩn ánh sai số ước lượng do
đó người ta thường g ọ i là sai số chuẩn (ký hiệu là se( X ) V ậ y :
se(X) = o(X) = Vvar(X) = -^L
VII
ở trên ta luôn giả thiết rằng mẫu được rút ra từ tổng thể theo
phương thức có h o à n l ạ i N ế u kích thước tổng thể là vô hạn hoặc kích thước tổng thể hữu hạn nhưng n < 0,1N thì có thể lấy mẫu không h o à n l ạ i mà không ảnh hưởng đ ế n k ế t quả Trường hợp
n > 0,1N thì đ ố i v ớ i các công thức trên phải sử dụng hệ số hiệu chỉnh
c- Qui luật phân phối của X
Qui luật phân phối xác suất của trung bình mẫu phụ thuộc và qui luật p h â n phối xác suất của đ ạ i lượng ngẫu nhiên gốc Người ta đã
p h â n phôi theo qui luật chuẩn N ( f i ; ơ In)
Trang 33Lịiáo trình lý thuyết xác tuất oà tttếnạ Ui toán
2- P h ư ơ n g sai m ẫ u
a- Định nghĩa: Cho mẫu ngẫu nhiên wx = (Xi, x2, , Xn)
Phương sai của nó (ký hiệu là s2) được định nghĩa:
S2=-ỉ-ấ(X,-X)1 (6.17)
n - 1 i=i Trong đó X là trung bình của mẫu ngẫu nhiên
* Chú ý: Theo định nghĩa trên, ta thấy phương sai mẫu ngẫu nhiên là
2
h à m của n đ ạ i lượng ngẫu nhiên X | , X 2 , , Xn n ê n s cũng là một
đ ạ i lượng ngẫu nhiên
Do s là đ ạ i lượng ngầu nhiên n ê n ta có thè inh E(S )
Giả sử: E(X) = ịi; Var(X) = a2
n Tf
Trang 34Qluítítiạ ó: Mẫn ngẫu nhiên
E ( X Ị ) = l i (Vi) n ê n E(X, - ự) 2 = Var(Xị) = Var(X) = ơ2
E(X) = H nên E[(X-n)2] = Var(X) = ơ2/n
Do đ ó :
2 n E(S2) =
n - 1
.2 N n.ơ -
Trang 35íịiá& trình Lị thuyết xóa mất oà- thống, kê toán
Đ ộ lệch chuẩn của m ẫ u ngẫu n h i ê n (ký h i ệ u S) là c ă n bậc hai
của phương sai mẫu:
Vì X i ( i = Ì, 2, n) là c á c đ ạ i lượng ngẫu n h i ê n , Fn là h à m của các
đ ạ i lượng ngẫu n h i ê n n ê n Fn cũng là m ộ t đ ạ i lượng ngẫu n h i ê n
* Chú ý: Nhìn vào biểu thức định nghĩa của Fn ta thấy giống với biểu
thức định nghĩa của X Thực chất Fn cũng là trung bình m ẫ u ngẫu
nhiên w x - (Xi., X a , , xn) M ẩ u ngẫu n h i ê n n à y được t h à n h lập
từ đ ạ i lượng ngẫu n h i ê n gốc X ( X là số phần tử có tính chất A có
trong phần tử chọn ngẫu n h i ê n từ tổng t h ể )
Trang 36@hườitạ ồ: Mẫu ngẫu nhiên
N ế u có m ẫ u cụ thể , ta sẽ tính được giá trị của F„ (ký h i ệ u là f )
nA
f = — (6.22)
n Trong đ ó nA là tổng số phần tử có tính chất A có trong m ẫ u cụ t h ể ; n
Giả sử có mẫu cụ thể w x = ( X i , x2, , xn) , thì trung bình m ẫ u
( x ) và phương sai m ẫ u ( s2 ) là hai giá trị cơ bản nhất đ ố i v ớ i m ẫ u cụ
thể n à y , s có thể suy ra từ s2 ; cồn f thì tính rất đơn giản Do đó phần
2
n à y c h ú n g ta chỉ nêu ra c ô n g thức tính X và s tương ứng v ớ i từng
trường hợp số l i ệ u h i ệ n có như sau
Ì- Trường hợp số liệu của mẫu cho dưới dạng không có
Trang 37íịiáữ trình lý- thuyết xòe Mất OÀ í/iấnạ kề loàn
Theo côn g thức định nghĩa của s ta c ó :
Ta có:
V ậ y :
(xj - x )2 = ( X ị )2 - 2 xix + ( x )2
ẳ(x,-x)2=ỉ[(x,)2-2x.xi+(x)2] 1=1
Thí dụ 3: Quan sát đ i ể m thi m ô n T o á n cao cấp của 10 sinh viên được
chọn ngẫu nhiên từ một lớp ta thu được các số l i ệ u sau:
10 I r ,
J X = 358; V ậ y : s2 = - [358 - 1 0 ( 5 , 8 )2 ] = 2,4 i=i 9
Trang 38phường ổjjtưui Iiạẫít nhiên
Thí dụ 4: Có các số liệu về doanh số bán (Y) và chi phí chào hàng
(X) của 12 công ty thương m ạ i tư nhân cho ở bảng dưới đây: H ã y tính trung bình mẫu và độ lệch chuẩn mẫu của X và Y ?
Trang 39íịiá& trình lý tíuiụết xác utấí oà thốnạ kẻ toán
Giải: Ta l ậ p bảng tính như sau:
Trang 40ũítư&tiạ ó: Mẫu Iiạẫii nhiên