1. Trang chủ
  2. » Giáo án - Bài giảng

giáo trìnhLí thuyết xác suất và thống kê toán

149 169 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 149
Dung lượng 11,87 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Để tìm qui luật phân phối xác suất của Y, trước hết ta tìm các giá Cột z ghi cạc giá trị mà z có thể nhận.. Đối với tổng thể, ta sử dụng một số khái niệm và ký hiệu sau đây: • N: Số phần

Trang 1

íỳiáty trinh Lị thuyết xúc tuất oà tỊỊúutạ kê toán

C h ư ơ n g 5

H À M C Á C Đ Ạ I L Ư Ợ N G N G Ẫ U N H I Ê N

V À L U Ậ T S Ố L Ớ N

I- Hàm của các đại lượng ngẫu nhiên

Trong thực t ế , ta thường gặp trường hợp một đ ạ i lượng ngẫu nhiên là h à m số của một hay nhiều đ ạ i lượng ngẫu nhiên k h á c K h i

đó n ế u biết được qui luật phân„phối xác suất của các đ ố i số thì ta có thể tìm được qui luật phân phối xác suất của c á c h à m số tương ứng Ì- Qui luật phân phối xác suất của hàm một đại lượng ngẫu

n h i ê n

N ế u v ớ i m ỗ i giá trị có th ể GÒ của đ ạ i lượng ngẫu nhiê n X , qua

h à m f ( X ) , ta xác định được một giá trị của đ ạ i lượng ngẫu n h i ê n Y thì Y được g ọ i là h à m của đ ạ i lượng ngẫu nhiên X :

Y = f(X)

a- Trường, hợp X là đại lượng ngẫu nhiên rời rạc và ứng với các giá

trị khác nhau của X ía có các giá trị khác nhau của Y

Trường hợp này, ứng với mỗi giá trị có thể nhận của X ta chỉ có

một giá trị có thể nhận của Y , tức:

(X=xi) = [Y=f(xi) = yi] (Vi)

Suy ra:

' P(X= Xi) = P(Y= yo ( V i )

Trang 2

ŨhưỞ4UỊ 5: Jốàni của eáe đại lượng, ngẫu nhiên oà luật IJỐ lởn

Thí dụ ỉ: Đ ạ i lượng ngẫu n h i ê n X có bang p h â n phối x á c suất n h ư

Trang 3

éịiáữ trình bị tluiụẾt xòe, mủi tui thống, kè toán

V ậ y qui luật p h â n phối x á c suất của Y như sau:

c- Trường hợp X tò đại lượng ngẫu nhiên liên tục

Giả sử đ ạ i lượng ngẫu n h i ê n X liên tục v ớ i h à m mật độ x á c suất f(x) đã biết và Y la ham số của X : Y = f ( X )

Có thể chứng minh được rằng: Nếu Y = f(X) là hàm khả vi, đơn

đ i ệ u tăng hoặc đơn đ i ệ u g i ả m , có h à m ngược là X = *F(y) thì hàm mật độ x á c suất (p(y) của đ ạ i lượng ngẫu nhiên Y được x á c định bằng b i ể u thức:

9(y) = f [vĩ ' ( y ) ] | T ' ( y ) |

2- Qui luật phân phối xác suất của hàm hai đại lượng ngẫu

n h i ê n

Trang 4

thường 5: Vỗàm cùa các đại lưựnạ ngẫu nhiên oà luật iế lán

N ế u ứng v ớ i m ỗ i cặp giá trị c ó th ể nhậ n của hai đ ạ i lượng ngẫ u nhiêri X và z có một giá trị có thể nhận của đ ạ i lượng ngẫu n h i ê n Y thì Y được g ọ i là h à m của 2 đ ạ i lượng ngẫu nhiên X và z

Y = q>(X, Z) Nếu biết được qui luật phân phối xác suất của X và z, ta có

t h ể t ì m đ ư ợ c q u i l u ậ t p h â n p h ố i x á c suất của Y = (p(X, Z)

Để tìm các giá trị mà Y có thể nhận và tính các xác suất tương ứng

của Y n g ư ờ i ta thường t i ế n h à n h lập bảng, Đ ể biết c á c h lập bảng n à y

la x é t m ộ t thí dụ sau đ â y :

Thí dạ: Có 2 máy cùng sản suất một loại sản phẩm, tỷ lệ sản phẩm

l o ạ i A của m á y thứ nhất là 0,8; của m á y thứ hai là 0, 7; L ấ y 3 sản

p h ẩ m do m á y thứ nhất sản xuất và Ì sản p h ẩ m do m á y thứ hai sản xuất đ ể k i ể m tra T i m quy luật p h â n phối x á c suất của số sản p h ẩ m

l o ạ i A có trong 4 sản phẩm l ấ y ra từ hai m á y đ ể k i ể m tra ?

Giải: Gọi X là số sản phẩm loại A có trong 3 sản phẩm lấy ra từ máy

thứ nhất đ ể k i ể m tra D ễ thấy rằng X ~ B(3; 0,8) N ê n ta d ễ d à n g tìm được bảng p h â n phối x á c suất của X như sau:

G ọ i z là số sản phẩm l o ạ i A có trong Ì sản p h ẩ m l ấ y ra từ m á y t h ứ hai đ ể k i ể m tra z ~ B ( l ; 0,7) Bảng p h â n p h ố i x á c suất của z n h ư sau:

G ọ i Y là số sán phẩm l o ạ i A có ư ơ n g 4 sản phẩm l ấ y ra từ hai m á y

đ ể k i ể m ư a thì:

Trang 5

íịiáo trình, lý thuyết xòe, mất oà thống, kẻ toán ì

tức Y là h à m của hai đ ạ i lượng ngẫu n h i ê n X và z

Để tìm qui luật phân phối xác suất của Y, trước hết ta tìm các giá

Cột z ghi cạc giá trị mà z có thể nhận Trong thí dụ này, z'chỉ có

thể nhận một trong hai giá trị: 0 hoặc 1;

Các ô còn lại ta ghi các giá trị mà Y có thể nhận Để xác định các

giá trị n à y ta c ă n cứ v à o b i ể u thức của h à m b i ể u đ i ể n m ố i quan hệ giữa Y v ớ i X và z , trong thí dụ ta đ a n g x é t b i ể u thức h à m n à y có dạng: Y = X + z , đồng thời c ă n cứ v à o giá trị của X và z ở cột và dòng tương ứng

Chẳng hạn: Y nhận giá trị 0 khi X = 0 đồng thời z = 0;

Y = l khi x = 0 đồng thời z = Ì hoặc X = Ì đồng thời z = 0

(tương ứng v ớ i hai ừường hợp này trên bảng có hai ô ghi số 1)

Trang 6

(Phương 5: 7Càm eủa eáe đại /ưựttạ ngẫu nhiên g ã luật tố lởn

( Y = 3) = [(X = 2)(Z = 1)] u Ĩ ( X = 3)(Z = 0)]

( Y = 4 ) = [ ( X = 3 ) ( Z = 1 ) ]

Á p dụn g côn g thức cộng x á c suất và côn g thức nhân xá c suất, ta tính

c á c x á c suất tương ứng v ớ i các giá trị của Y như sau:

P(Y = 0) = P(X = 0).P(Z = 0) = 0,08 0,3 = 0,0024

• P(Y = 1) = P(X = 0).P(Z = 1) + P(X = 1).P(Z = 0)

= 0,008 0,7 + 0,096 0,3 = 0,0344 P(Y = 2) = P(X = 2).P(Z = 0) + P(X = 1).P(Z = 1)

= 0,384 0,3 + 0,096 0,7 = 0,1824 P(Y = 3) = P(X = 2).P(Z = 1) + P(X = 3).P(Z = 0)

= 0,384 0,7 + 0,512 0,3 = 0,4224 P(Y = 4) = P(X = 3).P(Z = 1) = 0,512 0,7 = 0,3584

V ậ y ta có qui luật p h â n p h ố i x á c suất của Y như sau:

• Trường hợp X, z là các đại lượng ngẫu nhiên liên tục

C ó t h ể chứng (ninh được rằng: h à m mật độ x á c suất (p(y) của Y (Y = X + Z) được x á c định theo công thức:

y ' y

cp(y)= J f1( x ) fỉ( y - x ) d x Hoặc: Ịf, (y - z ) f2 (z)dz

f ị và Ỉ2 là các h à m mật độ xác suất của X và z tương ứng

[với đ i ề u k i ệ n là khi một trong 2 h à m n à y x á c định trong khoảng (-00, +oo) bằng một b i ể u thức]

Trang 7

íịiá& trịnh dị t/uiụết xác xuất MÌ thống, kê toán

3- C á c t h a m s ố đ ặ c t r ư n g c ủ a h à m c á c đ ạ i l ư ợ n g n g ẫ u n h i ê n Giả sử đ ạ i lượng ngẫu nhiên r ờ i rạc X có p h â n phối x á c suất như sau:

Ta cần tìm kỳ vọng toán và phương sai của đ ạ i lượng ngẫu nhiên Y [Y = (p(X)] C á c tham số đặc trưng này được xác định bằng c á c công thức sau:

E(Y) = E[(p(X)]=ịọ(xi)pi

Var(Y) = Var[<p(X)] = £<p2(x,)Pl -[E(Y)]2

i = l

* Nêu X là đại lượng ngẫu nhiên liên tục với hàm mật độ xác suất là

f(x) thì kỳ vọng toán và phương sai của đ ạ i lượng ngẫu nhiên

Y = (p(X) được xác định bằng công thức:

•KO E(Y) = E [ Ọ ( X ) ] = J(p(x)f(x)dx

-co +00

V a r ( Y ) = Var[(p(X)] = J(p2 ( x ) f ( x ) d x - [ E ( Y ) ]2

-00 li- Luật số lớn

Như ta đã thấy ở các phần trước, không thể dự đoán trước một cách

chắc chắn đ ạ i lượng ngẫu nhiên sẽ nhận giá trị n à o trong c á c giá trị

có thể nhận của nó khi thực h i ệ n p h é p thử, vì điều đó phụ thuộc v à o rất nhiều nguyên nhân m à ta không thể tính hết được Nhưng n ế u ta

Trang 8

thường 5: 7õàtii của các đại lường Iiạẫii nhiều oà luật tá' lân

xét đồng thời một số lớn các đại lượng ngẫu nhiên thì tính "ngẫu

n h i ê n " của h i ệ n tượng mất đi và qui luật tất nhiên của nó được thể

h i ệ n

Đối với thực tiễn thì điều quan trọng là phải xác định các điều

k i ệ n trong đó tác động đồng thời của nhiều nguyên nhàn niiẫn nhiên

sẽ dẫ n đ ế n k ế t quả gầ n như khôn g phụ thuộc gì và o cá c y ế u tô ngẫu

n h i ê n nữa và khi đó ta có thể dự đoán được tiến ưình của h i ệ n tượng C á c đ i ề u k i ệ n n à y được chỉ ra trong các định lý có tên là luật

số lớn Định lý Chebyshev là định lý tổng quát nhấí của luật số lớn,

c ò n định lý Bernoulli là định lý đơn giằn nhất

Để chứng minh' các định lý này ta sử dụng bất đẳng thức

Chebyshev

Ì- Bất đẳng thức Chebyshev

C ó t h ể chứng minh được rằng: N ế u X là đ ạ i lượng ngẫu nhiên có

kỳ vọng toán và phương sai hữu hạn thì v ớ i m ọ i số dương s bé tùy ý,

Trang 9

íịiấ trình lự thuyết xòe Mất OĂ tkếttạ kẻ toân

Thí dụ: Thu nhập trung bình của c â c hộ gia đình ở một vùng lă 900

U S D / n ă m vă độ lệch chuẩn lă 120 USD H ê y x â c định khoảng thu nhập xung quanh giâ trị trung bình của ít nhất 95% hộ gia đình ô vùng đó

Giải: Gọi X lă thu nhập của một hô gia đình ở vùng năy thì X lă đại

lượng ngẫu nhiín với qui luật p h đ n phối chưa biết, nhưng E(X) = 900

p(jx-E(X)|.<e)>l-^^ y

6 ì = > P ( ị x - 9 0 0 | < e ) > l - ^ y - = 0,95

£

Từ đó ta tìm được s = 536,656

Vậy ít nhất 95% hộ gia đình ở vùng đó có thu nhập hăng năm nằm

trong khoảng (900 - 536,656; 90Ọ + 536,656) tức thu nhập của câc

hộ gia đình trong khoảng (363,344;• 1436,656) U S D / n ă m

2- Định lý Chebyshev

Nếu câc đại lượng ngẫu nhiín X[, X2 , xn độc lập từng đôi,

có kỳ vọng toân hữu hạn vă câc phương sai đ ề u bị chặn trín b ở i hằng số c [Var(Xị) < c ; V i = thì Ve > 0 b ĩ tùy ý cho trước ta luôn có:

Trang 10

@hưư4iạ 5: Jôàm của oán đại tường, ngẫu nhiều oà luật- úi lứt Ị

Áp dụng bất đẳng thức Chebyshev cho đại lượng ngẫu nhiên X ta

n ế u ta thay m ỗ i Var(Xi ) ( i = 1,«) bằng c thì bấ t đ ẳ n g thức sẽ chỉ mạnh t h ê m

Đó là điều cầaphải chứng minh

• Trường hợp riêng của định lý Chebyshev

N ế u X i , X2, , xn là c á c đ ạ i lượng ngẫu nhiê n độc lậ p từng đôi ,

có c ù n ể kỳ vọng toán, [E(Xị) = a ( V i = Ị , H ) ] thì Ve > 0 b é tùy ý

ta-luôn c ó :

Trang 11

L i m P n—>00

ì JQ_

• Bản chất của định lý Chebyshev

I •!.!•; r i u In vhcv Jã chứng tỏ sự ổ n định của ư u n g bình số học của một số lớn các đ ạ i lượng ngẫu nhiên xung quanh trung bình số học các kỳ vọng toán của các đ ạ i lượng ngẫu nhiên ấy

Như vậy, mặc dù từng đ ạ i lượng ngẫu nhiên độc lập có thể nhận giá trị sai khác nhiều so với kỳ vọng toán của chúng, nhưng trung bình sù học của một số lớn c á c đ ạ i lượng ngẫu nhiên l ạ i nhận giá trị gần bằng trung bình số học của các kỳ vọng toán của chúng v ớ i xác suất rất lớn' Đ i ề u đó cho p h é p dự đ o á n giá trị giá trị trung bình số học của đ ạ i lượng ngẫu nhiên

Trong thực tế, định lý Chebyshev được ứng dụng rộng rãi trong

n h i ề u lĩnh vực Chẳng hạn, trường hợp r i ê n g của n ó là cơ sở cho phương p h á p đo lường trong vật lý N h ư chúng ta đ ề u b i ế t , đ ể xác định một đ ạ i lượng n à o đ ó , người ta thường t i ế n h à n h đo nhiều lần

và l ấ y ừung bình số học của c á c k ế t quả đo ấy l à m giá trị thực của

đ ạ i lượng cần đo

Thật vậy: ta có thể coi kết quả của n lần đo là các đại lượng ngẫu

nhiên Xị, X2, , Xn C á c đ ạ i lương n à y độc l ậ p từng đôi, có cùng

kỳ vọng toán (kỳ vọng toán của c ác đ ạ i lượng ngẫu nhiên n à y chính

là giá trị thực của đ ạ i lượng cần đo) và phương sai của chúng đ ề u bị chặn trên bởi chính độ chính x á c của thiết bị dùng đ ể đo Vì t h ế theo trường hợp riên g của định lý Chebyshev thì trung bìn h số học của các k ế t quả đo sẽ sai lệeh rất ít so với giá trị thực của đ ạ i lượng cần đo và điều đó xảy ra v ớ i x á c suất gần bằng 1

Định lý Chebyshev còn là cơ sở cho một phương pháp được áp

dụng rộng rãi trong thống kê là phương p h á p mẫu mà thực chất là

118

Trang 12

(?ilười UI 5: JCtưn cua eáe đai Ixíđ4iạ ngẫu nhiên oà Lưu lơ lởn

dựa v à o một mẫu khá nhỏ ta có thể k ế t luận về toàn bộ tập hợp các

đ ố i tượng cần nghiên cứu

Chẳng hạn để đánh giá năng suất cây trồng ở một vùng nào đó

người ta k h ô n g cần phải điều tra toàn bộ diện tích trồng l o ạ i cây này

mà chỉ cần dựa v à o k ế t quả thu hoa ch cửa một mẫu mà v ẫ n đưa ra được các k ế t luận đủ chính x á c v ề năng suất cây trồng của vùng đó 3- Định lý Bernoulỉi

Nếu Fn là tần suất xuất hiện biến cố A trong n phép thử độc lập và

p là x á c suất xuất h i ệ n b i ế n c ố trong m ỗ i p h é p thử đó thì v ớ i m ọ i e dương b é tùy ý, ta luôn luôn có:

Lim p(| Fn - p I < E) = Ì

Chứng minh: Gọi X là số lần xuất hiện biến cô A trong n phép thử

độc lập X i (ỉ = ỉ,n) là số l ầ n xuất hiện b i ế n cố A trong p h é p thử thứ

I I >0 thú > M ne X j có p h â n phối xác suất như sau:

iu \ n

) i=i E(Xi) = o.q + l.p = p => E(X) = E

Var(Xị) = E( X?) - [E(Xi)]2 = p - p2 = p(l - p) = p.q

í n ^ "

=> Var(X) = Var X x = L V a ( X ) = 'nP(l

Trang 13

íịiáữ trình tụ thuyết xòe, mất oà tháng, kê tơón

X é t đ ạ i lượng ngẫu nhiên Fn = — Ta thấy Fn chính là tần suất

n xuất h i ệ n b i ế n c ố A ương n p h é p thử độc l ậ p '

Trang 14

&uứfrtạ ó: Mẫu ngẫu nhiên

P h ầ n 2

T H Ô N G K Ê T O Á N

Thống kê toán là bộ môn toán học nghiên cứu qui luật của các hiện

tượng ngẫu n h i ê n có tính chất số lớn trên cơ sở thu thập và xử lý c á c

số l i ệ u thống k ê - các k ế t quả quan sát Như vậy nội dung chủ y ế u của thống kê toán là x â y dựng các phương p h á p thu thập và xử lý

c á c số1 l i ệ u thống k ê nhằm rút ra các k ế t luận khoa học C á c phương

p h á p thống k ê toán là công cụ đ ể giải quyết nhiều vấn đề khoa học

và thực t i ễ n nảy sinh trong c á c lĩnh vực khác nhau của tự nhiên và kinh t ế xã h ộ i

số dấu hiệu định tính hay định lượng n à o đó C á c dấu hiệu n à y thể

h i ệ n trên nhiều phần tử k h á c nhau T ậ p hợp tất cả các phần tử chứa đựng thông tin về các dấu hiệu ta cần nghiên cứu được g ọ i là tập

hợp chính hay tổng thể ~ >

Chẳng hạn, một doanh nghiệp cần nghiên cứu tập hợp các khách

Trang 15

QiáA trình bị ưuujẤ't xác uiất nả thấtig kê toán

hàng của mình theo các dấu h i ệ u như: mức độ hài lòng của khách

h à n g v ề sản phẩm hay dịch vụ của doanh nghiệp (dấu h i ệ u định tính) hoặc nghiên cứu theo dấu hiệu định lượng là nhu cầu của khách hàng về số lượng sản phẩm của doanh nghiệp Trong trường hợp này thì tạp hợp gồm tất cả các k h á c h h à n g của doanh nghiệp là tổng thể Đối với tổng thể, ta sử dụng một số khái niệm và ký hiệu sau đây:

• N: Số phần tử của tổng thể và được gọi là kích thước của tổng thề

Kích thước của tổng thể phụ thuộc v à o vấ n đ ề và phạ m v i nghiên cứu

• X* : Dấu hiệu ta cần khảo sát, nghiên cứu (trong kinh tế thường gọi

là chỉ tiêu) Dấu hiệu nghiên cứu có thể là định tính hoặc định lượng Cần nhấn mạnh rằng, khi nói nghiên cứu một tổng thể có nghĩa là ta

n g h i ê n cứu dấu hiệ u X* được th ể h i ệ n trê n cá c phầ n tử của tổng thể

• Xi (i = 1,2, k) là các giá trị của dấu hiệu X* đo được trên các

phần tử của tổng thể Xi là những thông tin cần thiết đ ể ta nghiên cứu

v ề dấu hiệ u x \ còn cá c phần tử của tổng th ể là những đ ố i tượng mang thông tin

Trang 16

&UÌƯIUỊ ó: MÂU IUỊỖU nhiều

Ta cũng có.thể mô tả tổng thể bằng bảng phân phối tần suất Dạng

tổng q u á t của bảng n à y như sau:

Về hình thức, bảng phân phối tần suất của tổng thể tương tự như

bảng p h â n phối xác suất của đ ạ i lượng ngẫu nhiên rời rạc N ó phản

á n h cơ cấu của tổng thể

Trang 17

cịiáo trình Lị thuyết xác mất oà tlÚHtọ kê tữáiL

2- Phương sai của tổng thể

Phương sai của tổng thể (ký hiệu là ơ2) được xác định theo công

gọi tắt là tỷ lệ tổng thể), p cũng chính là xác suất lấy được phần tử

có tính chất A khi lấy ngẫu nhiên một phần tử từ tổng thể

Thí dụ: Ngành cao su có 500.000 công nhân Để nghiên cứu mức

sống của họ, người tá khảo'sát chỉ tiêu X* :" Thu nhập thực tế của

công nhân ngành cao su" và giả sử thu được các số l i ệ u cho ở bảng

sau:

Trang 18

ót lứtfi tạ ó: Mẫu ngẫu nhiên

• Độ lệch chuẩn của thu nhập (độ lệch chuẩn của tổng thể):

ơ = V23100 = 151,987

• T ỷ l ệ công nhân có thu nhập cao của n g à n h cao su (tỷ l ệ tổng thể):

N ế u ta coi những côn g n h â n có mức thu nhập từ 1000 (ngà n đồng) -trở l ê n là những người có thu nhập cao thì tỷ l ệ công n h â n có thu

Trang 19

4ỳiá& bình bị tluiụết xác tuất oà tliếnạ kê tơÓMi

30000 + 25000 _

n = •— = 0,11 hay 1 1 %

li- Khái niệm mẫu

Đ ể nghiên cứu tổng thể theo m ộ t hay một số dấu hiệu n à o đó ta cần nghiên cứu toàn bộ các phần tử của tổng thể, tức là thống kê toàn bộ táp hợp và phân tích từng phần tử của nó theo dấu hiệu nghiên cứu Chẳng hạn đ ể nghiên cứu d â n số của một nước theo các dấu hiệu như: giới tính, độ tuổi, nghề nghiệp, trình độ học v ấ n , nơi

cư trú, ta phải t i ế n hành tổng điều tra dân sô và p h â n tích từng người theo các dấu hiệu trên sau đó tổng hợp cho toàn bộ d â n số của

cả nước Tuy nhiên trong thực t ế cách l à m này gặp phải những khó khăn sau đây:

• N ế u kích thước của tổng thể quá lớn thì việc nghiên cứu toàn bộ phải chịu chi phí lớn về t i ề n của, thời gian, nhân lực, phương t i ệ n , dễ xảy ra sai sót trong quá trình thu thập thông tin ban đầu, hạn c h ế

độ chính xác của k ế t quả p h â n tích

• Nếu các phần tử của tập hợp lại bị phá hủy trong quá trình điều

tra thì phương phá p nghiê n cứu toà n bộ trở thàn h vô nghĩa Chẳng hạn: đ ể k i ể m tra chất lượng của các hộp sữa do một h ã n g sản xuất thì ta không thể mở tất cả các hộp sữa do hãng này sản xuất đ ể k i ể m tra được

• Có những trường hợp ta không thể x á c định được )àn bộ các phần tử của tổng thể Trường hợp này thường xảy ra trong việc điều tra c á c vấn đ ề thuộc về lĩnh vực xã h ộ i học Chẳng hạn: đ i ề u tra những người nghiện ma túy, những người n h i ễ m H I V , những trẻ vị thành niên phạm pháp Trong các trường hợp đó ta cũng không thể t i ế n hành điều tra toàn bộ được vì cùn một bộ phận khá lớn chưa phát h i ệ n được nên không thể xác định được toàn bộ số phần tử của tổng thể

Trang 20

CHuùttiq ó: Mẫu ngẫu nhiên

Vì vậy, từ t h ế kỷ 17, phương p h á p nghiên cứu mẫu đã ra đ ờ i , ngày càng phát triển và được sử dụng rộng rãi trong nhiều lĩnh vực T ư tưởng cơ bản của phương p h á p mẫu như'sau:

T ừ tổng-thể ta l ấ y ra n phần tử và đo lường giá trị của dấu hiệu X* trên chúng, n phần tử n à y lập n ê n một mẫu s ố phần tử của mẫu (n)

được g ọ i là kích thước mẫu thông thường kích thước của mẫu nhỏ

hơn nhiều so với kích thước của tổng thể Vì vậy ta có khả năng thực

t ế đ ể thu thập, x ử lý và khai thá c thôn g tin mẫ u mộ t các h nhanh chóng, toàn d i ệ n hơn Sử dụng các phương p h á p toán học (đặc b i ệ t

là lý thuyết xác suất), người ta t i ế n h à n h suy rộng k ế t quả nghiên cứu trên m ẫ u cho toàn bộ tổng t h ể , đó là mục đích cuối cùng của phương p h á p mẫu

Để đạt được mục đích trên thì mẫu phải đại diện cho tổng thể

M u ố n vậy, khi lấy mẫu phải đ ả m bảo tính ngẫu nhiên, không chọn

m ẫ u theo một tiêu chuẩn chủ quan đã định trước

Trong thực t ế có nhiều cách lấy mẫu:

Ì- Lấy mẫu ngẫu nhiên:!

2- Chọn mẫu cơ giới:

C á c phần tử của tổng thể được đưa v à o mẫu cách nhau một khoảng

x á c định Chẳng hạn, trên một dây chuyền sản xuất, cứ sau một khoảng thời gian t n à o đó l ạ i lấy ra một sản phẩm đ ể đưa v à o mẫu

Trang 21

4ịỉá& trình lự thuyết xác Mất oà tìt éhiạ UẾ IOÚML

Ta chia tổng thể thành một số lớp theo một chỉ tiêu phụ nào đó,

sao cho các phần tử trong m ỗ i lớp đồng đ ề u hơn Sau đó mới lấy ngẫu nhiên từ m ỗ i lớp một số phần tử đ ể đưa v à o mẫu C á c h chọn mẫu này thường được á p dụng khi phạm vi nghiên cứu rộng, số lượng phần tử của tổng thể quá lớn

Việc lấy mẫu được tiến hành chủ yếu theo 2 phương thức:

a- Lấy mẫu có hoàn lại (có lặp)

Phương p h á p này được á p dụng khi tập hợp chính có ít phần tử Theo phương thức này, m ỗ i lần l ấ y vào mẫu chỉ một pịiần tử Sau khi đã được nghiên cứu ta trả l ạ i phần tử đỏ v à o tập hợp chính trước khi lấy phần tử tiếp theo

Như vậy, v ớ i cách l ấ y n à y , một phần tử có thể xuất h i ệ n nhiều lần trong mẫu

b- Lấy mẫu không hoàn lại (không lặp)

Theo cách l ấ y này, phần tử được l ấ y ra nghiên cứu sẽ bị l o ạ i hẳn

ra khỏi tạp hợp chính

Trong thực tế, nếu kích thước của tổng thể khá lổn thì phương thức

lây mẫu có hoàn l ạ i và k h ô n g hoàn l ạ i cho ta k ế t quả sai lệch nhau không đáng k ể Đặc biệt khi kích thước của tổng thể là vô hạn CÒIL-kích thước của mẫu là hữu hạn thì không có sự k h á c b i ệ t giữa hai phương thức lấy mẫu Lúc đó có thể chọn mẫu theo phương thức không hoàn l ạ i mà vẫn xem như mẫu được chọn theo phương thức có hoàn l ạ i

Việc lựa chọn phương pháp lấy mẫu phụ thuộc vào mục đích, đối

tuỢng.nghiên cứu và điều k i ệ n t i ế n hành Trong giáo trình n à y , để thuận tiện cho việc mô hình hoa ta giả thiết mẫu được thành lập theo phương thức có lặp

Trang 22

&uỉđti(Ị Ó: Mẫu ngầu /thiền

H I - M ô h ì n h x á c s u ấ t c ủ a t ổ n g t h ể v à m ẫ u

Ta có thể dùng công cụ toán học để mô tả và khái quát các khái

n i ệ m : tổng t h ể , dấu h i ệ u n g h i ê n cứu và m ẫ u đã nêu ở phần trên Tức

là x â y dựng m ô hình toán học của chúng

Ì- Đại lượng ngẫu nhiên góc và qui luật phân phối gốc

Từ bảng 6.1 (hoặc 6.2) ta thấy có thể mô hình hoa dấu hiệu X*

bằng m ộ t đ ạ i lượng ngẫu nhiên

T h ậ t vậy, n ế u lấy ngẫu n h i ê n từ tổng thể ra một phần tử và g ọ i X

là giá trị của dấu hiệu X* đo được ư ê n phần tử lấy ra đó thì X là đ ạ i lượng ngẫu nhiên có p h â n p h ố i x á c suất như sau

Bảng 6.7

N h ư v ậ y dấu h i ệ u mà ta nghiên cứu (X*) được mô hình hóa bởi

đ ạ i lượng ngẫu nhiên X Qui luật phân phối x á c suất của X được g ọ i

, , ì

là qui luật p h â n phôi góc

2- Các tham số của đại lượng ngẫu nhiên gốc

a- Kỳ vọng toán: Với qui luật phàn phối xác suất (6.7) của X

Theo định nghĩa, kỳ vọng toán của X sẽ là:

E(X) = £xiPi

i = l

So sánh với (6.3) ta thấy trung bình của tổng thể chính là kỳ

vọng toán của đại lượng ngẫu nhiên gốc X: ịx = E(X)

b- Phương sai: Theo định nghĩa của phương sai ta có:

Trang 23

(ịiáữ trình bị thuyết xát Mất ó điếng, kê tơáit

V a r ( X ) = Ề [ X i - E ( X ) ] 2 P ;

i = l Nhưng E(X) = li, Do đ ĩ :

V a r ( X ) = Ề ( x , - | i ) 2 p?

i=I

So s á n h vớ i (6.4) ta thấy phương sai của tổng thể chính là

2

phương sai của đại lượng ngẫu nhiên gốc X: ơ = V a r ( X )

3- Mầu ngẫu nhiên

Giả sử lấy ra n phần tử từ tổng t h ể , tạo n ê n một m ẫ u cĩ kích thước

n theo phương-pháp cĩ h o à n l ạ i G ọ i X j là giá trị của dấu h i ệ u X đo được trên phần tử thứ i ( i = Ì, 2, , n) Vì các phần tử được lấy ra theo phương thức cĩ hồrt l ạ i n ê n X i , %2, , x „ là các đ ạ i lượng ngẫu nhiêiTđộc lập, cĩ qui luật p h â n phối xác suất giống v ớ i qui luật p h â n phối xác suất của X

V ậ y n phần tử thuộc mẫu, nếu gạt bỏ c á c hình thức cụ t h ể , được

mơ tả bằng n đ ạ i lượng ngẫu nhiên: X i , X2, , xn Do đĩ ta cĩ thể khái quát đ ể định nghĩa mẫu ngẫu nhiên như sau:

Cho đại lượng ngẫu nhiên X vơi qui luật phân phối xác suất nào

đĩ Một mẫu ngẫu nhiên kích thước n được thành lập từ đại lượng ngẫu nhiên X là n đại lượng ngẫu nhiên độc lập, cĩ cùng phân phối xác suất với đại lượng ngẫu nhiên X

Ký h i ệ u mẫu ngẫu nhiên kích thước n được xây dựng từ đ ạ i lượng ngẫu nhiên X là: Wx = ( X i , X2, , xn)

Thực hiện một p h é p thử đơ'i v ớ i m ẫ u ngẫu nhiên Wx, tức là thực

h i ệ n một p h é p thử đ ố i v ớ i m ỗ i thành phần (Xi) của mẫu (trong thực

t ế thường là lấ y ra n phần tử cụ th ể từ tổng thể) G i ả sử X i nhậ n giá trị Xi ( i = Ì, 2, , n) C á c giá trị X i , x2, , xn tạo thành một giá

Trang 24

()li ương ó: Jtlẫu ngẫu nhiên

trị của m ẫ u ngẫu nhiên, hay còn được g ọ i là một m ẫ u cụ t h ể Ký

ngẫu nhiên (có hoàn l ạ i ) 5 sinh viên của lớp Giả sử đ i ể m thi của

sinh viên thứ nhất là ỉ ; của s/v thứ hai là 9 ; của h/s thứ ba là 5 ; của

h/s thứ tư là 7 và của h/s thứ n ă m là 4, thì ta có một mẫu cụ t h ể là:

wx = ( 5 , 9 , 5 , 7 , 4 ) Thực hiện một phép thử khác đối với wx (tức chon 5 s/v khác của

Trang 25

cịiáo trình lự thuyết xác mất OÀ tỉtốttạ kê toái!

w x = (4, 7, 9, 9, 5) Nếu kích thước mẫu lớn, việc trình bầy một cách cụ thể kết quả

quan sát như trên là không thuận tiện Trong trường hợp n à y ta sử dụng các khái n i ệ m : giá trị cua dấu h i ệ u X (Xi); tần suất của Xi (Pi)

đã nêu ở phần trên đ ể trình bầy mẫu cụ I h ể dưới dạng bảng

Đ ể phân biệt với các ký hiệu của tổng thể Đ ố i v ớ i m ẫ u ta dùng các ký hiệu sau đây:

ni: Tần số của Xj; fi = — : Tần suất của Xi

n

Thí dụ 2: T ừ bảng (6.6) ta thấy thu nhập của công nhân n g à n h cao su

có thể mô hĩnh hoa bởi đ ạ i lượng ngẫu n h i ê n X với bảng p h â n phối xác suât như sau:

Gọi Xi là "Thu nhập của công nhân thứ i được đưa vào mẫu"

x5()(), độc lập, có cùng p h â n phối xác suất v ớ i X Tức ta có m ẫ u ngẫu nhiên: w x = ( X | , x2 X500) được x â y dựng từ đ ạ i lượng ngẫu nhiên gốc X

Thực hiện một phép thử đối với mẫu wx, tức điều ưa thu nhập

của 500 công nhân cụ thể Giả sử k ế t quả đ i ề u tra cho ở bảng sau:

Trang 26

Qhươnạ ó: Mầu tiạẫu nhiên

Nếu điều tra thu nhập của 500 cồng nhân khác ta lại có một mẫu

cụ t h ể k h á c (một giá trị khác) của mẫu ngẫu nhiên W x

Như vậy, mẫu ngẫu nhiên có thể phản ánh được kết quả điều tra

thực nghiệm B ở i vì các k ế t quả này được coi là một giá trị của nó Tức là khái quát được thực nghiệm Quan hệ giữa mẫu ngẫu nhiên

và m ẫ u cụ thể (hay một giá trị của nó) tươne tự như quan hệ giữa đ ạ i lượng ngẫu nhiên và một giá trị có thể nhận của nó

4- Các phương pháp mô tả số liệu mẫu

a- Mô tả mẫu bằng bảng phân phối tần số thực nghiệm:

Bảng 6 ì 3

Trang 27

ựịiáơ trình lý thuụểt xòe, mạt oà thống, kê toán

trong đó: f j = — ; Đ ố i v ớ i bảng trên, ta luôn có: 2 / 1 = 1

n i=i

p

c- Đ ể mô tả số l i ệ u mẫu một cách rõ r à n g1 Hơn cho p h é p ta đ ư a * a

những nhận x é t sơ bộ ban đầu v ề tổng thể người ta còn x â y dựng các

l o ạ i đồ thị k h á c nhau của p h â n phối thực nghiệm

o Đa giác tần số: là một đường gãy khúc nối các điểm (Xi, ni);

© Biểu đố tần số: Khi dấu hiệu nghiên cứu có phân phối liên tục

thì nên xây dựng biểu đồ tần số hoặc biểu đồ tần suất Đ ể làm điều

Trang 28

&iươtiạ ó: Jtlmi ngẫu nhiên

đó khoảng chứa tất cả các giá trị quan sát được của m ẫ u được chia

thành một số khoảng có chiều dài bằng h và ứng với mỗi khoảng ta

tính số quan sát của mẫu thuộc khoảng này, tức là tính tần số (ni)

tương ứng với từng khoảng Biểu đồ tần số là biểu đồ dạng bậc

thang tạo nên bởi nhiều hình chữ nhật có đáy bằng h và chiều cao

bằng — Lúc đó diên tích của hình chữ nhát thứ i bằng h — = ni

h h Vậy diện tích tất cả các hình chữ nhật sẽ bằng kích thước mẫu n

"Ểơng tự biểu đồ tần suất là biểu đồ dạng bậc thang tạo nên bởi

5 , f

nhiêu hình chữ nhát có đáy bằng h và chiều cao bằng — L ú c đó

h diện tích của hình chư nhật thứ i bằng h — = fj và diện tích tất cả các

h hình chữ nhật sẽ bằng 1

Thí dụ: Vẽ biểu đồ tần số của phân phối thực nghiệm cho ở bảng

Trang 29

Lịláo trình ỉ lị thuyết xác mối oà Miếng, kê toán

© Biểu đồ hình bánh xe: Đ ố i với các dấu hiệu định tính thì người ta

thường m ô tả số liệu mẫu bằng b i ể u đổ hình b á n h xe Đ ó là một hình tròn được chia thành các phần tương ứng v ớ i tỷ l ệ của các bộ phận trong mẫu

Thí dụ: Điều tra ngẫu nhiên 100 khách hàng của một doanh nghiệp

thì thấy các khách hàng được p h â n theo tỷ l ệ sau v ề tầng lớp xã hội

Trang 30

& tươi KỊ ó: Mẫn ít í/tí li ít hiền

N ô n g

d â n 40%

T r i X

t h ứ c / \

\<ò°ỉ/ T h ư ơ n g / n h â n 15%

C ô n g nhân 35%

Đ ồ ứiị của p h â n p h ố i m ẫ u có t h ể v ẽ d ễ dàng n ế u ta sử dùng c á c phần m ề m thống k ê n h ư E x c e l , SPSS, S t a t a ,

IV- Các tham số đặc trưng của mẫu

K h i nghiên cứu m ẫ u , người ta thường quan t â m đ ế n c á c tham số đặc trưng sau đ â y :

Ì - T r u n g b ì n h m ẫ u

a- Định nghĩa: Cho m ẫ u ngẫu nhiên kích thước n, được xây dựng

từ đ ạ i lượng ngẫu nhiên X : W x = ( X | , x2 ) - , xn)

Trung bình mẫu ngẫu nhiên (ký hiệu là X) được định nghĩa:

i n

x n?xi

n j_i

(6.10)

Do X ị , X2, , x „ là c á c đ ạ i lượng ngẫu nhiên , theo định nghĩa

t r ê n thì X là h à m của n đ ạ i lượng ngẫu nhiê n X i , X2, , xn n ê n

X ũ m g là m ộ t đ ạ i lượng ngẫu nhiên

Trang 31

(ịiéuy trinh, lý thuyết xán suất oà thống, kè lơảỉi

E ( X ) = M- và V a r ( X ) = ơ / n Thật vậy, theo tính chất của kỳ vọng toán, ta có :

E(X) = EÍ Ì V Xj ì = 1Ỳ E(X,) = i nụ = n

Như vậy, bất kể ^ui luật phân phối xác suất của đại lượng ngẫu

nhiên gốc như t h ế n ã o , thống kê X cũng có kỳ vọng toán bằng kỳ

Trang 32

ẽhưtùtạ ó: jỊỊẫu Iiạẫu nhiên

vọng_của đ ạ i lượng ngẫu' nhiên gốc [E(X) = E ( X ) J Còn phương sai của X nhỏ hơn phương sai của đ ạ i lượng ngẫu nhiên gốc n lần Nghĩa là c á c giá trị có th ể có của X ổ n định quanh kỳ vọng hơn cá c giá trị có thể có của X

Nếu lấy căn bậc hai của Var( X) ta được độ lệch chuẩn ơ( X ) Độ

lệch chuẩn này của X được dùng đ ể phẩn ánh sai số ước lượng do

đó người ta thường g ọ i là sai số chuẩn (ký hiệu là se( X ) V ậ y :

se(X) = o(X) = Vvar(X) = -^L

VII

ở trên ta luôn giả thiết rằng mẫu được rút ra từ tổng thể theo

phương thức có h o à n l ạ i N ế u kích thước tổng thể là vô hạn hoặc kích thước tổng thể hữu hạn nhưng n < 0,1N thì có thể lấy mẫu không h o à n l ạ i mà không ảnh hưởng đ ế n k ế t quả Trường hợp

n > 0,1N thì đ ố i v ớ i các công thức trên phải sử dụng hệ số hiệu chỉnh

c- Qui luật phân phối của X

Qui luật phân phối xác suất của trung bình mẫu phụ thuộc và qui luật p h â n phối xác suất của đ ạ i lượng ngẫu nhiên gốc Người ta đã

p h â n phôi theo qui luật chuẩn N ( f i ; ơ In)

Trang 33

Lịiáo trình lý thuyết xác tuất oà tttếnạ Ui toán

2- P h ư ơ n g sai m ẫ u

a- Định nghĩa: Cho mẫu ngẫu nhiên wx = (Xi, x2, , Xn)

Phương sai của nó (ký hiệu là s2) được định nghĩa:

S2=-ỉ-ấ(X,-X)1 (6.17)

n - 1 i=i Trong đó X là trung bình của mẫu ngẫu nhiên

* Chú ý: Theo định nghĩa trên, ta thấy phương sai mẫu ngẫu nhiên là

2

h à m của n đ ạ i lượng ngẫu nhiên X | , X 2 , , Xn n ê n s cũng là một

đ ạ i lượng ngẫu nhiên

Do s là đ ạ i lượng ngầu nhiên n ê n ta có thè inh E(S )

Giả sử: E(X) = ịi; Var(X) = a2

n Tf

Trang 34

Qluítítiạ ó: Mẫn ngẫu nhiên

E ( X Ị ) = l i (Vi) n ê n E(X, - ự) 2 = Var(Xị) = Var(X) = ơ2

E(X) = H nên E[(X-n)2] = Var(X) = ơ2/n

Do đ ó :

2 n E(S2) =

n - 1

.2 N n.ơ -

Trang 35

íịiá& trình Lị thuyết xóa mất oà- thống, kê toán

Đ ộ lệch chuẩn của m ẫ u ngẫu n h i ê n (ký h i ệ u S) là c ă n bậc hai

của phương sai mẫu:

Vì X i ( i = Ì, 2, n) là c á c đ ạ i lượng ngẫu n h i ê n , Fn là h à m của các

đ ạ i lượng ngẫu n h i ê n n ê n Fn cũng là m ộ t đ ạ i lượng ngẫu n h i ê n

* Chú ý: Nhìn vào biểu thức định nghĩa của Fn ta thấy giống với biểu

thức định nghĩa của X Thực chất Fn cũng là trung bình m ẫ u ngẫu

nhiên w x - (Xi., X a , , xn) M ẩ u ngẫu n h i ê n n à y được t h à n h lập

từ đ ạ i lượng ngẫu n h i ê n gốc X ( X là số phần tử có tính chất A có

trong phần tử chọn ngẫu n h i ê n từ tổng t h ể )

Trang 36

@hườitạ ồ: Mẫu ngẫu nhiên

N ế u có m ẫ u cụ thể , ta sẽ tính được giá trị của F„ (ký h i ệ u là f )

nA

f = — (6.22)

n Trong đ ó nA là tổng số phần tử có tính chất A có trong m ẫ u cụ t h ể ; n

Giả sử có mẫu cụ thể w x = ( X i , x2, , xn) , thì trung bình m ẫ u

( x ) và phương sai m ẫ u ( s2 ) là hai giá trị cơ bản nhất đ ố i v ớ i m ẫ u cụ

thể n à y , s có thể suy ra từ s2 ; cồn f thì tính rất đơn giản Do đó phần

2

n à y c h ú n g ta chỉ nêu ra c ô n g thức tính X và s tương ứng v ớ i từng

trường hợp số l i ệ u h i ệ n có như sau

Ì- Trường hợp số liệu của mẫu cho dưới dạng không có

Trang 37

íịiáữ trình lý- thuyết xòe Mất OÀ í/iấnạ kề loàn

Theo côn g thức định nghĩa của s ta c ó :

Ta có:

V ậ y :

(xj - x )2 = ( X ị )2 - 2 xix + ( x )2

ẳ(x,-x)2=ỉ[(x,)2-2x.xi+(x)2] 1=1

Thí dụ 3: Quan sát đ i ể m thi m ô n T o á n cao cấp của 10 sinh viên được

chọn ngẫu nhiên từ một lớp ta thu được các số l i ệ u sau:

10 I r ,

J X = 358; V ậ y : s2 = - [358 - 1 0 ( 5 , 8 )2 ] = 2,4 i=i 9

Trang 38

phường ổjjtưui Iiạẫít nhiên

Thí dụ 4: Có các số liệu về doanh số bán (Y) và chi phí chào hàng

(X) của 12 công ty thương m ạ i tư nhân cho ở bảng dưới đây: H ã y tính trung bình mẫu và độ lệch chuẩn mẫu của X và Y ?

Trang 39

íịiá& trình lý tíuiụết xác utấí oà thốnạ kẻ toán

Giải: Ta l ậ p bảng tính như sau:

Trang 40

ũítư&tiạ ó: Mẫu Iiạẫii nhiên

Ngày đăng: 20/09/2017, 22:57

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm