Định nghĩa: Biến ngẫu nhiên rời rạc X nhận một trong hai giá trị có thể có X = 0; 1 với xác suất tương ứng tính bằng công thức trên gọi là phân phối theo quyluật không – một với tham số
Trang 1CHƯƠNG III:
MỘT SỐ QUY LUẬT PHÂN PHÓI XÁC SUẤT THÔNG DỤNG ( 5 +1 +1)
Giả sử trong bình có N quả cầu trong đó có M cầu trắng và N-M cầu đen Mỗiphép thử là lấy ra ngẫu nhiên 1 quả cầu từ bình Theo những cách lấy khác nhau
sẽ có các quy luật phân phối xác suất khác nhau
III.1.QUY LUẬT KHÔNG - MỘT A(p)
Giả sử lấy ngẫu nhiên 1 quả cầu từ bình Có hai biến cố xảy ra hoặc lấyđược cầu trắng (biến cố A), hoặc không lấy được cầu trắng, tức là lấy được cầuđen ( biến cố A )
Xác suất P(A) = M/N = p; P(A ) = (N-M)/N = 1 – M/N = 1 – p = q Tổng quát giả sử ta tiến hành một phép thử trong đó biến cố A có thể xảy
ra với xác suất bằng p Gọi X là số lần xuất hiện biến cố A trong phép thử đó,thì X là biến ngẫu nhiên rời rạc nhận hai giá trị có thể có là 0 ( không xảy ra biến
cố A) và 1 nếu biến cố A xảy ra Do A và A lầ xung khắc nên xác suất để biếnngẫu nhiên X nhận một trong hai giá trị trên là :
Px = px
.q1-x với q = 1- p; x = 0; 1
1 Định nghĩa: Biến ngẫu nhiên rời rạc X nhận một trong hai giá trị có thể có X
= 0; 1 với xác suất tương ứng tính bằng công thức trên gọi là phân phối theo quyluật không – một với tham số p Ký hiêu là: A(p)
Bảng phân phối xác suất theo quy luật không – một luôn có dạng:
2 Các tham số đặc trưng của A(p):
E(x) = 0.q + 1.p = p E(X2) = 02.q + 12.p = p
Suy ra phương sai V(X) = p – p2 = p(1- p) = p.q
Độ lệch chuẩn; pq
III.2 QUY LUẬT NHỊ THỨC – B(n,p)
Trong ví dụ đã nêu trên, bây giờ ta đổi cách lấy quả cầu: lấy n lần có hoànlại ( lấy ra 1 quả cầu, hoàn lại thùng và lấy lại…n lần như thế ) Vẫn có kết quảchỉ với 2 biến cố A và A P(A) = M/N ; P(A ) = (N-M)/N cho mỗi lần lấy, quátrình này thỏa mãn lược đồ Bernoulli Gọi X là “ số lần xuất hiện biến cố Atrong n phép thử trên thì X là biến ngẫu nhiên rời rạc với các giá trị có thể có X:
= 0, 1, 2,…, n theo công thức Bernoulli ta có Px = x
n
C pxqn-x với x = 0, 1, 2 ,n
Trang 21 Đinh nghĩa: Biến ngẫu nhiên rời rạc X nhận một trong các giá trị có thể có X
= 0, 1, 2,…, n với các xác suất được tính bằng công thức trên, gọi là phân phốitheo quy luật nhị thức với các tham số n, p ký hiệu B(n, p)
Thí dụ 1: Trong một phân xưởng có 5 máy hoạt động độc lập Xác suất để trongmột ngày mỗi máy hỏng đều bằng 0,1 tìm xác suất để:
a Trong một ngày có 2 máy hỏng
b Trong một ngày có không quá 2 máy bị hỏng
Giải: Gọi X là “ số máy hỏng trong một ngày” dễ thấy X có quy luật phân phốinhị thức B(n, p) với n =5; p =0,1
a Xác suất để trong một ngày có 2 máy hỏng chính là xác suất để X = 2
Giải: Trước tiên ta tìm xác suất người đó bán được hàng trong một ngày Gọi X
là số lần bán được hàng trong ngày, theo bài ra X là biến ngẫu nhiên thỏa mãnlược đồ Bernoulli với n = 10 ; p = 0,2
P = P(X ≥ 1) = 1 – P(X=0) = 1 – 0 ( 0 , 2 ) 0 ( 0 , 8 ) 10 0 , 8926
không bán được hàng là hai biến cố xung khắc)
Gọi Y là số ngày người ấy bán được hàng trong năm thì Y tuân theo quy luật nhịthức với n = 300 và p = 0,8926 Vậy số ngày trung bình trong năm người đó bánđược hàng chính là kỳ vọng toán:
E(X) = n.p =300.0,8926 = 267,78 ngày
Trang 3III.3 QUY LUẬT POISSON – P()Giả sử biến ngẫu nhiên X tuân theo quy luật nhị thức B(n,p) song với n quá lớn
và xác suất p quá nhỏ và kỳ vọng toán E(X) = np = là số không đổi khi ấyviệc tính toán theo công thức Bernoulli gặp khó khăn vì vậy người ta sử dụngcông thức xấp xỉ Poisson sau đây:
Px = e
x
x
! (*)
1 Định nghĩa: Biến ngẫu nhiên rời rạc X nhận một trong các giá trị có thể có X
= 0, 1, 2,… với xác suất tương ứng được tính bằng công thức (*) gọi là phânphối theo quy luật Poisson với tham số ký hiệu P( )
Thí dụ 1: một máy dệt có 5000 ống sợi, xác suất để trong một phút ống sợi bịđứt bằng 0,0002 Tìm xác suất để trong một phút có không quá 2 ống sợi bị đứt.Giải gọi X là số ống sợi bị đứt trong 1 phút thì X thỏa mãn quy luật phân phốinhị thức, nhưng do n = 5000; p =0,0002 ; np = 5000.0,0002 =1 = nên X thỏaquy luật phân phối Poisson Tìm xác suất để trong 1 phút có không quá 2 ốngsợi bị đứt là đi tìm xác suất sao cho X nhận các giá trị trong đoạn [0 ; 2] .Ta có:P(0 ≤ X ≤ 2) = P0 + P1 + P2
1 1
2
1 0
1
1 1
0 0
0
) 71 , 2 ( 2
1
2
1
) 71 , 2
(
1
1
) 71 , 2 ( ) 71 , 2 (
! 0
2 Các tham số đặc trưng của quy luật P( )
Với X là biến ngẫu nhiên phân phối theo quy luật Poisson:
E(X) =
V(X) =
Mốt được xác định : - 1 ≤ m0 ≤ chú ý m0 là một số nguyên
III.4.QUY LUẬT SIÊU BỘI – M (N,n)
Ta trở lại ví dụ đã nêu ở đầu chương, bây gời ta lấy ngẫu nhiên lần lượt ra n quảcầu theo phương thức không hoàn lại Lúc này các phép thử sẽ không độc lậpvới nhau nữa, do đó xác suất lấy được quả cầu trắng ở mỗi lần sẽ khác nhau.Xác suất để trong n quả cầu lấy ra có x quả màu trắng như đã biết được tính theocông thức xác suất cổ điển:
Px = n
N
x n M N
x M
Trang 41.Định nghĩa: Biến ngẫu nhiên rời rạc X nhận một trong các giá trị có thể có X =
0, 1, 2,…, n với các xác suất tương ứng được tính bằng công thức Px =
2 bóng Tìm xác suất để người đó mua được cả 2 bóng đều tốt
Giải: Gọi X là số bóng tốt mà người đó có thể mua được X phân phối theoquy luật siêu bội với N = 100, M = 95 và n = 2 ta có :
99 100
94 95
2 100
0 5
2 95
C
C C
2 Các tham số đực trưng của quy luật M(N,n)
X là biến ngẫu nhiên phân phối theo quy luật siêu bội thì:
n N N
M N N
M
biến ngẫu nhiên rời rạc
III.5 QUY LUẬT PHÂN PHỐI ĐỀU U(a,b)1.Định nghĩa: Biến ngẫu nhiên liên tục X gọi là phân phói theo quy luật đềutrong khoảng (a; b) nếu hàm mật độ xác suất của nó có dạng:
)
; ( 1
)
(
b a x khi
b a x khi a
b x
Trang 5E(X) = ( ) 1 1 2 2
x a b
dx a b x dx x f
b a
dx a b x dx x f
2 2
X E X
Quy luật phân phối đều có ứng dụng rộng rãi trong thống kê, nhất là trongcác phương pháp phi tham số Trong lý thuyết kết luận thống kê người ta quy
định: Nếu ta không biết gì về giá trị của tham số cần ước lượng, thì mỗi giá trị
có thể có của tham số đó là đồng khả năng Điều đó dẫn đến việc quan niệm
tham số cần ước lượng như một biến ngẫu nhiên tuân theo quy luật phân phốiđều
Thí dụ: khi thâm nhập một thị trường mới, doanh nghiệp không thể khảng địnhđược một cách chắc chắn doanh số hàng tháng sẽ đạt được bao nhiêu mà chỉ dựkiến được rằng doanh số tối thiểu sẽ là 20 triệu đồng / tháng, và tối đa là 40triệu đồng / tháng Tìm xác suất để doanh nghiệp đạt được doanh thu tối thiểu là
35 triệu đồng / tháng
Giải: Gọi X là doanh số hàng tháng mà doanh nghiệp có thể đạt ở thị trường
đó Do không có thông tin gì hơn, nên ta xem X là biến ngẫu nhiên liên tụcphân phối đều trên khoảng (20;40)
Vậy X có hàm mật độ xác suất như sau:
; 20 ( 0
) 40
; 20 ( 4
, 0 20 40
1
)
(
x khi
x khi x
f
Xác suất cần tìm là: P(X ≥ 35) = ( ) 0 , 5 0 , 25
40
35 35
x f
III.6.QUY LUẬT PHÂN PHỐI CHUẢN – N(µ, 2
2
1 )
f
Đồ thị:
Trang 62 Các tham số đặc trưng của quy luật phân phối chuẩn: người ta chứng minhđược rằng nếu X là quy luật phân phối chuẩn thì:
Kỳ vọng toán E(X) = µ
Phương sai V(X) = 2
trong khoảng (a;b)
P(a<X<b) =
b a
dx x
2
1
0 0
2 ) (
2 2
2
2
1 )
(
người ta lập bảng sẵn cho giá trị của hàm này
4 Ứng dụng của quy luật phân phối chuẩn: Nếu biến ngẫu nhiên là tổng của một số lớn các biến ngẫu nhiên độc lập và giá trị của mỗi biến độc lập chỉ chiếm vị trí rất nhỏ trong tỏng đó thì X có phân phối xấp xỉ chuẩn.
Nhiều lĩnh vực trong thực tế là những biến ngẫu nhiên tuân theo quy luậtnày thí dụ; năng suất của cùng một loại cây trồng trong các thửa ruộng khácnhau tuân theo phân phối chuẩn, hay năng suất lao động của các công nhân cócùng tay nghề và làm cùng một công việc như nhau cũng theo phân phối chuẩn,
…
Trang 7III.7 QUY LUẬT KHI BÌNH PHƯƠNG 2 (n)
Biến ngẫu nhiên liên tục 2 gọi là phân phối theo quy luật khi bình phương với
n bậc tự do nếu hàm mật độ của nó được xác định sau;
) 2 ( 2 1
0 0
)
( 2 1
2
x khi x
e n
x khi x
f
n x n
t n
n
n t
1 ) 2
1 ( ) 1 (
) 2
( )
BÀI TẬP
Trang 8CHƯƠNG IV:
ƯỚC LƯỢNG THAM SỐ VÀ KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
IV.1.KHÁI NIỆM VỀ TỔNG THỂ NGHIÊN CỨU ( 1)
Trong các chương trước ta đã nghiên cứu một số khái niệm về lý thuyếtxác suất, các dữ liệu mà chúng ta xét tới trong các bài toán xác suất đó, khôngchỉ bằng các suy luận toán học, mà phải được quan sát, thu thập trong thực tế,những dữ liệu này thu thập phải đảm bảo được tính khách quan, chính xác, vìvậy cần được sử lý, kiểm định, do vậy thống kê toán học phải dựa trên các kếtquả của lý thuyết xác suất, còn muốn ứng dụng các kết quả của lý thuyết xácsuất vào thực tiễn thì phải thông qua Thống kê toán học
Thí dụ: Ta muốn nghiên cứu chiều cao X của các em học sinh ở lứa tuổilên 10 Hỏi X có phân phối gì? Trả lời câu hỏi này là nhiệm vụ của thống kêtoán học
Trong thực tế nhiều khi phải nghiên cứu một tập hợp các phần tử đồngnhất theo một hay nhiều dấu hiệu định lượng, hoặc định tính đặc trưng cho cácphần tử đó Người ta có thể nghiên cứu toàn bộ, tức là thống kê toàn bộ tập hợp
đó và phân tích từng phần tử theo dấu hiệu nghiên cứu Thí dụ để nghiên cứudân số của một nước theo dấu hiệu như tuổi tác, trình độ học vấn, giới tính, địabàn dân cư, cơ cấu nghề nghiệp…người ta tiến hành tổng điều tra dân số nước
đó và phân tích từng người theo các dấu hiệu đó
1 Định nghĩa: Toàn bộ tập hợp các phần tử đồng nhất theo một dấu hiệu nghiêncứu định tính hoặc định lượng nào đó được gọi là tổng thể nghiên cứu hay tổngthể
Số lượng các phần tử của tổng thể gọi là kích thước của tổng thể, ký hiệu
là N
Với mỗi tổng thể ta thường nghiên cứu các dấu hiệu đặc trưng cho tổngthể đó, chúng được gọi là dấu hiệu nghiên cứu, ký hiệu là
2 Các phương pháp mô tả tổng thể:
+ Giả sử tổng thể với dấu hiệu nghiên cứu định lượng nhận các giá trị
xi với các tần số tương ứng là Ni ( Ni là số phần tử của tổng thể có cùng giá trị
xi ) có bảng phân phối tần số sau:
i N
; pi gọi là tần suất của xi khi đó tổng thể
có bảng phân phối tần suất sau:
Trang 91 1 0
j i
N
N N
w
và gọi là tần suất tích lũy của xi
Bảng phân phối tần số, tần suất, tần số tích lũy, tần số tích lũy của một tổng thể
là quá trình mô tả tổng thể theo dấu hiệu nghiên cữu , dẫu hiệu nghiên cữu
hoàn toàn có thể mô hình hóa bằng một biến ngẫu nhiên rời rạc X biến ngẫunhiên X dùng để mô hình hóa dấu hiệu nghiên cữu gọi là biến ngẫu nhiêngốc, còn quy luật phân phối xác suất của nó gọi là quy luật phân phối gốc
3 Các tham số đặc trưng của tổng thể:
i N x
Ta có E(X) =
N i i
Năng xuát lao động xi Số công nhân Ni Ni.xi
50
55
60
3510
150275600
Trang 1070
75
1273
780490225
Tìm năng xuất lao động trung bình của mỗi công nhân
Giải: theo công thức E(X) =
N i i
x
N 1
1
= 2520/40 = 63 = m+ Trung bình điều hòa:
1
1 Nếu dấu hiệu của tổng thể nhận các giá trị x1, x2,…., xk với các tấn số tương ứng
x N
N m
1
Thí dụ 2: Một xí nghiệp có hai phân xưởng cùng lắp ráp 1 loại xản phẩm Phânxưởng thứ nhất lắp ráp 1 sản phẩm hết 15 phút, phân xưởng thứ hai hết 20 phút.Nếu trong một ngày mỗi phân xưởng làm việc 8 giờ hãy tìm thời gian trung bình
8
* 60 15
8
* 60 960 1
x N
N m
phút+ Trung bình nhân:
m 1 2
2 1
Thí dụ 3: Trong khoảng thời gian 10 năm, tốc độ tăng giá trị sản lượng của xínghiệp như sau: có 5 năm tốc độ tăng so với năm trước là 110 %; có 2 năm tốc
độ tăng là 125 % và có 3 năm tốc độ tăng là 115 % Tìm tốc độ tăng trưởngtrung bình hàng năm của xí nghiệp trong 10 năm đó
Trang 11Giải: ta có :
144 , 1
0583 , 0 ) 15 , 1 lg 3 25 , 1 lg 2 1 , 1 lg 5 ( 10
1 lg
) 15 , 1 (
) 25 , 1 (
) 1 , 1 (
k N N g
m m
x x x
i m x
N 1
2
) (
k i
i i
i i k
x N
2 2
1
) ( 1
Trong thực tế để thuận tiện ngườita tính phương sai tổng thể theo công thức sau:
i x m N
N 1
2 2
2 1
Phương sai tổng thể chính là phương sai của biến ngẫu nhiên trong tổng thể đó
Nó phản ánh mức độ phân tán của dấu hiệu xung quanh giá trị trung bìnhtổng thể
N 1
2 2
Trang 12VI.2 MẪU NGẪU NHIÊN
1 Định nghĩa và các phương pháp mô tả mẫu:
Trong nhiều trường hợp không thể nghiên cứu tất cả các phần tử của một tổngthể nghiên cứu vì thế người ta lấy từ tổng thể ra n phần tử và tiến hành nghiêncứu trên các phần tử này Tập hợp n phần tử này gọi là mẫu kích thước n
1.1.Định nghĩa: Mẫu ngẫu nhiên kích thước n là tập hợp của n biến ngẫu nhiênđộc lập X1, X2,….,Xn được thành lập từ biến ngẫu nhiên X trong tổng thể nghiêncứu và có cùng quy luật xác suất với X Ký hiệu: W = (X1, X2,….,Xn)
Thí dụ 1: gọi X là số chấm thu được khi tung một con xúc xắc, X là biến ngẫunhiên với bảng phân phối xác suất
3 2 1
(
6
1
X E
35 ) 6
21 ( ) 6
2 1
1.2 Các phương pháp mô tả mẫu:
+ Giả sử từ tổng thể với biến ngẫu nhiên gốc X rút ra một mẫu cụ thể kích thước
n, trong đó giá trị xi xuất hiện với tuần số ni sau khi sắp xếp các xi theo thứ tựtăng dần ta có bảng phân phói tần số như sau:
Trang 13j i
n n
x
F* ( )
là tần suất tích lũy của xi thì hàm F*(xi) là một hàm của xi vàgọi là hàm phân bố thực nghiệm của mẫu
Chú ý: hàm phân bố thực nghiệm hội tụ theo xác suất về xác suất F(x) của biến
cố đó khi kích thước mẫu đủ lớn Từ đó có thể dùng hàm phân bố thực nghiệmcủa mẫu để mô tả một cách gần đúng quy luật phân phói gốc F(x) của tổng thể.+ Để mô tả mẫu người ta còn xây dựng các loại đồ thị khác nhau của phân phốithực nghiệm ( sinh viên tự tham khảo)
2 Một số thống kê đặc trưng mẫu:
2.1 Thống kê là gì?
Việc tổng hợp mẫu W = ( X1,….,Xn) được thực hiện dưới dạng một hàmnào đó của các giá trị X1,….,Xn của mẫu nó được gọi là thống kê, ký hiệu là G.như vậy: G = f(X1,X2,….,Xn) Dễ thấy thống kê là một hàm của các biến ngẫunhiên nên bản thân nó cúng là một biến ngẫu nhiên tuân theo quy luật phân phốixác suất nhất định và có các tham số đặc trưng như kỳ vọng E(G), phương saiV(G)… Khi mẫu ngẫu nhiên nhận một giá trị cụ thể (x1,x2, ,x n) thì Gcũng nhận một giá trị cụ thể g = f(x1,x2,…,xn)
Các thống kê cùng với quy luật phân phối xác suất của chúng là cơ sở đểsuy rộng các thông tin của mẫu cho dấu hiệu nghiên cứu của tổng thể
2.2.Một số thống kê đặc trưng mẫu:
a.Kỳ vọng mẫu: Giả sử từ biến ngẫu nhiên gốc X trong tổng thể lập mẫu ngẫunhiên kích thức n: W = (X1,X2,…,Xn) kỳ vọng mẫu là một thống kê, ký hiệu là
X và là trung bình số học của các giá trị mẫu: X =
x n
i x n n
x
1
1
Nếu biến ngẫu nhiên gốc có E(X) = m thì E(X ) = m
Nếu biến ngẫu nhiên góc có V(X) = 2
thì V(X ) = 2
/n
Trang 14Độ lêch chuẩn V(X) n
b.Trung vị: Trung vị ký hiệu là Xd là giá trị nằm ở chính giữa, tức là giá trị chia
cá số liệu mẫu thành hai phần bằng nhau:
+ Nếu số liệu mẫu gồm n gíá trị rời rạc được xếp theo thứ tự tăng dần và n là số
lê thì Xd = (n+1)/2; còn nếu n là số chẵn thì trung vị là hai giá trị nằm ở chínhgiữa của dãy số liệu đó, nó được gọi là khoảng trung vị
+Nếu số liệu mẫu được ghép lớp theo phân phối tần số thì trung vị có thể tínhgần đúng bới công thức: h
n
S n L X
đ
x d
) 2
n - Tần số của lớp chứa trung vị
H – Độ dài của lưps chứa trung vịThí dụ: Tìm trung vị của mẫu được cho bởi phân phố thực nghiệm trong bảngsau:
Đoạn giá trị chiều dài h = 5 Tần số ni Tần số tích lũy wi
41026628696100
33 , 23 5 36
26 2
c Tổng bình phương các sai lệch và độ lệch bình phương trung bình:
Cho mẫu ngẫu nhiên xây dựng từ biến ngẫu nhiên gốc X
W = (X1,X2,…,Xn) ta ký hiêu tổng bình phương các sai lệch giữa các giá trị củamẫu và kỳ vọng mẫu là SS =
n i
i X X
1
2
) ( giá trị SS thường được sử dụng đểphân tích phương sai