LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN HỌCPhan Văn Tân Bộ mô Khí tượng... KHÔNG GIAN MẪU VÀ THỐNG KÊ TRÊN KHÔNG GIAN MẪU 5.1 Không gian mẫu • Mẫu là gì?. – Là tập hợp hữu hạn các phần tử lấ
Trang 1LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN HỌC
Phan Văn Tân
Bộ mô Khí tượng
Trang 2CHƯƠNG 5 KHÔNG GIAN MẪU VÀ THỐNG KÊ
TRÊN KHÔNG GIAN MẪU
5.1 Không gian mẫu
• Mẫu là gì?
– Là tập hợp hữu hạn các phần tử lấy từ tập tất cả các phần tử cóthể có nào đó
• Tại sao phải lấy mẫu?
– Để nghiên cứu một hiện tượng, một sự kiện nào đó ta không thể xem xét tất cả các thành phần cấu thành nó, vì số thành phần là vô hạn hoặc quá nhiều
– Ví dụ:
• Nghiên cứu tâm lý lứa tuổi
• Điều tra xã hội học về một chính sách nào đó
• Đánh giá chất lượng sản phNm của nhà máy
• …
Trang 3CHƯƠN G 5 KHÔN G GIAN MẪU VÀ THỐN G KÊ
TRÊN KHÔN G GIAN MẪU
5.1 Không gian mẫu
• Tập tổng thể: Tập hợp tất cả các thành phần có thể có
– Tập toàn bộ, tập chính qui
• Tập mẫu: Tập hợp các thành phần được lấy ra để thí nghiệm, kiểm tra
– Số thành phần được chọn: Dung lượng mẫu
– Tập hợp tất cả các mẫu có thể lấy được gọi là không gian mẫu– Mỗi mẫu lấy ra là một điểm trong không gian mẫu
• Không gian mẫu ứng với không gian các sự kiện sơ cấp
• Mỗi mẫu ứng với một sự kiện sơ cấp trong lý thuyết xác suất
• Có hai loại mẫu:
– Mẫu có lặp
– Mẫu không lặp
Trang 4CHƯƠN G 5 KHÔN G GIAN MẪU VÀ THỐN G KÊ
TRÊN KHÔN G GIAN MẪU
5.1 Không gian mẫu
• Giả sử tập tổng thể gồm N phần tử, tập mẫu gồm n phần tử (n<N )
– Mẫu được lấy bằng cách rút ngẫu nhiên n lần, mỗi lần một
phần tử từ tập tổng thể rồi trả lại tập tổng thể sau khi đã ghi nhận kết quả
¾ Đó là cách lấy mẫu có lặp: Một phần tử có thể được lấy nhiều lần
– Mẫu được lấy bằng cách rút ngẫu nhiên n phần tử từ tập tổng
thể, sau mỗi lần lấy ghi nhận kết quả nhưng không trả lại tập tổng thể
¾ Đó là cách lấy mẫu không lặp: Mỗi phần tử chỉ có thể được chọn một lần duy nhất
Trang 5CHƯƠN G 5 KHÔN G GIAN MẪU VÀ THỐN G KÊ
TRÊN KHÔN G GIAN MẪU
5.1 Không gian mẫu
• Đối với cách lấy mẫu lặp:
– Mỗi phần tử trong số n phần tử của mẫu có N cách chọn, vì
mỗi phần tử sau khi chọn được trả lại tập ban đầu
– Î Có tất cả N n cách lấy mẫu khác nhau
• Đối với các lấy mẫu không lặp:
– Có N cách chọn phần tử thứ nhất của tập mẫu
– Có (N –1) cách chọn phần tử thứ hai, vì phần tử thứ nhất không được trả lại tập ban đầu
– …
– Có (N –n+1) cách chọn phần tử thứ n của tập mẫu
– Î Có tất cả N (N –1)…(N –n+1)=AN n cách lấy mẫu
Trang 6CHƯƠN G 5 KHÔN G GIAN MẪU VÀ THỐN G KÊ
TRÊN KHÔN G GIAN MẪU
5.1 Không gian mẫu
• N hận thấy: Khi n << N thì Î hai cách lấy mẫu tương đương nhau
• Để có kết luận tương đối chính xác về tập tổng thể thì tập mẫu n
phải tiêu biểu
• Mẫu được coi là tiêu biểu nếu nó được lấy một cách ngẫu nhiên, tức mọi phần tử của tập tổng thể phải có xác suất được chọn như nhau
• N ếu mẫu được lấy để nghiên cứu đại lượng ngẫu nhiên X thì tập mẫu (X1, X2,…, Xn) được coi là mẫu của X
• Mỗi Xi, i=1,2, ,n, đều được chọn từ tập giá trị của X nên các Xi lànhững đại lượng ngẫu nhiên có cùng phân bố với X
1
~
n
n N
N A
Trang 7CHƯƠN G 5 KHÔN G GIAN MẪU VÀ THỐN G KÊ
TRÊN KHÔN G GIAN MẪU
5.1 Không gian mẫu
Trang 8CHƯƠN G 5 KHÔN G GIAN MẪU VÀ THỐN G KÊ
TRÊN KHÔN G GIAN MẪU
5.2 Phân bố mẫu và phân bố chính xác
• Giả sử có mẫu (X1, X2,…, Xn) của đại lượng ngẫu nhiên X có phân
bố F(x) (F(x) được gọi là phân bố chính xác của X)
• Vì F(x) chưa biết nên cần tìm F(x) trên cơ sở tập mẫu lấy được
n
n x
F
x
x n
i n
2
(X cña tö
phÇn
)(
• F n (x) được gọi là phân bố mẫu của X
• Ứng với mỗi đối số x giá trị hàm F n (x) là tần suất của sự kiện X<x
• N ói cách khác, F n (x) là ước lượng của xác suất P(X<x)
Trang 9CHƯƠN G 5 KHÔN G GIAN MẪU VÀ THỐN G KÊ
TRÊN KHÔN G GIAN MẪU
5.2 Phân bố mẫu và phân bố chính xác
• Từ hệ thức
n
n x
F n( ) = x
• N hư vậy, có thể xem mẫu (X1, X2,…, Xn) như là tập các giá trị cóthể của biến ngẫu nhiên rời rạc X’, trong đó xác suất để X’ nhận
các giá trị có thể của nó là như nhau và bằng 1/n
• Để nghiên cứu X ta dựa vào tập mẫu (X1, X2,…, Xn), điều đó
tương đương với việc nghiên cứu biến ngẫu nhiên rời rạc X’
P( = i) = 1 , =1,2, ,
Trang 10CHƯƠN G 5 KHÔN G GIAN MẪU VÀ THỐN G KÊ
TRÊN KHÔN G GIAN MẪU
5.3 Các đặc trưng mẫu của đại lượng ngẫu nhiên
• Xét biến ngẫu nhiên X với mẫu lấy được X’={X1, X2,…, Xn}
• Ký hiệu các đặc trưng chính xác của X là:
– Hàm phân bố F(x)=P(X<x)
– Kỳ vọng: μ=M[X], phương sai: σ2=D[X]=M[(X–μ)2]
– Mômen gốc bậc k: mk=M[Xk]
– Mômen trung tâm bậc k: μk=M[(X–μ)k]
• Cần xác định các đặc trưng mẫu của X
• Từ mục trước:
n
n x
F n( ) = x
n
i n
X X
P( = i) = 1 , =1,2, ,
Trang 11CHƯƠN G 5 KHÔN G GIAN MẪU VÀ THỐN G KÊ
TRÊN KHÔN G GIAN MẪU
5.3 Các đặc trưng mẫu của đại lượng ngẫu nhiên
P X X
M
X
1 1
1)
(]
[
• Phương sai mẫu:
2 2
2 1
2 1
2
)(
1]
[
~
X X
X
X n
X
X n
X D s
D
n
i
i n
i
i x
k
n
X M
m
1
1]
k
n
X X
M
1
)(
1]
)[(
~μ
Trang 12CHƯƠN G 5 KHÔN G GIAN MẪU VÀ THỐN G KÊ
TRÊN KHÔN G GIAN MẪU
5.4 Phân bố của các đặc trưng thống kê
• Xét biến ngẫu nhiên X có mật độ xác suất f(x) và mẫu (X1, X2,…,
Xn) là mẫu có lặp của X
• Vì các Xi là độc lập và có cùng phân bố với X nên f(xi)≡f(x)
• Có thể xét (X1, X2,…, Xn) như là
hệ n đại lượng ngẫu nhiên hay
vector ngẫu nhiên n chiều nhận
Trang 13CHƯƠN G 5 KHÔN G GIAN MẪU VÀ THỐN G KÊ
TRÊN KHÔN G GIAN MẪU
5.4 Phân bố của các đặc trưng thống kê
• Định nghĩa: Một hàm số g(X1, X2,…, Xn) bất kỳ với các biến là(X1, X2,…, Xn) được gọi là một đại lượng thống kê hay một đặc trưng thống kê trên không gian mẫu
• Vì (X1, X2,…, Xn) là một hệ các đại lượng ngẫu nhiên nên g(X1,
X2,…, Xn) cũng là một đại lượng ngẫu nhiên
• Phương sai mẫu:
• Các mômen gốc, mômen trung tâm mẫu đều là những đại
lượng thống kê trên không gian mẫu
Trang 14CHƯƠN G 5 KHÔN G GIAN MẪU VÀ THỐN G KÊ
TRÊN KHÔN G GIAN MẪU
5.4 Phân bố của các đặc trưng thống kê
• Cho Y=g(X1, X2,…, Xn) là một đại lượng thống kê và
f(x1)×f(x2)×…×f(xn) là mật độ xác suất của (X1, X2,…, Xn)
• Cần xác định phân bố F y (y) của Y
• Về nguyên tắc ta có:
})
, ,(
:), ,{(
,
)()
()
(
1 1
1 1
y x
x g x
x G
dx dx
x f x
f y
F
n n
G
n n
Trang 15CHƯƠN G 5 KHÔN G GIAN MẪU VÀ THỐN G KÊ
TRÊN KHÔN G GIAN MẪU
5.4 Phân bố của các đặc trưng thống kê
• Phân bố của một số đại lượng thống kê thường gặp
• Định lý 1: N ếu mẫu (X1, X2,…, Xn) được lấy từ đại lượng ngẫu nhiên X có phân bố chuNn N (μ,σ) thì
Trang 16CHƯƠN G 5 KHÔN G GIAN MẪU VÀ THỐN G KÊ
TRÊN KHÔN G GIAN MẪU
5.4 Phân bố của các đặc trưng thống kê
• Phân bố của một số đại lượng thống kê thường gặp
• Định lý 2: N ếu X có phân bố chuNn N (μ,σ) và (X1, X2,…, Xn) làmẫu của X thì *2
X n
s
1 1
2 2
,)
(1
1
• Định nghĩa: N ếu Z có phân bố chuNn N (0,1), U có phân bố χ2 với
n bậc tự do, χ2(n), thì
n U
Z n
Trang 17CHƯƠN G 5 KHÔN G GIAN MẪU VÀ THỐN G KÊ
TRÊN KHÔN G GIAN MẪU
5.4 Phân bố của các đặc trưng thống kê
• Phân bố của một số đại lượng thống kê thường gặp
• Định lý 3: N ếu X có phân bố chuNn N (μ,σ) và (X1, X2,…, Xn) làmẫu của X thì
n s
X t
X n
s
1 1
2 2
,)
(1
1
• Định nghĩa: N ếu U1 và U2 độc lập có phân bố χ2 với n1 và n2 bậc
tự do, U1∈χ2(n1), U2∈χ2(n2)thì
2 2
1 1/
/
n U
Trang 18CHƯƠN G 5 KHÔN G GIAN MẪU VÀ THỐN G KÊ
TRÊN KHÔN G GIAN MẪU
5.4 Phân bố của các đặc trưng thống kê
• Phân bố của một số đại lượng thống kê thường gặp
• Định lý 4: N ếu X và Y đều có phân bố chuNn và có cùng phương
sai, D[X]=D[Y]=σ2, (X1, X2,…, Xn1) là mẫu của X, (Y1, Y2,…,
2 1
2
,)
(1
i
i n
X n
2 2
2
,)
(1
i
i n
Y n
s
Trang 19CHƯƠN G 5 KHÔN G GIAN MẪU VÀ THỐN G KÊ
TRÊN KHÔN G GIAN MẪU
Những điều cần chú ý
• Khi xét đại lượng ngẫu nhiên X với mẫu (X1, X2,…, Xn):
– Các Xi nhận các giá trị trong tập các giá trị có thể của X nên các Xi có cùng phân bố với X, f(xi)=f(x)
– Các Xi là độc lập với nhau
– Có thể xét (X1, X2,…, Xn) như là một hệ n đại lượng ngẫu
nhiên, phân bố của hệ: f(x1,…,xn)=f(x1)×…×f(xn)
– Bộ giá trị (x1,…,xn) là những hằng số cụ thể, và là kết quả của một lần chọn nào đó Î Khái niệm mẫu (X1, X2,…, Xn) là một khái niệm trừu tượng
X X
M
1 1
1
1]
[
• Phân biệt:
• Tương tự, với các đặc trưng khác: Phương sai, mômen,…
Trang 20CHƯƠN G 5 KHÔN G GIAN MẪU VÀ THỐN G KÊ
TRÊN KHÔN G GIAN MẪU
5.5 Các đặc trưng mẫu của hệ các đại lượng ngẫu nhiên
• Xét hệ hai đại lượng ngẫu nhiên (X,Y) với mẫu lấy được (X1,Y1), (X2,Y2),…, (Xn,Yn)
• Khi đó, ngoài các đặc trưng riêng như kỳ vọng, phương sai,
mômen gốc, mômen trung tâm của từng đại lượng ngẫu nhiên, các đặc trưng quan trọng cần được xem xét là mômen tương quan và
n 1 ( )( )
1
~μ
• Mômen tương quan mẫu giữa hai đại lượng ngẫu nhiên được xác định bởi
X
1 1
1 ,
mẫu của X và Y
Do tính ứng dụng phổ biến của mômen tương quan mẫu nên để
thuận tiện ta sẽ sử dụng ký hiệu R xy thay cho μ~xy
Trang 21CHƯƠN G 5 KHÔN G GIAN MẪU VÀ THỐN G KÊ
TRÊN KHÔN G GIAN MẪU
5.5 Các đặc trưng mẫu của hệ các đại lượng ngẫu nhiên
y x
xy
y x
xy xy
Y
Y n
X
X n
Y Y
X
X n
s s D
D r
1
2 1
2
1
)(
1)
(1
))(
y n
i
i x
n
s D
X
X n
s
D
1
2 2
Trang 22CHƯƠN G 5 KHÔN G GIAN MẪU VÀ THỐN G KÊ
TRÊN KHÔN G GIAN MẪU
5.5 Các đặc trưng mẫu của hệ các đại lượng ngẫu nhiên
• Đối với hệ m đại lượng ngẫu nhiên (X1,X2,…,Xm) với mẫu lấy được (X11,X21,…,Xn1),…, (X1m,X22,…,Xnm)
• Có thể sắp xếp mẫu thành ma trận n hàng (dung lượng mẫu) và m cột (tương ứng với m đại lượng ngẫu nhiên)
• Các đặc trưng mẫu được xác định như sau
m j
X n
• Các phương sai mẫu:
• Trong nhiều trường hợp để đơn giản ta sử dụng ký hiệu
thay cho ký hiệu
m j
X
X n
s D
n
i
j ij
Trang 23CHƯƠN G 5 KHÔN G GIAN MẪU VÀ THỐN G KÊ
TRÊN KHÔN G GIAN MẪU
5.5 Các đặc trưng mẫu của hệ các đại lượng ngẫu nhiên
m k
j X
X X
X n
n
i
k ik
j ij
• Các mômen tương quan mẫu:
• Tập hợp các mômen tương quan mẫu lập thành ma trận tương
quan mẫu:
• Sử dụng ký hiệuthay cho ký hiệu jk
R
k
j x x
m
m m
x x x
x x
x
x x x
x x
x
x x x
x x
x
xx
R
μμ
μ
μμ
μ
μμ
μ
~
~
~
~
~
~
2 1
2 2
2 1
2
1 2
1 1
m
m m
xx
R R
R
R R
R
R R
2 22
21
1 12
11
Trang 24CHƯƠN G 5 KHÔN G GIAN MẪU VÀ THỐN G KÊ
TRÊN KHÔN G GIAN MẪU
5.5 Các đặc trưng mẫu của hệ các đại lượng ngẫu nhiên
) , , 2 , 1 ,
(
,
~ )
)(
(
1 )
m k
j
X X
X
X n
X X
k ik
n
i
k ik
j ij
• N hận thấy:
• Ma trận tương quan mẫu là ma trận đối xứng
• Khi j≡k:
), ,2,1(
,
~)
(
1)
D X
X n
X X
n
i
j ij
j ij
x x
• Các phần tử trên đường chéo chính là phương sai của các đại
lượng ngẫu nhiên thành phần
Trang 25CHƯƠN G 5 KHÔN G GIAN MẪU VÀ THỐN G KÊ
TRÊN KHÔN G GIAN MẪU
5.5 Các đặc trưng mẫu của hệ các đại lượng ngẫu nhiên
m k
j s
s
R s
s D
D
r
k j
jk
x x
x x
x x
x x x
x
k j
k j
k j
k j k
• Các hệ số tương quan mẫu:
• Tập hợp các hệ số tương quan mẫu lập thành ma trận tương quan mẫu chuNn hóa: • Sử dụng ký hiệu
thay cho ký hiệu
jk
r
k
j x x
m
m m
x x x
x x
x
x x x
x x
x
x x x
x x
x
xx
r r
r
r r
r
r r
r P
2 2
2 1
2
1 2
1 1
m
m m
xx
r r
r
r r
r
r r
r P
2 22
21
1 12
11
Trang 26CHƯƠN G 5 KHÔN G GIAN MẪU VÀ THỐN G KÊ
TRÊN KHÔN G GIAN MẪU
5.5 Các đặc trưng mẫu của hệ các đại lượng ngẫu nhiên
j
r D
D D
D
r
j k j
k
j k
k j
k j k
x x
x x
x x
x x x
D D
D
r
j j
j j
j j j
j
x
x
x x
x x x
Trang 27CHƯƠN G 5 KHÔN G GIAN MẪU VÀ THỐN G KÊ
TRÊN KHÔN G GIAN MẪU
5.5 Các đặc trưng mẫu của hệ các đại lượng ngẫu nhiên
m
m m
xx
D R
R
R D
R
R R
2 2
21
1 12
2 21
1 12
m m
m m
xx
r r
r r
r r
P
Trang 28CHƯƠN G 5 KHÔN G GIAN MẪU VÀ THỐN G KÊ
TRÊN KHÔN G GIAN MẪU
5.5 Các đặc trưng mẫu của hệ các đại lượng ngẫu nhiên
2 2
2 2
2 1
2 1
1 2
1
2 2
1
2
2
1 2
1
) 2
(
1 )
(
1
~
X X
X X
X
X n
X
X n
X n
X X
X
X n
X
X n
n
i
i x
−
=
= +
• Chú ý: Sử dụng một số phép biến đổi đơn giản ta có thể nhận
được các hệ thức tương đương sau
• Phương sai mẫu:
Y X XY
Y X Y
X n
Y Y
X
X n
n
i
i i n
i
i i
=
1)
k j n
i
k ik
j ij
jk x
(
1
~
μ
Trang 29CHƯƠN G 5 KHÔN G GIAN MẪU VÀ THỐN G KÊ
TRÊN KHÔN G GIAN MẪU
HẾT CHƯƠN G 5