– Mẫu: Một số phần tử cá thể được chọn ngẫu nhiên trong dân số để khảo sát... Để tránh khỏi sai lầm, việc lấy mẫu phải thực hiện sao cho mọi phần tử có cơ hội đồng đều được quan sát..
Trang 1LÝ THUYẾT
LẤY MẪU
Trang 2– Dân số (tổng thể): Tập hợp tất cả
các phần tử (cá thể) chúng ta cần nghiên cứu.
– Mẫu: Một số phần tử (cá thể)
được chọn ngẫu nhiên trong dân
số để khảo sát.
I ĐẠI CƯƠNG
Trang 3Ta chỉ tính toán và xử lý trên mẫu
rồi suy ra kết quả cho toàn bộ dân số nên có thể mắc sai lầm
Để tránh khỏi sai lầm, việc lấy mẫu phải thực hiện sao cho mọi phần tử có
cơ hội đồng đều được quan sát.
Trang 4Có 2 cách lấy mẫu a.Lấy mẫu có hoàn lại:
Phần tử vừa quan sát được trả lại cho tổng thể trước khi quan sát lần sau.
b.Lấy mẫu không hoàn lại:
Phần tử vừa quan sát không trả lại
cho tổng thể trước khi quan sát lần sau.
° Nếu tổng thể có rất nhiều phần tử thì
2 cách lấy mẫu được được coi như nhau.
Trang 5• Thông thường, ta lấy mẫu để ước
lượng những đại lượng chưa biết như: tỉ
lệ, trung bình, phương sai,…
• Gọi X 1 , X 2 , X 3 ,…,X n là những kết quả
quan sát Thông thường chúng ta lấy mẫu trong 1 tổng thể rất nhiều nên các biến số ngẫu nhiên X 1 , X 2 ,…, X n được coi như
độc lập và cùng phân phối.
Trang 6II THỐNG KÊ
• Để nghiên cứu một đặc tính nào đó
của một dân số, ta lấy mẫu ngẫu nhiên (X 1 , X 2 , … ,X n ) từ dân số đó và tính các giá trị tương ứng những giá trị này, là một hàm theo mẫu, ta gọi là thống ke
• Ký hiệu:
( )
T T(X ,X , X ) T X = L = r
Trang 7Khi đã quan sát được mẫu, ta có thể tính ra giá trị của một thống kê.
Vì mẫu là ngẫu nhiên, nên T cũng là đại
lượng ngẫu nhiên, nghĩa là T có qui luật xác suất, có vọng trị, có phương sai, có hàm mật độ…
Tùy theo từng vấn đề nghiên cứu, ta có thể đặt ra một hay nhiều thống kê khác nhau.
Trang 8Các thống kê thường dùng là:
1 Trung bình mẫu:
2 Phương sai mẫu:
3.Hiệu hai trung bình:
4.Tỉ số hai phương sai:
S S
Trang 10III THỐNG KÊ TRUNG BÌNH MẪU
1 Định nghĩa:
Cho mẫu (X 1 , X 2 , …, X n ) trung bình mẫu là:
2 Qui luật xác suất của :
• a Định lý:
Nếu mẫu ngẫu nhiên (X 1 , X 2 , …, X n ) rút từ
1 dân số có phân phối bất kỳ, với trung
Trang 11: gọi là độ lệch chuẩn của
Giá trị này còn gọi là sai số chuẩn
của số trung bình Sai số này cũng còn gọi là sai số do chọn mẫu
Thật vậy nếu , mẫu trở thành chính dân số đó,
không còn sai số nữa.
Trang 12b Định lý:
Nếu mẫu ngẫu nhiên (X 1 , X 2 , …,X n )
rút từ một dân số có phân phối bình thường:
Trang 13• c Định lý giới hạn trung tâm:
Với mẫu (X 1 , X 2 , …, X n ) rút từ dân số có
vọng trị , phương sai
thì khi n ∞
nên
Định lý này rất quan trọng đối với người
làm thống kê, Với mẫu lớn thì gần như có phân phối Bình thường, bất chấp đặc tính X trong dân số có phân phối gì.
÷
X −µ n ~ N(0;1) khi n → ∞σ
X
Trang 14IV THỐNG KÊ PHƯƠNG SAI MẪU
Trang 15• Ý nghĩa của phương sai:
Nếu số liệu phân tán hẹp, thì S 2 sẽ nhỏ.
Do đó: S 2 đo lường mức độ phân tán của số liệu.
Trang 173 Qui luật xác suất của S 2 :
• Vọng trị của S 2 :
• Định lý: Các phân phối liên quan tới
S 2 :
Nếu mẫu (X 1 , X 2 , …, X n ) rút từ dân số
có phân phối chuẩn thì:
Trang 19• II THỐNG KÊ TRUNG BÌNH MẪU
Trang 20• b.Định lý:
Nếu mẫu ngẫu nhiên (X 1 , X 2 , …, X n ) rút
từ một dân số có phân phối bình thường: thì
c.Định lý giới hạn trung tâm:
Với mẫu (X 1 , X 2 , …, X n ) rút từ dân số có
X − µ n ~ N(0;1) khi n → ∞σ
Trang 21III THỐNG KÊ PHƯƠNG SAI MẪU S 2
X n
X S
2
2 i
2
−
−
= ∑
Trang 22• 3.Qui luật xác suất của S 2 :
• Vọng trị của S 2 :
• Định lý: Các phân phối liên quan tới S 2 :
Nếu mẫu (X 1 , X 2 , …, X n ) rút từ dân
số có phân phối chuẩn thì.
Trang 23• 1 Đo lượng cholesterlemie (đơn vị: mg%)
của một số người, ta được:
• a Tính trung bình mẫu và độ lệch tiêu
chuẩn của
• b Một mẫu thứ nhì cũng quan sát lượng
cholesterlemie Y (mg%) của 30 người,
tính được = 180 mg% ,
Nhập 2 mẫu lại, tính trung bình và độ
lệch chuẩn của mẫu nhập.
X(mg%) 150-160 160-170 170-180 180-190 190-200 200-210
%mg16
Trang 24X =
98 ,
181.25 mg%
180 mg%
14.98 mg%
16 mg%
Trang 26X n
X S
2
2 2
(
∑ X2 = ( n − 1 ) S2X + n X2
2 2
Trang 27• Mẫu nhập:
Phương sai mẫu nhập:
53
) 56 , 180 (
54 7092
,
1773022 1
N
Z N
Z
2
2 2
, 15
SZ =
7092 ,
1773022 Y
X
Z 2 = ∑ 2 + ∑ 2 =
∑
Trang 28• 2 Có 3 mẫu quan sát sức nặng con người, kết quả ghi nhận được như sau:
• Nhập chung 3 mẫu lại, tính trung bình và
55 kg
57 kg
54 kg
8.30 kg 8.60 kg 8.50 kg
Trang 29X = ∑ 1 + ∑ 2 + ∑ 3 =
∑
kg23
,
55240
13255N
X
Trang 30X n
X S
Trang 31X N
X S
2
2 2
55 (
240 95
,
Trang 32• 3 Đo độ dài của 30 chi tiết được chọn ngẫu nhiên của một loại sản phẩm ta được bảng
số liệu sau:
• a Tính các đặc trưng mẫu
• b Lập bảng phân phối thực nghiệm.
• c Tìm hàm phân phối thực nghiệm tương ứng với mẫu trên.
39 43 41 41 40 41 43 42 41 39
40 42 44 42 42 41 41 42 43 40
41 42 43 39 40 41 39 40 42 41
Trang 333 Bảng số liệu ban đầu có thể thu gọn, khi xét đến tần số của các giá trị quan sát, ta
) 44 +
43 4 + 42 7 + 41 9 + 40 5 + 39 4
( 30
1
= X
,n i là tần số của X i trong mẫu đã cho.
a.
= 41,17
Trang 342 i
1 n
1 S
k 1 i
2
2 i i
2
2
i n X n X
1 n
1 )
X n X
( 1
n
1
(50893 30 41 17 ) 1 80 29
1
=80,
1
=S
Trang 35c Từ bảng phân phối thực nghiệm dễ
dàng tìm được phân phối F30(x) theo quy tắc “cộng dồn sang trái ”:
b Bảng phân phối thực nghiệm:
Trang 37• 4 Khi kiểm tra thể lực một nhóm sinh viên
ta có kết quả về cân nặng như sau:
• a Tính
• b Lập bảng phân phối thực nghiệm.
• c Tìm hàm phân phối thực nghiệm.
X i (kg)
42.5-47.5
52.5
47.5- 57.5
52.5- 62.5
57.5- 67.5
S , S ,
X 2
Trang 38• 4 Giải
• Khi các giá trị mẫu thì ta lấy
.
) b , a (
2
b +
n = ∑ i =
•Từ đấy ta có bảng số liệu thu gọn
Trang 3934 X
X 1
Trang 40c Hàm phân phối thực nghiệm
0 neáu x 45
8 45 x 50
80
22 50 x 5580