Các số liệu trong bảng 1 gọi là các số liệu thống kê, còn gọi là các giá trị của dấu hiệu và số các số liệu thống kê là 35.. III- BẢNG PHÂN BỐ TẦN SỐ VÀ TẦN SUẤT GHÉP LỚP Giả sử dãy n
Trang 1§1 BẢNG PHÂN BỐ TẦN SỐ VÀ TẦN SUẤT
I- ÔN TẬP
1 Số liệu thống kê:
Ví dụ: Khi điều tra “Năng suất lúa hè thu năm 1998” của 31 tỉnh, người ta thu thập được các số liệu ghi trong bảng dưới đây:
Năng suất lúa hè thu (tạ/ha) năm 1998 của 31 tỉnh
30
25
35
30
45
35
25
30
30
25
30
40
35
30
40
45
40
40
40
30
35
40
25
35
35
45
35
45
45
35 35
Bảng 1
Tập hợp các đơn vị điều tra là tập hợp 31 tỉnh, mỗi một tỉnh là một đơn vị
điều tra Dấu hiệu điều tra là năng suất lúa hè thu năm 1998 ở mỗi tỉnh Các số liệu
trong bảng 1 gọi là các số liệu thống kê, còn gọi là các giá trị của dấu hiệu và số các số liệu thống kê là 35
2 Tần số:
Tần số là số lần xuất hiện của một số liệu trong bảng thống kê
II- TẦN SUẤT
Giả sử dãy n số liệu thống kê đã cho có k giá trị khác nhau (k n) Gọi xi là một giá trị bất kì trong k giá trị đó và ni là tần suất của giá trị tương ứng Khi đó, số
n
n
i gọi là tần suất của giá trị xi
III- BẢNG PHÂN BỐ TẦN SỐ VÀ TẦN SUẤT GHÉP LỚP
Giả sử dãy n số liệu thống kê đã cho được phân vào k lớp (k < n) Xét lớp thứ i (i = 1, 2, 3, k) trong k lớp đó, ta có:
Số ni các số liệu thống kê thuộc lớp thứ i được gọi là tần số của lớp đó
Số
n
n
i được gọi là tần suất của lớp thứ i
CHƯƠNG V THỐNG KÊ
Trang 2§2 BIỂU ĐỒ
I- BIỂU ĐỒ TẦN SUẤT HÌNH CỘT VÀ ĐƯỜNG GẤP KHÚC TẦN SUẤT
Ta có thể mô tả một cách trực quan các bảng phân bố tần suất (hoặc tần số), bảng phân bố tần suất (hoặc tần số) ghép lớp bằng biểu đồ hoặc đường gấp khúc
1 Biểu đồ tần suất hình cột:
Để mô tả bảng phân bố tần suất ghép lớp và trình bày các số liệu thống kê:
Chiều cao của 36 học sinh
Lớp số đo chiều cao
(cm)
Tần số Tần suất
(%) [150 ; 156)
[156 ; 162) [162 ; 168) [168 ; 174]
6
12
13
5
16,7 33,3 36,1 13,9
2 Đường gấp khúc tần suất:
Cũng có thể mô tả bảng phân bố tần suất ghép lớp bằng cách vẽ đường gấp khúc tần suất
a) Giá trị đại diện: Trong bảng phân bố ghép lớp, ta gọi trung bình cộng của hai mút lớp thứ i là giá trị đại diện của lớp đó, kí hiệu là ci
b) Cách vẽ đường gấp khúc tần suất: Trên mặt phẳng tọa độ, xác định các điểm (ci; fi), i = 1, 2, 3, , k, trong đó ci và fi lần lượt là giá trị đại diện, tần suất của các lớp của bảng phân bố (gồm k lớp)
Vẽ các đoạn thẳng nối điểm (ci; fi) với điểm (ci+1; fi+1), i = 1, 2, 3, , k-1
ta thu được một đường gấp khúc, gọi là đường gấp khúc tần suất
3 Chú ý: Ta cũng có thể mô tả bảng phân bố tần số ghép lớp bằng biểu đồ tần
số hình cột hoặc đường gấp khúc tần số Cách vẽ cũng như cách vẽ biểu đồ tần suất hình cột hoặc đường gấp khúc tần suất, trong đó thay trục tần suất bởi trục tần số
II- BIỂU ĐỒ HÌNH QUẠT
*Chú ý: Các bảng phân bố tần suất ghép lớp cũng có thể mô tả bằng biểu đồ
hình quạt
Trang 3§3 SỐ TRUNG BÌNH CỘNG SỐ TRUNG VỊ
MỐT
I- SỐ TRUNG BÌNH CỘNG (HAY SỐ TRUNG BÌNH)
Ta có thể tính số trung bình cộng của các số liệu thống kê theo các công thức sau đây
Trường hợp bảng phân bố tần số, tần suất
i i i
k
i i i k
n x n n x n x
n x n n
x
1 1
2 2 1 1
1 1
)
( 1
với ni, xi lần lượt là tần số, tần suất của giá trị xi, n là số các số liệu thống kê
n1 + n2+ +nk = n
Trường hợp bảng phân bố tần số, tần suất ghép lớp
i i i
k
i i i
c f c
n n
x
1 1
1
với ci, ni, fi lần lượt là giá trị đại diện, tần số, tần suất của lớp thứ i, n là số các số liệu thống kê
II- SỐ TRUNG VỊ
Sắp thứ tự các số liệu thống kê thành dãy không giảm (hoặc không tăng) Số trung vị (của các số liệu thống kê đã cho) kí hiệu Me là số đứng giữa dãy nếu số phần tử là lẻ và là trung bình cộng của hai số đứng giữa dãy nếu số phần tử là chẵn
III- MỐT
Mốt của một bảng phân bố tần số là giá trị có tần số lớn nhất và được kí hiệu là M0
Trang 4§4 PHƯƠNG SAI VÀ ĐỘ LỆCH CHUẨN
I- PHƯƠNG SAI
1 Định nghĩa:
Phương sai của một dãy số liệu là trung bình cộng của bình phương các độ lệch giữa các số liệu thống kê và số trung bình của dãy đó
2 Công thức tính:
Có thể tính phương sai theo một trong ba cách sau:
Đối với bảng phân bố tần số, tần suất:
2 2
2 2
2 1 1
2 2
2 2
2 1 1 2
) (
) (
) (
] ) (
) (
) ( [ 1
x x f x
x f x
x f
x x n x
x n x x n n s
k k
k k x
Đối với bảng phân bố tần số, tần suất ghép lớp:
2 2
2 2
2 1 1
2 2
2 2
2 1 1 2
) (
) ( )
(
] ) (
) ( ) ( [ 1
x c f x
c f x
c f
x c n x
c n x c n n s
k k
k k x
trong đó ni, fi lần lượt là tần số, tần suất của giá trị xi trong bảng phân bố tần số, tần suất (hay là tần số, tần suất của lớp thứ i trong bảng phân bố tần số, tần suất ghép lớp); n1 + n2 + + nk = n là số các số liệu thống kê, x là số trung bình cộng của các số liệu thống kê; ci là giá trị đại diện của lớp thứ i
Hoặc: 2
2 2
x
s x x trong đóx2 là trung bình cộng của các bình phương số liệu thống kê
Đối với bảng phân bố tần số, tần suất:
2 2
2 2
2 1 1 2 2
2 2
2 1 1
2 1(n x n x n k x k) f x f x f k x k n
Đối với bảng phân bố tần số, tần suất ghép lớp:
2 2
2 2
2 1 1 2 2
2 2
2 1 1
2 1(n c n c n k c k) f c f c f k c k n
3 Ý nghĩa và cách sử dụng phương sai:
Phương sai được sử dụng để đánh giá mức độ phân tán của các số liệu thống kê (so với số trung bình cộng của các số liệu)
Khi hai dãy số liệu thống kê có cùng đơn vị đo và có số trung bình cộng bằng nhau hoặc xấp xỉ bằng nhau, nếu phương sai càng nhỏ thì mức độ phân tán (so với số trung bình cộng) của các số liệu thống kê càng bé
Trang 5LÝ THUYẾT & BÀI TẬP
Phương sai 2
x
s và độ lệch chuẩn sx đều được dùng để đánh giá mức độ phân tán của các số liệu thống kê (so với số trung bình cộng) Nhưng khi cần chú ý đến đơn
vị đo thì ta dùng sx, vì sx có cùng đơn vị đo với dấu hiệu được nghiên cứu
I Một số khái niệm
Một tập con hữu hạn các đơn vị điều tra được gọi là một mẫu
Số phần tử của một mẫu được gọi là kích thước mẫu
Các giá trị của dấu hiệu thu được trên mẫu được gọi là một mẫu số liệu
II Trình bày một mẫu số liệu
Tần số của một giá trị là số lần xuất hiện của mỗi giá trị trong mẫu số liệu
Tần suất f i của giá trị x i là tỉ số giữa tần số n i và kích thước mẫu N:
f N
(thường viết tần suất dưới dạng %)
Bảng phân bố tần số – tần suất Bảng phân bố tần số – tần suất ghép lớp
III Biểu đồ
Biểu đồ hình cột Biểu đồ hình quạt Đường gấp khúc
IV Các số đặc trưng của mẫu số liệu
1 Số trung bình
Với mẫu số liệu kích thước N là x x1 2, , ,x N:
x
N
1 2
Với mẫu số liệu được cho bởi bảng phân bố tần số:
n x n x n x k k
x
N
1 1 2 2
Với mẫu số liệu được cho bởi bảng phân bố tần số ghép lớp:
n c n c n c k k
x
N
1 1 2 2
[x 1 ; x 2 ) n 1 f 1
[x 2 ; x 3 ) n 2 f 2
[x k ; x k+1 ) n k f k
N 100 (%)
x 1 n 1 f 1
x 2 n 2 f 2
… … …
x k n k f k
N 100 (%)
Trang 62 Số trung vị
Giả sử ta có một mẫu gồm N số liệu được sắp xếp theo thứ tự không giảm (hoặc không tăng) Khi đó số trung vị Me là:
– Trung bình cộng của hai số đứng giữa nếu N chẵn
3 Mốt
Mốt của một bảng phân bố tần số là giá trị có tần số lớn nhất và được kí hiệu là M O
Chú ý:
– Số trung bình của mẫu số liệu được dùng làm đại diện cho các số liệu của mẫu – Nếu các số liệu trong mẫu có sự chênh lệch quá lớn thì dùng số trung vị làm đại diện cho các số liệu của mẫu
– Nếu quan tâm đến giá trị có tần số lớn nhất thì dùng mốt làm đại diện Một mẫu
số liệu có thể có nhiều mốt
4 Phương sai và độ lệch chuẩn
Để đo mức độ chênh lệch (độ phân tán) giữa các giá trị của mẫu số liệu so với số trung bình ta dùng phương sai s2 và độ lệch chuẩn s s2
Với mẫu số liệu kích thước N là x x1 2, , ,x N:
x x
2
2
( )
Với mẫu số liệu được cho bởi bảng phân bố tần số, tần suất:
2
2
2
Với mẫu số liệu được cho bởi bảng phân bố tần số, tần suất ghép lớp:
2
2
2
(c i , n i , f i là giá trị đại diện, tần số, tần suất của lớp thứ I;
N là số các số liệu thống kê N = n1n2 n k )
Chú ý: Phương sai và độ lệch chuẩn càng lớn thì độ phân tán (so với số trung
bình) của các số liệu thống kê càng lớn