Mục tiêu• Tính được các giá trị: trung bình, trung vị, phương sai, độ lệch chuẩn.. • Trình bày được ý nghĩa của những chỉ số: Trung bình, trung vị, phương sai, độ lệch chuẩn... Trung
Trang 1Đo lường vị trí trung tâm và
biến thiên
Lớp CN YTCC K10
Trang 2Mục tiêu
• Tính được các giá trị: trung bình, trung vị,
phương sai, độ lệch chuẩn.
• Trình bày được ý nghĩa của những chỉ số:
Trung bình, trung vị, phương sai, độ lệch
chuẩn.
Trang 3Ví dụ 1
• Số liệu Hemoglobin ở 70 phụ nữ
• Làm thế nào để tóm tắt số liệu này?
Trang 4Tóm tắt số liệu
x i
Trang 6Đo lường độ tập trung
• Trung bình
• Trung vị
• Mode (yếu vị)
Trang 8Trung vị
• Trung vị của 1 bộ số liệu là giá trị đứng giữa các quan sát đó
nếu chúng ta xếp các quan sát theo thứ tự.
• Có sự khác biệt giữa giá trị trung vị của bộ số liệu có số quan
sát chẵn và lẻ.
• Ví dụ:
– Trung vị của 1, 3, 15, 16, và 17 (5 số liệu): là 15
– Trung vị của 1, 2, 3, 5, 8, và 9 (6 số liệu): là giá trị trung bình của
hai giá trị đứng giữa các quan sát đó
Tính trung vị của số liệu ví dụ 1, giải thích ý nghĩa?
Trang 9Mode (yếu vị)
• Giá trị mode của một tập hợp các quan sát là giá trị
có tần số xuất hiện nhiều nhất trong tập hợp đó
Trang 10Tại sao?
• Tại sao lại có các giá trị thống kê khác nhau
dùng để đo lường độ tập trung?
• Vì: Chúng có các tính chất, điểm mạnh điểm
yếu để giúp chúng ta hiểu bản chất của bộ số liệu.
Trang 11Trung bình
• Điểm mạnh
• Điểm yếu
• Trung bình của 1, 2, và 1.000.000 là 333.334,33, Không
thể nói là đại diện cho bộ số liệu được
• Hoặc giá trị trung bình của 1; 2; 9500; 9600; 9700 và
9900 là 6450.5 !
Trang 12Trung vị
• Điểm mạnh
– Duy nhất đối với mỗi bộ số liệu
– Tiện dụng trong việc mô tả độ lệch của các quan sát bao gồm cả các quan sát cực lớn hoặc cực
nhỏ.
• Điểm yếu
– Do việc xác định giá trị trung vị có sự khác biệt giữa bộ số liệu chẵn lẻ do đó nó ít được sử dụng trong các thống kê suy luận
Trang 13Mode (yếu vị)
• Điểm mạnh
– Nếu một bộ số liệu có giá trị mode, thì sẽ rất hữu dụng cho ta khi mô tả bộ số liệu đó Ví dụ: hầu hết các trường hợp tự tử đều là trẻ em gái tuổi 14-19.
• Điểm yếu
– Có nhiều bộ số liệu không có mode, hoặc có quá nhiều mode, và trong trường hợp này sử dụng giá trị mode sẽ không có tác dụng gì nhiều
Trang 14Đo lường độ phân tán
• Khoảng
• Phương sai – Độ lệch chuẩn
• Khoảng phân vị
Trang 15nhất và giá trị nhỏ nhất của bộ số liệu
• Ví dụ
– Khoảng của bộ số liệu 2, 4, 7 là 5.
– Khoảng của bộ số liệu -10, -3, 4 là 14.
• Thông thường trong mô tả: ghi rõ số nhỏ nhất
– số lớn nhất
– Số ngày nằm viện trung bình là 10 ngày (1-50 ngày)
Trang 17x n x n
i i
n
i i
n
2
2 1
Trang 20Độ lệch chuẩn
• Điểm yếu của phương sai: đơn vị đo lường
bình phương
• Độ lệch chuẩn (standard deviation – SD, S):
lấy căn của phương sai
• Tính độ lệch chuẩn của ví dụ 2
Trang 21Ý nghĩa
• Minh họa mức độ phân tán của số liệu
– Khoảng 68% các giá trị quan sát sẽ nằm trong
khoảng (trung bình ± s)
– Khoảng 95% các giá trị quan sát nằm trong
khoảng (trung bình ± 2s)
– Hầu hết nằm trong khoảng (trung bình ± 3s)
Minh họa mức độ phân tán của ví dụ 2
Trang 22Ví dụ 3
• Khoảng bách phân vị trong theo dõi dinh
dưỡng trẻ em
• Phân vị là gì?
Trang 23Phân vị
• Mô tả tỷ lệ số liệu có giá trị dưới giá trị phân
vị
• Phiên giải:
– Phân vị 25% của 1 bộ số liệu là 3?
– Phân vị 50% của 1 bộ số liệu là 8?
– Phân vị 75% của 1 bộ số liệu là 11?
– Phân vị 100%?
Trang 24Ví dụ 4
0.5 1.2 2.1 2.5 2.5 3.0 3.8 4.0 4.2 4.5 5.0 5.0 5.0 5.0 6.0 6.5 7.0 8.0 9.5 13.0
Đường kính (tính bằng cm) của khối u Sarcomas được lấy ra từ ngực của 20 phụ nữ
-Nhận xét bộ số liệu
Tính phân vị 25%, 50%, 75%
Vấn đề?
Trang 27Hai bước tính phân vị
• Tìm vị trí của phân vị
• Tính phân vị
Trang 30(a) Giá trị trung bình, trung vị, mode, phương sai, độ lệch
Trang 31– Phương sai – Độ lệch chuẩn
– Khoảng phân vị - Biểu đồ Box-Whisher
Áp dụngcho cácbiến sốđịnh lượng