BÀI GIẢNG đo lường vị trí trung tâm và độ biến thiên môn THỐNG KÊ NỘI DUNG: 1. Trình bày được định nghĩa, tính chất và thực hiện tính toán và phiên giải các đại lượng đo lường vị trí trung tâm của bộ số liệu 2. Trình bày được định nghĩa, tính chất và thực hiện tính toán và phiên giải các đại lượng đo lường sự phân tán của bộ số liệu.
Trang 1Đo l ường vị trí trung ng v trí trung ị trí trung
Trang 2M c tiêu ục tiêu
1 Trình bày được định nghĩa, tính chất và thực hiện tính
toán và phiên giải các đại lượng đo lường vị trí trung tâm của bộ số liệu
2 Trình bày được định nghĩa, tính chất và thực hiện tính
toán và phiên giải các đại lượng đo lường sự phân tán của bộ số liệu
Trang 4Tóm t t s li u ắt số liệu ố liệu ệu
Đặc trưng chung của bộ số liệu này là gì?
xi
Trang 5Tóm t t s li u ắt số liệu ố liệu ệu
• Thông qua các con số thống kê cơ bản:
Trang 8Trung bình (tt)
Trang 9• Tính toán rất đơn giản
• Giá trị trung bình là duy nhất
• Dễ bị ảnh hưởng bởi các giá trị cực trị của bộ số liệu
• Ví dụ
• Trung bình của 1, 2, và 1.000.000 là 333.334,33, Không thể nói là đại diện
cho bộ số liệu được
• Hoặc giá trị trung bình của 1; 2; 9500; 9600; 9700 và 9900 là 6450.5 !
Trang 10• Trung vị của 1 bộ số liệu là giá trị đứng giữa các quan sát
đó nếu chúng ta xếp các quan sát theo thứ tự.
• Có sự khác biệt giữa giá trị trung vị của bộ số liệu có số
quan sát chẵn và lẻ.
• Ví dụ:
• Trung vị của 1, 3, 15, 16, và 17 (5 số liệu): là 15
• Trung vị của 1, 2, 3, 5, 8, và 9 (6 số liệu): là giá trị trung bình của
Trang 11Trung v (tt) ị trí trung
• Ưu điểm:
• Mỗi bộ số liệu chỉ có duy nhất một giá trị trung vị
• Được dùng thay thế cho giá trị trung bình khi bộ số liệu có phân
bố lệch, có giá trị cực trị (outliers) vì trung vị không bị ảnh hưởng bởi giá trị cực trị
• Nhược điểm
• Giá trị trung vị ít được dùng trong thống kê suy luận
• Bộ số liệu có số quan sát chẵn có cách xác định trung vị khác với
bộ số liệu có quan sát lẻ
Trang 12• Giá trị mode của một tập hợp các quan sát là giá trị có tần số
xuất hiện nhiều nhất trong tập hợp đó
Trang 13Đo l ường vị trí trung ng đ phân tán ộ biến thiên
• Phương sai – Độ lệch chuẩn
• Khoảng
• Phân vị - Khoảng phân vị
Trang 15i i
n
2
2 1
Trang 17Đ l ch chu n ộ biến thiên ệu ẩn
• Điểm yếu của phương sai: đơn vị đo lường bình
phương
• Độ lệch chuẩn (standard deviation – SD, S): lấy căn
của phương sai
Trang 18H s bi n thiên (C.V) ệu ố liệu ến thiên
• Sự biến thiên tương đối của một phân bố và thường dùng để
đo mức độ thuần nhất của phân bố
Trang 19• Chỉ dựa trên giá trị của hai quan sát (lớn nhất và nhỏ nhất), không
đề cập đến sự dao động, biến thiên của các quan sát khác nằm giữa hai quan sát này
• Cỡ mẫu lớn thì giá trị khoảng cũng thường sẽ lớn
Trang 20• Phân vị thứ p (pth) của một bộ số liệu là một giá trị mà p% các
quan sát nhỏ hơn giá trị này và (1-p)% quan sát lớn hơn giá trị
này
• Phiên giải:
• Phân vị 25% của 1 bộ số liệu là 3?
• Phân vị 50% của 1 bộ số liệu là 8?
• Phân vị 75% của 1 bộ số liệu là 11?
Trang 25Kho ng phân v - IQR ảng ị trí trung
• Là khoảng chứa 50% các quan sát có trong tập hợp/ bộ số liệu
• IQR = Q3 – Q1
• Ví dụ: IQR = 6,375 – 2,625 = 3,75
Trang 26Đ ường vị trí trung ng cong phân b chu n ố liệu ẩn
• Các giá trị trung bình, trung vị mà mode là bằng nhau
• Phân tán:
• Khoảng 68% quan sát sẽ nằm trong khoảng 1 độ lệch chuẩn (sd)
quanh giá trị trung bình;
• 95% quan sát nằm trong khoảng 2sd;
• Có 99,7% các quan sát nằm trong khoảng 3sd