Các giá trị thống kê cơ bản• Đo lường vị trí trung tâm trung tâm hoặc giá trị đại diện cho bộ số liệu... Trung v ị• Giá trị trung vị của một tập hợp các quan sát là giá trị đứng giữa cá
Trang 1Đo lường vị trí trung tâm và độ biến thiên
BỘ THỐNG KÊ – DÂN SỐ
Trang 3Các giá trị thống kê cơ bản
• Đo lường vị trí trung tâm (trung tâm hoặc giá trị đại diện cho bộ số liệu)
Trang 4Đo lường sự tập trung
Trung bình Trung vị Mode
Trang 5X X
Trang 6Trung v ị
• Giá trị trung vị của một tập hợp các quan sát là giá
trị đứng giữa các quan sát đó nếu chúng ta xếp các quan sát theo thứ tự.
• Trung vị=giá trị của quan sát thứ (n+1)/2
• Có sự khác biệt giữa giá trị trung vị của bộ số liệu
Trang 7Gi á trị MODE
• Giá trị mode của một tập hợp các quan sát là giá
trị có tần số xuất hiện nhiều nhất trong tập hợp
Trang 8Đo lường độ tập trung
T ại sao lại có các giá trị thống kê dùng để đo lường độ tập trung ??
Chúng có các tính chất, điểm mạnh điểm yếu để giúp
chúng ta hiểu bản chất của tập hợp quan sát.
Trang 9Tính chất giá trị trung bình
• Điểm mạnh
– Tính toán rất đơn giản
– Giá trị trung bình là duy nhất
Trang 10Tính chất của giá trị trung vị
• Điểm mạnh:
– Duy nhất đối với mỗi bộ số liệu
– Đơn giản dễ tính toán
– Tiện dụng trong việc mô tả bộ số liệu bị lệch bởi các quan sát bao gồm cả các quan sát cực lớn hoặc cực nhỏ
– Không bị ảnh hưởng bởi các giá trị quan sát
• Điểm yếu:
– Do việc xác định giá trị trung vị có sự khác biệt giữa bộ số liệu chẵn lẻ do đó nó ít được sử dụng trong các thống kê suy luận
Trang 11So sánh trung bình- Trung vị
Trung bình < Trung vị
Trung bình = Trung vị
Trung bình > Trung vị
Trang 12T ính chất của giá trị Mode
• Điểm mạnh:
– Nếu một bộ số liệu có giá trị mode, thì sẽ rất hữu
dụng cho ta khi mô tả bộ số liệu đó Ví dụ: hầu hết các trường hợp tự tử đều là trẻ em gái tuổi 14-19
• Điểm yếu:
– Có nhiều bộ số liệu không có mode, hoặc có quá
nhiều mode, và trong trường hợp này sử dụng giá trị mode sẽ không có tác dụng gì nhiều
Trang 13Đo lường sự phân tán
KhoảngPhương sai
Độ lệch chuẩnKhoảng phân vị
Trang 14• Giá trị Khoảng là khoảng cách giữa giá trị lớn
nhất và giá trị nhỏ nhất của bộ số liệu
Trang 15n i
i
• n quan sát : x1, x 2 , x n
• Phương sai s 2 được tính bằng:
• Bậc tự do
Trang 18CV 18,2 41,7
100
x s
CV
Trang 19Phân vị
• Một tập hợp các giá trị quan sát : x1, x2, xn
• Giá trị phân vị thứ p - pth là:
– giá trị x
– có p% giá trị quan sát nhỏ hơn pth
– và có (100-p)% giá trị quan sát lớn hơn pth
Trang 20Phân vị (tiếp)
• Phân vị ¼
– Q1= giá trị quan sát thứ (n+1)/4– Q2= giá trị quan sát thứ (n+1)/2– Q3= giá trị quan sát thứ 3(n+1)/4
• Khoảng phân vị
– IQR= Q3-Q1
Trang 21– Chia đôi hình chữ nhật tại vị trí Q2
• Vẽ một đường thẳng từ cạnh trái của hình chữ nhật đến điểm nhỏ nhất
• Vẽ một đường thẳng từ cạnh phải của hình chữ nhật đến điểm lớn nhất
• Nhận xét về độ tập trung và phân tán
Trang 22Ví dụ
• Ví dụ: Bảng số liệu dưới đây thể hiện
đường kính (cm) của khối u được lấy ra từ
20 bệnh nhân ung thư vú.
0,5 1,2 2,1 2,5 2,5 3,0 3,8 4,0
4,2 4,5 5,0 5,0 5,0 5,0 6,0 6,5
7,0 8,0 9,5 13,0
Trang 24• Nhận xét: khoảng 50% giá trị quan sát nằm trong khoảng 2,6 và 6,4 đường kẻ dọc cho thấy rằng trung vị nằm ở giá trị 4,75
Đường kẻ bên phải dài hơn thể hiện rằng phân bố này là một phân bố lệch trái
Trang 25Đọc kết quả phân tích trên
máy tính