Chương 4 TÓM TẮT DỮ LIỆU BẰNG CÁC ĐẠI LƯỢNG SỐ Ths.. Nguyễn Tiến Dũng Viện Kinh tế và Quản lý, Trường ĐH Bách khoa Hà Nội Email: dung.nguyentien3@hust.edu.vn... MỤC TIÊU CỦA CHƯƠNG● Sau
Trang 1Chương 4 TÓM TẮT DỮ LIỆU BẰNG CÁC ĐẠI LƯỢNG SỐ
Ths Nguyễn Tiến Dũng Viện Kinh tế và Quản lý, Trường ĐH Bách khoa Hà Nội
Email: dung.nguyentien3@hust.edu.vn
Trang 2MỤC TIÊU CỦA CHƯƠNG
● Sau khi kết thúc chương này, người học có thể:
● Kể tên và biết cách tính các đại lượng đặc trưng cho độ tập trung: trung bình, trung vị, mốt, tứ phân vị, phân vị
● Nói tên và biết cách tính các đại lượng đặc trung cho độ phân tán của tập DL: khoảng biến thiên, độ trải giữa,
phương sai và độ lệch chuẩn
● Nắm được ý nghĩa của hệ số biến thiên
● Phát biểu được quy tắc thực nghiệm và quy tắc
Chebysev về quy luật phân phối của tập DL
● Biết cách vẽ và khám phá đặc điểm của tập DL qua biểu
đồ hộp và râu
● Phân biệt được các tham số tổng thể và tham số mẫu
Trang 3CÁC NỘI DUNG CHÍNH
4.1 Các đại lượng đo lường độ tập trung và phương
pháp mô tả hình dáng tập DL
4.2 Các đại lượng đo lường độ phân tán
4.3 Các đại lượng TK mô tả cho bảng tần số
4.4 Các đại lượng TK mô tả cho tổng thể
4.5 Khám phá DL qua biểu đồ hộp và râu (box plot) 4.6 Sử dụng kết hợp TB và độ lệch chuẩn
4.7 Phân biệt một số cặp khái niệm
Trang 44.1 CÁC ĐẠI LƯỢNG ĐO LƯỜNG ĐỘ TẬP TRUNG VÀ PHƯƠNG PHÁP MÔ TẢ HÌNH DÁNG TẬP DỮ LIỆU
● 4.1.1 Các ĐL đo lường độ tập trung phổ biến
● 4.1.2 Sử dụng Excel để tính các ĐL TK mô tả độ tập trung
● 4.1.3 Nhóm các ĐL khác mô tả sự phân bố của tập DL
● 4.1.4 Hình dáng của phân phối
Trang 54.1.1 Các ĐL đo lường độ tập trung phổ biến
● 4.1.1.1 Trung bình cộng (arithmetic mean)
● 4.1.1.2 Trung vị (Median)
● 4.1.1.3 Mốt (Mode)
● 4.1.1.4 Trung bình nhân (geometric mean)
Trang 64.1.2 Sử dụng Excel để tính các đại lượng TK mô
tả độ tập trung
Standard Deviation 5,078
Sample Variance 25,789
Confidence Level(95,0%) 1,896
Trang 74.1.3 Nhóm các ĐL khác mô tả sự phân bố của tập
dữ liệu
● 4.1.3.1 Tứ phân vị (quartiles)
● 4.1.3.2 Phân vị (percentiles)
Trang 84.2 Các đại lượng đo lường độ phân tán
● 4.2.1 Khoảng biến thiên R
● 4.2.2 Độ trải giữa IQR = Q3 – Q1
● 4.2.3 Phương sai và độ lệch chuẩn của mẫu
Trang 94.3 Các đại lượng TK mô tả cho bảng tần số
● 4.3.1 Trung bình cộng
● 4.3.2 Trung vị
● 4.3.3 Mốt
● 4.3.4 Phương sai và độ lệch chuẩn
Trang 104.4 Các đại lượng TK mô tả cho tổng thể
● 4.4.1 TB cộng của tổng thể
● 4.4.2 Phương sai và độ lệch chuẩn của tổng thể
Trang 114.5 Khám phá DL qua biểu đồ hộp và râu
● Bước 1: Vẽ hộp
● Xác định Q1, Q2, Q3
● Vẽ hình hộp xung quanh
● Vẽ đường qua trung vị
● Bước 2: Vẽ râu trên
● Nếu xmax ≤ Q3 + 1,5.IQR, thì râu trên =
xmax
● Nếu không phải, thì râu trên =
Q3+1,5IQR và vẽ 1 dấu chấm ở vị trí xmax
● Bước 3: Vẽ râu dưới
● Nếu xmin ≥ Q1 – 1,5.IQR, thì râu dưới =
xmin
● Nếu không phải, thì râu dưới = Q1 –
1,5.IQR và vẽ thêm 1 dấu chấm ở vị trí
xmin
Trang 134.6 Sử dụng kết hợp TB và độ lệch chuẩn
● 4.6.1 Hệ số biến thiên CV
● 4.6.2 Quy tắc thực nghiệm
● 4.6.3 Quy tắc Chebysev
● 4.6.4 Chuẩn hoá dữ liệu
Trang 144.6.2 Quy tắc thực nghiệm
● Với phân phối cân
đối, có khoảng
● 68% rơi vào µ±
● 95% rơi vào µ± 2
● 99,7% rơi vào µ± 3
Trang 154.6.3 Quy tắc Chebysev
● Với một phân
phối bất kỳ, luôn
có ít nhất
● (1-1/k2).100%
quan sát rơi vào
khoảng µ± k.
Trang 164.6.4 Chuẩn hoá dữ liệu
● Biến X ~ N(µ; 2) Z ~ N(0; 12)
● hoặc
● Biến X ~ N( 𝑥; 𝑠2) Z ~ N(0; 12)
x
x x z
s
Trang 174.7 Phân biệt một số cặp khái niệm
● Tham số tổng thể và tham số mẫu
● Tham số tổng thể: µ, 2, , p
● Tham số mẫu: 𝑥, s2, s, ps
● Biến thiên và độ lệch chuẩn
● Biến thiên: sự sai lệch giữa giá trị quan sát với TB
● ĐLC: thước đo tổng hợp về sự biến thiên