KỸ NĂNG KIỂM TRA 1 Chương 3 THỐNG KÊ MÔ TẢ CÁC ĐẠI LƯỢNG SỐ 2 1 CÁC ĐẠI LƯỢNG ĐO LƯỜNG VỊ TRÍ 3 Trung bình o Trung bình ▪ Là đại lượng đo lường vị trí trung tâm của dữ liệu ▪ Được xem là đại lượng qua[.]
Trang 1Chương 3
THỐNG KÊ MÔ TẢ:
CÁC ĐẠI LƯỢNG SỐ
Trang 21 CÁC ĐẠI LƯỢNG ĐO LƯỜNG VỊ TRÍ
Trang 3Trung bình
o Trung bình:
▪ Là đại lượng đo lường vị trí trung tâm của dữ liệu.
▪ Được xem là đại lượng quan trọng nhất để đo lường vị trí.
𝜇 = 𝑥1 + 𝑥2 + 𝑥3 + ⋯ + 𝑥𝑛
σ 𝑥𝑖N
Trang 5o Phương pháp tính trung bình dữ liệu đã phân nhóm:
▪ Trung bình mẫu cho dữ liệu nhóm:
▪ Trung bình tổng thể cho dữ liệu nhóm:
𝜇 = 𝑀1𝑓1 + 𝑀2𝑓2 + 𝑀3𝑓3 + ⋯ + 𝑀𝑛𝑓𝑛
σ 𝑀𝑖𝑓𝑖N
Trung bình (tt)
Trang 6Bảng 3.3: Phân phối tần số thời gian kiểm toán
Thời gian kiểm toán trung bình:
Trang 7Trung vị (𝐌 𝐞 )
o Trung vị:
▪ Là giá trị đứng ở vị trí giữa khi các dữ liệu được sắp xếp theo thứ tự tăng dần
o Phương pháp xác định trung vị:
▪ Đối với một số lẻ của các quan sát, trung vị là giá trị đứng ở chính giữa
▪ Đối với một số chẵn của các quan sát, trung vị là trung bình của hai giá trị đứng ở chính giữa
Ví dụ: Xác định trung vị
▪ Cho số liệu về quy mô sinh viên của 5 lớp học : 50 47 52 60 58
Trang 9▪ Là giá trị mà có ít nhất p% số quan sát có giá trị nhỏ hơn hoặc bằng giá trị phân vị mức
p và có ít nhất (100-p)% số quan sát có giá trị lớn hơn hoặc bằng giá trị phân vị mức p.
▪ Ví du: một sinh viên được 8 điểm môn Thống kê kinh doanh 1, nếu điểm 8 của sinh
viên tương ứng với phân vị thứ 60 thì có nghĩa là sẽ có khoảng 60% số sinh viên có điểm thấp hơn hoặc bằng 8 và có khoảng 40% số sinh viên có điểm cao hơn hoặc bằng 8.
Trang 11Tứ phân vị thứ 2 (Phân vị thứ 50)
Tứ phân vị thứ 3 (Phân vị thứ 75)
Trang 12Mối quan hệ giữa Trung bình, Trung vị, Mode và hình dáng phân phối
o Đại lượng đo lường hình dáng của một phân phối được gọi là Hệ số bất đối xứng (Skewness)
o Công thức tính Skewness cho dữ liệu mẫu:
Trang 132 CÁC ĐẠI LƯỢNG ĐO LƯỜNG
ĐỘ PHÂN TÁN
Trang 14Khoảng biến thiên (R)
o Khoảng biến thiên:
▪ Là chênh lệch giữa giá trị nhỏ nhất và giá trị lớn nhất.
▪ Khoảng biến thiên càng lớn thì dữ liệu biến thiên càng nhiều (và ngược lại).
▪ Tính toán chỉ dựa vào hai giá trị lớn nhất và nhỏ nhất, bỏ qua các giá trị quan sát khác,
Trang 15Độ trải giữa (IQR)
Trang 16▪ Phương sai càng lớn thì dữ liệu biến thiên càng nhiều (và ngược lại).
▪ Khi tính toán đã dựa trên tất cả các giá trị dữ liệu, tuy nhiên đơn vị sẽ bị bình phương và không phù hợp với thực tế.
o Phương sai cho dữ liệu phân nhóm:
Trang 17▪ Độ lệch chuẩn càng lớn thì dữ liệu biến thiên càng nhiều (và ngược lại).
o Độ lệch chuẩn cho dữ liệu phân nhóm:
▪ Phương pháp tính:
• Độ lệch chuẩn tổng thể: 𝜎 = 𝜎2 = σ(𝑀𝑖−𝜇)2𝑓𝑖
𝑁
• Độ lệch chuẩn mẫu: 𝑠 = 𝑠2 = σ(𝑀𝑖− ҧ𝑥)2𝑓𝑖
Trang 18▪ Hệ số biến thiên càng lớn thì dữ liệu biến thiên càng nhiều (và ngược lại).
▪ Hệ số biến thiên rất hữu ích trong việc so sánh độ phân tán của các biến có độ lệch chuẩn khácnhau và trung bình khác nhau
Trang 19o Ví dụ: Dữ liệu về mức lương khởi điểm (nghìn đồng) của một mẫu gồm 12 người trong 1 doanh nghiệp
như sau:
Tính các đại lượng đo lường độ phân tán?
Trang 203 PHÂN TÍCH DỮ LIỆU THĂM DÒ
Trang 22Biểu đồ hộp (Box Plot)
o Biểu đồ hộp:
▪ Là tóm tắt bằng hình vẽ của dữ liệu dựa trên bộ tóm tắt 5 số.
▪ Tác dụng của biểu đồ hộp:
• Nhận biết vị trí của bộ dữ liệu trên cơ sở Trung vị.
• Nhận biết sự dàn trải của dữ liệu trên cơ sở độ dài của hộp (IQR) và độ dài của râu.
• Nhận biết độ lệch phân phối của dữ liệu.
• So sánh 2 hay nhiều bộ dữ liệu với cùng một thước đo.
• Nhận biết giá trị bất thường.
▪ Các bước xây dựng biểu đồ hộp:
• Bước 1: Vẽ trục ngang (hoặc đứng) biểu hiện phạm vi biến thiên của dữ liệu
• Bước 2: Vẽ một hộp với các cạnh nằm ở tứ phân vị thứ 1 (𝐐𝟏) và thứ 3 (𝐐𝟑)
• Bước 3: Đường thẳng được vẽ trong hộp ở vị trí Trung vị.
• Bước 4: Xác định các giới hạn cho biểu đồ hộp là:
✓ Giới hạn dưới: 1,5(IQR) bên trái 𝐐𝟏: 𝐐𝟏-1,5(IQR)
✓ Giới hạn trên: 1,5(IQR) bên phải 𝐐𝟑: 𝐐𝟑+1,5(IQR)
Dữ liệu bên ngoài giới hạn này được xem là giá trị bất thường (giá trị đột biến)
• Bước 5: Vẽ râu:
✓ Râu bên trái: bắt đầu từ cạnh trái 𝐐𝟏 của hộp, kết thúc tại giá trị nhỏ nhất
✓ Râu bên phải: bắt đầu từ cạnh phải 𝐐𝟑 của hộp, kết thúc tại giá trị lớn nhất
Trang 23o Ví dụ: Dữ liệu về mức lương khởi điểm (USD) của một mẫu gồm 12 sinh viên tốt nghiệp ngành QTKD như sau:
3310 3355 3450 3480 3480 3490 3520 3540 3550 3650 3730 3925
Biểu đồ 3.1: Biểu đồ hộp về mức lương khởi điểm của sinh viên ngành QTKD
✓ 𝐐𝟏= 3465 (USD) 𝐐𝟐 = 𝟑𝟓𝟎𝟓 (USD) 𝐐𝟑= 3600 (USD) IQR = 3600 - 3465 = 135 (USD)
✓ Giới hạn dưới: 𝐐𝟏-1,5(IQR) = 3465 – 1,5*135 = 3262,5 (USD)
✓ Giới hạn trên: 𝐐𝟑+1,5(IQR)=3600 + 1,5*135 = 3802,5 (USD)
4000
*
Trang 244 CÁC ĐẠI LƯỢNG ĐO LƯỜNG MỐI LIÊN HỆ GIỮA HAI BIẾN
Trang 25Hiệp phương sai
o Hiệp phương sai:
▪ Là đại lượng đo lường cường độ mối liên hệ tuyến tính giữa hai biến x và y.
• Hiệp phương sai có giá trị dương càng lớn cho thấy mối liên hệ tuyến tính thuận càng mạnh
• Hiệp phương sai có giá trị âm càng lớn cho thấy mối liên hệ tuyến tính nghịch càng mạnh
▪ Hạn chế:
• Bị ảnh hưởng bởi đơn vị đo lường của hai biến x và y.
Trang 26Hệ số tương quan
o Hệ số tương quan Pearson:
▪ Là đại lượng đo lường cường độ mối liên hệ tuyến tính giữa hai biến x và y.
✓ 𝑆𝑥𝑦: hiệp phương sai mẫu
✓ 𝑆𝑥, 𝑆𝑦: độ lệch chuẩn của mẫu x và mẫu y
▪ Tính chất:
• Hệ số tương quan có giá trị từ -1 đến +1, tiến về -1 là tương quan nghịch, tiến về +1 là tương quan thuận.
• Hệ số tương quan càng gần ±1 liên hệ tương quan tuyến tính càng mạnh.
• Hệ số tương quan bằng 0: không có mối liên hệ