Bài giảng Tin học ứng dụng nâng cao: Phân tích dữ liệu thống kê cung cấp cho người học các kiến thức: Thống kê mô tả, bảng tần suất, xếp hạng và phần trăm theo nhóm. Mời các bạn cùng tham khảo nội dung chi tiết.
Trang 1v 1.1 - 04/2013
Phân tích dữ liệu thống kê
Trang 2Nội dung
1 Thống kê mô tả
2 Bảng tần suất
3 Xếp hạng và phần trăm theo nhóm
Trang 3Thống kê mô tả
Descriptive Statistics
Trang 4Khái niệm cơ bản (1/2)
• Tổng thể (Populations) - toàn bộ các quan sát có thể có của
một biến với một phân bố xác suất xác định Số phần tử của tổng thế ký hiệu là N
• Mẫu (Sample) - một bộ phận của tổng thể được quan sát nhờ
thì nghiệm hay điều tra để nghiên cứu một tổng thế chưa biết quy luật phân bố xác suất Mẫu gồm hữu hạn n phần tử Số n
được gọi là cỡ mẫu.
• Tần số (Frequency) - Gọi xi là các giá trị quan sát được của
biến ngẫu nhiên X (i = 1, 2, n) Số lần xuất hiện của giá trị xi
trong khối dữ liệu được gọi là tần số của xi và được ký hiệu là fi
Ta có
=
l
∑
Trang 5Khái niệm cơ bản (2/2)
• Tần số tích luỹ (Cumulative Frequency) - Tần số tích luỹ của
một giá trị xi là tổng số tần số của giá trị này với tần số của các giá trị nhỏ hơn xi.
• Số định tâm (Measure of Central Tendency) - Số định tâm của
nhóm dữ liệu là số đại diện cho tất cả các dữ liệu đó, nó thể hiện vai trò trung tâm của nhóm dữ liệu.
• Số phân tán (Measure of Dispersion) - Số phần tán dùng để
thể hiện sự khác biệt giữa các số trong khối dữ liệu đối với số định tâm
• Độ lệch chuẩn (Standard deviation)
• Phương sai (Variance)
Trang 6Thông số thống kê (1/4)
Số trung bình AVERAGE (number1, number2, ) Tính trung bình của các tham số
của nó
Số trung vị MEDIAN (number1, number2, ) Là số mà phân nửa giá trị quan
sát được của khối dữ liệu nhỏ hơn
nó và phân nữa còn lại lớn hơn nó
Số yếu vị MODE (number1, number2, ) Là số có tần số lớn nhất
Phương sai mẫu VAR(number1, number2, ) Là số trung bình số học của bình
phương các độ lệch giữa các lượng biến và số trung bình số học của các lượng biến đó
Trang 7Thông số thống kê (2/4)
Độ lệch chuẩn STDEV (number1, number2, ) Là căn bậc 2 của phương sai
Hàng số Range = XMax - XMin Là sai biệt giữa lượng biến lớn
nhất và lượng biến nhỏ nhất của dãy số
Giá trị nhỏ nhất MIN (number1, number2, ) Giá trị nhỏ nhất của lượng biến
Giá trị lớn nhất MAX (number1, number2, ) Giá trị lớn nhất của lượng biến
Số phần tử COUNT (value1, value2, ) Số phần tử trong mẫu
Thứ hạng RANK (number, ref, order)
order=0 danh sách giảm dầnorder≠0 danh sách tăng dần
Trả về thứ hạng của một số trong danh sách
Trang 8Thông số thống kê (3/4)
Độ bất đối xứng SKEW (number1, number2, ) Độ bất đối xứng được tính bằng
cách lấy moment thứ ba của trị trung bình chia cho độ lệch chuẩn luỹ thừa ba
Độ nhọn KURT (number1, number2, ) Độ nhọn được tính bằng cách lấy
moment thứ tư của trị trung bình chia cho độ lệch chuẩn luỹ thừa bốn
Tìm giá trị nhỏ thứ
k trong mẫu
SMALL (array, k)
SMALL(array, 1) → Số MinSMALL(array, n) → Số Max
Hàm trả về lượng biến nhỏ thứ k trong mẫu có n lượng biến
Tìm giá trị lớn thứ
k trong mẫu
LARGE(array, k)LARGE(array, 1) → Số MaxLARGE(array, n) → Số Min
Hàm trả về lượng biến lớn thứ k trong mẫu có n lượng biến
Trang 9Data_array : tập số liệu Bins_array : các nhóm trong tập số liệu
Trả về tần số xuất hiện các biến
cố trong các khoảng cho trước
Xếp hạng theo
phần trăm
PERCENTRANK (array, x, significance)
array : tập số liệu
x : giá trị cần biết hạngsignificance : số lẻ cần thiết
Trả về hạng của một giá trị trong tập số liệu theo phần trăm trong tập số liệu
Trang 10Descriptive Statistics
Vùng địa chỉ dữ liệu cần
thống kê
Dữ liệu theo hàng hay cột
Vùng địa chỉ dữ liệu được
Trị quan sát lớn/nhỏ thứ k
Trang 11Ví dụ
Trang 12Ví dụ
Trang 13Bảng tần suất
Histogram
Trang 14• Mô tả số lần xuất hiện của một mẫu thông tin trong một tập dữ liệu
• Mỗi mẫu thông tin gọi là bin, mỗi lần số bin lặp lại được hiểu là tần suất xuất
Bấm OK để thực hiện tính toán
Thêm đồ thị tần suất
Trang 15Ví dụ
Trang 16Ví dụ
Trang 17Xếp hạng và phần trăm
theo nhóm Rank and Percentile
Trang 18Rank and Percentile
Dữ liệu theo hàng hay cột
Trang 19Ví dụ
Trang 20Ví dụ
Trang 21Cảm ơn sự chú ý
Câu hỏi ?