1. Trang chủ
  2. » Công Nghệ Thông Tin

Bài giảng Tin học ứng dụng nâng cao: Phân tích dữ liệu thống kê - Lê Viết Mẫn

21 48 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 21
Dung lượng 1,74 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Bài giảng Tin học ứng dụng nâng cao: Phân tích dữ liệu thống kê cung cấp cho người học các kiến thức: Thống kê mô tả, bảng tần suất, xếp hạng và phần trăm theo nhóm. Mời các bạn cùng tham khảo nội dung chi tiết.

Trang 1

v 1.1 - 04/2013

Phân tích dữ liệu thống kê

Trang 2

Nội dung

1 Thống kê mô tả

2 Bảng tần suất

3 Xếp hạng và phần trăm theo nhóm

Trang 3

Thống kê mô tả

Descriptive Statistics

Trang 4

Khái niệm cơ bản (1/2)

• Tổng thể (Populations) - toàn bộ các quan sát có thể có của

một biến với một phân bố xác suất xác định Số phần tử của tổng thế ký hiệu là N

• Mẫu (Sample) - một bộ phận của tổng thể được quan sát nhờ

thì nghiệm hay điều tra để nghiên cứu một tổng thế chưa biết quy luật phân bố xác suất Mẫu gồm hữu hạn n phần tử Số n

được gọi là cỡ mẫu.

• Tần số (Frequency) - Gọi xi là các giá trị quan sát được của

biến ngẫu nhiên X (i = 1, 2, n) Số lần xuất hiện của giá trị xi

trong khối dữ liệu được gọi là tần số của xi và được ký hiệu là fi

Ta có

=

l

Trang 5

Khái niệm cơ bản (2/2)

• Tần số tích luỹ (Cumulative Frequency) - Tần số tích luỹ của

một giá trị xi là tổng số tần số của giá trị này với tần số của các giá trị nhỏ hơn xi.

• Số định tâm (Measure of Central Tendency) - Số định tâm của

nhóm dữ liệu là số đại diện cho tất cả các dữ liệu đó, nó thể hiện vai trò trung tâm của nhóm dữ liệu.

• Số phân tán (Measure of Dispersion) - Số phần tán dùng để

thể hiện sự khác biệt giữa các số trong khối dữ liệu đối với số định tâm

• Độ lệch chuẩn (Standard deviation)

• Phương sai (Variance)

Trang 6

Thông số thống kê (1/4)

Số trung bình AVERAGE (number1, number2, ) Tính trung bình của các tham số

của nó

Số trung vị MEDIAN (number1, number2, ) Là số mà phân nửa giá trị quan

sát được của khối dữ liệu nhỏ hơn

nó và phân nữa còn lại lớn hơn nó

Số yếu vị MODE (number1, number2, ) Là số có tần số lớn nhất

Phương sai mẫu VAR(number1, number2, ) Là số trung bình số học của bình

phương các độ lệch giữa các lượng biến và số trung bình số học của các lượng biến đó

Trang 7

Thông số thống kê (2/4)

Độ lệch chuẩn STDEV (number1, number2, ) Là căn bậc 2 của phương sai

Hàng số Range = XMax - XMin Là sai biệt giữa lượng biến lớn

nhất và lượng biến nhỏ nhất của dãy số

Giá trị nhỏ nhất MIN (number1, number2, ) Giá trị nhỏ nhất của lượng biến

Giá trị lớn nhất MAX (number1, number2, ) Giá trị lớn nhất của lượng biến

Số phần tử COUNT (value1, value2, ) Số phần tử trong mẫu

Thứ hạng RANK (number, ref, order)

order=0 danh sách giảm dầnorder≠0 danh sách tăng dần

Trả về thứ hạng của một số trong danh sách

Trang 8

Thông số thống kê (3/4)

Độ bất đối xứng SKEW (number1, number2, ) Độ bất đối xứng được tính bằng

cách lấy moment thứ ba của trị trung bình chia cho độ lệch chuẩn luỹ thừa ba

Độ nhọn KURT (number1, number2, ) Độ nhọn được tính bằng cách lấy

moment thứ tư của trị trung bình chia cho độ lệch chuẩn luỹ thừa bốn

Tìm giá trị nhỏ thứ

k trong mẫu

SMALL (array, k)

SMALL(array, 1) → Số MinSMALL(array, n) → Số Max

Hàm trả về lượng biến nhỏ thứ k trong mẫu có n lượng biến

Tìm giá trị lớn thứ

k trong mẫu

LARGE(array, k)LARGE(array, 1) → Số MaxLARGE(array, n) → Số Min

Hàm trả về lượng biến lớn thứ k trong mẫu có n lượng biến

Trang 9

Data_array : tập số liệu Bins_array : các nhóm trong tập số liệu

Trả về tần số xuất hiện các biến

cố trong các khoảng cho trước

Xếp hạng theo

phần trăm

PERCENTRANK (array, x, significance)

array : tập số liệu

x : giá trị cần biết hạngsignificance : số lẻ cần thiết

Trả về hạng của một giá trị trong tập số liệu theo phần trăm trong tập số liệu

Trang 10

Descriptive Statistics

Vùng địa chỉ dữ liệu cần

thống kê

Dữ liệu theo hàng hay cột

Vùng địa chỉ dữ liệu được

Trị quan sát lớn/nhỏ thứ k

Trang 11

Ví dụ

Trang 12

Ví dụ

Trang 13

Bảng tần suất

Histogram

Trang 14

• Mô tả số lần xuất hiện của một mẫu thông tin trong một tập dữ liệu

• Mỗi mẫu thông tin gọi là bin, mỗi lần số bin lặp lại được hiểu là tần suất xuất

Bấm OK để thực hiện tính toán

Thêm đồ thị tần suất

Trang 15

Ví dụ

Trang 16

Ví dụ

Trang 17

Xếp hạng và phần trăm

theo nhóm Rank and Percentile

Trang 18

Rank and Percentile

Dữ liệu theo hàng hay cột

Trang 19

Ví dụ

Trang 20

Ví dụ

Trang 21

Cảm ơn sự chú ý

Câu hỏi ?

Ngày đăng: 31/10/2020, 15:32

HÌNH ẢNH LIÊN QUAN

Thêm một bảng kết quả trong đó, kết quả phần trăm  tích luỹ sẽ được sắp xếp  - Bài giảng Tin học ứng dụng nâng cao: Phân tích dữ liệu thống kê - Lê Viết Mẫn
h êm một bảng kết quả trong đó, kết quả phần trăm tích luỹ sẽ được sắp xếp (Trang 14)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm