Data visualization trực quan hóa dữ liệu slide cua mot mon trong do co he luat dan cuat dh cong ngeh thong tinThis section is largely based on Sowa’s Conceptual Structures;Sussman and Abelsons’s SICP, Suppe’s Introduction to Logic, Parteeet al’s Mathematical Methods in Linguistics, Cruse’s LexicalSemantics and Thinking about Android Epistemology.
Trang 1Data Visualization
Họ tên : Nguyễn Trọng Ngô Việt Du MSSV :12520565
GVHD : GV Đổ Văn Tiến Lớp :CS338.K21
Nhận Dạng
Trang 2Data Visualization
Khái Niệm : trực quan hóa
Mục đích :biến các nguồn dữ liệu qua Data Visualization để người
xem, người đọc dễ nhận biết nhất
Sử dụng :Data Visualization thường được sử dụng sau khi có kết quả
phân tích từ dữ liệu
Trang 31/Dữ Liệu trong Data Visualization
Dữ liệu định tính (Qualitative Data)
Dữ liệu định tính phản ánh tính chất, hay loại hình, không có biểu hiện trực tiếp bằng con số
Dữ liệu định lượng (Quantitative Data)
biểu hiện trực tiếp bằng con số
Trang 4Dữ liệu định tính (Qualitative Data)
(Bar chart/ Column chart), biểu đồ tròn (Pie chart), biểu đồ Parento
Ví Dụ:
Trang 5Dữ liệu định tính (Qualitative Data)
Trang 6Dữ liệu định lượng (Quantitative Data)
Ví Dụ: độ tuổi của 30 sinh viên đang học tại trường
28 22 25 21 26 24 23 30 31 33 19 20 22 27 30 19 28 31 22 27 37 35 22 19 22 23 26 28 25 36
Trường hợp dữ liệu định lượng
ít
biểu đồ thân và lá
Trang 7Dữ liệu định lượng (Quantitative Data)
Trường hợp dữ liệu định lượng được thu thập nhiều hơn
Histogram ,Frequency Polygon, Dot Plot
- Với h là trị số khoảng cách tổ/nhóm
- Xmax là giá trị lớn nhất
- Xmin là giá trị nhỏ nhất
- K là số tổ K = (2 x n) x 1/3, với n là tổng số quan sát.
Trang 8Dữ liệu định lượng (Quantitative Data)
VD: năng suất lúa của 50 hộ dân (tạ/ha)
K = (2 x 50) x 1/3 = 4.64 Khoảng cách xấp xỉ 5
h = (54 – 30) / 5 = 4.8 xấp xỉ 5 tổ.
Trang 9Dữ liệu định lượng (Quantitative Data)
Trang 10Những dạng biểu đồ, đồ thị khác nhau trong Data
Visualization
Comparison: muốn biết sự hơn kém giữa các đối tượng
Composition: muốn biết cụ thể về từng thành phần cấu tạo và
mỗi thành phần ấy chiếm tỷ lệ như thế nào
Distribution: muốn xem xét về phân phối dữ liệu, mức độ phân tán,
mức độ tập trung của dữ liệu hay xác định các điểm bất thường,
giá trị ngoại lệ của dữ liệu
Trend: muốn tìm hiểu về xu hướng biến động của đối tượng
Relationship/Correlation: muốn tìm hiểu về mối liên hệ,
tương quan giữa 2 hay nhiều đối tượng
Trang 11Bar/ Column chart (biểu đồ cột)
•So sánh các giá trị của một đối tượng
•So sánh giữa các đối tượng khác nhau theo thời gian
•So sánh các thành phần khác loại có trong một nhóm, một tập hợp
•Biểu đồ cột đứng nếu không có quá nhiều đối tượng để so sánh
•Biểu đồ cột ngang được sử dụng khi nhãn, tên của các đối tượng quá dài, hay số đối tượng so sánh nhiều (nhiều hơn 10)
Trang 12Line Graph (Biểu đồ đường)
•Muốn tìm hiểu về xu hướng tăng giảm, mức
độ biến động của dữ liệu
•So sánh, tìm hiểu mức độ liên hệ giữa các đối
tượng khác nhau ở những tập dữ liệu khác nhau
Trang 13Pie chart, Stacked Column/ Bar chart
Mục đích sử dụng để tìm ra thành phần nào chiếm tỷ lệ cao nhất,
bé nhất hay so sánh giữa các thành phần với nhau.
Trang 14Scatter plot
Scatter plot hiển thị mối quan hệ giữa hai biến định lượng khác nhau
hoặc nó có thể thể hiện xu hướng phân phối của dữ liệu, ngoài ra còn có thể tìm ra các giá trị ngoại lệ, và kiểm tra tính tương đồng của các bộ dữ liệu
Trang 15Cảm ơn các bạn đã lắng nghe