1. Trang chủ
  2. » Luận Văn - Báo Cáo

tích hợp biến thị giác vào đồ thị nhiều chiều trực quan hóa dữ liệu nhiều biến để cải thiện tính trực quan

68 57 1

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 68
Dung lượng 1,94 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Luận văn “Tích hợp biến thị giác vào đồ thị nhiều chiều trực quan hóa dữ liệu nhiều biến để cải thiện tính trực quan” áp dụng phép tích Descartes để tích hợp biến thị giác với các lớp dấ

Trang 1

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC MỞ THÀNH PHỐ HỒ CHÍ MINH



Phạm Thị Mỹ Thuận

TÍCH HỢP BIẾN THỊ GIÁC VÀO ĐỒ THỊ NHIỀU CHIỀU

TRỰC QUAN HÓA DỮ LIỆU NHIỀU BIẾN

ĐỂ CẢI THIỆN TÍNH TRỰC QUAN

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

TP Hồ Chí Minh, Năm 2019

Trang 2

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC MỞ THÀNH PHỐ HỒ CHÍ MINH



Phạm Thị Mỹ Thuận

TÍCH HỢP BIẾN THỊ GIÁC VÀO ĐỒ THỊ NHIỀU CHIỀU

TRỰC QUAN HÓA DỮ LIỆU NHIỀU BIẾN

ĐỂ CẢI THIỆN TÍNH TRỰC QUAN

Chuyên ngành : Khoa học máy tính

Mã số chuyên ngành : 60.48.01.01

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

Người hướng dẫn khoa học: PGS.TS Trần Vĩnh Phước

TP Hồ Chí Minh, năm 2019

Trang 3

i

LỜI CAM ĐOAN

Tôi cam đoan rằng luận văn “Tích hợp biến thị giác vào đồ thị nhiều chiều trực quan hóa dữ liệu nhiều biến để cải thiện tính trực quan” là bài nghiên cứu của chính tôi

Ngoại trừ những tài liệu tham khảo được trích dẫn trong luận văn này, tôi cam đoan rằng toàn phần hay những phần nhỏ của luận văn này chưa từng được sử dụng để nhận bằng thạc sĩ ở những nơi khác

Không có sản phẩm/nghiên cứu nào của người khác được sử dụng trong luận văn này mà không được trích dẫn theo đúng qui định

Luận văn này chưa bao giờ được nộp để nhận bất kỳ bằng cấp nào tại các trường đại học hoặc cơ sở đào tạo khác

Thành phố Hồ Chí Minh, năm 2019

Phạm Thị Mỹ Thuận

Trang 4

Tôi xin cảm ơn quý thầy cô lãnh đạo, giảng viên, và chuyên viên trường Đại học Mở TP Hồ Chí Minh đã cung cấp những kiến thức quý báu cũng như hỗ trợ cho tôi trong suốt thời gian học tập tại trường

Tôi xin chân thành cảm ơn đến các anh chị trong nhóm nghiên cứu về trực quan hóa đã cùng thảo luận khoa học, hướng dẫn, và hỗ trợ tôi, cũng như những góp

ý quý báu để tôi có thể hoàn thành luận văn này

Cuối cùng tôi xin gửi lời cảm ơn sâu sắc nhất đến những người thân, những đồng nghiệp và thầy cô đã luôn bên cạnh hỗ trợ, động viên và tạo điều kiện thuận lợi nhất để tôi hoàn thành luận văn

Trang 5

iii

TÓM TẮT

Trực quan hóa là một ánh xạ biến đổi dữ liệu thành thông tin hoặc tri thức bằng phương pháp nhìn-hiểu của con người đối với các hình ảnh, đồ thị biểu diễn

dữ liệu trên màn hình máy tính Thách thức về tính hiệu quả của đồ thị biểu diễn tập

dữ liệu là mức độ trực quan của đồ thị, đồ thị có tính trực quan càng cao thì con người càng dễ trích xuất thông tin và/hoặc khai phá tri thức từ dữ liệu Một giải pháp kỹ thuật để nâng cao tính trực quan của đồ thị nhiều chiều biểu diễn dữ liệu nhiều biến là tích hợp biến thị giác vào đồ thị

Luận văn “Tích hợp biến thị giác vào đồ thị nhiều chiều trực quan hóa dữ liệu nhiều biến để cải thiện tính trực quan” áp dụng phép tích Descartes để tích hợp biến thị giác với các lớp dấu hiệu định tính hoặc định lượng nhằm nâng cao tính trực quan của đồ thị Qui trình tích hợp biến thị giác năm bước được đề xuất như sau:

Bước 1: Phân hoạch đồ thị thành những lớp dấu hiệu Mỗi phần tử của đồ thị nhiều chiều được gọi là dấu hiệu (mark) Tại bước này, những dấu hiệu của đồ thị được phân hoạch thành những lớp (tập) dấu hiệu có cùng tính chất hoặc có cùng khoảng giá trị

Bước 2: Thiết lập các biến thị giác phát sinh Căn cứ số lượng và tính chất của các lớp dấu hiệu được phân hoạch, người thiết kế sử dụng các biến thị giác cơ bản để tạo ra các biến thị giác phát sinh là tập con của một biến thị giác cơ bản hoặc tập con của một tích biến thị giác cơ bản

Bước 3: Xử lý phần giao của các lớp dấu hiệu Đặc điểm của các lớp dấu hiệu được phân hoạch là có thể giao nhau hoặc không giao nhau Những dấu hiệu thuộc phần giao của hai lớp phải được tích hợp các biến thị giác sao cho thể hiện được cả hai tính chất của hai lớp

Trang 6

iv

Bước 4: Tích hợp biến thị giác vào các lớp dấu hiệu Mỗi lớp dấu hiệu được tích hợp bởi một dấu hiệu trực quan (phần tử) của biến thị giác phát sinh bằng phép tích Descartes

Bước 5: Hiển thị kết quả Đồ thị nhiều chiều trên khối nhiều chiều sau khi được nâng cao tính trực quan bằng cách tích hợp biến thị giác được ánh xạ vào màn hình phẳng 2D để hiển thị

Qui trình tích hợp biến thị giác của luận văn “Tích hợp biến thị giác vào đồ thị nhiều chiều trực quan hóa dữ liệu nhiều biến để cải thiện tính trực quan” được áp dụng vào tập dữ liệu dịch bệnh tay-chân-miệng tỉnh Bình Dương 2012-2014 như một trường hợp minh họa Trong đó, đồ thị được tích hợp biến thị giác theo tiếp cận định tính để phối hợp các dấu hiệu cùng biến và phân biệt các dấu hiệu khác biến, đồng thời đồ thị cũng được áp dụng tích hợp biến thị giác theo tiếp cận định lượng

để chọn lọc các dấu hiệu max của biến giúp người dùng phát hiện sự tương quan giữa các biến

Trang 7

v

MỤC LỤC

Trang

LỜI CAM ĐOAN i

LỜI CẢM ƠN ii

TÓM TẮT iii

MỤC LỤC v

DANH MỤC HÌNH viii

DANH MỤC BẢNG x

Chương 1 1

GIỚI THIỆU 1

1.1 GIỚI THIỆU 1

1.2 MỤC TIÊU NGHIÊN CỨU 3

1.3 ĐỐI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU 3

1.3.1 Đối tượng nghiên cứu 3

1.3.2 Phạm vi nghiên cứu 3

1.4 PHƯƠNG PHÁP NGHIÊN CỨU 3

1.5 CẤU TRÚC LUẬN VĂN 4

Chương 2 6

TỔNG QUAN VỀ TRỰC QUAN HÓA 6

2.1 CHIẾN LƯỢC BIẾN ĐỔI DỮ LIỆU THÀNH THÔNG TIN / TRI THỨC 6 2.2 HỆ THỐNG TRỰC QUAN HÓA 9

2.2.1 Tiếp cận hai tầng của hệ thống trực quan hóa 9

Trang 8

vi

2.2.2 Tầng cảm nhận trực quan của hệ thống trực quan hóa 10

2.2.3 Tầng kỹ thuật trực quan của hệ thống trực quan hóa 10

2.3 HỆ THỐNG THỊ GIÁC CỦA CON NGƯỜI 11

2.3.1 Con người là một hệ thống thông tin 11

2.3.2 Hệ thống thị giác của con người 12

2.3.3 Luật cảm nhận thông tin của hệ thống thị giác con người 13

2.4 BIẾN DỮ LIỆU 16

2.4.1 Dữ liệu 16

2.4.2 Biến dữ liệu 17

2.4.3 Quan hệ của các biến dữ liệu 17

2.4.4 Mô hình khối biểu diễn dữ liệu nhiều biến 19

2.4.5 Thiết kế đồ thị cấu trúc nhiều biến 21

2.5 TÍNH CHẤT TRỰC QUAN 22

2.6 HIỂN THỊ TRỰC QUAN 24

Chương 3 26

TÍCH HỢP BIẾN THỊ GIÁC VÀO ĐỒ THỊ NHIỀU CHIỀU 26

3.1 GIỚI THIỆU 26

3.2 BIẾN TRỰC QUAN 27

3.2.1 Biến vị trí 27

3.2.2 Biến thị giác 27

3.3 QUI TRÌNH TÍCH HỢP BIẾN THỊ GIÁC 30

3.3.1 Bước 1 Phân hoạch đồ thị thành các lớp dấu hiệu 30

3.3.2 Bước 2 Thiết lập các biến thị giác phát sinh 35

3.3.3 Bước 3 Xử lý phần giao của các lớp dấu hiệu 36

Trang 9

vii

3.3.4 Bước 4 Tích hợp biến thị giác vào các lớp dấu hiệu 37

3.3.5 Bước 5 Hiển thị kết quả 39

3.4 TÓM TẮT 39

Chương 4 41

TÍCH HỢP BIẾN THỊ GIÁC VÀO ĐỒ THỊ BIỂU DIỄN DỮ LIỆU DỊCH BỆNH TAY-CHÂN-MIỆNG 41

4.1 GIỚI THIỆU 41

4.2 ĐỒ THỊ BIỂU DIỄN DỮ LIỆU DỊCH BỆNH TAY-CHÂN-MIỆNG TỈNH BÌNH DƯƠNG 2012-2014 42

4.3 ÁP DỤNG QUI TRÌNH TÍCH HỢP BIẾN THỊ GIÁC VÀO ĐỒ THỊ BIỂU DIỄN DỮ LIỆU DỊCH BỆNH TAY-CHÂN-MIỆNG 44

4.3.1 Bước 1 Phân hoạch đồ thị thành các lớp dấu hiệu 44

4.3.2 Bước 2 Thiết lập tập biến thị giác phát sinh 46

4.3.3 Bước 3 Xử lý phần giao của các lớp dấu hiệu 47

4.3.4 Bước 4 Tích hợp biến thị giác vào các lớp dấu hiệu 47

4.3.5 Bước 5 Hiển thị kết quả 49

4.4 ĐÁNH GIÁ TÍNH TRỰC QUAN CỦA ĐỒ THỊ SAU KHI TÍCH HỢP BIẾN THỊ GIÁC 49

4.5 KẾT QUẢ PHÂN TÍCH TRỰC QUAN 50

Chương 5 51

KẾT LUẬN 51

DANH MỤC CÁC CÔNG TRÌNH ĐÃ CÔNG BỐ 53

TÀI LIỆU THAM KHẢO 54

Trang 10

viii

DANH MỤC HÌNH

Hình 1.1: Hệ thống trực quan hóa ánh xạ dữ liệu thành thông tin và/hoặc tri thức thông qua cảm nhận trực quan của con người 1 Hình 2.1: Dữ liệu được biến đổi thành thông tin và/hoặc tri thức bằng các chiến lược: mô hình toán hoặc trực quan hóa 6 Hình 2.2: Hệ thống trực quan hóa để trích xuất thông tin và/hoặc khai phá tri thức gồm hai tầng là kỹ thuật trực quan và cảm nhận trực quan Tầng kỹ thuật trực quan liên quan đến máy tính và tầng cảm nhận trực quan liên quan đến con người 9 Hình 2.3: Tầng kỹ thuật trực quan của hệ thống trực quan hóa gồm chức năng thiết

kế đồ thị cấu trúc và hiển thị trực quan gồm ánh xạ đồ thị cấu trúc lên màn hình phẳng và tích hợp biến thị giác để nâng cao tính trực quan phù hợp yêu cầu người dùng 11 Hình 2.4: Nguyên lý cảm thụ thông tin bằng mắt (nguồn [13]) 12 Hình 2.5: Ngôi sao quan hệ giữa các nhóm biến dữ liệu 18 Hình 2.6: Kỹ thuật trực quan biểu diễn tập dữ liệu thành đồ thị cấu trúc rồi ánh xạ lên màn hình phẳng thành đồ thị phẳng 24 Hình 3.1: Vận tốc gió có giá trị thực được ánh xạ vào thang cấp độ là những số nguyên 33 Hình 3.2: Hàm truyền biểu diễn quan hệ giữa giá trị thực và cấp độ giá trị nguyên của biến dữ liệu 34 Hình 3.3: Cực đại và cực tiểu của một đồ thị 35

Trang 11

ix

Hình 4.1: Khối nhiều chiều phi không gian được dùng để biểu diễn dữ liệu dịch bệnh tay-chân-miệng ở tỉnh Bình Dương 43 Hình 4.2: Các lớp dấu hiệu của đồ thị biểu diễn dữ liệu dịch bệnh tay-chân-miệng ở tỉnh Bình Dương được phân hoạch theo ba cấp 44 Hình 4.3: Giản đồ Venn biểu diễn quan hệ tập của các lớp dấu hiệu được phân hoạch từ đồ thị biểu diễn tập dữ liệu dịch bệnh tay-chân-miệng ở tỉnh Bình Dương 45 Hình 4.4: Đồ thị biểu diễn tập dữ liệu dịch bệnh tay-chân-miệng tỉnh Bình Dương 2012-2014 đã được tích hợp biến thị giác, gồm các dấu hiệu biểu diễn số bệnh nhân (red), lượng mưa (blue), độ ẩm (green), nhiệt độ (orange) 49

Trang 12

x

DANH MỤC BẢNG

Bảng 2.1: Bảng phân loại dữ liệu dựa vào thuộc tính 17 Bảng 3.1: Bảng tóm tắt các biến thị giác và minh họa các phần tử của biến (nguồn [6]) 28

Trang 13

1

Chương 1 GIỚI THIỆU

1.1 GIỚI THIỆU

Trực quan hóa là một ánh xạ biến đổi dữ liệu thành thông tin và/hoặc tri thức thông qua cảm nhận bằng thị giác của con người Nói cách khác, trực quan hóa biến đổi dữ liệu từ các dạng, các cấu trúc khác nhau thành hình ảnh để con người có thể cảm nhận thông tin và/hoặc tri thức qua hệ thống thị giác bằng phương pháp nhìn-hiểu Hệ thống trực quan hóa gồm hai tầng, kỹ thuật trực quan và cảm nhận trực quan (Hình 1.1) Tầng kỹ thuật trực quan sử dụng khả năng của máy tính để tạo ra những hình ảnh, đồ thị biểu diễn dữ liệu trên màn hình phẳng hỗ trợ người dùng cảm nhận thông tin / tri thức ẩn chứa trong dữ liệu Nhiều phần mềm thương mại đã

và đang được phát triển để hiển thị dữ liệu như những đồ thị với những kiểu hệ tọa

độ khác nhau, tọa độ trực giao, tọa độ song song, tọa độ trụ, glyphs, v.v

Hình 1.1: Hệ thống trực quan hóa ánh xạ dữ liệu thành thông tin và/hoặc tri thức thông

qua cảm nhận trực quan của con người

Trang 14

2

Triết lý “Tổng thể thì nhiều hơn tổng cộng của các hợp phần” đã thúc đẩy cho nhóm trực quan hóa của chúng tôi, tại Việt Nam, nghiên cứu biểu diễn trực quan tập dữ liệu trên một đồ thị Phương pháp biểu diễn tập dữ liệu trên một đồ thị

hỗ trợ người dùng trả lời được nhiều câu hỏi phân tích dữ liệu tại những mức sơ cấp, mức toàn cục, và mức quan hệ Một đồ thị biểu diễn đầy đủ các biến dữ liệu và

dữ liệu giúp người dùng phát hiện sự tương quan giữa các biến dữ liệu Nói cách khác, đồ thị nhiều chiều biểu diễn tập dữ liệu không chỉ hỗ trợ người dùng trích xuất thông tin mà còn có thể phát hiện những qui luật mới để cung cấp vào kho tàng tri thức của con người

Thách thức khoa học xảy ra khi áp dụng triết lý này là tính trực quan của đồ thị bị suy giảm khi số chiều và/hoặc dung lượng dữ liệu tăng lên Sự suy giảm trực quan của đồ thị tác động đến khả năng trích xuất thông tin, khai phá tri thức mới từ

dữ liệu Nói cách khác, sự suy giảm trực quan làm giảm tính hiệu quả của đồ thị biểu diễn dữ liệu trong việc trích xuất thông tin, khai phá tri thức Sự hạn chế về kích thước, độ phân giải, độ dài biến của màn hình làm suy giảm tính chọn lọc và tính phối hợp trực quan Sự hạn chế về khả năng cảm nhận thông tin bằng phương pháp nhìn-hiểu của con người dẫn đến những đòi hỏi một đồ thị biểu diễn dữ liệu phải được cảm nhận dễ dàng theo các tính chất trực quan

Ý tưởng của luận văn “Tích hợp biến thị giác vào đồ thị nhiều chiều trực quan hóa dữ liệu nhiều biến để cải thiện tính trực quan” là tích hợp biến thị giác vào

đồ thị biểu diễn tập dữ liệu để cải thiện tính trực quan của đồ thị, nâng cao hiệu quả của đồ thị trực quan trong việc trích xuất thông tin và/hoặc khai phá tri thức Một đồ thị biểu diễn dữ liệu có tính trực quan cao giúp người dùng cảm nhận tốt hơn thông tin và tri thức ẩn chứa trong dữ liệu Người dùng trả lời tốt những câu hỏi phân tích

dữ liệu để trích xuất thông tin, khai phá tri thức khi đồ thị biểu diễn dữ liệu có tính trực quan phù hợp với tính chất của dữ liệu và đáp ứng yêu cầu cảm nhận của người dùng để thực hiện bài toán phân tích dữ liệu

Trang 15

3

1.2 MỤC TIÊU NGHIÊN CỨU

Luận văn “Tích hợp biến thị giác vào đồ thị nhiều chiều trực quan hóa dữ liệu nhiều biến để cải thiện tính trực quan” nghiên cứu và hệ thống hóa các phương pháp tích hợp biến thị giác vào đồ thị biểu diễn dữ liệu nhằm nâng cao hiệu quả của đồ thị trong việc trích xuất thông tin, khai phá tri thức từ dữ liệu bằng phương pháp trực quan, nhìn-hiểu

1.3 ĐỐI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU

1.3.1 Đối tượng nghiên cứu

 Quan hệ giữa các biến dữ liệu

 Đồ thị nhiều chiều

 Biến thị giác

 Hệ thống thị giác của con người

 Phương pháp tích hợp biến thị giác

1.3.2 Phạm vi nghiên cứu

Áp dụng cho một trường hợp nghiên cứu trong lĩnh vực y tế

1.4 PHƯƠNG PHÁP NGHIÊN CỨU

- Phương pháp phân tích Luận văn áp dụng phương pháp phân tích để phân hoạch các dấu hiệu biểu diễn dữ liệu thành những lớp dấu hiệu định tính hoặc định lượng

- Phương pháp hình học Luận văn áp dụng phương pháp hình học để mô tả cấu trúc đồ thị biểu diễn tập dữ liệu

Trang 16

4

- Phương pháp đại số Luận văn áp dụng phương pháp đại số để mô tả các lớp dấu hiệu được phân hoạch và tích hợp biến thị giác vào đồ thị biểu diễn tập dữ liệu nhiều biến

1.5 CẤU TRÚC LUẬN VĂN

Luận văn được bố cục thành năm chương như sau:

Chương một Giới thiệu

Chương một nêu những thách thức khi con người nhìn đồ thị biểu diễn tập dữ liệu để hiểu ý nghĩa và tri thức ẩn chứa bên trong tập dữ liệu đó Từ những thách thức đó, luận văn đặt mục tiêu nghiên cứu, nêu ra những phương pháp nghiên cứu chính

Chương hai Tổng quan về trực quan hóa

Chương hai đề cập đến một chiến lược phân tích dữ liệu được phát triển hiện nay là phân tích trực quan, trong đó, dữ liệu với nhiều kiểu khác nhau được biểu diễn thành đồ thị để con người có thể cảm nhận nội dung ẩn chứa trong đó bằng phương pháp nhìn-hiểu Nội dung của chương liên quan đến những khái niệm về hệ thống trực quan hóa Những đặc điểm cảm nhận thông tin và tri thức bằng thị giác của con người được phân tích trong các trường hợp khác nhau Những tính chất của

dữ liệu, biến dữ liệu, và quan hệ gữa các biến dữ liệu được phân tích để đề xuất mô hình các loại khối biểu diễn dữ liệu nhiều biến Tổng hợp các lý luận về đánh giá tính trực quan của đồ thị và nghiên cứu biến thị giác để làm công cụ tăng tính trực quan của đồ thị

Chương ba Tích hợp biến thị giác vào đồ thị nhiều chiều

Chương ba xây dựng qui trình tích hợp biến thị giác vào đồ thị nhằm nâng cao tính trực quan của đồ thị nhiều chiều biểu diễn tập dữ liệu nhiều biến Chương ba

Trang 17

và phân hoạch các dấu hiệu biểu diễn giá trị của dữ liệu thành những lớp dấu hiệu theo định tính hoặc định lượng Kết quả sau khi tích hợp các biến thị giác vào các lớp dấu hiệu là một đồ thị có tính trực quan cao hơn, biểu diễn tập dữ liệu dịch bệnh tay-chân-miệng ở tỉnh Bình Dương giai đoạn 2012-2014 Nhìn vào đồ thị có tính trực quan cao này, người dùng dễ dàng phát hiện sự tương quan của số bệnh nhân với lượng mưa và độ ẩm vì thấy các giá trị cực đại của các biến này xuất hiện đồng thời

Chương năm Kết luận

Chương năm tóm tắt những kết quả đạt được của luận văn là thiết kế qui trình tích hợp biến thị giác vào đồ thị nhiều chiều để làm tăng tính trực quan, và áp dụng minh họa qui trình này cho đồ thị biểu diễn tập dữ liệu dịch bệnh tay-chân-miệng tỉnh Bình Dương 2012-2014 Một kết quả không kém phần quan trọng của luận văn nữa là hệ thống hóa các đặc điểm quan hệ giữa tính chất của dữ liệu với khả năng cảm nhận bằng thị giác của con người

Trang 18

6

Chương 2 TỔNG QUAN VỀ TRỰC QUAN HÓA

2.1 CHIẾN LƯỢC BIẾN ĐỔI DỮ LIỆU THÀNH THÔNG TIN / TRI THỨC

Hình 2.1: Dữ liệu được biến đổi thành thông tin và/hoặc tri thức bằng các chiến lược: mô

hình toán hoặc trực quan hóa

Sự phát triển của internet làm cho môi trường trao đổi dữ liệu rộng mở, những dòng dữ liệu luôn tràn ngập trên internet xuất phát từ nhiều nguồn khác nhau,

cứ mỗi 20 tháng thì khối dữ liệu tăng lên gấp đôi hoặc hơn nữa [1] Tốc độ gia tăng khối lượng dữ liệu trên internet ngày nay có thể còn cao hơn nhiều do sự phát triển của công nghệ IoT Từ những dữ liệu được tạo ra bởi những nhà khoa học đến dữ liệu của các cơ quan chính phủ, rồi những doanh nghiệp lớn nhỏ khác nhau cũng tạo cho mình những cơ sở dữ liệu kết nối vào internet Sự phát triển của khoa học vũ trụ

và công nghệ ứng dụng giúp con người nhận ít nhất một ảnh từ vệ tinh cứ mỗi giây Công nghệ IoT kết nối các cảm biến thu thập dữ liệu về thời tiết, môi trường, và vô

số camera được lắp đặt khắp nơi trên mặt đất, từ cơ quan an ninh, công sở đến nhà ở cũng cung cấp vô số dữ liệu Tài nguyên dữ liệu trên internet đã và đang gia tăng

Trang 19

7

cực nhanh trong vài năm gần đây Bài toán đặt ra là làm thế nào để không lãng phí tài nguyên dữ liệu đồ sộ này Trích xuất thông tin và/hoặc khai phá tri thức trong các nguồn dữ liệu để mang lại lợi ích cho cá nhân, tập thể, quốc gia, hoặc toàn nhân loại là mục tiêu của nhiều nhà khoa học và tổ chức khoa học [2]

Về phương diện khoa học và kỹ thuật, khoa học dữ liệu (data science) xây dựng cơ sở lý luận và phát triển các công nghệ biến đổi dữ liệu thành thông tin và/hoặc tri thức Đến nay, có hai chiến lược chính để phân tích dữ liệu thành thông tin và/hoặc tri thức là mô hình toán và trực quan hóa (Hình 2.1) [3] Chiến lược mô hình toán xây dựng các thuật toán và triển khai trên máy tính để phân tích dữ liệu, tìm kiếm thông tin và/hoặc tri thức mới ẩn chứa trong dữ liệu mà không cần sự tham gia của người dùng Chiến lược trực quan hóa đòi hỏi sự đóng góp của người dùng, máy tính được sử dụng như phương tiện hỗ trợ khả năng cảm nhận và nhận biết của con người

- Mô hình toán: Mô hình thống kê là mô hình kinh điển với những thuật toán luôn được cập nhật theo nhu cầu phân tích dữ liệu hoặc theo tính chất đa dạng của dữ liệu Chiến lược phân tích dữ liệu bằng mô hình thống kê sử dụng máy tính để có kết quả, tri thức của người phân tích không được sử dụng trong tiến trình tạo ra kết quả Chiến lược này đang gặp phải một thách thức là không có sẵn đủ mô hình toán đáp ứng sự đa dạng của dữ liệu cũng như sự đa dạng của các bài toán phân tích Mặt khác, khi áp dụng các mô hình thống kê để phân tích dữ liệu còn có yêu cầu phải hiệu chỉnh mô hình cho phù hợp với từng loại bài toán cụ thể Ngày nay, mô hình trí tuệ nhân tạo cũng được nhiều nhà khoa học áp dụng để phân tích dữ liệu, đặc biệt là những mô hình áp dụng học sâu (deep learning) Cả hai mô hình thống kê và mô hình trí tuệ nhân tạo có đặc điểm chung là được xây dựng theo loại dữ liệu và kiểu bài toán đã và

Trang 20

Nổi lên từ đầu thế kỷ 21, nhóm các nhà khoa học do Andrienko chủ trì

đã bắt đầu triển khai nhiều bài toán phân tích trực quan, nhóm Andrienko tận dụng khái niệm khối không gian - thời gian (Space-time Cube) đề xuất bởi Hagerstrand năm 1970 để biểu diễn đối tượng di chuyển [7] Andrienko cũng đã cải biên tam giác quan hệ What-Where-When của Peuquet [8] thành tam giác Object-Location-Time [9] để biểu diễn và phân tích đối tượng không gian – thời gian, đặc biệt là đối tượng di chuyển [10, 11] trên một khối không gian – thời gian Các công trình của nhóm Andrienko không quan tâm đến việc biểu diễn sự biến thiên những thuộc tính của đối tượng theo không gian hoặc thời gian Nhóm nhà khoa học do Kraak chủ trì biểu diễn đối tượng không gian – thời gian trên hai khối, khối không gian – thời gian biểu diễn quan hệ Object-Location-Time và khối thuộc tính - không gian biểu diễn quan hệ Attribute-Location [12] Trong khi đó, luận án tiến sĩ của Nguyễn Thị Hồng dưới

sự hướng dẫn của PGS.TS Trần Vĩnh Phước áp dụng triết lý “Tổng thể thì nhiều hơn tổng cộng” để biểu diễn tập dữ liệu bằng một đồ thị trực

Trang 21

đến máy tính và tầng cảm nhận trực quan liên quan đến con người

Tận dụng những tính chất ưu việt của mỗi chiến lược, ngày nay, nhiều hệ thống sử dụng kết hợp hai chiến lược để trích xuất thông tin / khai phá tri thức từ dữ liệu: mô hình toán và phân tích trực quan

2.2 HỆ THỐNG TRỰC QUAN HÓA

2.2.1 Tiếp cận hai tầng của hệ thống trực quan hóa

Theo quan điểm toán học, một hệ thống trực quan hóa là một hệ thống ánh

xạ dữ liệu thành thông tin và/hoặc tri thức Hệ thống trực quan hóa cơ bản gồm hai tầng, tầng kỹ thuật trực quan và tầng cảm nhận trực quan Tầng kỹ thuật trực quan

sử dụng khả năng của máy tính để biến đổi dữ liệu các dạng khác nhau thành đồ thị Tầng cảm nhận trực quan sử dụng khả năng của hệ thống thị giác con người để cảm nhận thông tin và/hoặc tri thức ẩn chứa trong dữ liệu được trình bày như đồ thị Hệ

Trang 22

10

thống trực quan hóa biến đổi dữ liệu thành tri thức bằng cách giữ con người trong tầng cảm nhận trực quan của hệ thống Nói cách khác, trong hệ thống trực quan hóa, con người và máy tính hợp tác với nhau để trích xuất thông tin, khai phá tri thức từ

dữ liệu

2.2.2 Tầng cảm nhận trực quan của hệ thống trực quan hóa

Con người giữ vai trò chính trong tầng cảm nhận trực quan Tại đó, chính người dùng nhìn đồ thị trực quan trình bày trên màn hình để cảm nhận và trích xuất thông tin hoặc khai phá tri thức ẩn chứa trong dữ liệu Người dùng có thể tương tác với máy tính để có thể nhìn-hiểu đồ thị biểu diễn trực quan dữ liệu Kết quả này phụ thuộc vào khả năng mô tả dữ liệu của đồ thị trực quan trước mắt người dùng và khả năng cảm nhận thị giác cũng như tri thức và trải nghiệm của người dùng Một hệ thống trực quan tốt là hệ thống trích xuất được nhiều thông tin và khai phá được nhiều tri thức Một đồ thị trực quan biểu diễn tập dữ liệu được đánh giá là hữu hiệu khi đồ thị đáp ứng cao các tính trực quan hỗ trợ tốt cho sự cảm nhận của hệ thống thị giác con người trong các bài toán phân tích dữ liệu

2.2.3 Tầng kỹ thuật trực quan của hệ thống trực quan hóa

Tầng kỹ thuật trực quan biến đổi dữ liệu bảng nhiều biến thành đồ thị nhiều chiều có tính trực quan cao phù hợp với khả năng cảm nhận và nhận biết thông tin hoặc tri thức ẩn chứa trong dữ liệu Như vậy, tầng kỹ thuật trực quan được thực hiện trên máy tính với hai chức năng, chức năng thiết kế đồ thị cấu trúc và chức năng hiển thị trực quan Chức năng thiết kế đồ thị cấu trúc biến đổi tập dữ liệu nhiều biến

có cấu trúc bảng thành đồ thị nhiều chiều có cấu trúc dạng khối Về phương diện toán học, đồ thị cấu trúc được thiết kế theo quan hệ hàm của các biến dữ liệu Chức năng hiển thị trực quan ánh xạ đồ thị cấu trúc lên màn hình phẳng và tích hợp biến thị giác vào các dấu hiệu của đồ thị phẳng để nâng cao tính trực quan của đồ thị hỗ trợ khả năng cảm nhận bằng thị giác của con người

Trang 23

11

Hình 2.3: Tầng kỹ thuật trực quan của hệ thống trực quan hóa gồm chức năng thiết kế đồ thị cấu trúc và hiển thị trực quan gồm ánh xạ đồ thị cấu trúc lên màn hình phẳng và tích hợp biến thị giác để nâng cao tính trực quan phù hợp yêu cầu người dùng

2.3 HỆ THỐNG THỊ GIÁC CỦA CON NGƯỜI

2.3.1 Con người là một hệ thống thông tin

Theo quan điểm thông tin, con người được ví như một hệ thống thông tin thu thập dữ liệu qua các giác quan Trong đó, mỗi giác quan là một hệ thống thu thập dữ liệu, não bộ giữ vai trò trung tâm xử lý và phân tích tổng hợp nhiều loại dữ liệu khác nhau Hệ thống thị giác thu thập dữ liệu thông qua mắt, hệ thống thính giác thu thập dữ liệu thông qua tai, hệ thống xúc giác thu thập dữ liệu thông qua da, hệ thống khứu giác thu thập dữ liệu thông qua mũi, và hệ thống vị giác thu thập dữ liệu thông qua lưỡi

Con người cảm nhận về thế giới thực bằng năm giác quan: thị giác, thính giác, xúc giác, khứu giác, và vị giác Thị giác cảm nhận mọi thực thể trong thế giới thực bằng mắt, thính giác cảm nhận âm thanh trong thế giới thực bằng tai, xúc giác cảm nhận các vật thể trong thế giới thực bằng cách tiếp xúc qua làn da, khứu giác cảm nhận mùi bằng mũi, vị giác cảm nhận vị chua cay đắng ngọt bằng lưỡi Thông tin từ

Trang 24

đó, đồ thị, biểu đồ, sơ đồ được dùng để biểu diễn các loại dữ liệu khác nhau giúp con người cảm thụ nhiều thông tin nhất từ dữ liệu [14] Những loại dữ liệu được thu thập bằng những dạng khác nhau như âm thanh, chữ viết, số, v.v… được chuyển đổi thành dạng đồ thị, biểu đồ, sơ đồ giúp người dùng nhận biết được ý nghĩa của dữ liệu thông qua hệ thống thị giác

2.3.2 Hệ thống thị giác của con người

Hình 2.4: Nguyên lý cảm thụ thông tin bằng mắt (nguồn [13])

Mọi vật thể trong thế giới thực đều phát ra những tia sáng do chính vật thể đó

tự sinh ra hoặc phản chiếu từ nguồn sáng khác (Hình 2.4) Mắt người nhận ra vật thể bởi các tia sáng từ vật thể đến mắt, dữ liệu từ những tia sáng này được hệ thống dây thần kinh dẫn lên não để phân tích hình dạng và màu sắc của vật thể Dữ liệu nhận được từ mắt được dẫn lên não bộ ở hai mức khái quát và chi tiết Tại mức khái

Trang 25

13

quát, não bộ phân tích song song nhanh những đặc tính nổi trội của vật thể Tại mức chi tiết, não bộ phân tích nối tiếp để phát hiện và lưu trữ những chi tiết của vật thể Tiến trình cảm nhận thông tin bằng phương pháp nhìn-hiểu đồ thị trực quan của con người được thực hiện theo các bước sau:

- Cảm nhận toàn thể: Khi nhìn đồ thị, mắt người tiếp nhận những tia sáng đến từ đồ thị để cung cấp cho não bộ xử lý nhanh, não bộ trích xuất thông tin ở mức khái quát, như các hợp phần của đồ thị

- Cảm nhận chi tiết: Sau khi xử lý nhanh để cảm nhận toàn thể, trích xuất thông tin tại mức khái quát, não bộ xử lý chi tiết hơn bằng phương pháp nối tiếp để nhận dạng các biến, đặc tính các biến, và các thành phần chi tiết của đồ thị

- Cảm nhận quan hệ: Phương pháp nhìn-hiểu hoặc là nhìn để hiểu một đồ thị biểu diễn dữ liệu, mỗi người dùng tùy theo kiến thức và trải nghiệm của mình có thể cảm nhận các quan hệ giữa các biến, giữa các thành phần của

đồ thị tại những góc nhìn khác nhau với kỳ vọng phát hiện ra những quan

hệ hoặc qui luật mới

2.3.3 Luật cảm nhận thông tin của hệ thống thị giác con người

Hệ thống thị giác của con người cảm nhận thông tin / tri thức từ thế giới thực hoặc từ những tập dữ liệu mô tả về thế giới thực theo những luật hình dạng còn gọi

là luật gestalt, và những luật không gian Những luật này được áp dụng khi thiết kế

đồ thị cấu trúc để sao cho hệ thống thị giác con người có thể cảm nhận nhiều nhất thông tin ẩn chứa trong dữ liệu

Nhóm luật cảm nhận hình dạng:

Trang 26

14

- Luật vật / nền (objects / background): Luật vật / nền chỉ ra khả năng của hệ thống thị giác con người là nhận dạng hình ảnh những đối tượng được thể hiện trên nền đồng nhất hay không đồng nhất

- Luật tương tự: Luật tương tự chỉ ra khả năng của hệ thống thị giác con người là nhận dạng những vật hoặc hình ảnh những đối tượng, những dấu hiệu giống nhau về hình dạng, ký hiệu, màu sắc, kích thước, hoặc hướng để gom chung thành một nhóm

- Luật gần nhau: Luật gần nhau chỉ ra khả năng của hệ thống thị giác con người

là nhận dạng những vật hoặc hình ảnh những đối tượng hoặc dấu hiệu gần nhau

để gom thành một nhóm Hai đối tượng gần nhau có nhiều quan hệ hơn hai đối tượng xa nhau

- Luật đối xứng: Luật đối xứng chỉ ra khả năng của hệ thống thị giác con người

là nhận dạng những vật hoặc hình ảnh những đối tượng hoặc dấu hiệu đối xứng qua một điểm hoặc một đường ảo để gom thành một nhóm

- Luật liên tục: Luật liên tục chỉ ra khả năng của hệ thống thị giác con người là nhận dạng những vật hoặc hình ảnh những đối tượng hoặc dấu hiệu không liên tục dãy chữ số thẳng hàng hay không thẳng hàng để liên kết chúng lại như một

từ hoặc một câu

- Luật đóng: Luật đóng chỉ ra khả năng của hệ thống thị giác con người là nhận dạng những vật hoặc hình ảnh những đối tượng hoặc dấu hiệu gián đoạn như đường đứt nét để hiểu chúng như một đường liên tục Luật đóng được áp dụng

để làm các hệ thống đèn nhấp nháy mô tả chuyển động

- Luật song song: Luật song song chỉ ra khả năng của hệ thống thị giác con người là nhận dạng những vật hoặc hình ảnh những đối tượng hoặc dấu hiệu song song để gom chung một nhóm

Trang 27

15

- Luật đồng bộ: Luật đồng bộ chỉ ra khả năng của hệ thống thị giác con người là nhận dạng những vật hoặc hình ảnh những đối tượng hoặc dấu hiệu có cùng hành vi thay đổi để gom chung một nhóm, ví dụ những xe di chuyển cùng hướng và cùng thay đổi hướng

- Luật cùng chung vùng: Luật cùng chung vùng chỉ ra khả năng của hệ thống thị giác con người là nhận dạng những vật hoặc hình ảnh những đối tượng hoặc dấu hiệu tọa lạc trong cùng chung vùng có đường biên được xác định thực hoặc

ảo

- Luật điểm nổi trội: Luật điểm nổi trội chỉ ra khả năng của hệ thống thị giác con người là nhận dạng những vật hoặc hình ảnh những đối tượng hoặc dấu hiệu nổi trội trên một nền phức tạp Hệ thống thị giác có khuynh hướng nhìn thấy những dấu hiệu nổi trội trước khi nhìn lan ra xung quanh

- Luật kinh nghiệm: Luật kinh nghiệm chỉ ra khả năng của hệ thống thị giác con người là nhận dạng những vật hoặc hình ảnh những đối tượng hoặc dấu hiệu theo kinh nghiệm đã có trước

Nhóm luật cảm nhận không gian:

- Luật hướng đứng nổi trội: Luật hướng đứng nổi trội chỉ ra khuynh hướng hệ thống thị giác con người nhận dạng vật để đứng dài hơn vật để ngang dù hai vật

có chiều dài thực tế bằng nhau

- Luật quan hệ một phần với toàn thể: Luật quan hệ một phần với toàn thể chỉ ra khuynh hướng hệ thống thị giác con người không chỉ cảm nhận một phần mà còn cảm nhận toàn thể

- Luật bề mặt: Luật bề mặt chỉ ra khuynh hướng hệ thống thị giác con người cảm nhận những mặt không đồng nhất dễ hơn những mặt đồng nhất

Trang 28

- Luật rõ / mờ: Luật rõ / mờ chỉ ra khuynh hướng hệ thống thị giác con người cảm nhận một vật rõ gần hơn vật mờ

- Luật phối cảnh: Luật phối cảnh chỉ ra khuynh hướng hệ thống thị giác con người cảm nhận một vật có chiều sâu, nghĩa là cảm nhận 3D

- Luật thị sai: Luật thị sai chỉ ra khuynh hướng hệ thống thị giác con người khi

di chuyển là cảm nhận vật ở xa di chuyển cùng chiều và vật ở gần di chuyển ngược chiều

2.4 BIẾN DỮ LIỆU

2.4.1 Dữ liệu

Dữ liệu là những số, ký tự, âm thanh, hình ảnh để mô tả về một đối tượng hoặc một hiện tượng một cách định tính và/hoặc định lượng Dữ liệu không cung cấp cho con người nhiều ý nghĩa mong muốn, nhưng chính những ý nghĩa ẩn chứa trong dữ liệu chính là thông tin mà con người muốn có được Theo quan điểm toán học, dữ liệu được phân loại thành dữ liệu định danh, dữ liệu thứ tự, dữ liệu khoảng cách, và dữ liệu tỉ lệ Tính chất của dữ liệu được xác định bằng các phép toán: bằng / khác, lớn hơn / nhỏ hơn, cộng / trừ, nhân / chia (Bảng 2.1) [15, 16]

Trang 29

Dữ liệu thứ tự (Ordinal)

Dữ liệu khoảng cách (Inteval)

Dữ liệu tỉ lệ (Ratio)

dữ liệu gọi là giá trị của biến dữ liệu Những hàng của bảng chứa những giá trị của những biến khác nhau có quan hệ với nhau Về phương diện toán học, mỗi biến dữ liệu được khảo sát như là biến độc lập hoặc biến phụ thuộc

2.4.3 Quan hệ của các biến dữ liệu

Các biến dữ liệu của tập dữ liệu khảo sát được phân thành năm nhóm biến: - nhóm biến đối tượng O, nhóm biến thuộc tính A, nhóm biến thời gian T, nhóm biến không gian (vị trí) mặt đất L2, nhóm biến không gian (vị trí) có độ cao L3 Quan hệ hàm giữa năm nhóm biến này được mô tả như hình sao (Hình 2.5) Trong đó, biến thời gian là biến độc lập được dùng là biến tham chiếu; biến vị trí 2D và biến vị trí 3D có thể là biến độc lập hoặc biến phụ thuộc; biến đối tượng và biến thuộc tính là

Trang 30

18

biến phụ thuộc tham chiếu thời gian hoặc tham chiếu vị trí 2D, vị trí 3D Các quan

hệ mô tả trong hình sao (Hình 2.5) được biểu diễn toán học như sau:

- Quan hệ 1: là quan hệ ánh xạ n-n vì một đối tượng có thể có nhiều thuộc tính, một thuộc tính có thể là tính chất của nhiều đối tượng

- Quan hệ 2: là quan hệ hàm T  O Quan hệ này chỉ đối tượng thời gian hoặc

sự kiện [9]

Hình 2.5: Ngôi sao quan hệ giữa các nhóm biến dữ liệu

- Quan hệ 3: là quan hệ hàm T  L3 Quan hệ này chỉ vị trí trên cao thay đổi theo thời gian khi biểu diễn đối tượng bay

Trang 31

19

- Quan hệ 4: là quan hệ hàm L3  L2 Quan hệ này chỉ hình chiếu trên mặt đất của đối tượng trên cao, mỗi vị trí trên cao có một hình chiếu, nhiều vị trí trên cao có thể có chung một hình chiếu

- Quan hệ 5: là quan hệ hàm L2  A Quan hệ này chỉ thuộc tính thay đổi theo vị trí, ví dụ lượng nhiên liệu trong xe di chuyển thay đổi theo vị trí

- Quan hệ 6: là quan hệ hàm T  A Quan hệ này chỉ định thuộc tính thay đổi theo thời gian

- Quan hệ 7: là quan hệ hàm 1-1, L3  O Quan hệ này chỉ định rằng tại một thời điểm một đối tượng tồn tại tại một vị trí không gian có độ cao và tại một vị trí không gian có độ cao chỉ tồn tại một đối tượng

- Quan hệ 8: là quan hệ hàm, T  L2 Quan hệ này chỉ định vị trí thay đổi theo thời gian của đối tượng di chuyển mặt đất

- Quan hệ 9: là quan hệ hàm, L3  A Quan hệ này chỉ định thuộc tính thay đổi theo vị trí trong không gian có độ cao, ví dụ nhiên liệu của các vật bay

- Quan hệ 10: là quan hệ hàm 1-1, L2  O Quan hệ này chỉ định rằng tại một thời điểm một đối tượng tồn tại tại một vị trí không gian mặt đất và tại một vị trí không gian mặt đất chỉ tồn tại một đối tượng

2.4.4 Mô hình khối biểu diễn dữ liệu nhiều biến

Các quan hệ trong ngôi sao quan hệ giữa các nhóm biến dữ liệu có thể phân thành ba nhóm: nhóm quan hệ tham chiếu biến thời gian T, nhóm quan hệ tham chiếu biến vị trí không gian mặt đất L2, nhóm quan hệ tham chiếu biến vị trí không gian có độ cao L3 Trên cơ sở các quan hệ giữa các nhóm biến dữ liệu được phân tích trong ngôi sao quan hệ giữa các nhóm biến dữ liệu Mô hình khối nhiều chiều biểu diễn dữ liệu nhiều biến được thiết kế thành ba loại tương ứng: khối nhiều chiều

Trang 32

20

phi không gian biểu diễn các biến tham chiếu biến thời gian T, không tham chiếu biến không gian L2 và L3; khối nhiều chiều không gian L2 biểu diễn các biến tham chiếu biến vị trí mặt đất và tham chiếu biến thời gian T nếu có; khối nhiều chiều không gian L3 biểu diễn các biến tham chiếu biến vị trí có độ cao và tham chiếu biến thời gian T nếu có

- Khối nhiều chiều phi không gian: Khối nhiều chiều phi không gian được thiết lập từ một hệ thống những trục tọa độ song song, mỗi trục biểu diễn một thuộc tính, trục tham chiếu chung được xoay thẳng góc với các trục thuộc tính Khi áp dụng khối nhiều chiều phi không gian để biểu diễn các tập dữ liệu tham chiếu thời gian, vấn đề đặt ra là đồng bộ các đơn vị thời gian tham chiếu của các thuộc tính

- Khối nhiều chiều không gian L2: Khối nhiều chiều không gian L2 được thiết lập bằng cách kết hợp khối không gian – thời gian (STC: Space-Time Cube) với khối nhiều chiều phi không gian Trong đó, khối không gian – thời gian là một

hệ tọa độ trực giao ba chiều do Hagerstrand đề xuất năm 1970, gồm hai trục chỉ thị vị trí trên mặt đất và một trục chỉ thị thời gian Các khối không gian – thời gian và khối phi không gian kết hợp lại bằng cách chia sẻ trục thời gian Trục thời gian được nhiều trục tham chiếu cần phải được đồng bộ đơn vị thời gian

- Khối nhiều chiều không gian L3: Khối nhiều chiều không gian L3 được thiết lập bằng cách kết hợp khối không gian – thời gian (STC: Space-Time Cube) với khối không gian có độ cao (không gian 3D) và khối nhiều chiều phi không gian Trong đó, khối không gian – thời gian kết hợp với khối không gian 3D bằng cách chia sẻ hai trục tọa độ chỉ thị vị trí mặt đất kết hợp với khối phi không gian bằng cách chia sẻ trục thời gian Việc đồng bộ hóa đơn vị thời gian và đồng bộ hóa các đơn vị chỉ thị vị trí mặt đất trên các trục dùng chung phải được áp dụng các dấu hiệu của graph cùng được tham chiếu

Trang 33

21

2.4.5 Thiết kế đồ thị cấu trúc nhiều biến

Chức năng thiết kế đồ thị cấu trúc biến đổi tập dữ liệu nhiều biến có cấu trúc bảng thành đồ thị nhiều chiều cấu trúc theo dạng khối mà hệ thống thị giác của con người có thể cảm nhận được Trong tập dữ liệu có cấu trúc bảng, mỗi trường dữ liệu

là một biến dữ liệu mà theo quan điểm hàm toán học, mỗi biến dữ liệu có thể là độc lập hay tham chiếu đến biến dữ liệu khác, gọi là biến tham chiếu Kết quả phân tích quan hệ giữa các nhóm biến dữ liệu trong hình sao (Hình 2.5) cho thấy rằng biến thời gian luôn luôn là biến độc lập được dùng làm biến tham chiếu trong các quan

hệ hàm, biến không gian 2D và biến không gian 3D có thể là biến tham chiếu hoặc

là biến phụ thuộc thời gian, biến đối tượng và biến thuộc tính là những biến phụ thuộc thời gian hoặc vị trí

Kết quả phân tích quan hệ hàm giữa các biến dữ liệu cho phép gom các biến của tập dữ liệu thành các tổ hợp hai hoặc ba, bốn biến dữ liệu có quan hệ để biểu diễn thành những đồ thị hai chiều hoặc ba chiều Trong mỗi tổ hợp biến, biến tham chiếu là biến thời gian hoặc là tích của hai hoặc ba biến chỉ thị vị trí không gian Mỗi đồ thị hai hoặc ba chiều này biểu diễn tính chất định tính và định lượng của thuộc tính Trong đó, những đồ thị hai chiều biểu diễn những tổ hợp hai biến dữ liệu trên các khối nhiều chiều phi không gian, những đồ thị ba chiều biểu diễn những tổ hợp ba hoặc bốn biến dữ liệu trên các khối không gian – thời gian hoặc khối 3D

Đối với những tập dữ liệu phi không gian, đồ thị biểu diễn tập dữ liệu được thực hiện bằng cách kết hợp các đồ thị 2D thành khối nhiều chiều phi không gian có cùng biến tham chiếu là biến thời gian Đối với những tập dữ liệu nhiều biến có những biến chỉ thị vị trí không gian 2D, đồ thị biểu diễn tập dữ liệu được thực hiện bằng cách kết hợp các đồ thị 2D cùng tham chiếu biến thời gian với các đồ thị biểu diễn vị trí không gian – thời gian trên các khối không gian – thời gian để thành khối nhiều chiều không gian 2D Đối với những tập dữ liệu nhiều biến có những biến chỉ thị vị trí không gian 3D, đồ thị biểu diễn tập dữ liệu được thực hiện bằng cách kết

Trang 34

22

hợp các đồ thị 2D có cùng tham chiếu biến thời gian với các đồ thị biểu diễn vị trí không gian – thời gian trên các khối không gian – thời gian và khối 3D để thành khối nhiều chiều không gian 3D

Sự sắp xếp các đồ thị 2D và đồ thị 3D khi kết hợp trên các khối nhiều chiều phi không gian, khối nhiều chiều phi không gian 2D, khối nhiều chiều phi không gian 3D không những cần tính mỹ thuật mà còn phải đáp ứng các tính chất cảm nhận hình dạng và cảm nhận không gian của hệ thống thị giác con người Thật vậy, mục tiêu của việc thiết lập các đồ thị là giúp hệ thống thị giác con người thực hiện nhiệm vụ của bài toán phân tích dữ liệu Hệ thống thị giác của con người có thể cảm nhận hình phối cảnh 3D thể hiện trên màn hình phẳng và có thể gom nhóm các dấu hiệu theo các tiêu chí khác nhau hỗ trợ con người trả lời những câu hỏi tự đặt ra để tìm thông tin hoặc tri thức trong dữ liệu Do đó, việc kết nối các khối nhiều chiều phi không gian với các khối nhiều chiều 2D hoặc 3D để tạo ra đồ thị cấu trúc biểu diễn tập dữ liệu nhiều biến cần phải bảo đảm tính chất trực quan của đồ thị

2.5 TÍNH CHẤT TRỰC QUAN

Tính hiệu quả của một đồ thị trực quan được đánh giá khách quan dựa trên các tính chất trực quan của đồ thị Nhiều tác giả đã thống nhất với nhau về cách đánh giá khách quan tính chất trực quan của đồ thị dựa trên tính phối hợp, tính chọn lọc, tính thứ tự, tính định lượng, và độ dài biến [17, 18] Các tính chất trực quan áp dụng trên những phần tử của cấu trúc đồ thị mà còn được gọi là những dấu hiệu (marks) của cấu trúc đồ thị, hoặc là áp dụng trên những phần tử của cấu trúc đồ thị phẳng trên màn hình mà còn được gọi là những dấu hiệu phẳng (planar marks)

1 Tính phối hợp: Tính phối hợp của một đồ thị liên quan đến sự tương đồng về một hoặc vài tính chất của những dấu hiệu cấu trúc đồ thị hoặc

đồ thị phẳng Tính phối hợp giúp cho người dùng gom nhóm các dấu hiệu (của đồ thị cấu trúc hoặc của đồ thị phẳng) có cùng tính chất Tính

Ngày đăng: 13/12/2020, 19:00

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1] W. J. Frawley, G. Piatetsky-Shapiro, and C. J. Matheus, "Knowledge Discovery in Databases: An Overview," AI Magazine, vol. 13, pp. 57-70, 1992 Sách, tạp chí
Tiêu đề: Knowledge Discovery in Databases: An Overview
[3] H. T. Nguyen, T. M. T. Pham, T. A. T. Nguyen, A. V. T. Tran, P. V. Tran, and D. V. Pham, "Two-Stage Approach to Classifying Multidimensional Cubes for Visualization of Multivariate Data," in 7th EAI International Conference of Context-Aware Systems and Applications, and Nature of Computation, and Communication, ICCASA 2018, Viet Tri, Vietnam, 2018, pp. 70-80 Sách, tạp chí
Tiêu đề: Two-Stage Approach to Classifying Multidimensional Cubes for Visualization of Multivariate Data
Tác giả: H. T. Nguyen, T. M. T. Pham, T. A. T. Nguyen, A. V. T. Tran, P. V. Tran, D. V. Pham
Nhà XB: 7th EAI International Conference of Context-Aware Systems and Applications, and Nature of Computation, and Communication
Năm: 2018
[4] P. V. Tran, H. T. Nguyen, and T. V. Tran, "Approaching Multi-dimensional Cube for Visualization-based Epidemic Warning System - Dengue Fever,"presented at the 8th International Conference on Ubiquitous Information Management and Communication, ACM IMCOM 2014, Siem Reap, Cambodia, 2014 Sách, tạp chí
Tiêu đề: Approaching Multi-dimensional Cube for Visualization-based Epidemic Warning System - Dengue Fever
Tác giả: P. V. Tran, H. T. Nguyen, T. V. Tran
Nhà XB: ACM IMCOM
Năm: 2014
[5] H. T. Nguyen, C. K. T. Duong, T. T. Bui, and P. V. Tran, "Visualization of Spatio-temporal Data of Bus Trips," presented at the IEEE 2012 International Conference on Control, Automation and Information Science, ICCAIS 2012, Hochiminh City, Vietnam, 2012 Sách, tạp chí
Tiêu đề: Visualization of Spatio-temporal Data of Bus Trips
Tác giả: H. T. Nguyen, C. K. T. Duong, T. T. Bui, P. V. Tran
Nhà XB: IEEE
Năm: 2012
[6] H. T. Nguyen, A. V. T. Tran, T. A. T. Nguyen, L. T. Vo, and P. V. Tran, "Multivariate cube integrated retinal variable to visually represent Sách, tạp chí
Tiêu đề: Multivariate cube integrated retinal variable to visually represent
Tác giả: H. T. Nguyen, A. V. T. Tran, T. A. T. Nguyen, L. T. Vo, P. V. Tran
[7] T. Hagerstrand, "What about people in regional science?," presented at the Ninth European Congress of Regional Science Association, 1970 Sách, tạp chí
Tiêu đề: What about people in regional science
[8] D. J. Peuquet, "It's About Time: A Conceptual Framework for the Representation of Temporal Dynamics in Geographic Information Systems,"Annals of the Association of American Geographers, vol. 84, pp. 441-461, Sep. 1994 1994 Sách, tạp chí
Tiêu đề: It's About Time: A Conceptual Framework for the Representation of Temporal Dynamics in Geographic Information Systems
Tác giả: D. J. Peuquet
Nhà XB: Annals of the Association of American Geographers
Năm: 1994
[9] G. Andrienko, N. Andrienko, P. Bak, D. Keim, S. Kisilevich, and S. Wrobel, "A conceptual framework and taxonomy of techniques for analyzing movement," Journal of Visual Languages and Computing, vol. 22, pp. 213- 232, 2011 Sách, tạp chí
Tiêu đề: A conceptual framework and taxonomy of techniques for analyzing movement
Tác giả: G. Andrienko, N. Andrienko, P. Bak, D. Keim, S. Kisilevich, S. Wrobel
Nhà XB: Journal of Visual Languages and Computing
Năm: 2011
[10] N. Andrienko and G. Andrienko, "Visual analytics of movement: an overview of methods, tools, and procedures," Information Visualization, vol.12, pp. 13-24, 2013 Sách, tạp chí
Tiêu đề: Visual analytics of movement: an overview of methods, tools, and procedures
[11] N. Andrienko, G. Andrienko, N. Pelekis, and S. Spaccapietra, "Basic concepts of movement data," in Mobility, Data Mining and Privacy, Geographic Knowledge Discovery, F. Giannotti and D. Pedreschi, Eds., ed Berlin Heidelberg: Springer-Verlag 2008, pp. 15-38 Sách, tạp chí
Tiêu đề: Mobility, Data Mining and Privacy
Tác giả: N. Andrienko, G. Andrienko, N. Pelekis, S. Spaccapietra
Nhà XB: Springer-Verlag
Năm: 2008
[12] X. Li and M.-J. Kraak, "New Views on Multivariable Spatio-temporal Data: the Space-time Cube Expanded," presented at the International Symposium on Spatio-temporal Modelling, Spatial Reasoning, Analysis, Data Mining and Data Fusion XXXVI, 2005 Sách, tạp chí
Tiêu đề: New Views on Multivariable Spatio-temporal Data: the Space-time Cube Expanded
[13] S. Few, "Tapping the Power of Visual Perception," Perceptual Edge, pp. 1-8, September 4, 2004 Sách, tạp chí
Tiêu đề: Tapping the Power of Visual Perception
Tác giả: S. Few
Nhà XB: Perceptual Edge
Năm: 2004
[14] S. Few, "Data Visualization for Human Perception," in The Encyclopedia of Human-Computer Interaction, M. Soegaard and R. F. Dam, Eds., 2nd ed Aarhus, Denmark, 2014 Sách, tạp chí
Tiêu đề: Data Visualization for Human Perception
Tác giả: S. Few
Nhà XB: The Encyclopedia of Human-Computer Interaction
Năm: 2014
[15] S. Card, "Information Visualization," in Information Visualization, Chi, Ed., ed: PARC, 2007, pp. 510-543 Sách, tạp chí
Tiêu đề: Information Visualization
Tác giả: S. Card
Nhà XB: PARC
Năm: 2007
[16] C. K. Stuart, M. Jock, and S. Ben, "Readings in Information Visualization. Using Vision to Think," Academic Press 1999 Sách, tạp chí
Tiêu đề: Readings in Information Visualization. Using Vision to Think
Tác giả: C. K. Stuart, M. Jock, S. Ben
Nhà XB: Academic Press
Năm: 1999
[17] J. Bertin, "General Theory, from Semiology of Graphics," in The Map Reader. Theories of Mapping Practice and Cartographic Representation, M.Dodge, R. Kitchin, and C. Perkins, Eds., ed: John Wiley & Sons, Ltd., 2011, pp. 8-16 Sách, tạp chí
Tiêu đề: The Map Reader. Theories of Mapping Practice and Cartographic Representation
Tác giả: J. Bertin
Nhà XB: John Wiley & Sons, Ltd.
Năm: 2011
[18] M. Green, "Toward a Perceptual Science of Multidimensional Data Visualization: Bertin and Beyond," ERGO/GERO Human Factors Science, Citeseer, 1998 Sách, tạp chí
Tiêu đề: Toward a Perceptual Science of Multidimensional Data Visualization: Bertin and Beyond
[19] J. Bertin, "Semiology of graphics: Diagrams, networks, maps," ed: University of Wisconsin 1983 Sách, tạp chí
Tiêu đề: Semiology of graphics: Diagrams, networks, maps
[20] J. Wagemans, J. Feldman, S. Gepshtein, J. R. Ruth Kimchi4, Pomerantz, P. A. v. d. Helm, et al., "A Century of Gestalt Psychology in Visual Perception II. Conceptual and Theoretical Foundations," Psychological Bulletin, vol.138, pp. 1218–1252, 2012 Sách, tạp chí
Tiêu đề: A Century of Gestalt Psychology in Visual Perception II. Conceptual and Theoretical Foundations
Tác giả: J. Wagemans, J. Feldman, S. Gepshtein, J. R. Ruth Kimchi4, Pomerantz, P. A. v. d. Helm
Nhà XB: Psychological Bulletin
Năm: 2012
[21] D. S. Alexandre and J. M. R. S. Tavares, "Introduction of Human Perception in Visualization," International Journal of Imaging and Robotics™, vol. 4, pp. 60-70, 2010 Sách, tạp chí
Tiêu đề: Introduction of Human Perception in Visualization

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w