Luận văn “Tích hợp biến thị giác vào đồ thị nhiều chiều trực quan hóa dữ liệu nhiều biến để cải thiện tính trực quan” áp dụng phép tích Descartes để tích hợp biến thị giác với các lớp dấ
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC MỞ THÀNH PHỐ HỒ CHÍ MINH
Phạm Thị Mỹ Thuận
TÍCH HỢP BIẾN THỊ GIÁC VÀO ĐỒ THỊ NHIỀU CHIỀU
TRỰC QUAN HÓA DỮ LIỆU NHIỀU BIẾN
ĐỂ CẢI THIỆN TÍNH TRỰC QUAN
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
TP Hồ Chí Minh, Năm 2019
Trang 2BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC MỞ THÀNH PHỐ HỒ CHÍ MINH
Phạm Thị Mỹ Thuận
TÍCH HỢP BIẾN THỊ GIÁC VÀO ĐỒ THỊ NHIỀU CHIỀU
TRỰC QUAN HÓA DỮ LIỆU NHIỀU BIẾN
ĐỂ CẢI THIỆN TÍNH TRỰC QUAN
Chuyên ngành : Khoa học máy tính
Mã số chuyên ngành : 60.48.01.01
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
Người hướng dẫn khoa học: PGS.TS Trần Vĩnh Phước
TP Hồ Chí Minh, năm 2019
Trang 3i
LỜI CAM ĐOAN
Tôi cam đoan rằng luận văn “Tích hợp biến thị giác vào đồ thị nhiều chiều trực quan hóa dữ liệu nhiều biến để cải thiện tính trực quan” là bài nghiên cứu của chính tôi
Ngoại trừ những tài liệu tham khảo được trích dẫn trong luận văn này, tôi cam đoan rằng toàn phần hay những phần nhỏ của luận văn này chưa từng được sử dụng để nhận bằng thạc sĩ ở những nơi khác
Không có sản phẩm/nghiên cứu nào của người khác được sử dụng trong luận văn này mà không được trích dẫn theo đúng qui định
Luận văn này chưa bao giờ được nộp để nhận bất kỳ bằng cấp nào tại các trường đại học hoặc cơ sở đào tạo khác
Thành phố Hồ Chí Minh, năm 2019
Phạm Thị Mỹ Thuận
Trang 4Tôi xin cảm ơn quý thầy cô lãnh đạo, giảng viên, và chuyên viên trường Đại học Mở TP Hồ Chí Minh đã cung cấp những kiến thức quý báu cũng như hỗ trợ cho tôi trong suốt thời gian học tập tại trường
Tôi xin chân thành cảm ơn đến các anh chị trong nhóm nghiên cứu về trực quan hóa đã cùng thảo luận khoa học, hướng dẫn, và hỗ trợ tôi, cũng như những góp
ý quý báu để tôi có thể hoàn thành luận văn này
Cuối cùng tôi xin gửi lời cảm ơn sâu sắc nhất đến những người thân, những đồng nghiệp và thầy cô đã luôn bên cạnh hỗ trợ, động viên và tạo điều kiện thuận lợi nhất để tôi hoàn thành luận văn
Trang 5iii
TÓM TẮT
Trực quan hóa là một ánh xạ biến đổi dữ liệu thành thông tin hoặc tri thức bằng phương pháp nhìn-hiểu của con người đối với các hình ảnh, đồ thị biểu diễn
dữ liệu trên màn hình máy tính Thách thức về tính hiệu quả của đồ thị biểu diễn tập
dữ liệu là mức độ trực quan của đồ thị, đồ thị có tính trực quan càng cao thì con người càng dễ trích xuất thông tin và/hoặc khai phá tri thức từ dữ liệu Một giải pháp kỹ thuật để nâng cao tính trực quan của đồ thị nhiều chiều biểu diễn dữ liệu nhiều biến là tích hợp biến thị giác vào đồ thị
Luận văn “Tích hợp biến thị giác vào đồ thị nhiều chiều trực quan hóa dữ liệu nhiều biến để cải thiện tính trực quan” áp dụng phép tích Descartes để tích hợp biến thị giác với các lớp dấu hiệu định tính hoặc định lượng nhằm nâng cao tính trực quan của đồ thị Qui trình tích hợp biến thị giác năm bước được đề xuất như sau:
Bước 1: Phân hoạch đồ thị thành những lớp dấu hiệu Mỗi phần tử của đồ thị nhiều chiều được gọi là dấu hiệu (mark) Tại bước này, những dấu hiệu của đồ thị được phân hoạch thành những lớp (tập) dấu hiệu có cùng tính chất hoặc có cùng khoảng giá trị
Bước 2: Thiết lập các biến thị giác phát sinh Căn cứ số lượng và tính chất của các lớp dấu hiệu được phân hoạch, người thiết kế sử dụng các biến thị giác cơ bản để tạo ra các biến thị giác phát sinh là tập con của một biến thị giác cơ bản hoặc tập con của một tích biến thị giác cơ bản
Bước 3: Xử lý phần giao của các lớp dấu hiệu Đặc điểm của các lớp dấu hiệu được phân hoạch là có thể giao nhau hoặc không giao nhau Những dấu hiệu thuộc phần giao của hai lớp phải được tích hợp các biến thị giác sao cho thể hiện được cả hai tính chất của hai lớp
Trang 6iv
Bước 4: Tích hợp biến thị giác vào các lớp dấu hiệu Mỗi lớp dấu hiệu được tích hợp bởi một dấu hiệu trực quan (phần tử) của biến thị giác phát sinh bằng phép tích Descartes
Bước 5: Hiển thị kết quả Đồ thị nhiều chiều trên khối nhiều chiều sau khi được nâng cao tính trực quan bằng cách tích hợp biến thị giác được ánh xạ vào màn hình phẳng 2D để hiển thị
Qui trình tích hợp biến thị giác của luận văn “Tích hợp biến thị giác vào đồ thị nhiều chiều trực quan hóa dữ liệu nhiều biến để cải thiện tính trực quan” được áp dụng vào tập dữ liệu dịch bệnh tay-chân-miệng tỉnh Bình Dương 2012-2014 như một trường hợp minh họa Trong đó, đồ thị được tích hợp biến thị giác theo tiếp cận định tính để phối hợp các dấu hiệu cùng biến và phân biệt các dấu hiệu khác biến, đồng thời đồ thị cũng được áp dụng tích hợp biến thị giác theo tiếp cận định lượng
để chọn lọc các dấu hiệu max của biến giúp người dùng phát hiện sự tương quan giữa các biến
Trang 7v
MỤC LỤC
Trang
LỜI CAM ĐOAN i
LỜI CẢM ƠN ii
TÓM TẮT iii
MỤC LỤC v
DANH MỤC HÌNH viii
DANH MỤC BẢNG x
Chương 1 1
GIỚI THIỆU 1
1.1 GIỚI THIỆU 1
1.2 MỤC TIÊU NGHIÊN CỨU 3
1.3 ĐỐI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU 3
1.3.1 Đối tượng nghiên cứu 3
1.3.2 Phạm vi nghiên cứu 3
1.4 PHƯƠNG PHÁP NGHIÊN CỨU 3
1.5 CẤU TRÚC LUẬN VĂN 4
Chương 2 6
TỔNG QUAN VỀ TRỰC QUAN HÓA 6
2.1 CHIẾN LƯỢC BIẾN ĐỔI DỮ LIỆU THÀNH THÔNG TIN / TRI THỨC 6 2.2 HỆ THỐNG TRỰC QUAN HÓA 9
2.2.1 Tiếp cận hai tầng của hệ thống trực quan hóa 9
Trang 8vi
2.2.2 Tầng cảm nhận trực quan của hệ thống trực quan hóa 10
2.2.3 Tầng kỹ thuật trực quan của hệ thống trực quan hóa 10
2.3 HỆ THỐNG THỊ GIÁC CỦA CON NGƯỜI 11
2.3.1 Con người là một hệ thống thông tin 11
2.3.2 Hệ thống thị giác của con người 12
2.3.3 Luật cảm nhận thông tin của hệ thống thị giác con người 13
2.4 BIẾN DỮ LIỆU 16
2.4.1 Dữ liệu 16
2.4.2 Biến dữ liệu 17
2.4.3 Quan hệ của các biến dữ liệu 17
2.4.4 Mô hình khối biểu diễn dữ liệu nhiều biến 19
2.4.5 Thiết kế đồ thị cấu trúc nhiều biến 21
2.5 TÍNH CHẤT TRỰC QUAN 22
2.6 HIỂN THỊ TRỰC QUAN 24
Chương 3 26
TÍCH HỢP BIẾN THỊ GIÁC VÀO ĐỒ THỊ NHIỀU CHIỀU 26
3.1 GIỚI THIỆU 26
3.2 BIẾN TRỰC QUAN 27
3.2.1 Biến vị trí 27
3.2.2 Biến thị giác 27
3.3 QUI TRÌNH TÍCH HỢP BIẾN THỊ GIÁC 30
3.3.1 Bước 1 Phân hoạch đồ thị thành các lớp dấu hiệu 30
3.3.2 Bước 2 Thiết lập các biến thị giác phát sinh 35
3.3.3 Bước 3 Xử lý phần giao của các lớp dấu hiệu 36
Trang 9vii
3.3.4 Bước 4 Tích hợp biến thị giác vào các lớp dấu hiệu 37
3.3.5 Bước 5 Hiển thị kết quả 39
3.4 TÓM TẮT 39
Chương 4 41
TÍCH HỢP BIẾN THỊ GIÁC VÀO ĐỒ THỊ BIỂU DIỄN DỮ LIỆU DỊCH BỆNH TAY-CHÂN-MIỆNG 41
4.1 GIỚI THIỆU 41
4.2 ĐỒ THỊ BIỂU DIỄN DỮ LIỆU DỊCH BỆNH TAY-CHÂN-MIỆNG TỈNH BÌNH DƯƠNG 2012-2014 42
4.3 ÁP DỤNG QUI TRÌNH TÍCH HỢP BIẾN THỊ GIÁC VÀO ĐỒ THỊ BIỂU DIỄN DỮ LIỆU DỊCH BỆNH TAY-CHÂN-MIỆNG 44
4.3.1 Bước 1 Phân hoạch đồ thị thành các lớp dấu hiệu 44
4.3.2 Bước 2 Thiết lập tập biến thị giác phát sinh 46
4.3.3 Bước 3 Xử lý phần giao của các lớp dấu hiệu 47
4.3.4 Bước 4 Tích hợp biến thị giác vào các lớp dấu hiệu 47
4.3.5 Bước 5 Hiển thị kết quả 49
4.4 ĐÁNH GIÁ TÍNH TRỰC QUAN CỦA ĐỒ THỊ SAU KHI TÍCH HỢP BIẾN THỊ GIÁC 49
4.5 KẾT QUẢ PHÂN TÍCH TRỰC QUAN 50
Chương 5 51
KẾT LUẬN 51
DANH MỤC CÁC CÔNG TRÌNH ĐÃ CÔNG BỐ 53
TÀI LIỆU THAM KHẢO 54
Trang 10viii
DANH MỤC HÌNH
Hình 1.1: Hệ thống trực quan hóa ánh xạ dữ liệu thành thông tin và/hoặc tri thức thông qua cảm nhận trực quan của con người 1 Hình 2.1: Dữ liệu được biến đổi thành thông tin và/hoặc tri thức bằng các chiến lược: mô hình toán hoặc trực quan hóa 6 Hình 2.2: Hệ thống trực quan hóa để trích xuất thông tin và/hoặc khai phá tri thức gồm hai tầng là kỹ thuật trực quan và cảm nhận trực quan Tầng kỹ thuật trực quan liên quan đến máy tính và tầng cảm nhận trực quan liên quan đến con người 9 Hình 2.3: Tầng kỹ thuật trực quan của hệ thống trực quan hóa gồm chức năng thiết
kế đồ thị cấu trúc và hiển thị trực quan gồm ánh xạ đồ thị cấu trúc lên màn hình phẳng và tích hợp biến thị giác để nâng cao tính trực quan phù hợp yêu cầu người dùng 11 Hình 2.4: Nguyên lý cảm thụ thông tin bằng mắt (nguồn [13]) 12 Hình 2.5: Ngôi sao quan hệ giữa các nhóm biến dữ liệu 18 Hình 2.6: Kỹ thuật trực quan biểu diễn tập dữ liệu thành đồ thị cấu trúc rồi ánh xạ lên màn hình phẳng thành đồ thị phẳng 24 Hình 3.1: Vận tốc gió có giá trị thực được ánh xạ vào thang cấp độ là những số nguyên 33 Hình 3.2: Hàm truyền biểu diễn quan hệ giữa giá trị thực và cấp độ giá trị nguyên của biến dữ liệu 34 Hình 3.3: Cực đại và cực tiểu của một đồ thị 35
Trang 11ix
Hình 4.1: Khối nhiều chiều phi không gian được dùng để biểu diễn dữ liệu dịch bệnh tay-chân-miệng ở tỉnh Bình Dương 43 Hình 4.2: Các lớp dấu hiệu của đồ thị biểu diễn dữ liệu dịch bệnh tay-chân-miệng ở tỉnh Bình Dương được phân hoạch theo ba cấp 44 Hình 4.3: Giản đồ Venn biểu diễn quan hệ tập của các lớp dấu hiệu được phân hoạch từ đồ thị biểu diễn tập dữ liệu dịch bệnh tay-chân-miệng ở tỉnh Bình Dương 45 Hình 4.4: Đồ thị biểu diễn tập dữ liệu dịch bệnh tay-chân-miệng tỉnh Bình Dương 2012-2014 đã được tích hợp biến thị giác, gồm các dấu hiệu biểu diễn số bệnh nhân (red), lượng mưa (blue), độ ẩm (green), nhiệt độ (orange) 49
Trang 12x
DANH MỤC BẢNG
Bảng 2.1: Bảng phân loại dữ liệu dựa vào thuộc tính 17 Bảng 3.1: Bảng tóm tắt các biến thị giác và minh họa các phần tử của biến (nguồn [6]) 28
Trang 131
Chương 1 GIỚI THIỆU
1.1 GIỚI THIỆU
Trực quan hóa là một ánh xạ biến đổi dữ liệu thành thông tin và/hoặc tri thức thông qua cảm nhận bằng thị giác của con người Nói cách khác, trực quan hóa biến đổi dữ liệu từ các dạng, các cấu trúc khác nhau thành hình ảnh để con người có thể cảm nhận thông tin và/hoặc tri thức qua hệ thống thị giác bằng phương pháp nhìn-hiểu Hệ thống trực quan hóa gồm hai tầng, kỹ thuật trực quan và cảm nhận trực quan (Hình 1.1) Tầng kỹ thuật trực quan sử dụng khả năng của máy tính để tạo ra những hình ảnh, đồ thị biểu diễn dữ liệu trên màn hình phẳng hỗ trợ người dùng cảm nhận thông tin / tri thức ẩn chứa trong dữ liệu Nhiều phần mềm thương mại đã
và đang được phát triển để hiển thị dữ liệu như những đồ thị với những kiểu hệ tọa
độ khác nhau, tọa độ trực giao, tọa độ song song, tọa độ trụ, glyphs, v.v
Hình 1.1: Hệ thống trực quan hóa ánh xạ dữ liệu thành thông tin và/hoặc tri thức thông
qua cảm nhận trực quan của con người
Trang 142
Triết lý “Tổng thể thì nhiều hơn tổng cộng của các hợp phần” đã thúc đẩy cho nhóm trực quan hóa của chúng tôi, tại Việt Nam, nghiên cứu biểu diễn trực quan tập dữ liệu trên một đồ thị Phương pháp biểu diễn tập dữ liệu trên một đồ thị
hỗ trợ người dùng trả lời được nhiều câu hỏi phân tích dữ liệu tại những mức sơ cấp, mức toàn cục, và mức quan hệ Một đồ thị biểu diễn đầy đủ các biến dữ liệu và
dữ liệu giúp người dùng phát hiện sự tương quan giữa các biến dữ liệu Nói cách khác, đồ thị nhiều chiều biểu diễn tập dữ liệu không chỉ hỗ trợ người dùng trích xuất thông tin mà còn có thể phát hiện những qui luật mới để cung cấp vào kho tàng tri thức của con người
Thách thức khoa học xảy ra khi áp dụng triết lý này là tính trực quan của đồ thị bị suy giảm khi số chiều và/hoặc dung lượng dữ liệu tăng lên Sự suy giảm trực quan của đồ thị tác động đến khả năng trích xuất thông tin, khai phá tri thức mới từ
dữ liệu Nói cách khác, sự suy giảm trực quan làm giảm tính hiệu quả của đồ thị biểu diễn dữ liệu trong việc trích xuất thông tin, khai phá tri thức Sự hạn chế về kích thước, độ phân giải, độ dài biến của màn hình làm suy giảm tính chọn lọc và tính phối hợp trực quan Sự hạn chế về khả năng cảm nhận thông tin bằng phương pháp nhìn-hiểu của con người dẫn đến những đòi hỏi một đồ thị biểu diễn dữ liệu phải được cảm nhận dễ dàng theo các tính chất trực quan
Ý tưởng của luận văn “Tích hợp biến thị giác vào đồ thị nhiều chiều trực quan hóa dữ liệu nhiều biến để cải thiện tính trực quan” là tích hợp biến thị giác vào
đồ thị biểu diễn tập dữ liệu để cải thiện tính trực quan của đồ thị, nâng cao hiệu quả của đồ thị trực quan trong việc trích xuất thông tin và/hoặc khai phá tri thức Một đồ thị biểu diễn dữ liệu có tính trực quan cao giúp người dùng cảm nhận tốt hơn thông tin và tri thức ẩn chứa trong dữ liệu Người dùng trả lời tốt những câu hỏi phân tích
dữ liệu để trích xuất thông tin, khai phá tri thức khi đồ thị biểu diễn dữ liệu có tính trực quan phù hợp với tính chất của dữ liệu và đáp ứng yêu cầu cảm nhận của người dùng để thực hiện bài toán phân tích dữ liệu
Trang 153
1.2 MỤC TIÊU NGHIÊN CỨU
Luận văn “Tích hợp biến thị giác vào đồ thị nhiều chiều trực quan hóa dữ liệu nhiều biến để cải thiện tính trực quan” nghiên cứu và hệ thống hóa các phương pháp tích hợp biến thị giác vào đồ thị biểu diễn dữ liệu nhằm nâng cao hiệu quả của đồ thị trong việc trích xuất thông tin, khai phá tri thức từ dữ liệu bằng phương pháp trực quan, nhìn-hiểu
1.3 ĐỐI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU
1.3.1 Đối tượng nghiên cứu
Quan hệ giữa các biến dữ liệu
Đồ thị nhiều chiều
Biến thị giác
Hệ thống thị giác của con người
Phương pháp tích hợp biến thị giác
1.3.2 Phạm vi nghiên cứu
Áp dụng cho một trường hợp nghiên cứu trong lĩnh vực y tế
1.4 PHƯƠNG PHÁP NGHIÊN CỨU
- Phương pháp phân tích Luận văn áp dụng phương pháp phân tích để phân hoạch các dấu hiệu biểu diễn dữ liệu thành những lớp dấu hiệu định tính hoặc định lượng
- Phương pháp hình học Luận văn áp dụng phương pháp hình học để mô tả cấu trúc đồ thị biểu diễn tập dữ liệu
Trang 164
- Phương pháp đại số Luận văn áp dụng phương pháp đại số để mô tả các lớp dấu hiệu được phân hoạch và tích hợp biến thị giác vào đồ thị biểu diễn tập dữ liệu nhiều biến
1.5 CẤU TRÚC LUẬN VĂN
Luận văn được bố cục thành năm chương như sau:
Chương một Giới thiệu
Chương một nêu những thách thức khi con người nhìn đồ thị biểu diễn tập dữ liệu để hiểu ý nghĩa và tri thức ẩn chứa bên trong tập dữ liệu đó Từ những thách thức đó, luận văn đặt mục tiêu nghiên cứu, nêu ra những phương pháp nghiên cứu chính
Chương hai Tổng quan về trực quan hóa
Chương hai đề cập đến một chiến lược phân tích dữ liệu được phát triển hiện nay là phân tích trực quan, trong đó, dữ liệu với nhiều kiểu khác nhau được biểu diễn thành đồ thị để con người có thể cảm nhận nội dung ẩn chứa trong đó bằng phương pháp nhìn-hiểu Nội dung của chương liên quan đến những khái niệm về hệ thống trực quan hóa Những đặc điểm cảm nhận thông tin và tri thức bằng thị giác của con người được phân tích trong các trường hợp khác nhau Những tính chất của
dữ liệu, biến dữ liệu, và quan hệ gữa các biến dữ liệu được phân tích để đề xuất mô hình các loại khối biểu diễn dữ liệu nhiều biến Tổng hợp các lý luận về đánh giá tính trực quan của đồ thị và nghiên cứu biến thị giác để làm công cụ tăng tính trực quan của đồ thị
Chương ba Tích hợp biến thị giác vào đồ thị nhiều chiều
Chương ba xây dựng qui trình tích hợp biến thị giác vào đồ thị nhằm nâng cao tính trực quan của đồ thị nhiều chiều biểu diễn tập dữ liệu nhiều biến Chương ba
Trang 17và phân hoạch các dấu hiệu biểu diễn giá trị của dữ liệu thành những lớp dấu hiệu theo định tính hoặc định lượng Kết quả sau khi tích hợp các biến thị giác vào các lớp dấu hiệu là một đồ thị có tính trực quan cao hơn, biểu diễn tập dữ liệu dịch bệnh tay-chân-miệng ở tỉnh Bình Dương giai đoạn 2012-2014 Nhìn vào đồ thị có tính trực quan cao này, người dùng dễ dàng phát hiện sự tương quan của số bệnh nhân với lượng mưa và độ ẩm vì thấy các giá trị cực đại của các biến này xuất hiện đồng thời
Chương năm Kết luận
Chương năm tóm tắt những kết quả đạt được của luận văn là thiết kế qui trình tích hợp biến thị giác vào đồ thị nhiều chiều để làm tăng tính trực quan, và áp dụng minh họa qui trình này cho đồ thị biểu diễn tập dữ liệu dịch bệnh tay-chân-miệng tỉnh Bình Dương 2012-2014 Một kết quả không kém phần quan trọng của luận văn nữa là hệ thống hóa các đặc điểm quan hệ giữa tính chất của dữ liệu với khả năng cảm nhận bằng thị giác của con người
Trang 186
Chương 2 TỔNG QUAN VỀ TRỰC QUAN HÓA
2.1 CHIẾN LƯỢC BIẾN ĐỔI DỮ LIỆU THÀNH THÔNG TIN / TRI THỨC
Hình 2.1: Dữ liệu được biến đổi thành thông tin và/hoặc tri thức bằng các chiến lược: mô
hình toán hoặc trực quan hóa
Sự phát triển của internet làm cho môi trường trao đổi dữ liệu rộng mở, những dòng dữ liệu luôn tràn ngập trên internet xuất phát từ nhiều nguồn khác nhau,
cứ mỗi 20 tháng thì khối dữ liệu tăng lên gấp đôi hoặc hơn nữa [1] Tốc độ gia tăng khối lượng dữ liệu trên internet ngày nay có thể còn cao hơn nhiều do sự phát triển của công nghệ IoT Từ những dữ liệu được tạo ra bởi những nhà khoa học đến dữ liệu của các cơ quan chính phủ, rồi những doanh nghiệp lớn nhỏ khác nhau cũng tạo cho mình những cơ sở dữ liệu kết nối vào internet Sự phát triển của khoa học vũ trụ
và công nghệ ứng dụng giúp con người nhận ít nhất một ảnh từ vệ tinh cứ mỗi giây Công nghệ IoT kết nối các cảm biến thu thập dữ liệu về thời tiết, môi trường, và vô
số camera được lắp đặt khắp nơi trên mặt đất, từ cơ quan an ninh, công sở đến nhà ở cũng cung cấp vô số dữ liệu Tài nguyên dữ liệu trên internet đã và đang gia tăng
Trang 197
cực nhanh trong vài năm gần đây Bài toán đặt ra là làm thế nào để không lãng phí tài nguyên dữ liệu đồ sộ này Trích xuất thông tin và/hoặc khai phá tri thức trong các nguồn dữ liệu để mang lại lợi ích cho cá nhân, tập thể, quốc gia, hoặc toàn nhân loại là mục tiêu của nhiều nhà khoa học và tổ chức khoa học [2]
Về phương diện khoa học và kỹ thuật, khoa học dữ liệu (data science) xây dựng cơ sở lý luận và phát triển các công nghệ biến đổi dữ liệu thành thông tin và/hoặc tri thức Đến nay, có hai chiến lược chính để phân tích dữ liệu thành thông tin và/hoặc tri thức là mô hình toán và trực quan hóa (Hình 2.1) [3] Chiến lược mô hình toán xây dựng các thuật toán và triển khai trên máy tính để phân tích dữ liệu, tìm kiếm thông tin và/hoặc tri thức mới ẩn chứa trong dữ liệu mà không cần sự tham gia của người dùng Chiến lược trực quan hóa đòi hỏi sự đóng góp của người dùng, máy tính được sử dụng như phương tiện hỗ trợ khả năng cảm nhận và nhận biết của con người
- Mô hình toán: Mô hình thống kê là mô hình kinh điển với những thuật toán luôn được cập nhật theo nhu cầu phân tích dữ liệu hoặc theo tính chất đa dạng của dữ liệu Chiến lược phân tích dữ liệu bằng mô hình thống kê sử dụng máy tính để có kết quả, tri thức của người phân tích không được sử dụng trong tiến trình tạo ra kết quả Chiến lược này đang gặp phải một thách thức là không có sẵn đủ mô hình toán đáp ứng sự đa dạng của dữ liệu cũng như sự đa dạng của các bài toán phân tích Mặt khác, khi áp dụng các mô hình thống kê để phân tích dữ liệu còn có yêu cầu phải hiệu chỉnh mô hình cho phù hợp với từng loại bài toán cụ thể Ngày nay, mô hình trí tuệ nhân tạo cũng được nhiều nhà khoa học áp dụng để phân tích dữ liệu, đặc biệt là những mô hình áp dụng học sâu (deep learning) Cả hai mô hình thống kê và mô hình trí tuệ nhân tạo có đặc điểm chung là được xây dựng theo loại dữ liệu và kiểu bài toán đã và
Trang 20Nổi lên từ đầu thế kỷ 21, nhóm các nhà khoa học do Andrienko chủ trì
đã bắt đầu triển khai nhiều bài toán phân tích trực quan, nhóm Andrienko tận dụng khái niệm khối không gian - thời gian (Space-time Cube) đề xuất bởi Hagerstrand năm 1970 để biểu diễn đối tượng di chuyển [7] Andrienko cũng đã cải biên tam giác quan hệ What-Where-When của Peuquet [8] thành tam giác Object-Location-Time [9] để biểu diễn và phân tích đối tượng không gian – thời gian, đặc biệt là đối tượng di chuyển [10, 11] trên một khối không gian – thời gian Các công trình của nhóm Andrienko không quan tâm đến việc biểu diễn sự biến thiên những thuộc tính của đối tượng theo không gian hoặc thời gian Nhóm nhà khoa học do Kraak chủ trì biểu diễn đối tượng không gian – thời gian trên hai khối, khối không gian – thời gian biểu diễn quan hệ Object-Location-Time và khối thuộc tính - không gian biểu diễn quan hệ Attribute-Location [12] Trong khi đó, luận án tiến sĩ của Nguyễn Thị Hồng dưới
sự hướng dẫn của PGS.TS Trần Vĩnh Phước áp dụng triết lý “Tổng thể thì nhiều hơn tổng cộng” để biểu diễn tập dữ liệu bằng một đồ thị trực
Trang 21đến máy tính và tầng cảm nhận trực quan liên quan đến con người
Tận dụng những tính chất ưu việt của mỗi chiến lược, ngày nay, nhiều hệ thống sử dụng kết hợp hai chiến lược để trích xuất thông tin / khai phá tri thức từ dữ liệu: mô hình toán và phân tích trực quan
2.2 HỆ THỐNG TRỰC QUAN HÓA
2.2.1 Tiếp cận hai tầng của hệ thống trực quan hóa
Theo quan điểm toán học, một hệ thống trực quan hóa là một hệ thống ánh
xạ dữ liệu thành thông tin và/hoặc tri thức Hệ thống trực quan hóa cơ bản gồm hai tầng, tầng kỹ thuật trực quan và tầng cảm nhận trực quan Tầng kỹ thuật trực quan
sử dụng khả năng của máy tính để biến đổi dữ liệu các dạng khác nhau thành đồ thị Tầng cảm nhận trực quan sử dụng khả năng của hệ thống thị giác con người để cảm nhận thông tin và/hoặc tri thức ẩn chứa trong dữ liệu được trình bày như đồ thị Hệ
Trang 2210
thống trực quan hóa biến đổi dữ liệu thành tri thức bằng cách giữ con người trong tầng cảm nhận trực quan của hệ thống Nói cách khác, trong hệ thống trực quan hóa, con người và máy tính hợp tác với nhau để trích xuất thông tin, khai phá tri thức từ
dữ liệu
2.2.2 Tầng cảm nhận trực quan của hệ thống trực quan hóa
Con người giữ vai trò chính trong tầng cảm nhận trực quan Tại đó, chính người dùng nhìn đồ thị trực quan trình bày trên màn hình để cảm nhận và trích xuất thông tin hoặc khai phá tri thức ẩn chứa trong dữ liệu Người dùng có thể tương tác với máy tính để có thể nhìn-hiểu đồ thị biểu diễn trực quan dữ liệu Kết quả này phụ thuộc vào khả năng mô tả dữ liệu của đồ thị trực quan trước mắt người dùng và khả năng cảm nhận thị giác cũng như tri thức và trải nghiệm của người dùng Một hệ thống trực quan tốt là hệ thống trích xuất được nhiều thông tin và khai phá được nhiều tri thức Một đồ thị trực quan biểu diễn tập dữ liệu được đánh giá là hữu hiệu khi đồ thị đáp ứng cao các tính trực quan hỗ trợ tốt cho sự cảm nhận của hệ thống thị giác con người trong các bài toán phân tích dữ liệu
2.2.3 Tầng kỹ thuật trực quan của hệ thống trực quan hóa
Tầng kỹ thuật trực quan biến đổi dữ liệu bảng nhiều biến thành đồ thị nhiều chiều có tính trực quan cao phù hợp với khả năng cảm nhận và nhận biết thông tin hoặc tri thức ẩn chứa trong dữ liệu Như vậy, tầng kỹ thuật trực quan được thực hiện trên máy tính với hai chức năng, chức năng thiết kế đồ thị cấu trúc và chức năng hiển thị trực quan Chức năng thiết kế đồ thị cấu trúc biến đổi tập dữ liệu nhiều biến
có cấu trúc bảng thành đồ thị nhiều chiều có cấu trúc dạng khối Về phương diện toán học, đồ thị cấu trúc được thiết kế theo quan hệ hàm của các biến dữ liệu Chức năng hiển thị trực quan ánh xạ đồ thị cấu trúc lên màn hình phẳng và tích hợp biến thị giác vào các dấu hiệu của đồ thị phẳng để nâng cao tính trực quan của đồ thị hỗ trợ khả năng cảm nhận bằng thị giác của con người
Trang 2311
Hình 2.3: Tầng kỹ thuật trực quan của hệ thống trực quan hóa gồm chức năng thiết kế đồ thị cấu trúc và hiển thị trực quan gồm ánh xạ đồ thị cấu trúc lên màn hình phẳng và tích hợp biến thị giác để nâng cao tính trực quan phù hợp yêu cầu người dùng
2.3 HỆ THỐNG THỊ GIÁC CỦA CON NGƯỜI
2.3.1 Con người là một hệ thống thông tin
Theo quan điểm thông tin, con người được ví như một hệ thống thông tin thu thập dữ liệu qua các giác quan Trong đó, mỗi giác quan là một hệ thống thu thập dữ liệu, não bộ giữ vai trò trung tâm xử lý và phân tích tổng hợp nhiều loại dữ liệu khác nhau Hệ thống thị giác thu thập dữ liệu thông qua mắt, hệ thống thính giác thu thập dữ liệu thông qua tai, hệ thống xúc giác thu thập dữ liệu thông qua da, hệ thống khứu giác thu thập dữ liệu thông qua mũi, và hệ thống vị giác thu thập dữ liệu thông qua lưỡi
Con người cảm nhận về thế giới thực bằng năm giác quan: thị giác, thính giác, xúc giác, khứu giác, và vị giác Thị giác cảm nhận mọi thực thể trong thế giới thực bằng mắt, thính giác cảm nhận âm thanh trong thế giới thực bằng tai, xúc giác cảm nhận các vật thể trong thế giới thực bằng cách tiếp xúc qua làn da, khứu giác cảm nhận mùi bằng mũi, vị giác cảm nhận vị chua cay đắng ngọt bằng lưỡi Thông tin từ
Trang 24đó, đồ thị, biểu đồ, sơ đồ được dùng để biểu diễn các loại dữ liệu khác nhau giúp con người cảm thụ nhiều thông tin nhất từ dữ liệu [14] Những loại dữ liệu được thu thập bằng những dạng khác nhau như âm thanh, chữ viết, số, v.v… được chuyển đổi thành dạng đồ thị, biểu đồ, sơ đồ giúp người dùng nhận biết được ý nghĩa của dữ liệu thông qua hệ thống thị giác
2.3.2 Hệ thống thị giác của con người
Hình 2.4: Nguyên lý cảm thụ thông tin bằng mắt (nguồn [13])
Mọi vật thể trong thế giới thực đều phát ra những tia sáng do chính vật thể đó
tự sinh ra hoặc phản chiếu từ nguồn sáng khác (Hình 2.4) Mắt người nhận ra vật thể bởi các tia sáng từ vật thể đến mắt, dữ liệu từ những tia sáng này được hệ thống dây thần kinh dẫn lên não để phân tích hình dạng và màu sắc của vật thể Dữ liệu nhận được từ mắt được dẫn lên não bộ ở hai mức khái quát và chi tiết Tại mức khái
Trang 2513
quát, não bộ phân tích song song nhanh những đặc tính nổi trội của vật thể Tại mức chi tiết, não bộ phân tích nối tiếp để phát hiện và lưu trữ những chi tiết của vật thể Tiến trình cảm nhận thông tin bằng phương pháp nhìn-hiểu đồ thị trực quan của con người được thực hiện theo các bước sau:
- Cảm nhận toàn thể: Khi nhìn đồ thị, mắt người tiếp nhận những tia sáng đến từ đồ thị để cung cấp cho não bộ xử lý nhanh, não bộ trích xuất thông tin ở mức khái quát, như các hợp phần của đồ thị
- Cảm nhận chi tiết: Sau khi xử lý nhanh để cảm nhận toàn thể, trích xuất thông tin tại mức khái quát, não bộ xử lý chi tiết hơn bằng phương pháp nối tiếp để nhận dạng các biến, đặc tính các biến, và các thành phần chi tiết của đồ thị
- Cảm nhận quan hệ: Phương pháp nhìn-hiểu hoặc là nhìn để hiểu một đồ thị biểu diễn dữ liệu, mỗi người dùng tùy theo kiến thức và trải nghiệm của mình có thể cảm nhận các quan hệ giữa các biến, giữa các thành phần của
đồ thị tại những góc nhìn khác nhau với kỳ vọng phát hiện ra những quan
hệ hoặc qui luật mới
2.3.3 Luật cảm nhận thông tin của hệ thống thị giác con người
Hệ thống thị giác của con người cảm nhận thông tin / tri thức từ thế giới thực hoặc từ những tập dữ liệu mô tả về thế giới thực theo những luật hình dạng còn gọi
là luật gestalt, và những luật không gian Những luật này được áp dụng khi thiết kế
đồ thị cấu trúc để sao cho hệ thống thị giác con người có thể cảm nhận nhiều nhất thông tin ẩn chứa trong dữ liệu
Nhóm luật cảm nhận hình dạng:
Trang 2614
- Luật vật / nền (objects / background): Luật vật / nền chỉ ra khả năng của hệ thống thị giác con người là nhận dạng hình ảnh những đối tượng được thể hiện trên nền đồng nhất hay không đồng nhất
- Luật tương tự: Luật tương tự chỉ ra khả năng của hệ thống thị giác con người là nhận dạng những vật hoặc hình ảnh những đối tượng, những dấu hiệu giống nhau về hình dạng, ký hiệu, màu sắc, kích thước, hoặc hướng để gom chung thành một nhóm
- Luật gần nhau: Luật gần nhau chỉ ra khả năng của hệ thống thị giác con người
là nhận dạng những vật hoặc hình ảnh những đối tượng hoặc dấu hiệu gần nhau
để gom thành một nhóm Hai đối tượng gần nhau có nhiều quan hệ hơn hai đối tượng xa nhau
- Luật đối xứng: Luật đối xứng chỉ ra khả năng của hệ thống thị giác con người
là nhận dạng những vật hoặc hình ảnh những đối tượng hoặc dấu hiệu đối xứng qua một điểm hoặc một đường ảo để gom thành một nhóm
- Luật liên tục: Luật liên tục chỉ ra khả năng của hệ thống thị giác con người là nhận dạng những vật hoặc hình ảnh những đối tượng hoặc dấu hiệu không liên tục dãy chữ số thẳng hàng hay không thẳng hàng để liên kết chúng lại như một
từ hoặc một câu
- Luật đóng: Luật đóng chỉ ra khả năng của hệ thống thị giác con người là nhận dạng những vật hoặc hình ảnh những đối tượng hoặc dấu hiệu gián đoạn như đường đứt nét để hiểu chúng như một đường liên tục Luật đóng được áp dụng
để làm các hệ thống đèn nhấp nháy mô tả chuyển động
- Luật song song: Luật song song chỉ ra khả năng của hệ thống thị giác con người là nhận dạng những vật hoặc hình ảnh những đối tượng hoặc dấu hiệu song song để gom chung một nhóm
Trang 2715
- Luật đồng bộ: Luật đồng bộ chỉ ra khả năng của hệ thống thị giác con người là nhận dạng những vật hoặc hình ảnh những đối tượng hoặc dấu hiệu có cùng hành vi thay đổi để gom chung một nhóm, ví dụ những xe di chuyển cùng hướng và cùng thay đổi hướng
- Luật cùng chung vùng: Luật cùng chung vùng chỉ ra khả năng của hệ thống thị giác con người là nhận dạng những vật hoặc hình ảnh những đối tượng hoặc dấu hiệu tọa lạc trong cùng chung vùng có đường biên được xác định thực hoặc
ảo
- Luật điểm nổi trội: Luật điểm nổi trội chỉ ra khả năng của hệ thống thị giác con người là nhận dạng những vật hoặc hình ảnh những đối tượng hoặc dấu hiệu nổi trội trên một nền phức tạp Hệ thống thị giác có khuynh hướng nhìn thấy những dấu hiệu nổi trội trước khi nhìn lan ra xung quanh
- Luật kinh nghiệm: Luật kinh nghiệm chỉ ra khả năng của hệ thống thị giác con người là nhận dạng những vật hoặc hình ảnh những đối tượng hoặc dấu hiệu theo kinh nghiệm đã có trước
Nhóm luật cảm nhận không gian:
- Luật hướng đứng nổi trội: Luật hướng đứng nổi trội chỉ ra khuynh hướng hệ thống thị giác con người nhận dạng vật để đứng dài hơn vật để ngang dù hai vật
có chiều dài thực tế bằng nhau
- Luật quan hệ một phần với toàn thể: Luật quan hệ một phần với toàn thể chỉ ra khuynh hướng hệ thống thị giác con người không chỉ cảm nhận một phần mà còn cảm nhận toàn thể
- Luật bề mặt: Luật bề mặt chỉ ra khuynh hướng hệ thống thị giác con người cảm nhận những mặt không đồng nhất dễ hơn những mặt đồng nhất
Trang 28- Luật rõ / mờ: Luật rõ / mờ chỉ ra khuynh hướng hệ thống thị giác con người cảm nhận một vật rõ gần hơn vật mờ
- Luật phối cảnh: Luật phối cảnh chỉ ra khuynh hướng hệ thống thị giác con người cảm nhận một vật có chiều sâu, nghĩa là cảm nhận 3D
- Luật thị sai: Luật thị sai chỉ ra khuynh hướng hệ thống thị giác con người khi
di chuyển là cảm nhận vật ở xa di chuyển cùng chiều và vật ở gần di chuyển ngược chiều
2.4 BIẾN DỮ LIỆU
2.4.1 Dữ liệu
Dữ liệu là những số, ký tự, âm thanh, hình ảnh để mô tả về một đối tượng hoặc một hiện tượng một cách định tính và/hoặc định lượng Dữ liệu không cung cấp cho con người nhiều ý nghĩa mong muốn, nhưng chính những ý nghĩa ẩn chứa trong dữ liệu chính là thông tin mà con người muốn có được Theo quan điểm toán học, dữ liệu được phân loại thành dữ liệu định danh, dữ liệu thứ tự, dữ liệu khoảng cách, và dữ liệu tỉ lệ Tính chất của dữ liệu được xác định bằng các phép toán: bằng / khác, lớn hơn / nhỏ hơn, cộng / trừ, nhân / chia (Bảng 2.1) [15, 16]
Trang 29Dữ liệu thứ tự (Ordinal)
Dữ liệu khoảng cách (Inteval)
Dữ liệu tỉ lệ (Ratio)
dữ liệu gọi là giá trị của biến dữ liệu Những hàng của bảng chứa những giá trị của những biến khác nhau có quan hệ với nhau Về phương diện toán học, mỗi biến dữ liệu được khảo sát như là biến độc lập hoặc biến phụ thuộc
2.4.3 Quan hệ của các biến dữ liệu
Các biến dữ liệu của tập dữ liệu khảo sát được phân thành năm nhóm biến: - nhóm biến đối tượng O, nhóm biến thuộc tính A, nhóm biến thời gian T, nhóm biến không gian (vị trí) mặt đất L2, nhóm biến không gian (vị trí) có độ cao L3 Quan hệ hàm giữa năm nhóm biến này được mô tả như hình sao (Hình 2.5) Trong đó, biến thời gian là biến độc lập được dùng là biến tham chiếu; biến vị trí 2D và biến vị trí 3D có thể là biến độc lập hoặc biến phụ thuộc; biến đối tượng và biến thuộc tính là
Trang 3018
biến phụ thuộc tham chiếu thời gian hoặc tham chiếu vị trí 2D, vị trí 3D Các quan
hệ mô tả trong hình sao (Hình 2.5) được biểu diễn toán học như sau:
- Quan hệ 1: là quan hệ ánh xạ n-n vì một đối tượng có thể có nhiều thuộc tính, một thuộc tính có thể là tính chất của nhiều đối tượng
- Quan hệ 2: là quan hệ hàm T O Quan hệ này chỉ đối tượng thời gian hoặc
sự kiện [9]
Hình 2.5: Ngôi sao quan hệ giữa các nhóm biến dữ liệu
- Quan hệ 3: là quan hệ hàm T L3 Quan hệ này chỉ vị trí trên cao thay đổi theo thời gian khi biểu diễn đối tượng bay
Trang 3119
- Quan hệ 4: là quan hệ hàm L3 L2 Quan hệ này chỉ hình chiếu trên mặt đất của đối tượng trên cao, mỗi vị trí trên cao có một hình chiếu, nhiều vị trí trên cao có thể có chung một hình chiếu
- Quan hệ 5: là quan hệ hàm L2 A Quan hệ này chỉ thuộc tính thay đổi theo vị trí, ví dụ lượng nhiên liệu trong xe di chuyển thay đổi theo vị trí
- Quan hệ 6: là quan hệ hàm T A Quan hệ này chỉ định thuộc tính thay đổi theo thời gian
- Quan hệ 7: là quan hệ hàm 1-1, L3 O Quan hệ này chỉ định rằng tại một thời điểm một đối tượng tồn tại tại một vị trí không gian có độ cao và tại một vị trí không gian có độ cao chỉ tồn tại một đối tượng
- Quan hệ 8: là quan hệ hàm, T L2 Quan hệ này chỉ định vị trí thay đổi theo thời gian của đối tượng di chuyển mặt đất
- Quan hệ 9: là quan hệ hàm, L3 A Quan hệ này chỉ định thuộc tính thay đổi theo vị trí trong không gian có độ cao, ví dụ nhiên liệu của các vật bay
- Quan hệ 10: là quan hệ hàm 1-1, L2 O Quan hệ này chỉ định rằng tại một thời điểm một đối tượng tồn tại tại một vị trí không gian mặt đất và tại một vị trí không gian mặt đất chỉ tồn tại một đối tượng
2.4.4 Mô hình khối biểu diễn dữ liệu nhiều biến
Các quan hệ trong ngôi sao quan hệ giữa các nhóm biến dữ liệu có thể phân thành ba nhóm: nhóm quan hệ tham chiếu biến thời gian T, nhóm quan hệ tham chiếu biến vị trí không gian mặt đất L2, nhóm quan hệ tham chiếu biến vị trí không gian có độ cao L3 Trên cơ sở các quan hệ giữa các nhóm biến dữ liệu được phân tích trong ngôi sao quan hệ giữa các nhóm biến dữ liệu Mô hình khối nhiều chiều biểu diễn dữ liệu nhiều biến được thiết kế thành ba loại tương ứng: khối nhiều chiều
Trang 3220
phi không gian biểu diễn các biến tham chiếu biến thời gian T, không tham chiếu biến không gian L2 và L3; khối nhiều chiều không gian L2 biểu diễn các biến tham chiếu biến vị trí mặt đất và tham chiếu biến thời gian T nếu có; khối nhiều chiều không gian L3 biểu diễn các biến tham chiếu biến vị trí có độ cao và tham chiếu biến thời gian T nếu có
- Khối nhiều chiều phi không gian: Khối nhiều chiều phi không gian được thiết lập từ một hệ thống những trục tọa độ song song, mỗi trục biểu diễn một thuộc tính, trục tham chiếu chung được xoay thẳng góc với các trục thuộc tính Khi áp dụng khối nhiều chiều phi không gian để biểu diễn các tập dữ liệu tham chiếu thời gian, vấn đề đặt ra là đồng bộ các đơn vị thời gian tham chiếu của các thuộc tính
- Khối nhiều chiều không gian L2: Khối nhiều chiều không gian L2 được thiết lập bằng cách kết hợp khối không gian – thời gian (STC: Space-Time Cube) với khối nhiều chiều phi không gian Trong đó, khối không gian – thời gian là một
hệ tọa độ trực giao ba chiều do Hagerstrand đề xuất năm 1970, gồm hai trục chỉ thị vị trí trên mặt đất và một trục chỉ thị thời gian Các khối không gian – thời gian và khối phi không gian kết hợp lại bằng cách chia sẻ trục thời gian Trục thời gian được nhiều trục tham chiếu cần phải được đồng bộ đơn vị thời gian
- Khối nhiều chiều không gian L3: Khối nhiều chiều không gian L3 được thiết lập bằng cách kết hợp khối không gian – thời gian (STC: Space-Time Cube) với khối không gian có độ cao (không gian 3D) và khối nhiều chiều phi không gian Trong đó, khối không gian – thời gian kết hợp với khối không gian 3D bằng cách chia sẻ hai trục tọa độ chỉ thị vị trí mặt đất kết hợp với khối phi không gian bằng cách chia sẻ trục thời gian Việc đồng bộ hóa đơn vị thời gian và đồng bộ hóa các đơn vị chỉ thị vị trí mặt đất trên các trục dùng chung phải được áp dụng các dấu hiệu của graph cùng được tham chiếu
Trang 3321
2.4.5 Thiết kế đồ thị cấu trúc nhiều biến
Chức năng thiết kế đồ thị cấu trúc biến đổi tập dữ liệu nhiều biến có cấu trúc bảng thành đồ thị nhiều chiều cấu trúc theo dạng khối mà hệ thống thị giác của con người có thể cảm nhận được Trong tập dữ liệu có cấu trúc bảng, mỗi trường dữ liệu
là một biến dữ liệu mà theo quan điểm hàm toán học, mỗi biến dữ liệu có thể là độc lập hay tham chiếu đến biến dữ liệu khác, gọi là biến tham chiếu Kết quả phân tích quan hệ giữa các nhóm biến dữ liệu trong hình sao (Hình 2.5) cho thấy rằng biến thời gian luôn luôn là biến độc lập được dùng làm biến tham chiếu trong các quan
hệ hàm, biến không gian 2D và biến không gian 3D có thể là biến tham chiếu hoặc
là biến phụ thuộc thời gian, biến đối tượng và biến thuộc tính là những biến phụ thuộc thời gian hoặc vị trí
Kết quả phân tích quan hệ hàm giữa các biến dữ liệu cho phép gom các biến của tập dữ liệu thành các tổ hợp hai hoặc ba, bốn biến dữ liệu có quan hệ để biểu diễn thành những đồ thị hai chiều hoặc ba chiều Trong mỗi tổ hợp biến, biến tham chiếu là biến thời gian hoặc là tích của hai hoặc ba biến chỉ thị vị trí không gian Mỗi đồ thị hai hoặc ba chiều này biểu diễn tính chất định tính và định lượng của thuộc tính Trong đó, những đồ thị hai chiều biểu diễn những tổ hợp hai biến dữ liệu trên các khối nhiều chiều phi không gian, những đồ thị ba chiều biểu diễn những tổ hợp ba hoặc bốn biến dữ liệu trên các khối không gian – thời gian hoặc khối 3D
Đối với những tập dữ liệu phi không gian, đồ thị biểu diễn tập dữ liệu được thực hiện bằng cách kết hợp các đồ thị 2D thành khối nhiều chiều phi không gian có cùng biến tham chiếu là biến thời gian Đối với những tập dữ liệu nhiều biến có những biến chỉ thị vị trí không gian 2D, đồ thị biểu diễn tập dữ liệu được thực hiện bằng cách kết hợp các đồ thị 2D cùng tham chiếu biến thời gian với các đồ thị biểu diễn vị trí không gian – thời gian trên các khối không gian – thời gian để thành khối nhiều chiều không gian 2D Đối với những tập dữ liệu nhiều biến có những biến chỉ thị vị trí không gian 3D, đồ thị biểu diễn tập dữ liệu được thực hiện bằng cách kết
Trang 3422
hợp các đồ thị 2D có cùng tham chiếu biến thời gian với các đồ thị biểu diễn vị trí không gian – thời gian trên các khối không gian – thời gian và khối 3D để thành khối nhiều chiều không gian 3D
Sự sắp xếp các đồ thị 2D và đồ thị 3D khi kết hợp trên các khối nhiều chiều phi không gian, khối nhiều chiều phi không gian 2D, khối nhiều chiều phi không gian 3D không những cần tính mỹ thuật mà còn phải đáp ứng các tính chất cảm nhận hình dạng và cảm nhận không gian của hệ thống thị giác con người Thật vậy, mục tiêu của việc thiết lập các đồ thị là giúp hệ thống thị giác con người thực hiện nhiệm vụ của bài toán phân tích dữ liệu Hệ thống thị giác của con người có thể cảm nhận hình phối cảnh 3D thể hiện trên màn hình phẳng và có thể gom nhóm các dấu hiệu theo các tiêu chí khác nhau hỗ trợ con người trả lời những câu hỏi tự đặt ra để tìm thông tin hoặc tri thức trong dữ liệu Do đó, việc kết nối các khối nhiều chiều phi không gian với các khối nhiều chiều 2D hoặc 3D để tạo ra đồ thị cấu trúc biểu diễn tập dữ liệu nhiều biến cần phải bảo đảm tính chất trực quan của đồ thị
2.5 TÍNH CHẤT TRỰC QUAN
Tính hiệu quả của một đồ thị trực quan được đánh giá khách quan dựa trên các tính chất trực quan của đồ thị Nhiều tác giả đã thống nhất với nhau về cách đánh giá khách quan tính chất trực quan của đồ thị dựa trên tính phối hợp, tính chọn lọc, tính thứ tự, tính định lượng, và độ dài biến [17, 18] Các tính chất trực quan áp dụng trên những phần tử của cấu trúc đồ thị mà còn được gọi là những dấu hiệu (marks) của cấu trúc đồ thị, hoặc là áp dụng trên những phần tử của cấu trúc đồ thị phẳng trên màn hình mà còn được gọi là những dấu hiệu phẳng (planar marks)
1 Tính phối hợp: Tính phối hợp của một đồ thị liên quan đến sự tương đồng về một hoặc vài tính chất của những dấu hiệu cấu trúc đồ thị hoặc
đồ thị phẳng Tính phối hợp giúp cho người dùng gom nhóm các dấu hiệu (của đồ thị cấu trúc hoặc của đồ thị phẳng) có cùng tính chất Tính