vi DANH MỤC CÁC THUẬT NGỮ - KÍ HIỆU- CHỮ VIẾT TẮT Attributive language Thuộc tính ngôn ngữ Anchor Được xác định để so khớp một cặp khái niệm của hai ontology, sử dụng trong quá trình liê
Trang 1ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN
TRƯƠNG HẢI BẰNG
TÍCH HỢP ONTOLOGY MỜ TRÊN CƠ SỞ LÝ THUYẾT ĐỒNG THUẬN
LUẬN ÁN TIẾN SĨ KHOA HỌC MÁY TÍNH
TP HỒ CHÍ MINH – NĂM 2016
Trang 2ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN
TRƯƠNG HẢI BẰNG
TÍCH HỢP ONTOLOGY MỜ
TRÊN CƠ SỞ LÝ THUYẾT ĐỒNG THUẬN
Chuyên ngành: Khoa học máy tính
Mã số: 62.48.01.01 Phản biện 1: PGS TS Lê Hoài Bắc Phản biện 2: PGS TS Đỗ Văn Nhơn Phản biện 3: PGS TS Hồ Bảo Quốc Phản biện độc lập 1: PGS TS Trần Đình Khang Phản biện độc lập 2: PGS TS Lê Anh Cường
NGƯỜI HƯỚNG DẪN KHOA HỌC
1 GS TSKH NGUYỄN NGỌC THÀNH
2 PGS TS NGUYỄN PHI KHỨ
TP HỒ CHÍ MINH NĂM 2016
Trang 3LỜI CAM ĐOAN
Tôi xin cam đoan rằng nội dung của luận án này là kết quả nghiên cứu của chính bản thân Tất cả những tham khảo từ các nghiên cứu có liên quan đều được nêu rõ nguồn gốc từ danh mục các tài liệu tham khảo trong luận án Những đóng góp trong luận án
là nghiên cứu của tác giả đã công bố trong các bài báo khoa học nêu trong phần danh mục các công trình nghiên cứu chưa được công bố trong bất kì công trình nào khác
Tác giả luận án
Trương Hải Bằng
Trang 4ii
LỜI CẢM ƠN
Lời đầu tiên, Tôi xin bày tỏ lòng biết ơn sâu sắc đến GS TSKH NGUYỄN NGỌC THÀNH đã tận tình hướng dẫn và sự giúp đỡ quí báu của GS cho tôi hoàn thành được luận án này
Tôi xin chân thành cám ơn PGS.TS NGUYỄN PHI KHỨ sự động viên, chỉ bảo và hướng dẫn tạo điều kiện cho tôi rất nhiều trong quá trình học tập và nghiên cứu để hoàn thành luận án
Tôi cũng xin chân thành gửi lời cảm ơn đến tập thể Thầy Cô Trường Đại học Công nghệ Thông tin đã giúp đỡ, động viên và tạo điều kiện quí báu giúp Tôi hoàn thành khóa học đúng tiến độ
Cuối cùng tôi cảm ơn tất cả bạn bè và người thân đã góp nhiều ý kiến thiết thực và có những động viên khích lệ qúi báu giúp tôi vượt qua khó khăn và hoàn
thành tốt luận án
Tp Hồ Chí Minh, tháng năm 2015
Trương Hải Bằng
Trang 5MỤC LỤC
CHƯƠNG 1 MỞ ĐẦU 1
1.1 Động cơ nghiên cứu 1
1.2 Thách thức của bài toán tích hợp ontology mờ 2
1.3 Mục tiêu và phạm vi nghiên cứu 3
1.3.1 Mục tiêu nghiên cứu 3
1.3.2 Phạm vi nghiên cứu 3
1.4 Phương pháp nghiên cứu 3
1.4.1 Cơ sở khoa học 3
1.4.2 Giải pháp 3
1.4.3 Đánh giá, thử nghiệm 4
1.5 Nội dung nghiên cứu 4
1.6 Các đóng góp mới của luận án 5
1.7 Bố cục của luận án 5
CHƯƠNG 2 TÍCH HỢP ONTOLOGY MỜ VÀ CÁC NGHIÊN CỨU LIÊN QUAN 7
2.1 Ontology và tích hợp ontology 7
2.1.1 Ontology 7
2.1.2 Ontology và các nghiên cứu liên quan 9
2.1.3 Vai trò của ontology 9
2.1.4 Tích hợp ontology 10
2.2 Lý thuyết mờ 26
2.3 Tổng quan về ontology mờ và tích hợp ontology mờ 28
2.3.1 Ontology mờ 28
2.3.2 Tích hợp ontology mờ 35
2.4 Lý thuyết đồng thuận và mâu thuẫn tri thức 41
2.4.1 Tính không nhất quán thông tin 42
2.4.2 Biểu diễn mâu thuẫn tri thức 45
2.4.3 Lý thuyết đồng thuận 47
2.4.4 Nhận xét 57
Trang 6iv
2.4.5 Lược đồ lựa chọn tiêu chí đồng thuận 58
2.5 Tổng kết chương 58
CHƯƠNG 3 TÍCH HỢP ONTOLOGY MỜ TRÊN CƠ SỞ THUYẾT ĐỒNG THUẬN 60
3.1 Mô hình ontology mờ cho bài toán tích hợp 61
3.2 So khớp ontology mờ dựa trên phần chung tiềm năng 64
3.2.1 Các vấn đề cần giải quyết 64
3.2.2 Các phương pháp xác định sự tương đồng của các ontology 65
3.2.3 Các khái niệm và quy tắc so khớp PCP 68
3.2.4 Thuật toán so khớp PCP 70
3.2.5 Ví dụ minh họa thuật toán 72
3.2.6 Đánh giá thuật toán 75
3.3 Chất lượng của tri thức đồng thuận trong tích hợp ontology mờ 75
3.3.1 Lựa chọn tiêu chí đồng thuận trong tích hợp tri thức 76
3.3.2 Chất lượng của tri thức tích hợp sử dụng lý thuyết đồng thuận 77
3.4 Tích hợp ontology mờ ở mức khái niệm 78
3.4.1 Mâu thuẫn ontology mờ ở mức khái niệm 78
3.4.2 Thuật toán tích hợp ontology mờ mức khái niệm (FOI-1) 80
3.4.3 Phân tích và đánh giá thuật toán 82
3.5 Tích hợp ontology mờ ở mức quan hệ 82
3.5.1 Mâu thuẫn ontology mờ mức quan hệ 82
3.5.2 Thuật toán tích hợp ontology mờ mức quan hệ (FOI-2) 84
3.5.3 Phân tích và đánh giá thuật toán 86
3.6 Tích hợp ontology mờ ở mức thực thể 86
3.6.1 Biểu diễn cấu trúc đa thuộc tính - đa giá trị cho thực thể ontology mờ 88
3.6.2 Hàm khoảng cách giữa các giá trị thuộc tính trong bộ phức 89
3.6.3 Mâu thuẫn ontology mờ mức thực thể 91
3.6.4 Tiêu chí đồng thuận cho tích hợp ontology mờ mức thực thể mờ 91
3.6.5 Thuật toán tích hợp ontology mờ mức thực thể (FOI-3) 92
Trang 73.6.6 Phân tích và đánh giá thuật toán 93
3.7 Tổng kết chương 94
CHƯƠNG 4 THỰC NGHIỆM VÀ ĐÁNH GIÁ 96
4.1 Thử nghiệm 1 96
4.1.1 Dữ liệu thử nghiệm 96
4.1.2 Phương pháp đánh giá 99
4.1.3 Kết quả 101
4.1.4 Nhận xét 105
4.2 Thử nghiệm 2 106
4.2.1 Dữ liệu 106
4.2.2 Phương pháp đánh giá 107
4.2.3 Kết quả 108
4.2.4 Nhận xét 111
4.3 Tổng kết chương 112
CHƯƠNG 5 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 114
5.1 Kết luận 114
5.2 Các hạn chế 115
5.3 Hướng phát triển 115
5.4 KẾT QUẢ NGHIÊN CỨU 117
5.4.1 Danh mục các công trình đã công bố 117
5.4.2 Các hoạt động khoa học: đề tài/ dự án 119
TÀI LIỆU THAM KHẢO 120
PHỤ LỤC A ONTOLOGY VÀ CÁC NGHIÊN CỨU LIÊN QUAN 131
PHỤ LỤC B CÁC CÔNG CỤ TÍCH HỢP ONTOLOGY 136
PHỤ LỤC C HỆ THỐNG TÍCH HỢP ONTOLOGY MỜ FOIS 147
Trang 8vi
DANH MỤC CÁC THUẬT NGỮ - KÍ HIỆU- CHỮ VIẾT TẮT
Attributive language Thuộc tính ngôn ngữ
Anchor Được xác định để so khớp một cặp khái niệm của hai
ontology, sử dụng trong quá trình liên kết tiếp theo
Bootstrapping
Là tập hợp một số kỹ thuật phân tích dựa vào nguyên
lý chọn mẫu có hoàn lại (sampling with replacement)
để ước tính các thông số mà thống kê thông thường không giải được
Concept Hierarchy Generation Hệ phân cấp khái niệm
Complex tuple Bộ phức
Conflict body Mâu thuẫn thành viên
Conflict content Mâu thuẫn nội dung
Conflict profile Lược tả mâu thuẫn
Conflict subject Mâu thuẫn chủ đề
Crisp Ontology Ontology rõ
Data integration Tích hợp dữ liệu
Data, Information and Process
Integration with Semantic Web
Services
Dự án tích hợp (FP6 - 507.483) được hỗ trợ bởi chương trình FP6 của Liên minh châu Âu
Description Logics Logic mô tả
Elementary tuple Bộ cơ sở
Elementary values Giá trị cơ sở
Educational Game for Middle
& Primary School Students
Game Giáo dục cho Học sinh Trung & Tiểu học
Fuzzy Ontology Generation Hệ ontology mờ
Fuzzy Ontology Generation
frAmework
framework hệ ontology mờ
Formal Concept Analysis Phân tích khái niệm hình thức
Fuzzy profile Lược tả mờ
Fuzzy conflict profile Mâu thuẫn lược tả mờ
Fuzzy Description Logic Logic mô tả mờ
Fuzzy Markup Language Ngôn ngữ đánh dấu mờ
Fuzzy Ontology Ontology mờ
Fuzzy Ontology Integration Tích hợp ontology mờ
Trang 9Fuzzy Ontology Integration
System
Hệ thống tích hợp ontology mờ
Geographic Information
Systems
Hệ thống thông tin địa lý
Linking Open Data Liên kết dữ liệu mở
Object Oriented Progamming Lập trình hướng đối tương
Ontology Alignment Liên kết Ontology
Ontology Alignment
Evaluation Initiative
Cuộc thi thường niên đánh giá các công cụ tích hợp ontology
Ontology Conflict Mâu thuẫn Ontology
Ontology Heterogeneous Ontology không đồng nhất
Ontology Inconsistency Ontology không nhất quán
Ontology Integration Tích hợp Ontology
Ontology Mapping Ánh xạ Ontology
Ontology Matching So khớp Ontology
Ontology Merging Trộn Ontology
Ontology Mismatch Ontology không tương hợp
Web Ontology Language Ngôn ngữ mô tả ontology cho web ngữ nghĩa Paraconsistent logic Logic nhất quán ghép
Peer-to-peer-information
sharing
Hệ thống chia sẻ thông tin ngang hàng
Potentially Common Parts Phần chung tiềm năng
Extensible Markup Language Ngôn ngữ Đánh dấu Mở rộng
Super domain Siêu miền
Web Service Modeling
Language
Một mô hình ngôn ngữ cho các dịch vụ web ngữ nghĩa
Trang 10EGMPSS Educational Game for Middle & Primary School Students
FCA Formal Concept Analysis
FDL Fuzzy Description Logic
FML Fuzzy Markup Language
FOGA Fuzzy Ontology Generation frAmework
FOI Fuzzy Ontology Integration
FOIS Fuzzy Ontology Integration System
GIS Geographic Information Systems
IR Information Retrieval
KAON KArlsruhe ONtology
LOD Linking Open Data
OOP Object Oriented Progamming
OINT Ontology Integration
OMAP Ontology Mapping
PCP Potentially Common Parts
RDF Resource Description Framework
XML Extensible Markup Language
TIN Taxpayer's_identification number
WSML Web Service Modeling Language
Trang 11DANH MỤC CÁC BẢNG
Bảng 2.1 Bảng tóm tắt các công cụ tích hợp ontology 21
Bảng 2.2 ví dụ về các phương pháp gán giá trị mờ 27
Bảng 2.3 Các kiểu quan hệ và trọng số được gán 38
Bảng 2.4 Kết quả tích hợp trong các ont1 và ont2 38
Bảng 2.5 Bảng giá trị quan hệ của các cặp khái niệm trong ontology Ont1 39
Bảng 2.6 Bảng giá trị quan hệ của các cặp khái niệm trong ontology Ont2 39
Bảng 2.7 Mâu thuẫn phi logic 45
Bảng 3.1 Ví dụ về thực thể mờ thời tiết 64
Bảng 3.2 Khởi tạo Bảng MinTable 72
Bảng 3.3 Kết quả bảng MinTable thay đổi ở lần lặp thứ nhất 73
Bảng 3.4 Kết quả bảng MinTable thay đổi ở lần lặp thứ 2 74
Bảng 3.5 Kết quả bảng MinTable thay đổi ở lần lặp thứ 3 74
Bảng 3.6 Kết quả bảng MinTable thay đổi ở lần lặp thứ 4 74
Bảng 3.7 Phân tích độ phức tạp của thuật toán so khớp PCP 75
Bảng 3.8 Ví dụ về mâu thuẫn tri thức của chuyên gia 76
Bảng 3.9 Mâu thuẫn mức quan hệ của ontology 83
Bảng 3.10 Mâu thuẫn mức quan hệ của ontology mờ 84
Bảng 3.11 Giá trị thực thể của khái niệm sinh viên 87
Bảng 3.12 Giá trị thực thể của khái niệm nhân viên 87
Bảng 3.13 Mâu thuẫn giữa các thực thể mờ của một ontology thời tiết I 1,…, I6 88
Bảng 3.14 Minh họa cho bộ phức 89
Bảng 3.15 Minh họa cho bộ cơ sở 89
Bảng 3.16 Bảng tổng hợp các tiêu chí đồng thuận cho các thuật toán tích hợp ontology mờ FOI-1, FOI-2, FOI-3 93
Bảng 4.1 Thống kê các thành phần của ontololy mờ thời tiết đã xây dựng 97
Bảng 4.2 Minh họa cài đặt các khái niệm mờ thời tiết 97
Bảng 4.3 Minh họa cài đặt các quan hệ mờ thời tiết 98
Bảng 4.4 Minh họa cài đặt các thực thể mờ thời tiết 98
Trang 12x
Bảng 4.5 Mô tả thuộc tính của các ontology mờ thời tiết 107
Bảng 4.6 Mô tả quan hệ của các ontology mờ thời tiết 107
Bảng 4.7 Mô tả thực thể của các ontology mờ thời tiết 107
Bảng 4.8 Chất lượng xử lý mâu thuẫn của các hệ thống khác nhau 112
Trang 13DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ
Hình 1.1 Nội dung nghiên cứu của luận án 4
Hình 2.1 Các nghiên cứu liên quan 7
Hình 2.2 Khái niệm ontology từ các lĩnh vực khác nhau 8
Hình 2.3 Biểu diễn của tri thức trong ontology (Gruber, 1993) 8
Hình 2.4 Ontology và các nghiên cứu liên quan 9
Hình 2.5 Tích hợp các hệ thống tri thức ontology (N T Nguyen, 2008a) 10
Hình 2.6 Một ví dụ về ánh xạ ontology của hai trường Đại học 11
Hình 2.7 Mô hình tích hợp dữ liệu (Mao, 2008) 11
Hình 2.8 Truy vấn thông tin qua tích hợp ontology 12
Hình 2.9 Tích hợp ontology cho mục đích giao tiếp giữa các hệ thống thông tin 13
Hình 2.10 Một hệ thống đa tác tử để phát hiện xâm nhập 14
Hình 2.11 Các kỹ thuật so khớp cơ bản 15
Hình 2.12 Tích hợp ontology (Helena Sofia Pinto & Martins, 2001) 16
Hình 2.13 Trộn ontology (Helena Sofia Pinto & Martins, 2001) 16
Hình 2.14 Phân loại các phương pháp tích hợp ontology của (Noy, 2004) 17
Hình 2.15 Ví dụ liên kết ontology (Abolhassani et al., 2006) 18
Hình 2.16 Ví dụ trộn ontology (Murat Şensoy, 2006) 19
Hình 2.17 Phân loại các công cụ tích hợp ontology (Doan et al., 2004; Mao, 2008; Mao et al., 2010) 20
Hình 2.18 Tích hợp ontology 23
Hình 2.19 Các mức mâu thuẫn ontology (Nguyen, 2008a) 24
Hình 2.20 Một phân loại các nghiên cứu về định nghĩa ontology mờ 29
Hình 2.21 Cấu trúc miền một ontology mờ thời tiết (Lee et al., 2005) 31
Hình 2.22 Ví dụ về ontology mờ về tin tức thời tiết (Lee, Jian, & Huang, 2005) 32
Hình 2.23 Ví dụ Ontology mờ (Parry, 2005) 34
Hình 2.24 Ontology mờ Ont1 về lĩnh vực xuất bản (Abulaish & Dey, 2006) 36
Hình 2.25 Ontology mờ Ont2 về lĩnh vực xuất bản (Abulaish & Dey, 2006) 37
Hình 2.26 Phân loại các phương pháp tích hợp ontology mờ 40
Trang 14xii
Hình 2.27 Các mức mâu thuẫn dữ liệu (Kim et al., 1993) 44
Hình 2.28 Phân loại mâu thuẫn ontology (Hepp et al., 2007) 45
Hình 2.29 Các mức mâu thuẫn tri thức (N T Nguyen, 2008a) 46
Hình 2.30 Chất lượng của tri thức nhóm (Nguyen, CISIM 2014) 49
Hình 2.31 Ví dụ tiêu chí đồng thuận C 1 và C 2 52
Hình 2.32 Minh họa cho tiêu chí TLC 56
Hình 2.33 Lược đồ cho việc lựa chọn tiêu chí đồng thuận 58
Hình 3.1 Ví dụ một phần của ontology thời tiết 62
Hình 3.2 Ví dụ về khái niệm mờ thời tiết 63
Hình 3.3 Ví dụ về quan hệ mờ thời tiết 63
Hình 3.4 So khớp Anchor-PROMPT 65
Hình 3.5 Phần chung tiềm năng của hai ontology 68
Hình 3.6 Chất lượng của tri thức đồng thuận 77
Hình 3.7 Khái niệm WeatherPhenomenon trong ontology Weather1.OWL 79
Hình 3.8 Khái niệm WeatherPhenomenon trong ontology Weather2.OWL 80
Hình 4.1 Biểu đồ kết quả so khớp vòng thi directory OAEI từ năm 2006-2010 (Euzenat, Meilicke, Stuckenschmidt, Shvaiko, & Trojahn, 2011) 100
Hình 4.2 Kết quả đánh giá các hệ thống OAEI 2010 (Euzenat, Meilicke, Stuckenschmidt, Shvaiko, & Trojahn, 2011) 101
Hình 4.3 So sánh kết quả so khớp của PCP với 4 hệ thống khác 101
Hình 4.4 Kết quả của PCP trên 3 nhóm dữ liệu thử nghiệm của OAEI 102
Hình 4.5 Độ đo precision và recall cho các tập dữ liệu OAEI 103
Hình 4.6 Độ đo F-measure cho các tập dữ liệu OAEI 103
Hình 4.7 Độ đo precision và recall cho các tập dữ liệu ontology mờ 104
Hình 4.8 Độ đo F-measure cho các tập dữ liệu ontology mờ 104
Hình 4.9 So sánh phương pháp so khớp PCP và các hệ thống khác 105
Hình 4.10 So sánh chất lượng tri thức đồng thuận của hai lược tả khác nhau 108
Hình 4.11 Kết quả tích hợp mức Khái niệm 108
Hình 4.12 Chất lượng đồng thuận mức khái niệm của các lược tả khác nhau 109
Trang 15Hình 4.13 Kết quả tích hợp mức quan hệ 109
Hình 4.14 Chất lượng của sự đồng thuận mức quan hệ 110
Hình 4.15 Kết quả tích hợp mức thực thể 110
Hình 4.16 Chất lượng đồng thuận mức thực thể của các lược tả khác nhau 111
Hình 4.17 So sánh chất lượng xử lý mâu thuẫn của Chimaera và PROMPT 111
Trang 16CHƯƠNG 1
MỞ ĐẦU
1.1 Động cơ nghiên cứu
Trong nghiên cứu về ontology và web ngữ nghĩa, (Sanchez & Yamanoi, 2006) đã chỉ
ra rằng hiện nay ontology truyền thống không thích hợp cho việc triển khai các ứng dụng trong thế giới thực vì nó không đủ khả năng để mô tả và biểu diễn các thông tin
mơ hồ không chắc chắn Chẳng hạn ontology trong lĩnh vực thời tiết không thể biểu diễn giá trị của thuộc tính lượng mưa/nắng của một ngày là nhiều hay ít, cao hay thấp; trong lĩnh vực web ngữ nghĩa vấn đề sử dụng trạng từ và tính từ trong biểu diễn hoặc tìm kiếm thông tin: "Một nơi nghỉ dưỡng tốt", "ở một nơi rất lạnh" Xuất phát từ thực
tế này mô hình ontology mờ đã được đề xuất Định nghĩa ontology mờ đơn giản nhất
được (Dey & Abulaish, 2008) đề xuất là một cặp (C, R), trong đó C là các khái niệm
mờ và R là các quan hệ mờ Tùy theo mục tiêu nghiên cứu cặp (C, R) có thể được mở
rộng theo nhiều cách trong các miền ứng dụng khác nhau
Tích hợp tri thức là một quá trình trong đó sự không nhất quán của tri thức từ các nguồn khác nhau được hợp nhất nhằm mang lại một sự thống nhất của tri thức (N T Nguyen, 2008a) Ontology có có vai trò quan trọng trong việc tổ chức và quản lý thông tin tri thức ở các lĩnh vực nghiên cứu và ứng dụng khác nhau: trong tích hợp
cơ sở dữ liệu, thương mại điện tử, các dịch vụ web ngữ nghĩa, các mạng xã hội Để phát triển các hệ thống ứng dụng này, bài toán tích hợp ontology đã được nhiều công trình tập trung nghiên cứu Cùng với các kết quả nghiên cứu về lý thuyết các công cụ tích hợp ontology đã được xây dựng và phát triển: Anchor-PROMPT (Noy & Musen, 2001), RiMOM (J Li, Tang, Li, & Luo, 2009), (Y Jean-Mary & Kabuka, 2007), FCA-Merge (Stumme & Maedche, 2001), Chimaera (McGuinness, Fikes, Rice, & Wilder, 2000), (M Seddiqui, Aono, M., 2008), Falcon-AO (Hu et al., 2007),… Trong các hệ thống tri thức dựa trên ontology, các khái niệm, mối quan hệ và các thực thể của các đối tượng luôn luôn được thể hiện một cách chính xác Điều này không hoàn toàn phù hợp trong thế giới thực thường chứa các thông tin mơ hồ, không
Trang 17chắc chắn và không đầy đủ Mặt khác, do sự phân tán thông tin đến từ nhiều nguồn khác nhau và ngày càng gia tăng về số lượng các ontology dẫn đến sự không nhất quán thông tin và dữ liệu Các phương pháp và công cụ tích hợp ontology rõ không còn phù hợp, dẫn đến sự ra đời của bài toán tích hợp ontology mờ
Các công trình nghiên cứu về tích hợp ontology mờ hiện nay được thực hiện theo phương pháp so khớp/liên kết hoặc ánh xạ trên ontology mờ được định nghĩa theo logic mô tả mờ hoặc phi logic bằng cách mở rộng các thành phần của ontology truyền thống Một số rất ít các nghiên cứu đề cập đến bài toán xử lý mâu thuẫn ontology mờ
có thể kế đến là (Abulaish & Dey, 2006) đề xuất độ đo khái niệm nhất quán giữa hai ontology để xác định một khái niệm nhất quán giữa các ontology bị mâu thuẫn Một
tiếp cận khác, (Ferrara et al., 2008) đề xuất phương pháp giải quyết mâu thuẫn ở mức quan hệ trong ánh xạ ontology mờ Các mô hình ontology mờ được xây dựng chủ yếu phục vụ cho một ứng dụng cụ thể, chưa có nhiều nghiên cứu đề xuất các giải pháp xử
lý mâu thuẫn trên cấu trúc phức tạp của ontology mờ trong bài toán tích hợp Để giải quyết bài toán này, cần phải định nghĩa một mô hình ontology mờ và các thuật toán tích hợp trên mô hình tri thức đã xây dựng Tuy nhiên tích hợp ontology mờ là bài toán phức tạp vì tính không chắc chắn và không đầy đủ của thông tin, sự mâu thuẫn tri thức và cấu trúc đa dạng của nó Những khó khăn thách thức này thúc đẩy động
cơ nghiên cứu của luận án
Để đánh giá các thuật toán tích hợp ontology mờ của luận án, công việc thử nghiệm
được tiến hành theo các tiêu chí đánh giá của OAEI và chất lượng xử lý mâu thuẫn theo lý thuyết đồng thuận Dữ liệu thử nghiệm là các ontology của OAEI 1 và ontology
mờ thời tiết2 được mờ hóa theo phương pháp OWL2 của (Bobillo & Straccia, 2011).
1.2 Thách thức của bài toán tích hợp ontology mờ
Các khó khăn thách thức cho bài toán tích hợp ontology mờ là: (1) Cần phải xác định
mô hình tri thức ontology mờ cho bài toán tích hợp, (2) Tìm và xác định những điểm tương đồng và khác biệt giữa các ontology (so khớp ontology) (3) Xử lý mâu thuẫn
1 http://oaei.ontologymatching.org/
2 http://www.sensormeasurement.appspot.com/?p=ontologies#weather;
2
Trang 18giữa các ontology mờ trong quá trình tích hợp Trong đó vấn đề (3) Xử lý mâu thuẫn ontology mờ cần thỏa các điều kiện sau:
Bảo toàn thông tin: Dữ liệu của ontology nguồn không bị mất mát thông tin
Giải quyết mâu thuẫn: Tất cả các mâu thuẫn xuất hiện trong các ontology nguồn
phải được giải quyết
Bảo toàn cấu trúc: Các kiểu cấu trúc của kết quả tích hợp phải giống cấu trúc của
các yếu tố thành phần ban đầu
Chất lượng của các phương pháp xử lý mâu thuẫn
1.3 Mục tiêu và phạm vi nghiên cứu
1.3.1 Mục tiêu nghiên cứu
Mục tiêu nghiên cứu của luận án là
Xây dựng mô hình ontology mờ cho bài toán tích hợp
phương pháp tích hợp ontology mờ dựa trên cơ sở của lý thuyết đồng thuận
1.3.2 Phạm vi nghiên cứu
Xây dựng định nghĩa ontology mờ thích hợp cho bài toán tích hợp
Xây dựng thuật toán so khớp khái niệm giữa các ontology mờ dựa trên phần chung tiềm năng
Xây dựng các thuật toán tích hợp ontology mờ dựa trên lý thuyết đồng thuận theo các mức khái niệm, quan hệ và thực thể
1.4 Phương pháp nghiên cứu
1.4.1 Cơ sở khoa học
Sử dụng mô hình tri thức ontology mờ trên cơ sở lý thuyết mờ của (Zadeh, 1965)
Sử dụng lý thuyết đồng thuận trong tích hợp tri thức của (N T Nguyen, 2008a)
1.4.2 Giải pháp
Sử dụng mô hình tri thức ontology mờ cho thuật toán so khớp ontology mờ dựa trên
Trang 19phần chung tiềm năng và các thuật toán tích hợp ontology mờ dưa trên lý thuyết đồng thuận theo cấu trúc ba mức khái niệm, quan hệ và thực thể
1.4.3 Đánh giá, thử nghiệm
Dữ liệu thử nghiệm: từ OAEI và mờ hóa ontology thời tiết
lý thuyết IR và chất lượng tích hợp tri thức theo lý thuyết đồng thuận
1.5 Nội dung nghiên cứu
Bài toán PCP
Tích hợp ontology
mờ theo lý thuyết đồng thuận
ontology mờ
Cài đặt thử nghiệm và đánh giá
Hình 1.1 Nội dung nghiên cứu của luận án
1 Xây dựng định nghĩa ontology mờ (Mục 3.1, Chương 3)
2 Bài toán PCP: Xây dựng các thuật toán so khớp ontology mờ dựa trên phần chung
tiềm năng.(Mục 3.2, Chương 3).
3 Bài toán FOI-1: Định nghĩa bài toán mâu thuẫn mức khái niệm; Xây dựng thuật
toán tích hợp ontology mờ dựa trên lý thuyết đồng thuận mức khái niệm (Mục 3.4,
Chương 4)
4 Bài toán FOI-2.1, FOI-2.2: Định nghĩa bài toán mâu thuẫn mức quan hệ; Xây
Trang 20dựng thuật toán tích hợp ontology mờ dựa trên lý thuyết đồng thuận mức quan hệ
(Mục 3.5, Chương 3)
5 Bài toán FOI-3: Định nghĩa bài toán mâu thuẫn mức thực thể; Xây dựng thuật
toán tích hợp ontology mờ dựa trên lý thuyết đồng thuận mức thực thể (Mục 3.6,
Chương 3)
6 Cài đặt thử nghiệm (Chương 4)
1.6 Các đóng góp mới của luận án
Xây dựng mô hình tri thức ontology mờ
Xây dựng thuật toán so khớp ontology mờ
Xây dựng các thuật toán xử lý mâu thuẫn trong tích hợp ontology mờ ở ba mức khái niệm, quan hệ và thực thể dựa trên lý thuyết đồng thuận
Thực hiện cài đặt và đánh giá các thuật toán tích hợp ontology mờ trên một số bộ
dữ liệu ontology mờ thời tiết và OAEI
1.7 Bố cục của luận án
Chương 1 Giới thiệu
Động cơ nghiên cứu
Các thách thức của bài toán tích hợp ontology mờ
Mục tiêu và phạm vi nghiên cứu
Phương pháp nghiên cứu
Nội dung nghiên cứu
Các đóng góp mới của luận án
Chương 2 Tích hợp ontology mờ và các nghiên cứu liên quan:
Ontology và tích hợp ontology
Lý thuyết mờ
Tổng quan về ontology mờ và tích hợp ontology mờ
Lý thuyết đồng thuận và mâu thuẫn tri thức
Chương 3 Tích hợp ontology mờ trên cơ sở lý thuyết đồng thuận
Trang 21Chương này trình bày các kết quả đóng góp mới của luận án bao gồm các nội dung:
Xây dựng mô hình ontology mờ
Xây dựng thuật toán so khớp ontology mờ dựa trên phần chung tiềm năng
Xây dựng các thuật toán tích hợp ontology mờ theo các mức khái niệm, quan hệ
và thực thể theo các tiêu chí đồng thuận
Chương 4 Thực nghiệm và đánh giá
Thử nghiệm 1: thuật toán so khớp ontology mờ dựa trên phần chung tiềm năng
Thử nghiệm 2: tích hợp ontology mờ theo lý thuyết đồng thuận
Chương 5 Kết luận và hướng phát triển
Tài liệu tham khảo
Phụ lục A: Ontology và các nghiên cứu liên quan
Phụ lục B: Các công cụ tích hợp ontology
Phụ lục C: Hệ thống tích hợp ontology mờ FOIS
Trang 22CHƯƠNG 2
TÍCH HỢP ONTOLOGY MỜ
VÀ CÁC NGHIÊN CỨU LIÊN QUAN
Chương này trình bày cơ sở lý thuyết từ các nghiên cứu liên quan đến nội dung thực hiện của luận án (Hình 2.1), bao gồm:
Tích hợp ontology mờ
Lý thuyết mờ (Zadeh, 1965)
Hình 2.1 Các nghiên cứu liên quan
2.1 Ontology và tích hợp ontology
2.1.1 Ontology
Khái niệm ontology được phát triển từ nhiều lĩnh vực khác nhau (Hình 2.2), ontology bắt nguồn từ triết học, được dẫn xuất từ tiếng Hi Lạp là “onto” và “logia” Trong ngữ cảnh triết học, ontology thuộc một nhánh của siêu hình học, được sử dụng để nghiên cứu về bản chất của sự tồn tại, xác định các sự vật nào thực sự tồn tại và cách thức
mô tả chúng (Aristoteles)
Trang 23Hình 2.2 Khái niệm ontology từ các lĩnh vực khác nhau
Trong lĩnh vực trí tuệ nhân tạo, ontology được định nghĩa theo cách khác: một
ontology là một đặc tả hình thức, của khái niệm được chia sẻ thuộc một lĩnh vực nào
đó (Gruber, 1993)
Đặc tả hình thức: là biểu diễn của các khái niệm, quan hệ, thực thể, các ràng buộc
toàn vẹn mà máy tính có thể hiểu được
Khái niệm được chia sẻ: nói đến tri thức đồng thuận của cộng đồng
Một lĩnh vực nào đó: nói đến ứng dụng trong lĩnh vực cụ thể của thế giới thực
Bộ từ vựng
+ + + Thực thể
=
=
=
Quan hệ, ràng buộc và quy tắc Cấu trúc Sự phân cấp
Tri thức Ontology
Hình 2.3 Biểu diễn của tri thức trong ontology (Gruber, 1993)
Trong lĩnh vực tích hợp và xử lý mâu thuẫn tri thức (N T Nguyen, 2008a) khái niệm ontology được định nghĩa như sau:
O = (C, I, R, Z), trong đó:
Trang 24– I là tập hợp các thực thể
hệ giữa các thực thể và các khái niệm
2.1.2 Ontology và các nghiên cứu liên quan
Nội dung của phần này được trình bày trong phục lục A của luận án
2.1.3 Vai trò của ontology
Ontology đã trở thành một công cụ quan trọng trong trong nhiều lĩnh vực ứng dụng khác nhau với các ưu điểm như sau:
Cho phép chia sẻ những hiểu hiểu biết chung về các khái niệm, cấu trúc thông tin
giữa con người hoặc giữa các hệ thống thông tin tri thức: đây là ưu điểm quan
trọng của ontology liên quan đến bài toán tích hợp ontology
ontology và xây dựng mô hình tri thức ontology
nào để một hệ thống ontology có thể được dùng bởi các ngôn ngữ của các quốc
Hình 2.4 Ontology và các nghiên cứu liên quan
Ontology
Merging Traslation
Learning Mapping Management
Evaluation Reuse
Trang 25gia khác nhau mà không phải xây dựng lại từ đầu
phân tán dựa trên ontology thường xuyên xuất hiện mâu thuẫn giữa các thành
phần của hệ thống Để thực hiện sự nhất quán của tri thức cần phải xử lý các mâu
thuẫn xảy ra, đây là khó khăn lớn nhất liên quan đến bài toán tích hợp ontology
và lý thuyết đồng thuận
ontology để chia sẻ, tái sử dụng và tích hợp tri thức ontology
2.1.4 Tích hợp ontology
Ontology có vai trò quan trọng trong quá trình trao đổi tri thức và dữ liệu giữa các hệ thống thông tin phân tán Tích hợp tri thức là một quá trình mà trong đó sự không nhất quán của tri thức từ các nguồn khác nhau được hợp nhất nhằm mang lại một sự thống nhất của tri thức (Nguyen, 2008a) (Hình 2.5).
Hình 2.5 Tích hợp các hệ thống tri thức ontology (N T Nguyen, 2008a)
Tích hợp ontology và ứng dụng
Web ngữ nghĩa: Ontology đóng vai trò then chốt trong việc cung cấp ngữ nghĩa mà
máy có thể hiểu được các tài nguyên của WWW Hệ thống thông tin web ngữ nghĩa thường xuyên có yêu cầu trao đổi, chia sẻ dữ liệu và tái sử dụng Thực hiện yêu cầu này là vấn đề phức tạp vì sự tương tác ngữ nghĩa giữa các hệ thống khác nhau, đặc
Trang 26biệt trong môi trường phân tán và không đồng nhất của thông tin Theo (Ehrig, 2006), tích hợp ontology là điều kiện tiên quyết cần thiết để thiết lập khả năng tương tác giữa các tác nhân hoặc dịch vụ sử dụng hệ thống WWW Quan sát trang web Khoa khoa học máy tính của Đại học Washington1 và Đại học Sydney2: Để thông tin của hai khoa này được chia sẻ, hai trang web hiểu nhau về ngữ nghĩa Giải pháp là thực hiện ánh
xạ hai ontology của hai khoa với nhau (Hình 2.6)
Hình 2.6 Một ví dụ về ánh xạ ontology của hai trường Đại học3
Tích hợp dữ liệu: Tích hợp dữ liệu có thể được thực hiện từ nhiều hệ thống để truy
cập và xử lý mà không cần tập hợp dữ liệu của chúng vào một trung tâm lưu trữ dữ liệu
Hình 2.7 Mô hình tích hợp dữ liệu (Mao, 2008)
1 www.cs.washington.edu
2 http://sydney.edu.au/engineering/it/
3 http://www2002.org/CDROM/refereed/232/
Trang 27Hình 2.7 trình bày một mô hình tích hợp các hệ thống cơ sở dữ liệu khác nhau từ hai
cơ sở dữ liệu 𝐷1 và 𝐷2 được kết hợp với các ontology 𝑂1và 𝑂2 Ví dụ, thị trường kinh doanh trên trang web của Amazon1 có thể cần phải kết hợp các sản phẩm từ nhiều nhà cung cấp sản phẩm vào cho riêng của mình Một cổng thông tin web như NCSTRL2
có thể muốn tích hợp tài liệu từ nhiều thư mục của thư viện thành một hệ thống.Một công ty muốn tích hợp các loại dịch vụ của mình với các đối tác Một nhà nghiên cứu
có thể muốn tích hợp các công trình của mình cùng với các đồng nghiệp
Truy vấn thông tin: (Kern, Stolarczyk, & Nguyen, 2013) Các truy vấn thông tin từ
nhiều hệ thống tri thức ontology phân tán Các truy vấn được gửi đến các ontology tương ứng trong hệ thống thông tin phân tán, sau đó được hồi đáp cho người sử dụng thông qua hệ thống ontology đã được tích hợp (Hình 2.8)
Query
Query Response
Response Integration Module
Hình 2.8 Truy vấn thông tin qua tích hợp ontology
Hệ thống thông tin ngang hàng: là một hệ thống chia sẻ thông tin ngang hàng thông
qua kết nối mạng (Obrst, 2001) Việc chia sẻ thông tin trên hệ thống này rất phổ biến như: ảnh, nhạc, phim, sách, Để thiết lập việc trao đổi thông tin có ý nghĩa của người
1 http://www.amazon.com/
2
Trang 28sử dụng, một trong những bước quan trọng là xác định và mô tả các mối quan hệ thông tin của chúng Các mối quan hệ được xác định giữa các ontology được sử dụng cho mục đích truy vấn
Hình 2.9 Tích hợp ontology cho mục đích giao tiếp giữa các hệ thống thông tin
Hình 2.9 mô tả quá trình trao đổi thông tin giữa hai hệ thống thông tin tri thức Server
1 muốn truy vấn thông tin từ Server 2 Để Server 2 hiểu được truy vấn từ Server 1
cần phải tích hợp hai ontology1 và ontology2 Kết quả của quá trình tương tác giữa hai hệ thống sẽ phụ thuộc vào kết quả so khớp các ontology1 và ontology2
Hệ thống thông tin đa tác tử: được dùng để giao tiếp giữa các tác nhân trong hệ thống
đa tác tử không đồng nhất Trong các hệ thống này, các tác nhân phải xử lý sự không đồng nhất thông tin giữa các ontology trong việc giao tiếp với nhau Một ví dụ thực
tế đề cập đến một hệ thống phục vụ đa tác tử phát hiện xâm nhập trong một hệ thống mạng Hình 2.10 Có hai loại tác nhân được thiết kế: Tác nhân giám sát (MA) và tác nhân quản lý (MAA) Tác nhân giám sát quan sát các trang web, xử lý thông tin và đưa ra kết luận cần thiết để đánh giá hiện trạng của hệ thống an ninh Tác nhân quản
lý chịu trách nhiệm quản lý công việc của các tác nhân giám sát Nếu một cuộc tấn công xuất hiện, các tác nhân phải xác định được các kiểu, nguồn gốc và con đường
Trang 29lan truyền của cuộc tấn công này Thực tế xảy ra là các khu vực tác nhân giám sát có thể thu được kết quả từ một trang web có thể không nhất quán, cần phải xử lý mâu thuẫn trong trường hợp này
Management Server6 Management Server3
Định nghĩa 2.1.1 (Độ tương đồng): (Euzenat & Shvaiko, 2007) Cho O là một tập hợp
các thành phần của ontology, độ tương đồng được định nghĩa là một ánh xạ 𝜎: O × O
Trang 30→ R thỏa các điều kiện sau:
Ánh xạ 𝜎 có đầu vào là cặp (x, y) ∈ {O × O} và cho kết quả là một số thực đểbiểu
diễn độ sai khác giữa x và y Dựa trên độ đo tương đồng, các kỹ thuật so khớp ontology
được chia thành bốn loại là: Thuật ngữ, khái niệm, mở rộng và ngữ nghĩa (Hình 2.11)
Hình 2.11 Các kỹ thuật so khớp cơ bản
Các định nghĩa về tích hợp ontology
Theo Pinto và các cộng sự (H Sofia Pinto, Gómez-Pérez, & Martins, 1999; Helena
Sofia Pinto & Martins, 2001) tích hợp và trộn là hai tác vụ khác nhau: (1) Tích hợp
ontology: Xây dựng một ontology mới tái sử dụng các ontology thuộc các lĩnh vực
Dựa trên chuỗiDựa trên ngôn ngữ
Dựa trên cấu trúc
Dựa trên ngữ nghĩa
Kỹ thuật mô tả logic
Kỹ thuật SAT
Trang 31khác nhau (Hình 2.12), (2) Trộn ontology: Là tạo ontology mới bằng cách trộn các
ontology khác nhau trong cùng một lĩnh vực (Hình 2.13)
Ontology 1 Ontology 2
Ontology Nguồn
Các ontology nguồn có tên miền (domain) tương tự sẽ được tích hợp
Kết quả Tích hợp
Ontology Nguồn 1
Ontology Nguồn 2
Các ontology nguồn được
đặt vào một module trong
ontology kết quả -> dễ xác
định được phần nào đến từ
được kết nối yếu trong kết quả (ít chồng lấp)
Hình 2.12 Tích hợp ontology (Helena Sofia Pinto & Martins, 2001)
Nguồn
Các ontology nguồn có tên miền(domain) giống hệt nhau sẽ được trộn
Kết quả Trộn
Thông tin của các ontology
nguồn được hòa lẫn ở mức cao
-> khó có thể xác định phần nào
đến từ ontology nào
Các ontology nguồn được kết nối chặt chẽ trong kết quả (mức độ chồng lấp cao)
Hình 2.13 Trộn ontology (Helena Sofia Pinto & Martins, 2001)
Theo tiếp cận của (Noy, 2004) quá trình tích hợp ontology được phân thành hai loại
so khớp/liên kết hoặc ánh xạ/trộn như sau (Hình 2.14):
Trang 32Hình 2.14 Phân loại các phương pháp tích hợp ontology của (Noy, 2004)
Định nghĩa 2.1.2 (Tích hợp ontology): là việc xử lý tìm ra các thành phần tương đồng
giữa các ontology 𝑂1, , 𝑂𝑛 và tạo ra một ontology mới 𝑂∗để trao đổi thông tin giữa các hệ thống thông tin tri thức dựa trên các ontology 𝑂1, , 𝑂𝑛 Ontology 𝑂∗thay thế cho các ontology 𝑂1, , 𝑂𝑛 hoặc nó được sử dụng như một thành phần trung gian giữa các hệ thống tri thức dựa trên các ontology 𝑂1, , 𝑂𝑛.(Sowa, 1999)
Có thể thực hiện tích hợp ontology theo các kỹ thuật khác nhau: So khớp, liên kết ontology, ánh xạ và trộn ontology được định nghĩa như sau:
Định nghĩa 2.1.3 (So khớp ontology): là tìm kiếm các mối quan hệ hay sự tương đồng
giữa các thành phần trong các ontology khác nhau Quá trình này được sử dụng khi chúng ta cần giao tiếp trao đổi giữa hai hệ thống hoặc muốn sử dụng thông tin của hệ thống thứ hai cho người dùng của hệ thống thứ nhất So khớp ontology được sử dụng trong nhiều công việc khác như trộn ontology, trả lời truy vấn, dịch dữ liệu, hoặc web ngữ nghĩa
Định nghĩa so khớp ontology được đề cập trong các công trình: (Belhadef, 2011; Doan, Madhavan, Domingos, & Halevy, 2004; Euzenat., 2005; Madhavan, Bernstein,
& Rahm, 2001; Mascardi, Locoro, & Rosso, 2010; Noy & Musen, 2001; H Sofia Pinto et al., 1999; M Seddiqui, Aono, M., 2008; Todorov, Geibel, & Hudelot, 2011; Wang & Xu, 2007)
Định nghĩa 2.1.4 (Liên kết ontology): là tập hợp các tương ứng giữa hai ontology,
liên kết ontology là kết quả của quá trình so khớp
Định nghĩa này được đề cập trong các công trình: (Abolhassani, Hariri, & Haeri,
Trộn ontology:
Trộn các ontology khác nhau để tạo ra một ontology nhất quán: Cần
phải giải quyết các mâu thuẫn ontology xuất hiện trong quá trình tích hợp
Trang 332006; Bock & Hettenhausen, 2012; Chua & Kim, 2012; Ehrig, 2006; Y Jean-Mary
& Kabuka, 2007; Kabuka, 2014; J Li et al., 2009; Noy & Musen, 1999, 2000; M Seddiqui, Aono, M., 2008; M H Seddiqui & Aono, 2009; Wang & Xu, 2007) (Hình 2.15)
Hình 2.15 Ví dụ liên kết ontology (Abolhassani et al., 2006)
Định nghĩa 2.1.5 (Ánh xạ ontology): là sự tương ứng một chiều, của các khái niệm
và quan hệ từ một ontology này sang một ontology khác, ánh xạ ontology là một trường hợp của liên kết ontology
Định nghĩa này được đề cập trong các công trình : (Bakillah & Mostafavi, 2011; Buche, Dibie-Barthélemy, & Ibanescu, 2008; Choi, Song, & Han, 2006; Chungoora
& Young, 2008; Ehrig & Sure, 2004; Fernández, Velasco, & López-Carmona, 2009; Ferrara et al., 2008; Khattak, Pervez, Latif, & Lee, 2012; Kolli & Boufaida, 2011;
Ma, Zhang, Yan, & Cheng, 2014; Mao, 2008; Mao, Peng, & Spring, 2010; Rujuan Wang, 2012; Xu, Kang, Lu, Li, & Jiang, 2005; ZHAO, LI, & RAO, 2011) (Hình 2.16)
Định nghĩa 2.1.6 (Trộn ontology): là quá trình tạo ra một ontology mới từ các
ontology khác nhưng cùng một lĩnh vực, được sử dụng khi cần tích hợp một số hệ thống để tạo ra một hệ thống mới (Guzmán-Arenas & Cuevas, 2010; G LI, WANG,
& ZHANG, 2014; Z.-H Li & Li, 2012; Noy & Musen, 1999, 2000; Rung-Ching Chen, 2011; Stumme & Maedche, 2001) (Hình 2.17)
Trang 34Luxury Car Family CarSport Car
Family Car Sport Car
Automobile
Thing
Vehicle
Car Bus
Porsche BMW
Porsche BMW
Các công cụ tích hợp ontology
Cùng với các kết quả nghiên cứu về lý thuyết, có thể kể tên một số công cụ tích hợp ontology dựa trên công nghệ học máy, cấu trúc, ngữ nghĩa và phương pháp lai như: Anchor-PROMPT (Noy & Musen, 2001), RiMOM (J Li et al., 2009), (Y Jean-Mary
& Kabuka, 2007), FCA-Merge (Stumme & Maedche, 2001), Chimaera (McGuinness
et al., 2000), (M Seddiqui, Aono, M., 2008), Falcon-AO (Hu et al., 2007),… các công
cụ này thực hiện tích hợp ontology rõ theo các phương pháp so khớp/liên kết, ánh xạ
hoặc trộn ontology, hiện nay chưa có công cụ tích hợp cho ontology mờ
Có thể phân loại các công cụ tích hợp ontology theo các phương pháp: dựa trên Học
Hình 2.16 Ví dụ trộn ontology (Murat Şensoy, 2006)
Trang 35máy, cấu trúc, ngữ nghĩa và phương pháp lai (Hình 2.18) và bảng tóm tắt các công cụ tích hợp ontology (Bảng 2.1) Chi tiết về các công cụ tích hợp ontology được trình bày trong phần Phụ lục A của luận án
Hình 2.17 Phân loại các công cụ tích hợp ontology (Doan et al., 2004; Mao, 2008; Mao
ContentMa
Prompt
Structure
ASMOV CIDER SPIDER ONION CROSI CMS OntoBuilde DSSIM FCA-Merge
Falcon-Semantic
OntoMediat RiMOM Anchor-prompt MAFRA Chimera HCONE
Hybrid
COM++ AROMA Lily FOAM
Trang 36Thuật toán
Tính
tự động Tác giả
Dựa trên máy học
CAIMAN
- Hai Ontologies
- Kết quả Ánh xạ Ánh xạ * * Bán tự động
Technische University, Munchen,
2001 Content
Map
- Hai Ontologies
- Kết quả Ánh xạ Ánh xạ OWL 2 * Bán tự động
University of Oxford, UK, 2008
Prompt - Hai ontology
2003 Dựa trên câu trúc
2007 ASMOV
- OWL-DL
- Kết quả liên kết Liên kết * Jena ARP động Tự
INFOTECH Soft, Florida,
2007 CIDER
Scarlet
Tự động
KnowledgeMedia Institute, UK, 2008 ONION - - RDF Kết quả trộn Trộn JAVA SKAT Bán tự
động
Stanford University,2004 CROSI
CMS
- OWL
- Kết quả so khớp So khớp JAVA Jena & JWNL
Tự động
Hewlett Packard Lab, 2005 OntoBu
ilder
- Hai Ontologies
- Kết quả so khớp So khớp JAVA *
Tự động
Israel Institute of Technology, 2004
Trang 37DSSim - - Hai Ontologies Kết quả Ánh xạ Ánh xạ OWL SKOS
parser
Bán tự động
United Kingdom,
2006 FCA-
Merge
- Hai Ontologies
- Kết quả trộn Trộn * Concept lattice động Tự
University of Karlsruhe Germany,
2001 Dựa trên ngữ nghĩa
Bán tự động
DEI - ISEP– IPP Portugal, 2003
Bán tự động
AI-Lab, Greece,
2002 Phương pháp Lai
COM++
- XML, OWL
- XML So khớp * OWL API Bán tự động
Database groupLeipzig,
Tự động
Southeast University, China,
Institute AIFB, Germany,
2005
Nhận xét: Các công cụ tích hợp ontology đã được phân loại theo các phương pháp
Trang 38dựa trên học máy, cấu trúc, ngữ nghĩa và phương pháp lai Các phương pháp tích hợp theo tiếp cận khác nhau tuy nhiên vấn đề xử lý mâu thuẫn ontology vẫn còn là thách thức cho các nghiên cứu về tích hợp ontology, đặc biệt là trên ontology mờ
Tích hợp ontology dựa trên lý thuyết đồng thuận
Định nghĩa về tích hợp ontology và cấu trúc phân cấp về xử lý mâu thuẫn theo ba mức của (Nguyen, 2008a) là tiếp cận của phương pháp tích hợp ontology mờ trên cơ
sở lý thuyết đồng thuận của luận án (Chương 3)
Định nghĩa 2.1.7 (Nguyen, 2008a): Tích hợp ontology là quá trình xác định một
ontology O* tốt nhất đại diện cho các ontology O i, i=1, ,n (Hình 2.18)
Thuật toán tích hợp
Trang 39Tích hợp ontology được thực hiện theo các mức như sau (Hình 2.19):
Hình 2.19 Các mức mâu thuẫn ontology (Nguyen, 2008a)
Thực thể: cùng thực thể của các ontology khác nhau có mô tả mâu thuẫn với nhau Khái niệm: cùng khái niệm nhưng khác về cấu trúc trong các ontology khác nhau Quan hệ: có mâu thuẫn về quan hệ giữa hai khái niệm trong các ontology khác nhau Định nghĩa 2.1.8 (Định nghĩa ontology):
Ontotlogy là một bộ bốn O = (C, I, R, Z), trong đó:
của ontology được định nghĩa là một bộ ba: (c, 𝐴𝑐, 𝑉𝑐), trong đó:c là tên duy nhất
của khái niệm, 𝐴𝑐 ⊆ A là các thuộc tính trong A, 𝑉𝑐⊆⋃𝑎∈𝐴𝑐𝑉𝑎(𝑉𝑎là miền giá trị của thuộc tính 𝑎), 𝑉𝑐 = ⋃𝑎∈𝐴𝑐𝑉𝑎.Cặp (𝐴𝑐, 𝑉𝑐) được gọi là cấu trúc của khái niệm c
thuộc tính của tập 𝐴𝑐,với các giá trị trong tập 𝑉𝑐 là cặp (id, v), trong đó id là định danh của thực thể và v là giá trị của thực thể là một ánh xạ v: 𝐴𝑐→ 𝑉𝑐, v(a) ∈ 𝑉𝑐,
a∈ 𝐴𝑐
RO(c, c′) là quan hệ giữa hai khái niệm c và c′ trong ontology O
Trang 40hệ giữa các thực thể và các khái niệm
niệm (c, 𝐴𝑐, 𝑉𝑐) và (c’, 𝐴𝑐, 𝐴𝑐′), với (id, v) ∈ (𝑂1, c) và (id, v′)∈ (𝑂2, c′), mâu thuẫn thực thể xảy ra nếu v(a) ≠ v′(a) với a ∈𝐴𝑐∩ 𝐴𝑐′
Bài toán 2.1.1 (Xử lý mâu thuẫn mức thực thể): Để giải quyết mâu thuẫn của ontology
sử dụng phương pháp đồng thuận như sau: Cho tập các giá trị X = {𝑣1, 𝑣𝑛}, 𝑣𝑖 là một bộ của 𝐴𝑖 ⊆ A, 𝑣𝑖: 𝐴𝑖 → 𝑉𝑖, i = 1,…,n, 𝑉𝑖 =⋃ 𝑉𝑎
𝑎∈𝐴 𝑖 Cần xác định bộ v tốt nhất trong tập X thỏa điều kiện sau: ∑𝑛𝑖=1𝑑(𝑣,𝑣𝑖) = min
𝑣′ 𝑉 𝑎
∑𝑛𝑖=1𝑑(𝑣′,𝑣𝑖) Điều kiện này thỏa tiêu chí đồng thuận
Định nghĩa 2.1.10 (Mâu thuẫn mức khái niệm):
Cho hai ontology 𝑂1và 𝑂2, khái niệm c thuộc 𝑂1 là bộ (c, 𝐴𝑐1, ) và thuộc 𝑂2 là (c,
𝐴𝑐 2, 𝑉𝑐 2) Ta nói rằng sự mâu thuẫn khái niệm xảy ra nếu 𝐴𝑐 1≠ 𝐴𝑐 2 hoặc 𝑉𝑐 1≠ 𝑉𝑐 2
Thuật ngữ tốt nhất có nghĩa là có nhiều nhất các tiêu chí được thỏa trong việc xác định cặp (A * , V * ) Các tiêu chí được định nghĩa như sau:
P1 ∀ 𝑎, 𝑏 ∈ 𝐴 = ⋃𝑛 𝐴𝑖
𝑖=1 và a ↔ b thì tất cả sự xuất hiện của a trong tập 𝐴𝑖 có thể
được thay thế bởi thuộc tính b hoặc ngược lại
P2 Với mọi tập 𝐴𝑖chứa các thuộc tính a, b và a → b, có thể loại bỏ thuộc tính b
P3 ∀ 𝑎, 𝑏 ∈ 𝐴 = ⋃𝑛 𝐴𝑖
𝑖=1 , a ↓ b thì tất cả các xuất hiện của a trong tất cả các các tập
𝐴𝑖 có thể được thay thế bởi thuộc tính b hoặc ngược lại
P4 Sự xuất hiện của một thuộc tính trong tập hợp 𝐴∗chỉ phụ thuộc vào sự xuất hiện của thuộc tính này trong tập 𝐴𝑖
P5 Một thuộc tính xuất hiện trong tập 𝐴∗ nếu nó xuất hiện trong ít nhất một nửa của tập 𝐴𝑖
P6 Tập 𝐴∗ tương đương với A nếu thỏa P 1 - P3