1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Tích hợp ontology mờ trên cơ sở lý thuyết đồng thuận

166 319 1

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 166
Dung lượng 6,47 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

vi DANH MỤC CÁC THUẬT NGỮ - KÍ HIỆU- CHỮ VIẾT TẮT Attributive language Thuộc tính ngôn ngữ Anchor Được xác định để so khớp một cặp khái niệm của hai ontology, sử dụng trong quá trình liê

Trang 1

ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN

TRƯƠNG HẢI BẰNG

TÍCH HỢP ONTOLOGY MỜ TRÊN CƠ SỞ LÝ THUYẾT ĐỒNG THUẬN

LUẬN ÁN TIẾN SĨ KHOA HỌC MÁY TÍNH

TP HỒ CHÍ MINH – NĂM 2016

Trang 2

ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN

TRƯƠNG HẢI BẰNG

TÍCH HỢP ONTOLOGY MỜ

TRÊN CƠ SỞ LÝ THUYẾT ĐỒNG THUẬN

Chuyên ngành: Khoa học máy tính

Mã số: 62.48.01.01 Phản biện 1: PGS TS Lê Hoài Bắc Phản biện 2: PGS TS Đỗ Văn Nhơn Phản biện 3: PGS TS Hồ Bảo Quốc Phản biện độc lập 1: PGS TS Trần Đình Khang Phản biện độc lập 2: PGS TS Lê Anh Cường

NGƯỜI HƯỚNG DẪN KHOA HỌC

1 GS TSKH NGUYỄN NGỌC THÀNH

2 PGS TS NGUYỄN PHI KHỨ

TP HỒ CHÍ MINH NĂM 2016

Trang 3

LỜI CAM ĐOAN

Tôi xin cam đoan rằng nội dung của luận án này là kết quả nghiên cứu của chính bản thân Tất cả những tham khảo từ các nghiên cứu có liên quan đều được nêu rõ nguồn gốc từ danh mục các tài liệu tham khảo trong luận án Những đóng góp trong luận án

là nghiên cứu của tác giả đã công bố trong các bài báo khoa học nêu trong phần danh mục các công trình nghiên cứu chưa được công bố trong bất kì công trình nào khác

Tác giả luận án

Trương Hải Bằng

Trang 4

ii

LỜI CẢM ƠN

Lời đầu tiên, Tôi xin bày tỏ lòng biết ơn sâu sắc đến GS TSKH NGUYỄN NGỌC THÀNH đã tận tình hướng dẫn và sự giúp đỡ quí báu của GS cho tôi hoàn thành được luận án này

Tôi xin chân thành cám ơn PGS.TS NGUYỄN PHI KHỨ sự động viên, chỉ bảo và hướng dẫn tạo điều kiện cho tôi rất nhiều trong quá trình học tập và nghiên cứu để hoàn thành luận án

Tôi cũng xin chân thành gửi lời cảm ơn đến tập thể Thầy Cô Trường Đại học Công nghệ Thông tin đã giúp đỡ, động viên và tạo điều kiện quí báu giúp Tôi hoàn thành khóa học đúng tiến độ

Cuối cùng tôi cảm ơn tất cả bạn bè và người thân đã góp nhiều ý kiến thiết thực và có những động viên khích lệ qúi báu giúp tôi vượt qua khó khăn và hoàn

thành tốt luận án

Tp Hồ Chí Minh, tháng năm 2015

Trương Hải Bằng

Trang 5

MỤC LỤC

CHƯƠNG 1 MỞ ĐẦU 1

1.1 Động cơ nghiên cứu 1

1.2 Thách thức của bài toán tích hợp ontology mờ 2

1.3 Mục tiêu và phạm vi nghiên cứu 3

1.3.1 Mục tiêu nghiên cứu 3

1.3.2 Phạm vi nghiên cứu 3

1.4 Phương pháp nghiên cứu 3

1.4.1 Cơ sở khoa học 3

1.4.2 Giải pháp 3

1.4.3 Đánh giá, thử nghiệm 4

1.5 Nội dung nghiên cứu 4

1.6 Các đóng góp mới của luận án 5

1.7 Bố cục của luận án 5

CHƯƠNG 2 TÍCH HỢP ONTOLOGY MỜ VÀ CÁC NGHIÊN CỨU LIÊN QUAN 7

2.1 Ontology và tích hợp ontology 7

2.1.1 Ontology 7

2.1.2 Ontology và các nghiên cứu liên quan 9

2.1.3 Vai trò của ontology 9

2.1.4 Tích hợp ontology 10

2.2 Lý thuyết mờ 26

2.3 Tổng quan về ontology mờ và tích hợp ontology mờ 28

2.3.1 Ontology mờ 28

2.3.2 Tích hợp ontology mờ 35

2.4 Lý thuyết đồng thuận và mâu thuẫn tri thức 41

2.4.1 Tính không nhất quán thông tin 42

2.4.2 Biểu diễn mâu thuẫn tri thức 45

2.4.3 Lý thuyết đồng thuận 47

2.4.4 Nhận xét 57

Trang 6

iv

2.4.5 Lược đồ lựa chọn tiêu chí đồng thuận 58

2.5 Tổng kết chương 58

CHƯƠNG 3 TÍCH HỢP ONTOLOGY MỜ TRÊN CƠ SỞ THUYẾT ĐỒNG THUẬN 60

3.1 Mô hình ontology mờ cho bài toán tích hợp 61

3.2 So khớp ontology mờ dựa trên phần chung tiềm năng 64

3.2.1 Các vấn đề cần giải quyết 64

3.2.2 Các phương pháp xác định sự tương đồng của các ontology 65

3.2.3 Các khái niệm và quy tắc so khớp PCP 68

3.2.4 Thuật toán so khớp PCP 70

3.2.5 Ví dụ minh họa thuật toán 72

3.2.6 Đánh giá thuật toán 75

3.3 Chất lượng của tri thức đồng thuận trong tích hợp ontology mờ 75

3.3.1 Lựa chọn tiêu chí đồng thuận trong tích hợp tri thức 76

3.3.2 Chất lượng của tri thức tích hợp sử dụng lý thuyết đồng thuận 77

3.4 Tích hợp ontology mờ ở mức khái niệm 78

3.4.1 Mâu thuẫn ontology mờ ở mức khái niệm 78

3.4.2 Thuật toán tích hợp ontology mờ mức khái niệm (FOI-1) 80

3.4.3 Phân tích và đánh giá thuật toán 82

3.5 Tích hợp ontology mờ ở mức quan hệ 82

3.5.1 Mâu thuẫn ontology mờ mức quan hệ 82

3.5.2 Thuật toán tích hợp ontology mờ mức quan hệ (FOI-2) 84

3.5.3 Phân tích và đánh giá thuật toán 86

3.6 Tích hợp ontology mờ ở mức thực thể 86

3.6.1 Biểu diễn cấu trúc đa thuộc tính - đa giá trị cho thực thể ontology mờ 88

3.6.2 Hàm khoảng cách giữa các giá trị thuộc tính trong bộ phức 89

3.6.3 Mâu thuẫn ontology mờ mức thực thể 91

3.6.4 Tiêu chí đồng thuận cho tích hợp ontology mờ mức thực thể mờ 91

3.6.5 Thuật toán tích hợp ontology mờ mức thực thể (FOI-3) 92

Trang 7

3.6.6 Phân tích và đánh giá thuật toán 93

3.7 Tổng kết chương 94

CHƯƠNG 4 THỰC NGHIỆM VÀ ĐÁNH GIÁ 96

4.1 Thử nghiệm 1 96

4.1.1 Dữ liệu thử nghiệm 96

4.1.2 Phương pháp đánh giá 99

4.1.3 Kết quả 101

4.1.4 Nhận xét 105

4.2 Thử nghiệm 2 106

4.2.1 Dữ liệu 106

4.2.2 Phương pháp đánh giá 107

4.2.3 Kết quả 108

4.2.4 Nhận xét 111

4.3 Tổng kết chương 112

CHƯƠNG 5 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 114

5.1 Kết luận 114

5.2 Các hạn chế 115

5.3 Hướng phát triển 115

5.4 KẾT QUẢ NGHIÊN CỨU 117

5.4.1 Danh mục các công trình đã công bố 117

5.4.2 Các hoạt động khoa học: đề tài/ dự án 119

TÀI LIỆU THAM KHẢO 120

PHỤ LỤC A ONTOLOGY VÀ CÁC NGHIÊN CỨU LIÊN QUAN 131

PHỤ LỤC B CÁC CÔNG CỤ TÍCH HỢP ONTOLOGY 136

PHỤ LỤC C HỆ THỐNG TÍCH HỢP ONTOLOGY MỜ FOIS 147

Trang 8

vi

DANH MỤC CÁC THUẬT NGỮ - KÍ HIỆU- CHỮ VIẾT TẮT

Attributive language Thuộc tính ngôn ngữ

Anchor Được xác định để so khớp một cặp khái niệm của hai

ontology, sử dụng trong quá trình liên kết tiếp theo

Bootstrapping

Là tập hợp một số kỹ thuật phân tích dựa vào nguyên

lý chọn mẫu có hoàn lại (sampling with replacement)

để ước tính các thông số mà thống kê thông thường không giải được

Concept Hierarchy Generation Hệ phân cấp khái niệm

Complex tuple Bộ phức

Conflict body Mâu thuẫn thành viên

Conflict content Mâu thuẫn nội dung

Conflict profile Lược tả mâu thuẫn

Conflict subject Mâu thuẫn chủ đề

Crisp Ontology Ontology rõ

Data integration Tích hợp dữ liệu

Data, Information and Process

Integration with Semantic Web

Services

Dự án tích hợp (FP6 - 507.483) được hỗ trợ bởi chương trình FP6 của Liên minh châu Âu

Description Logics Logic mô tả

Elementary tuple Bộ cơ sở

Elementary values Giá trị cơ sở

Educational Game for Middle

& Primary School Students

Game Giáo dục cho Học sinh Trung & Tiểu học

Fuzzy Ontology Generation Hệ ontology mờ

Fuzzy Ontology Generation

frAmework

framework hệ ontology mờ

Formal Concept Analysis Phân tích khái niệm hình thức

Fuzzy profile Lược tả mờ

Fuzzy conflict profile Mâu thuẫn lược tả mờ

Fuzzy Description Logic Logic mô tả mờ

Fuzzy Markup Language Ngôn ngữ đánh dấu mờ

Fuzzy Ontology Ontology mờ

Fuzzy Ontology Integration Tích hợp ontology mờ

Trang 9

Fuzzy Ontology Integration

System

Hệ thống tích hợp ontology mờ

Geographic Information

Systems

Hệ thống thông tin địa lý

Linking Open Data Liên kết dữ liệu mở

Object Oriented Progamming Lập trình hướng đối tương

Ontology Alignment Liên kết Ontology

Ontology Alignment

Evaluation Initiative

Cuộc thi thường niên đánh giá các công cụ tích hợp ontology

Ontology Conflict Mâu thuẫn Ontology

Ontology Heterogeneous Ontology không đồng nhất

Ontology Inconsistency Ontology không nhất quán

Ontology Integration Tích hợp Ontology

Ontology Mapping Ánh xạ Ontology

Ontology Matching So khớp Ontology

Ontology Merging Trộn Ontology

Ontology Mismatch Ontology không tương hợp

Web Ontology Language Ngôn ngữ mô tả ontology cho web ngữ nghĩa Paraconsistent logic Logic nhất quán ghép

Peer-to-peer-information

sharing

Hệ thống chia sẻ thông tin ngang hàng

Potentially Common Parts Phần chung tiềm năng

Extensible Markup Language Ngôn ngữ Đánh dấu Mở rộng

Super domain Siêu miền

Web Service Modeling

Language

Một mô hình ngôn ngữ cho các dịch vụ web ngữ nghĩa

Trang 10

EGMPSS Educational Game for Middle & Primary School Students

FCA Formal Concept Analysis

FDL Fuzzy Description Logic

FML Fuzzy Markup Language

FOGA Fuzzy Ontology Generation frAmework

FOI Fuzzy Ontology Integration

FOIS Fuzzy Ontology Integration System

GIS Geographic Information Systems

IR Information Retrieval

KAON KArlsruhe ONtology

LOD Linking Open Data

OOP Object Oriented Progamming

OINT Ontology Integration

OMAP Ontology Mapping

PCP Potentially Common Parts

RDF Resource Description Framework

XML Extensible Markup Language

TIN Taxpayer's_identification number

WSML Web Service Modeling Language

Trang 11

DANH MỤC CÁC BẢNG

Bảng 2.1 Bảng tóm tắt các công cụ tích hợp ontology 21

Bảng 2.2 ví dụ về các phương pháp gán giá trị mờ 27

Bảng 2.3 Các kiểu quan hệ và trọng số được gán 38

Bảng 2.4 Kết quả tích hợp trong các ont1 và ont2 38

Bảng 2.5 Bảng giá trị quan hệ của các cặp khái niệm trong ontology Ont1 39

Bảng 2.6 Bảng giá trị quan hệ của các cặp khái niệm trong ontology Ont2 39

Bảng 2.7 Mâu thuẫn phi logic 45

Bảng 3.1 Ví dụ về thực thể mờ thời tiết 64

Bảng 3.2 Khởi tạo Bảng MinTable 72

Bảng 3.3 Kết quả bảng MinTable thay đổi ở lần lặp thứ nhất 73

Bảng 3.4 Kết quả bảng MinTable thay đổi ở lần lặp thứ 2 74

Bảng 3.5 Kết quả bảng MinTable thay đổi ở lần lặp thứ 3 74

Bảng 3.6 Kết quả bảng MinTable thay đổi ở lần lặp thứ 4 74

Bảng 3.7 Phân tích độ phức tạp của thuật toán so khớp PCP 75

Bảng 3.8 Ví dụ về mâu thuẫn tri thức của chuyên gia 76

Bảng 3.9 Mâu thuẫn mức quan hệ của ontology 83

Bảng 3.10 Mâu thuẫn mức quan hệ của ontology mờ 84

Bảng 3.11 Giá trị thực thể của khái niệm sinh viên 87

Bảng 3.12 Giá trị thực thể của khái niệm nhân viên 87

Bảng 3.13 Mâu thuẫn giữa các thực thể mờ của một ontology thời tiết I 1,…, I6 88

Bảng 3.14 Minh họa cho bộ phức 89

Bảng 3.15 Minh họa cho bộ cơ sở 89

Bảng 3.16 Bảng tổng hợp các tiêu chí đồng thuận cho các thuật toán tích hợp ontology mờ FOI-1, FOI-2, FOI-3 93

Bảng 4.1 Thống kê các thành phần của ontololy mờ thời tiết đã xây dựng 97

Bảng 4.2 Minh họa cài đặt các khái niệm mờ thời tiết 97

Bảng 4.3 Minh họa cài đặt các quan hệ mờ thời tiết 98

Bảng 4.4 Minh họa cài đặt các thực thể mờ thời tiết 98

Trang 12

x

Bảng 4.5 Mô tả thuộc tính của các ontology mờ thời tiết 107

Bảng 4.6 Mô tả quan hệ của các ontology mờ thời tiết 107

Bảng 4.7 Mô tả thực thể của các ontology mờ thời tiết 107

Bảng 4.8 Chất lượng xử lý mâu thuẫn của các hệ thống khác nhau 112

Trang 13

DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ

Hình 1.1 Nội dung nghiên cứu của luận án 4

Hình 2.1 Các nghiên cứu liên quan 7

Hình 2.2 Khái niệm ontology từ các lĩnh vực khác nhau 8

Hình 2.3 Biểu diễn của tri thức trong ontology (Gruber, 1993) 8

Hình 2.4 Ontology và các nghiên cứu liên quan 9

Hình 2.5 Tích hợp các hệ thống tri thức ontology (N T Nguyen, 2008a) 10

Hình 2.6 Một ví dụ về ánh xạ ontology của hai trường Đại học 11

Hình 2.7 Mô hình tích hợp dữ liệu (Mao, 2008) 11

Hình 2.8 Truy vấn thông tin qua tích hợp ontology 12

Hình 2.9 Tích hợp ontology cho mục đích giao tiếp giữa các hệ thống thông tin 13

Hình 2.10 Một hệ thống đa tác tử để phát hiện xâm nhập 14

Hình 2.11 Các kỹ thuật so khớp cơ bản 15

Hình 2.12 Tích hợp ontology (Helena Sofia Pinto & Martins, 2001) 16

Hình 2.13 Trộn ontology (Helena Sofia Pinto & Martins, 2001) 16

Hình 2.14 Phân loại các phương pháp tích hợp ontology của (Noy, 2004) 17

Hình 2.15 Ví dụ liên kết ontology (Abolhassani et al., 2006) 18

Hình 2.16 Ví dụ trộn ontology (Murat Şensoy, 2006) 19

Hình 2.17 Phân loại các công cụ tích hợp ontology (Doan et al., 2004; Mao, 2008; Mao et al., 2010) 20

Hình 2.18 Tích hợp ontology 23

Hình 2.19 Các mức mâu thuẫn ontology (Nguyen, 2008a) 24

Hình 2.20 Một phân loại các nghiên cứu về định nghĩa ontology mờ 29

Hình 2.21 Cấu trúc miền một ontology mờ thời tiết (Lee et al., 2005) 31

Hình 2.22 Ví dụ về ontology mờ về tin tức thời tiết (Lee, Jian, & Huang, 2005) 32

Hình 2.23 Ví dụ Ontology mờ (Parry, 2005) 34

Hình 2.24 Ontology mờ Ont1 về lĩnh vực xuất bản (Abulaish & Dey, 2006) 36

Hình 2.25 Ontology mờ Ont2 về lĩnh vực xuất bản (Abulaish & Dey, 2006) 37

Hình 2.26 Phân loại các phương pháp tích hợp ontology mờ 40

Trang 14

xii

Hình 2.27 Các mức mâu thuẫn dữ liệu (Kim et al., 1993) 44

Hình 2.28 Phân loại mâu thuẫn ontology (Hepp et al., 2007) 45

Hình 2.29 Các mức mâu thuẫn tri thức (N T Nguyen, 2008a) 46

Hình 2.30 Chất lượng của tri thức nhóm (Nguyen, CISIM 2014) 49

Hình 2.31 Ví dụ tiêu chí đồng thuận C 1 và C 2 52

Hình 2.32 Minh họa cho tiêu chí TLC 56

Hình 2.33 Lược đồ cho việc lựa chọn tiêu chí đồng thuận 58

Hình 3.1 Ví dụ một phần của ontology thời tiết 62

Hình 3.2 Ví dụ về khái niệm mờ thời tiết 63

Hình 3.3 Ví dụ về quan hệ mờ thời tiết 63

Hình 3.4 So khớp Anchor-PROMPT 65

Hình 3.5 Phần chung tiềm năng của hai ontology 68

Hình 3.6 Chất lượng của tri thức đồng thuận 77

Hình 3.7 Khái niệm WeatherPhenomenon trong ontology Weather1.OWL 79

Hình 3.8 Khái niệm WeatherPhenomenon trong ontology Weather2.OWL 80

Hình 4.1 Biểu đồ kết quả so khớp vòng thi directory OAEI từ năm 2006-2010 (Euzenat, Meilicke, Stuckenschmidt, Shvaiko, & Trojahn, 2011) 100

Hình 4.2 Kết quả đánh giá các hệ thống OAEI 2010 (Euzenat, Meilicke, Stuckenschmidt, Shvaiko, & Trojahn, 2011) 101

Hình 4.3 So sánh kết quả so khớp của PCP với 4 hệ thống khác 101

Hình 4.4 Kết quả của PCP trên 3 nhóm dữ liệu thử nghiệm của OAEI 102

Hình 4.5 Độ đo precision và recall cho các tập dữ liệu OAEI 103

Hình 4.6 Độ đo F-measure cho các tập dữ liệu OAEI 103

Hình 4.7 Độ đo precision và recall cho các tập dữ liệu ontology mờ 104

Hình 4.8 Độ đo F-measure cho các tập dữ liệu ontology mờ 104

Hình 4.9 So sánh phương pháp so khớp PCP và các hệ thống khác 105

Hình 4.10 So sánh chất lượng tri thức đồng thuận của hai lược tả khác nhau 108

Hình 4.11 Kết quả tích hợp mức Khái niệm 108

Hình 4.12 Chất lượng đồng thuận mức khái niệm của các lược tả khác nhau 109

Trang 15

Hình 4.13 Kết quả tích hợp mức quan hệ 109

Hình 4.14 Chất lượng của sự đồng thuận mức quan hệ 110

Hình 4.15 Kết quả tích hợp mức thực thể 110

Hình 4.16 Chất lượng đồng thuận mức thực thể của các lược tả khác nhau 111

Hình 4.17 So sánh chất lượng xử lý mâu thuẫn của Chimaera và PROMPT 111

Trang 16

CHƯƠNG 1

MỞ ĐẦU

1.1 Động cơ nghiên cứu

Trong nghiên cứu về ontology và web ngữ nghĩa, (Sanchez & Yamanoi, 2006) đã chỉ

ra rằng hiện nay ontology truyền thống không thích hợp cho việc triển khai các ứng dụng trong thế giới thực vì nó không đủ khả năng để mô tả và biểu diễn các thông tin

mơ hồ không chắc chắn Chẳng hạn ontology trong lĩnh vực thời tiết không thể biểu diễn giá trị của thuộc tính lượng mưa/nắng của một ngày là nhiều hay ít, cao hay thấp; trong lĩnh vực web ngữ nghĩa vấn đề sử dụng trạng từ và tính từ trong biểu diễn hoặc tìm kiếm thông tin: "Một nơi nghỉ dưỡng tốt", "ở một nơi rất lạnh" Xuất phát từ thực

tế này mô hình ontology mờ đã được đề xuất Định nghĩa ontology mờ đơn giản nhất

được (Dey & Abulaish, 2008) đề xuất là một cặp (C, R), trong đó C là các khái niệm

mờ và R là các quan hệ mờ Tùy theo mục tiêu nghiên cứu cặp (C, R) có thể được mở

rộng theo nhiều cách trong các miền ứng dụng khác nhau

Tích hợp tri thức là một quá trình trong đó sự không nhất quán của tri thức từ các nguồn khác nhau được hợp nhất nhằm mang lại một sự thống nhất của tri thức (N T Nguyen, 2008a) Ontology có có vai trò quan trọng trong việc tổ chức và quản lý thông tin tri thức ở các lĩnh vực nghiên cứu và ứng dụng khác nhau: trong tích hợp

cơ sở dữ liệu, thương mại điện tử, các dịch vụ web ngữ nghĩa, các mạng xã hội Để phát triển các hệ thống ứng dụng này, bài toán tích hợp ontology đã được nhiều công trình tập trung nghiên cứu Cùng với các kết quả nghiên cứu về lý thuyết các công cụ tích hợp ontology đã được xây dựng và phát triển: Anchor-PROMPT (Noy & Musen, 2001), RiMOM (J Li, Tang, Li, & Luo, 2009), (Y Jean-Mary & Kabuka, 2007), FCA-Merge (Stumme & Maedche, 2001), Chimaera (McGuinness, Fikes, Rice, & Wilder, 2000), (M Seddiqui, Aono, M., 2008), Falcon-AO (Hu et al., 2007),… Trong các hệ thống tri thức dựa trên ontology, các khái niệm, mối quan hệ và các thực thể của các đối tượng luôn luôn được thể hiện một cách chính xác Điều này không hoàn toàn phù hợp trong thế giới thực thường chứa các thông tin mơ hồ, không

Trang 17

chắc chắn và không đầy đủ Mặt khác, do sự phân tán thông tin đến từ nhiều nguồn khác nhau và ngày càng gia tăng về số lượng các ontology dẫn đến sự không nhất quán thông tin và dữ liệu Các phương pháp và công cụ tích hợp ontology rõ không còn phù hợp, dẫn đến sự ra đời của bài toán tích hợp ontology mờ

Các công trình nghiên cứu về tích hợp ontology mờ hiện nay được thực hiện theo phương pháp so khớp/liên kết hoặc ánh xạ trên ontology mờ được định nghĩa theo logic mô tả mờ hoặc phi logic bằng cách mở rộng các thành phần của ontology truyền thống Một số rất ít các nghiên cứu đề cập đến bài toán xử lý mâu thuẫn ontology mờ

có thể kế đến là (Abulaish & Dey, 2006) đề xuất độ đo khái niệm nhất quán giữa hai ontology để xác định một khái niệm nhất quán giữa các ontology bị mâu thuẫn Một

tiếp cận khác, (Ferrara et al., 2008) đề xuất phương pháp giải quyết mâu thuẫn ở mức quan hệ trong ánh xạ ontology mờ Các mô hình ontology mờ được xây dựng chủ yếu phục vụ cho một ứng dụng cụ thể, chưa có nhiều nghiên cứu đề xuất các giải pháp xử

lý mâu thuẫn trên cấu trúc phức tạp của ontology mờ trong bài toán tích hợp Để giải quyết bài toán này, cần phải định nghĩa một mô hình ontology mờ và các thuật toán tích hợp trên mô hình tri thức đã xây dựng Tuy nhiên tích hợp ontology mờ là bài toán phức tạp vì tính không chắc chắn và không đầy đủ của thông tin, sự mâu thuẫn tri thức và cấu trúc đa dạng của nó Những khó khăn thách thức này thúc đẩy động

cơ nghiên cứu của luận án

Để đánh giá các thuật toán tích hợp ontology mờ của luận án, công việc thử nghiệm

được tiến hành theo các tiêu chí đánh giá của OAEI và chất lượng xử lý mâu thuẫn theo lý thuyết đồng thuận Dữ liệu thử nghiệm là các ontology của OAEI 1 và ontology

mờ thời tiết2 được mờ hóa theo phương pháp OWL2 của (Bobillo & Straccia, 2011).

1.2 Thách thức của bài toán tích hợp ontology mờ

Các khó khăn thách thức cho bài toán tích hợp ontology mờ là: (1) Cần phải xác định

mô hình tri thức ontology mờ cho bài toán tích hợp, (2) Tìm và xác định những điểm tương đồng và khác biệt giữa các ontology (so khớp ontology) (3) Xử lý mâu thuẫn

1 http://oaei.ontologymatching.org/

2 http://www.sensormeasurement.appspot.com/?p=ontologies#weather;

2

Trang 18

giữa các ontology mờ trong quá trình tích hợp Trong đó vấn đề (3) Xử lý mâu thuẫn ontology mờ cần thỏa các điều kiện sau:

Bảo toàn thông tin: Dữ liệu của ontology nguồn không bị mất mát thông tin

Giải quyết mâu thuẫn: Tất cả các mâu thuẫn xuất hiện trong các ontology nguồn

phải được giải quyết

Bảo toàn cấu trúc: Các kiểu cấu trúc của kết quả tích hợp phải giống cấu trúc của

các yếu tố thành phần ban đầu

Chất lượng của các phương pháp xử lý mâu thuẫn

1.3 Mục tiêu và phạm vi nghiên cứu

1.3.1 Mục tiêu nghiên cứu

Mục tiêu nghiên cứu của luận án là

 Xây dựng mô hình ontology mờ cho bài toán tích hợp

 phương pháp tích hợp ontology mờ dựa trên cơ sở của lý thuyết đồng thuận

1.3.2 Phạm vi nghiên cứu

 Xây dựng định nghĩa ontology mờ thích hợp cho bài toán tích hợp

 Xây dựng thuật toán so khớp khái niệm giữa các ontology mờ dựa trên phần chung tiềm năng

 Xây dựng các thuật toán tích hợp ontology mờ dựa trên lý thuyết đồng thuận theo các mức khái niệm, quan hệ và thực thể

1.4 Phương pháp nghiên cứu

1.4.1 Cơ sở khoa học

 Sử dụng mô hình tri thức ontology mờ trên cơ sở lý thuyết mờ của (Zadeh, 1965)

 Sử dụng lý thuyết đồng thuận trong tích hợp tri thức của (N T Nguyen, 2008a)

1.4.2 Giải pháp

Sử dụng mô hình tri thức ontology mờ cho thuật toán so khớp ontology mờ dựa trên

Trang 19

phần chung tiềm năng và các thuật toán tích hợp ontology mờ dưa trên lý thuyết đồng thuận theo cấu trúc ba mức khái niệm, quan hệ và thực thể

1.4.3 Đánh giá, thử nghiệm

Dữ liệu thử nghiệm: từ OAEI và mờ hóa ontology thời tiết

lý thuyết IR và chất lượng tích hợp tri thức theo lý thuyết đồng thuận

1.5 Nội dung nghiên cứu

Bài toán PCP

Tích hợp ontology

mờ theo lý thuyết đồng thuận

ontology mờ

Cài đặt thử nghiệm và đánh giá

Hình 1.1 Nội dung nghiên cứu của luận án

1 Xây dựng định nghĩa ontology mờ (Mục 3.1, Chương 3)

2 Bài toán PCP: Xây dựng các thuật toán so khớp ontology mờ dựa trên phần chung

tiềm năng.(Mục 3.2, Chương 3).

3 Bài toán FOI-1: Định nghĩa bài toán mâu thuẫn mức khái niệm; Xây dựng thuật

toán tích hợp ontology mờ dựa trên lý thuyết đồng thuận mức khái niệm (Mục 3.4,

Chương 4)

4 Bài toán FOI-2.1, FOI-2.2: Định nghĩa bài toán mâu thuẫn mức quan hệ; Xây

Trang 20

dựng thuật toán tích hợp ontology mờ dựa trên lý thuyết đồng thuận mức quan hệ

(Mục 3.5, Chương 3)

5 Bài toán FOI-3: Định nghĩa bài toán mâu thuẫn mức thực thể; Xây dựng thuật

toán tích hợp ontology mờ dựa trên lý thuyết đồng thuận mức thực thể (Mục 3.6,

Chương 3)

6 Cài đặt thử nghiệm (Chương 4)

1.6 Các đóng góp mới của luận án

 Xây dựng mô hình tri thức ontology mờ

 Xây dựng thuật toán so khớp ontology mờ

 Xây dựng các thuật toán xử lý mâu thuẫn trong tích hợp ontology mờ ở ba mức khái niệm, quan hệ và thực thể dựa trên lý thuyết đồng thuận

 Thực hiện cài đặt và đánh giá các thuật toán tích hợp ontology mờ trên một số bộ

dữ liệu ontology mờ thời tiết và OAEI

1.7 Bố cục của luận án

Chương 1 Giới thiệu

 Động cơ nghiên cứu

 Các thách thức của bài toán tích hợp ontology mờ

 Mục tiêu và phạm vi nghiên cứu

 Phương pháp nghiên cứu

 Nội dung nghiên cứu

 Các đóng góp mới của luận án

Chương 2 Tích hợp ontology mờ và các nghiên cứu liên quan:

 Ontology và tích hợp ontology

 Lý thuyết mờ

 Tổng quan về ontology mờ và tích hợp ontology mờ

 Lý thuyết đồng thuận và mâu thuẫn tri thức

Chương 3 Tích hợp ontology mờ trên cơ sở lý thuyết đồng thuận

Trang 21

Chương này trình bày các kết quả đóng góp mới của luận án bao gồm các nội dung:

 Xây dựng mô hình ontology mờ

 Xây dựng thuật toán so khớp ontology mờ dựa trên phần chung tiềm năng

 Xây dựng các thuật toán tích hợp ontology mờ theo các mức khái niệm, quan hệ

và thực thể theo các tiêu chí đồng thuận

Chương 4 Thực nghiệm và đánh giá

 Thử nghiệm 1: thuật toán so khớp ontology mờ dựa trên phần chung tiềm năng

 Thử nghiệm 2: tích hợp ontology mờ theo lý thuyết đồng thuận

Chương 5 Kết luận và hướng phát triển

Tài liệu tham khảo

Phụ lục A: Ontology và các nghiên cứu liên quan

Phụ lục B: Các công cụ tích hợp ontology

Phụ lục C: Hệ thống tích hợp ontology mờ FOIS

Trang 22

CHƯƠNG 2

TÍCH HỢP ONTOLOGY MỜ

VÀ CÁC NGHIÊN CỨU LIÊN QUAN

Chương này trình bày cơ sở lý thuyết từ các nghiên cứu liên quan đến nội dung thực hiện của luận án (Hình 2.1), bao gồm:

Tích hợp ontology mờ

Lý thuyết mờ (Zadeh, 1965)

Hình 2.1 Các nghiên cứu liên quan

2.1 Ontology và tích hợp ontology

2.1.1 Ontology

Khái niệm ontology được phát triển từ nhiều lĩnh vực khác nhau (Hình 2.2), ontology bắt nguồn từ triết học, được dẫn xuất từ tiếng Hi Lạp là “onto” và “logia” Trong ngữ cảnh triết học, ontology thuộc một nhánh của siêu hình học, được sử dụng để nghiên cứu về bản chất của sự tồn tại, xác định các sự vật nào thực sự tồn tại và cách thức

mô tả chúng (Aristoteles)

Trang 23

Hình 2.2 Khái niệm ontology từ các lĩnh vực khác nhau

Trong lĩnh vực trí tuệ nhân tạo, ontology được định nghĩa theo cách khác: một

ontology là một đặc tả hình thức, của khái niệm được chia sẻ thuộc một lĩnh vực nào

đó (Gruber, 1993)

Đặc tả hình thức: là biểu diễn của các khái niệm, quan hệ, thực thể, các ràng buộc

toàn vẹn mà máy tính có thể hiểu được

Khái niệm được chia sẻ: nói đến tri thức đồng thuận của cộng đồng

Một lĩnh vực nào đó: nói đến ứng dụng trong lĩnh vực cụ thể của thế giới thực

Bộ từ vựng

+ + + Thực thể

=

=

=

Quan hệ, ràng buộc và quy tắc Cấu trúc Sự phân cấp

Tri thức Ontology

Hình 2.3 Biểu diễn của tri thức trong ontology (Gruber, 1993)

Trong lĩnh vực tích hợp và xử lý mâu thuẫn tri thức (N T Nguyen, 2008a) khái niệm ontology được định nghĩa như sau:

O = (C, I, R, Z), trong đó:

Trang 24

I là tập hợp các thực thể

hệ giữa các thực thể và các khái niệm

2.1.2 Ontology và các nghiên cứu liên quan

Nội dung của phần này được trình bày trong phục lục A của luận án

2.1.3 Vai trò của ontology

Ontology đã trở thành một công cụ quan trọng trong trong nhiều lĩnh vực ứng dụng khác nhau với các ưu điểm như sau:

Cho phép chia sẻ những hiểu hiểu biết chung về các khái niệm, cấu trúc thông tin

giữa con người hoặc giữa các hệ thống thông tin tri thức: đây là ưu điểm quan

trọng của ontology liên quan đến bài toán tích hợp ontology

ontology và xây dựng mô hình tri thức ontology

nào để một hệ thống ontology có thể được dùng bởi các ngôn ngữ của các quốc

Hình 2.4 Ontology và các nghiên cứu liên quan

Ontology

Merging Traslation

Learning Mapping Management

Evaluation Reuse

Trang 25

gia khác nhau mà không phải xây dựng lại từ đầu

phân tán dựa trên ontology thường xuyên xuất hiện mâu thuẫn giữa các thành

phần của hệ thống Để thực hiện sự nhất quán của tri thức cần phải xử lý các mâu

thuẫn xảy ra, đây là khó khăn lớn nhất liên quan đến bài toán tích hợp ontology

và lý thuyết đồng thuận

ontology để chia sẻ, tái sử dụng và tích hợp tri thức ontology

2.1.4 Tích hợp ontology

Ontology có vai trò quan trọng trong quá trình trao đổi tri thức và dữ liệu giữa các hệ thống thông tin phân tán Tích hợp tri thức là một quá trình mà trong đó sự không nhất quán của tri thức từ các nguồn khác nhau được hợp nhất nhằm mang lại một sự thống nhất của tri thức (Nguyen, 2008a) (Hình 2.5).

Hình 2.5 Tích hợp các hệ thống tri thức ontology (N T Nguyen, 2008a)

Tích hợp ontology và ứng dụng

Web ngữ nghĩa: Ontology đóng vai trò then chốt trong việc cung cấp ngữ nghĩa mà

máy có thể hiểu được các tài nguyên của WWW Hệ thống thông tin web ngữ nghĩa thường xuyên có yêu cầu trao đổi, chia sẻ dữ liệu và tái sử dụng Thực hiện yêu cầu này là vấn đề phức tạp vì sự tương tác ngữ nghĩa giữa các hệ thống khác nhau, đặc

Trang 26

biệt trong môi trường phân tán và không đồng nhất của thông tin Theo (Ehrig, 2006), tích hợp ontology là điều kiện tiên quyết cần thiết để thiết lập khả năng tương tác giữa các tác nhân hoặc dịch vụ sử dụng hệ thống WWW Quan sát trang web Khoa khoa học máy tính của Đại học Washington1 và Đại học Sydney2: Để thông tin của hai khoa này được chia sẻ, hai trang web hiểu nhau về ngữ nghĩa Giải pháp là thực hiện ánh

xạ hai ontology của hai khoa với nhau (Hình 2.6)

Hình 2.6 Một ví dụ về ánh xạ ontology của hai trường Đại học3

Tích hợp dữ liệu: Tích hợp dữ liệu có thể được thực hiện từ nhiều hệ thống để truy

cập và xử lý mà không cần tập hợp dữ liệu của chúng vào một trung tâm lưu trữ dữ liệu

Hình 2.7 Mô hình tích hợp dữ liệu (Mao, 2008)

1 www.cs.washington.edu

2 http://sydney.edu.au/engineering/it/

3 http://www2002.org/CDROM/refereed/232/

Trang 27

Hình 2.7 trình bày một mô hình tích hợp các hệ thống cơ sở dữ liệu khác nhau từ hai

cơ sở dữ liệu 𝐷1 và 𝐷2 được kết hợp với các ontology 𝑂1và 𝑂2 Ví dụ, thị trường kinh doanh trên trang web của Amazon1 có thể cần phải kết hợp các sản phẩm từ nhiều nhà cung cấp sản phẩm vào cho riêng của mình Một cổng thông tin web như NCSTRL2

có thể muốn tích hợp tài liệu từ nhiều thư mục của thư viện thành một hệ thống.Một công ty muốn tích hợp các loại dịch vụ của mình với các đối tác Một nhà nghiên cứu

có thể muốn tích hợp các công trình của mình cùng với các đồng nghiệp

Truy vấn thông tin: (Kern, Stolarczyk, & Nguyen, 2013) Các truy vấn thông tin từ

nhiều hệ thống tri thức ontology phân tán Các truy vấn được gửi đến các ontology tương ứng trong hệ thống thông tin phân tán, sau đó được hồi đáp cho người sử dụng thông qua hệ thống ontology đã được tích hợp (Hình 2.8)

Query

Query Response

Response Integration Module

Hình 2.8 Truy vấn thông tin qua tích hợp ontology

Hệ thống thông tin ngang hàng: là một hệ thống chia sẻ thông tin ngang hàng thông

qua kết nối mạng (Obrst, 2001) Việc chia sẻ thông tin trên hệ thống này rất phổ biến như: ảnh, nhạc, phim, sách, Để thiết lập việc trao đổi thông tin có ý nghĩa của người

1 http://www.amazon.com/

2

Trang 28

sử dụng, một trong những bước quan trọng là xác định và mô tả các mối quan hệ thông tin của chúng Các mối quan hệ được xác định giữa các ontology được sử dụng cho mục đích truy vấn

Hình 2.9 Tích hợp ontology cho mục đích giao tiếp giữa các hệ thống thông tin

Hình 2.9 mô tả quá trình trao đổi thông tin giữa hai hệ thống thông tin tri thức Server

1 muốn truy vấn thông tin từ Server 2 Để Server 2 hiểu được truy vấn từ Server 1

cần phải tích hợp hai ontology1 và ontology2 Kết quả của quá trình tương tác giữa hai hệ thống sẽ phụ thuộc vào kết quả so khớp các ontology1 và ontology2

Hệ thống thông tin đa tác tử: được dùng để giao tiếp giữa các tác nhân trong hệ thống

đa tác tử không đồng nhất Trong các hệ thống này, các tác nhân phải xử lý sự không đồng nhất thông tin giữa các ontology trong việc giao tiếp với nhau Một ví dụ thực

tế đề cập đến một hệ thống phục vụ đa tác tử phát hiện xâm nhập trong một hệ thống mạng Hình 2.10 Có hai loại tác nhân được thiết kế: Tác nhân giám sát (MA) và tác nhân quản lý (MAA) Tác nhân giám sát quan sát các trang web, xử lý thông tin và đưa ra kết luận cần thiết để đánh giá hiện trạng của hệ thống an ninh Tác nhân quản

lý chịu trách nhiệm quản lý công việc của các tác nhân giám sát Nếu một cuộc tấn công xuất hiện, các tác nhân phải xác định được các kiểu, nguồn gốc và con đường

Trang 29

lan truyền của cuộc tấn công này Thực tế xảy ra là các khu vực tác nhân giám sát có thể thu được kết quả từ một trang web có thể không nhất quán, cần phải xử lý mâu thuẫn trong trường hợp này

Management Server6 Management Server3

Định nghĩa 2.1.1 (Độ tương đồng): (Euzenat & Shvaiko, 2007) Cho O là một tập hợp

các thành phần của ontology, độ tương đồng được định nghĩa là một ánh xạ 𝜎: O × O

Trang 30

→ R thỏa các điều kiện sau:

Ánh xạ 𝜎 có đầu vào là cặp (x, y) ∈ {O × O} và cho kết quả là một số thực đểbiểu

diễn độ sai khác giữa x và y Dựa trên độ đo tương đồng, các kỹ thuật so khớp ontology

được chia thành bốn loại là: Thuật ngữ, khái niệm, mở rộng và ngữ nghĩa (Hình 2.11)

Hình 2.11 Các kỹ thuật so khớp cơ bản

Các định nghĩa về tích hợp ontology

Theo Pinto và các cộng sự (H Sofia Pinto, Gómez-Pérez, & Martins, 1999; Helena

Sofia Pinto & Martins, 2001) tích hợp và trộn là hai tác vụ khác nhau: (1) Tích hợp

ontology: Xây dựng một ontology mới tái sử dụng các ontology thuộc các lĩnh vực

Dựa trên chuỗiDựa trên ngôn ngữ

Dựa trên cấu trúc

Dựa trên ngữ nghĩa

Kỹ thuật mô tả logic

Kỹ thuật SAT

Trang 31

khác nhau (Hình 2.12), (2) Trộn ontology: Là tạo ontology mới bằng cách trộn các

ontology khác nhau trong cùng một lĩnh vực (Hình 2.13)

Ontology 1 Ontology 2

Ontology Nguồn

Các ontology nguồn có tên miền (domain) tương tự sẽ được tích hợp

Kết quả Tích hợp

Ontology Nguồn 1

Ontology Nguồn 2

Các ontology nguồn được

đặt vào một module trong

ontology kết quả -> dễ xác

định được phần nào đến từ

được kết nối yếu trong kết quả (ít chồng lấp)

Hình 2.12 Tích hợp ontology (Helena Sofia Pinto & Martins, 2001)

Nguồn

Các ontology nguồn có tên miền(domain) giống hệt nhau sẽ được trộn

Kết quả Trộn

Thông tin của các ontology

nguồn được hòa lẫn ở mức cao

-> khó có thể xác định phần nào

đến từ ontology nào

Các ontology nguồn được kết nối chặt chẽ trong kết quả (mức độ chồng lấp cao)

Hình 2.13 Trộn ontology (Helena Sofia Pinto & Martins, 2001)

Theo tiếp cận của (Noy, 2004) quá trình tích hợp ontology được phân thành hai loại

so khớp/liên kết hoặc ánh xạ/trộn như sau (Hình 2.14):

Trang 32

Hình 2.14 Phân loại các phương pháp tích hợp ontology của (Noy, 2004)

Định nghĩa 2.1.2 (Tích hợp ontology): là việc xử lý tìm ra các thành phần tương đồng

giữa các ontology 𝑂1, , 𝑂𝑛 và tạo ra một ontology mới 𝑂∗để trao đổi thông tin giữa các hệ thống thông tin tri thức dựa trên các ontology 𝑂1, , 𝑂𝑛 Ontology 𝑂∗thay thế cho các ontology 𝑂1, , 𝑂𝑛 hoặc nó được sử dụng như một thành phần trung gian giữa các hệ thống tri thức dựa trên các ontology 𝑂1, , 𝑂𝑛.(Sowa, 1999)

Có thể thực hiện tích hợp ontology theo các kỹ thuật khác nhau: So khớp, liên kết ontology, ánh xạ và trộn ontology được định nghĩa như sau:

Định nghĩa 2.1.3 (So khớp ontology): là tìm kiếm các mối quan hệ hay sự tương đồng

giữa các thành phần trong các ontology khác nhau Quá trình này được sử dụng khi chúng ta cần giao tiếp trao đổi giữa hai hệ thống hoặc muốn sử dụng thông tin của hệ thống thứ hai cho người dùng của hệ thống thứ nhất So khớp ontology được sử dụng trong nhiều công việc khác như trộn ontology, trả lời truy vấn, dịch dữ liệu, hoặc web ngữ nghĩa

Định nghĩa so khớp ontology được đề cập trong các công trình: (Belhadef, 2011; Doan, Madhavan, Domingos, & Halevy, 2004; Euzenat., 2005; Madhavan, Bernstein,

& Rahm, 2001; Mascardi, Locoro, & Rosso, 2010; Noy & Musen, 2001; H Sofia Pinto et al., 1999; M Seddiqui, Aono, M., 2008; Todorov, Geibel, & Hudelot, 2011; Wang & Xu, 2007)

Định nghĩa 2.1.4 (Liên kết ontology): là tập hợp các tương ứng giữa hai ontology,

liên kết ontology là kết quả của quá trình so khớp

Định nghĩa này được đề cập trong các công trình: (Abolhassani, Hariri, & Haeri,

Trộn ontology:

Trộn các ontology khác nhau để tạo ra một ontology nhất quán: Cần

phải giải quyết các mâu thuẫn ontology xuất hiện trong quá trình tích hợp

Trang 33

2006; Bock & Hettenhausen, 2012; Chua & Kim, 2012; Ehrig, 2006; Y Jean-Mary

& Kabuka, 2007; Kabuka, 2014; J Li et al., 2009; Noy & Musen, 1999, 2000; M Seddiqui, Aono, M., 2008; M H Seddiqui & Aono, 2009; Wang & Xu, 2007) (Hình 2.15)

Hình 2.15 Ví dụ liên kết ontology (Abolhassani et al., 2006)

Định nghĩa 2.1.5 (Ánh xạ ontology): là sự tương ứng một chiều, của các khái niệm

và quan hệ từ một ontology này sang một ontology khác, ánh xạ ontology là một trường hợp của liên kết ontology

Định nghĩa này được đề cập trong các công trình : (Bakillah & Mostafavi, 2011; Buche, Dibie-Barthélemy, & Ibanescu, 2008; Choi, Song, & Han, 2006; Chungoora

& Young, 2008; Ehrig & Sure, 2004; Fernández, Velasco, & López-Carmona, 2009; Ferrara et al., 2008; Khattak, Pervez, Latif, & Lee, 2012; Kolli & Boufaida, 2011;

Ma, Zhang, Yan, & Cheng, 2014; Mao, 2008; Mao, Peng, & Spring, 2010; Rujuan Wang, 2012; Xu, Kang, Lu, Li, & Jiang, 2005; ZHAO, LI, & RAO, 2011) (Hình 2.16)

Định nghĩa 2.1.6 (Trộn ontology): là quá trình tạo ra một ontology mới từ các

ontology khác nhưng cùng một lĩnh vực, được sử dụng khi cần tích hợp một số hệ thống để tạo ra một hệ thống mới (Guzmán-Arenas & Cuevas, 2010; G LI, WANG,

& ZHANG, 2014; Z.-H Li & Li, 2012; Noy & Musen, 1999, 2000; Rung-Ching Chen, 2011; Stumme & Maedche, 2001) (Hình 2.17)

Trang 34

Luxury Car Family CarSport Car

Family Car Sport Car

Automobile

Thing

Vehicle

Car Bus

Porsche BMW

Porsche BMW

Các công cụ tích hợp ontology

Cùng với các kết quả nghiên cứu về lý thuyết, có thể kể tên một số công cụ tích hợp ontology dựa trên công nghệ học máy, cấu trúc, ngữ nghĩa và phương pháp lai như: Anchor-PROMPT (Noy & Musen, 2001), RiMOM (J Li et al., 2009), (Y Jean-Mary

& Kabuka, 2007), FCA-Merge (Stumme & Maedche, 2001), Chimaera (McGuinness

et al., 2000), (M Seddiqui, Aono, M., 2008), Falcon-AO (Hu et al., 2007),… các công

cụ này thực hiện tích hợp ontology rõ theo các phương pháp so khớp/liên kết, ánh xạ

hoặc trộn ontology, hiện nay chưa có công cụ tích hợp cho ontology mờ

Có thể phân loại các công cụ tích hợp ontology theo các phương pháp: dựa trên Học

Hình 2.16 Ví dụ trộn ontology (Murat Şensoy, 2006)

Trang 35

máy, cấu trúc, ngữ nghĩa và phương pháp lai (Hình 2.18) và bảng tóm tắt các công cụ tích hợp ontology (Bảng 2.1) Chi tiết về các công cụ tích hợp ontology được trình bày trong phần Phụ lục A của luận án

Hình 2.17 Phân loại các công cụ tích hợp ontology (Doan et al., 2004; Mao, 2008; Mao

ContentMa

Prompt

Structure

ASMOV CIDER SPIDER ONION CROSI CMS OntoBuilde DSSIM FCA-Merge

Falcon-Semantic

OntoMediat RiMOM Anchor-prompt MAFRA Chimera HCONE

Hybrid

COM++ AROMA Lily FOAM

Trang 36

Thuật toán

Tính

tự động Tác giả

Dựa trên máy học

CAIMAN

- Hai Ontologies

- Kết quả Ánh xạ Ánh xạ * * Bán tự động

Technische University, Munchen,

2001 Content

Map

- Hai Ontologies

- Kết quả Ánh xạ Ánh xạ OWL 2 * Bán tự động

University of Oxford, UK, 2008

Prompt - Hai ontology

2003 Dựa trên câu trúc

2007 ASMOV

- OWL-DL

- Kết quả liên kết Liên kết * Jena ARP động Tự

INFOTECH Soft, Florida,

2007 CIDER

Scarlet

Tự động

KnowledgeMedia Institute, UK, 2008 ONION - - RDF Kết quả trộn Trộn JAVA SKAT Bán tự

động

Stanford University,2004 CROSI

CMS

- OWL

- Kết quả so khớp So khớp JAVA Jena & JWNL

Tự động

Hewlett Packard Lab, 2005 OntoBu

ilder

- Hai Ontologies

- Kết quả so khớp So khớp JAVA *

Tự động

Israel Institute of Technology, 2004

Trang 37

DSSim - - Hai Ontologies Kết quả Ánh xạ Ánh xạ OWL SKOS

parser

Bán tự động

United Kingdom,

2006 FCA-

Merge

- Hai Ontologies

- Kết quả trộn Trộn * Concept lattice động Tự

University of Karlsruhe Germany,

2001 Dựa trên ngữ nghĩa

Bán tự động

DEI - ISEP– IPP Portugal, 2003

Bán tự động

AI-Lab, Greece,

2002 Phương pháp Lai

COM++

- XML, OWL

- XML So khớp * OWL API Bán tự động

Database groupLeipzig,

Tự động

Southeast University, China,

Institute AIFB, Germany,

2005

Nhận xét: Các công cụ tích hợp ontology đã được phân loại theo các phương pháp

Trang 38

dựa trên học máy, cấu trúc, ngữ nghĩa và phương pháp lai Các phương pháp tích hợp theo tiếp cận khác nhau tuy nhiên vấn đề xử lý mâu thuẫn ontology vẫn còn là thách thức cho các nghiên cứu về tích hợp ontology, đặc biệt là trên ontology mờ

Tích hợp ontology dựa trên lý thuyết đồng thuận

Định nghĩa về tích hợp ontology và cấu trúc phân cấp về xử lý mâu thuẫn theo ba mức của (Nguyen, 2008a) là tiếp cận của phương pháp tích hợp ontology mờ trên cơ

sở lý thuyết đồng thuận của luận án (Chương 3)

Định nghĩa 2.1.7 (Nguyen, 2008a): Tích hợp ontology là quá trình xác định một

ontology O* tốt nhất đại diện cho các ontology O i, i=1, ,n (Hình 2.18)

Thuật toán tích hợp

Trang 39

Tích hợp ontology được thực hiện theo các mức như sau (Hình 2.19):

Hình 2.19 Các mức mâu thuẫn ontology (Nguyen, 2008a)

Thực thể: cùng thực thể của các ontology khác nhau có mô tả mâu thuẫn với nhau Khái niệm: cùng khái niệm nhưng khác về cấu trúc trong các ontology khác nhau Quan hệ: có mâu thuẫn về quan hệ giữa hai khái niệm trong các ontology khác nhau Định nghĩa 2.1.8 (Định nghĩa ontology):

Ontotlogy là một bộ bốn O = (C, I, R, Z), trong đó:

của ontology được định nghĩa là một bộ ba: (c, 𝐴𝑐, 𝑉𝑐), trong đó:c là tên duy nhất

của khái niệm, 𝐴𝑐 ⊆ A là các thuộc tính trong A, 𝑉𝑐⊆⋃𝑎∈𝐴𝑐𝑉𝑎(𝑉𝑎là miền giá trị của thuộc tính 𝑎), 𝑉𝑐 = ⋃𝑎∈𝐴𝑐𝑉𝑎.Cặp (𝐴𝑐, 𝑉𝑐) được gọi là cấu trúc của khái niệm c

thuộc tính của tập 𝐴𝑐,với các giá trị trong tập 𝑉𝑐 là cặp (id, v), trong đó id là định danh của thực thể và v là giá trị của thực thể là một ánh xạ v: 𝐴𝑐→ 𝑉𝑐, v(a) ∈ 𝑉𝑐,

a∈ 𝐴𝑐

RO(c, c′) là quan hệ giữa hai khái niệm c và c′ trong ontology O

Trang 40

hệ giữa các thực thể và các khái niệm

niệm (c, 𝐴𝑐, 𝑉𝑐) và (c’, 𝐴𝑐, 𝐴𝑐′), với (id, v) ∈ (𝑂1, c) và (id, v′)∈ (𝑂2, c′), mâu thuẫn thực thể xảy ra nếu v(a) ≠ v′(a) với a ∈𝐴𝑐∩ 𝐴𝑐′

Bài toán 2.1.1 (Xử lý mâu thuẫn mức thực thể): Để giải quyết mâu thuẫn của ontology

sử dụng phương pháp đồng thuận như sau: Cho tập các giá trị X = {𝑣1, 𝑣𝑛}, 𝑣𝑖 là một bộ của 𝐴𝑖 ⊆ A, 𝑣𝑖: 𝐴𝑖𝑉𝑖, i = 1,…,n, 𝑉𝑖 =⋃ 𝑉𝑎

𝑎∈𝐴 𝑖 Cần xác định bộ v tốt nhất trong tập X thỏa điều kiện sau: ∑𝑛𝑖=1𝑑(𝑣,𝑣𝑖) = min

𝑣′  𝑉 𝑎

∑𝑛𝑖=1𝑑(𝑣′,𝑣𝑖) Điều kiện này thỏa tiêu chí đồng thuận

Định nghĩa 2.1.10 (Mâu thuẫn mức khái niệm):

Cho hai ontology 𝑂1và 𝑂2, khái niệm c thuộc 𝑂1 là bộ (c, 𝐴𝑐1, ) và thuộc 𝑂2 là (c,

𝐴𝑐 2, 𝑉𝑐 2) Ta nói rằng sự mâu thuẫn khái niệm xảy ra nếu 𝐴𝑐 1≠ 𝐴𝑐 2 hoặc 𝑉𝑐 1≠ 𝑉𝑐 2

Thuật ngữ tốt nhất có nghĩa là có nhiều nhất các tiêu chí được thỏa trong việc xác định cặp (A * , V * ) Các tiêu chí được định nghĩa như sau:

P1 ∀ 𝑎, 𝑏 ∈ 𝐴 = ⋃𝑛 𝐴𝑖

𝑖=1 và a ↔ b thì tất cả sự xuất hiện của a trong tập 𝐴𝑖 có thể

được thay thế bởi thuộc tính b hoặc ngược lại

P2 Với mọi tập 𝐴𝑖chứa các thuộc tính a, b và a → b, có thể loại bỏ thuộc tính b

P3 ∀ 𝑎, 𝑏 ∈ 𝐴 = ⋃𝑛 𝐴𝑖

𝑖=1 , a ↓ b thì tất cả các xuất hiện của a trong tất cả các các tập

𝐴𝑖 có thể được thay thế bởi thuộc tính b hoặc ngược lại

P4 Sự xuất hiện của một thuộc tính trong tập hợp 𝐴∗chỉ phụ thuộc vào sự xuất hiện của thuộc tính này trong tập 𝐴𝑖

P5 Một thuộc tính xuất hiện trong tập 𝐴∗ nếu nó xuất hiện trong ít nhất một nửa của tập 𝐴𝑖

P6 Tập 𝐴∗ tương đương với A nếu thỏa P 1 - P3

Ngày đăng: 28/05/2016, 16:55

HÌNH ẢNH LIÊN QUAN

Hình 2.2. Khái niệm ontology từ các lĩnh vực khác nhau - Tích hợp ontology mờ trên cơ sở lý thuyết đồng thuận
Hình 2.2. Khái niệm ontology từ các lĩnh vực khác nhau (Trang 23)
Hình 2.9. Tích hợp ontology cho mục đích giao tiếp giữa các hệ thống thông tin - Tích hợp ontology mờ trên cơ sở lý thuyết đồng thuận
Hình 2.9. Tích hợp ontology cho mục đích giao tiếp giữa các hệ thống thông tin (Trang 28)
Hình 2.11. Các kỹ thuật so khớp cơ bản - Tích hợp ontology mờ trên cơ sở lý thuyết đồng thuận
Hình 2.11. Các kỹ thuật so khớp cơ bản (Trang 30)
Hình 2.16. Ví dụ trộn ontology (Murat Şensoy, 2006) - Tích hợp ontology mờ trên cơ sở lý thuyết đồng thuận
Hình 2.16. Ví dụ trộn ontology (Murat Şensoy, 2006) (Trang 34)
Hình 2.17. Phân loại các công cụ tích hợp ontology (Doan et al., 2004; Mao, 2008; Mao - Tích hợp ontology mờ trên cơ sở lý thuyết đồng thuận
Hình 2.17. Phân loại các công cụ tích hợp ontology (Doan et al., 2004; Mao, 2008; Mao (Trang 35)
Hình 2.29. Các mức mâu thuẫn tri thức (N. T. Nguyen, 2008a) - Tích hợp ontology mờ trên cơ sở lý thuyết đồng thuận
Hình 2.29. Các mức mâu thuẫn tri thức (N. T. Nguyen, 2008a) (Trang 61)
Hình 4.1. Biểu đồ kết quả so khớp vòng thi directory OAEI từ năm 2006-2010 (Euzenat, - Tích hợp ontology mờ trên cơ sở lý thuyết đồng thuận
Hình 4.1. Biểu đồ kết quả so khớp vòng thi directory OAEI từ năm 2006-2010 (Euzenat, (Trang 115)
Hình 4.5. Độ đo precision và recall cho các tập dữ liệu OAEI - Tích hợp ontology mờ trên cơ sở lý thuyết đồng thuận
Hình 4.5. Độ đo precision và recall cho các tập dữ liệu OAEI (Trang 118)
Hình 4.9. So sánh phương pháp so khớp PCP và các hệ thống khác - Tích hợp ontology mờ trên cơ sở lý thuyết đồng thuận
Hình 4.9. So sánh phương pháp so khớp PCP và các hệ thống khác (Trang 120)
Hình 4.16. Chất lượng đồng thuận mức thực thể của các lược tả khác nhau - Tích hợp ontology mờ trên cơ sở lý thuyết đồng thuận
Hình 4.16. Chất lượng đồng thuận mức thực thể của các lược tả khác nhau (Trang 126)
Hình B.4. Mô hình cấu trúc của Prompt - Tích hợp ontology mờ trên cơ sở lý thuyết đồng thuận
nh B.4. Mô hình cấu trúc của Prompt (Trang 154)
Hình B.7. Kiến trúc hệ thống của ASMOV - Tích hợp ontology mờ trên cơ sở lý thuyết đồng thuận
nh B.7. Kiến trúc hệ thống của ASMOV (Trang 156)
Hình B.9. Kiến trúc hệ thống của Anchor-Flood - Tích hợp ontology mờ trên cơ sở lý thuyết đồng thuận
nh B.9. Kiến trúc hệ thống của Anchor-Flood (Trang 158)
Hình C.2.  Cài đặt giá trị mờ của Khái niệm - Tích hợp ontology mờ trên cơ sở lý thuyết đồng thuận
nh C.2. Cài đặt giá trị mờ của Khái niệm (Trang 163)
Hình C.4.  Giá trị mờ của thực thể - Tích hợp ontology mờ trên cơ sở lý thuyết đồng thuận
nh C.4. Giá trị mờ của thực thể (Trang 164)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm