đồ án công nghệ thông tin Tiếp cận web ngữ nghĩa và ontology trong việc phát triển ứng dụng quản trị tri thức cho doanh nghiệp

Mãi đến khi web ngữ nghĩa và ontology ra đời, với khả năng máy tính có thể hiểu được và xử lý được các thông tin thì bài toán quản trị tri thức mới có thêm hướng đi mới đầy triển vọng.Cũ

Trang 1

PHIẾU GIAO NHIỆM VỤ ĐỒ ÁN TỐT NGHIỆP

1 Mục đích nội dung của ĐATN

Tiếp cận web ngữ nghĩa và ontology trong việc phát triển ứng dụng quản trị tri thức cho doanhnghiệp

2 Các nhiệm vụ cụ thể của ĐATN

1 Tìm hiểu về công nghệ web ngữ nghĩa

2 Tìm hiểu về tổng quan về bài toán quản trị tri thức cho doanh nghiệp

3 Tìm hiểu về hướng tiếp cận web ngữ nghĩa và ontology vào hệ thống quản trị tri thức

cho doanh nghiệp

4 Phân tích và thiêt kế hệ thống quản trị tri thức dựa trên ontology cho doanh nghiệp, cụ

thể là công ty Mitani (BK-KMS)

5 Tham gia xây dựng hệ thống

3 Lời cam đoan của sinh viên:

Tôi – sinh viên Trần Cảnh Toàn - cam kết ĐATN là công trình nghiên cứu của bản thân tôi dưới sự hướng dẫn của TS.Cao Tuấn Dũng

Các kết quả nêu trong ĐATN là trung thực, không phải là sao chép toàn văn của bất kỳ côngtrình nào khác

Hà Nội, ngày tháng năm

Tác giả ĐATN

Trần Cảnh Toàn

4 Xác nhận của giáo viên hướng dẫn về mức độ hoàn thành của ĐATN và cho phép bảo vệ:

Hà Nội, ngày tháng năm

Giáo viên hướng dẫn

TS.Cao Tuấn Dũng

Trang 2

LỜI CẢM ƠN

Trước hết, em xin chân thành cảm ơn thầy Cao Tuấn Dũng Em thực sự biết ơn thầy đãđịnh hướng cho em với đề tài của đồ án cũng như giúp đỡ nhiệt tình, giảng giải tỉ mỉcác khía cạnh của bài toán cho em Thầy cũng giúp chúng em kiểm tra hệ thống mộtcách cẩn thận để làm tăng chất lượng chương trình

Em cũng xin gửi lời cảm ơn đến các thầy cô giáo trong bộ môn Công nghệ phần mềm,trong khoa Công nghệ thông tin nói riêng và trong Trường Đại học Bách Khoa Hà nộinói chung Sự chỉ bảo nghiêm khắc nhưng nhiệt tình của các thầy cô đã giúp chúng emphát triển những kĩ năng cần thiết trong nghề nghiệp cũng như trong nghiên cứu

Em xin đặc biệt gửi lời cảm ơn đến các thầy cô trong ban lãnh đạo bộ môn Công NghệPhần Mềm, đã rất tích cực và năng động trong hợp tác với doanh nghiệp và tạo điềukiện cho sinh viên chúng em sớm được làm việc trong môi trường dự án với sức ép củacác công ty Chúng em đã trưởng thành và tự tin lên rất nhiều, không chỉ về chuyênmôn mà còn về kỹ năng trình bày và khả năng ngoại ngữ

Nhân dịp này, em xin cảm ơn nhóm dự án Mitani-03, đặc biệt là em Nguyễn Đức Đạt

và Đỗ Đình Thắng, đã giúp đỡ em rất nhiều trong việc hoàn thành đồ án này

Cuối cùng xin gửi đến những người thân yêu nhất trong gia đình: bố mẹ và anh chị.Cảm ơn mọi người đã đặt niềm tin ở con!

Trang 3

TÓM TẮT NỘI DUNG ĐỒ ÁN TỐT NGHIỆP

Tri thức từ lâu đã được xem là chìa khóa cho mọi vấn đề Trong thế giới ngày nay, tri thức vừa

là nguồn lực con người vừa là nguồn động lực kinh tế chủ yếu Không giống như các loại vậtchất thông thường, khi chia sẻ với nhau, tri thức không những không mất đi mà còn được bổ

sung thêm: "Anh ta nghe ý kiến của tôi và tự nhận lấy kiến thức cho mình mà không hề làm giảm kiến thức của tôi; giống như anh ta thắp sáng ngọn nến của anh ta bằng ngọn nến của tôi và nhận ánh sáng mà không hề làm tôi bị tối đi" [Thomas Jefferson].

Cũng vì thế, trong vài thập kỷ gần đây, nhu cầu về một hệ thống quản trị tri thức cho doanhnghiệp đã bắt đầu hình thành với yêu cầu cho phép nhân viên truy cập dễ dàng và hiệu quả vàonguồn tri thức của doanh nghiệp, cũng như khuyến khích và hỗ trợ nhân viên chia sẻ tri thứcvới nhau và đóng góp trở lại cho công ty Đã có một số phần mềm được phát triển(như LotusNotes), và được áp dụng tại nhiều công ty bên các nước châu Âu, châu Mỹ và cả trong khuvực Tuy nhiên, hầu hết đều chưa thỏa mãn được yêu cầu đặt ra, do chưa thể khai thác hết cáckhía cạnh của tri thức nhất là các tri thức ẩn

Mãi đến khi web ngữ nghĩa và ontology ra đời, với khả năng máy tính có thể hiểu được và xử

lý được các thông tin thì bài toán quản trị tri thức mới có thêm hướng đi mới đầy triển vọng.Cũng đã có một số dự án nghiên cứu và áp dụng cách tiếp cận này trong các hệ quản trị trithức và bước đầu tương đối thành công

Trong đồ án này, chúng tôi tập trung nghiên cứu và phân tích hiện trạng của các phương pháptiếp cận web ngữ nghĩa và ontology trong bài toán quản trị tri thức, cũng như tham khảo một

số hệ quản trị tri thức dựa trên ontology điển hình Từ đó rút ra được mô hình phù hợp và tiếnhành xây dựng hệ thống “quản trị tri thức dựa trên ontology cho doanh nghiệp BK-KMS”

Hệ thống này nằm trong nội dung dự án Mitani-03 giữa bộ môn Công nghệ phần mềm vớicông ty Mitani Sangyo của Nhật

Trang 4

ABSTRACT OF THESIS

Knowledge is known as the key success for everything Today, knowledge is either the humanresource or the economic motivation Furthermore, when exchanged, knowledge doesn’t onlyloss the value, but also increases itself So many enterprise need for knowledge managementsystem Some of them have been developed such as Lotus Notes, but they don’t match therequirements

Until Semantic Web and Ontology appear - with ability of information processable andknowable by machine, a new and realizable approach for solving the knowledge managementproblem has been detect Some systems with this approach have developed, and success infirst step

In this project, we analyze and review the state-of-the-art of ontology-based managementsystem and also refer the beyond system, to get the suitable architect for developing the

“Ontology-based Knowledge Management System for Enterprises” call BK-KMS

This system is in the content of the Collaborative Research Project between Mitani Sangyo cowith Department of Software Engineering – Faculty of Information Technology – Ha NoiUniversity of Technology where I ‘m the student leader of this project

Trang 5

Mục lục

LỜI CẢM ƠN 2

DANH MỤC HÌNH VẼ 8

I.1 H Ệ QUẢN TRỊ TRI THỨC 9

I.1.1 Tri thức 9

I.1.2 Quản trị tri thức 10

I.1.3 Hệ quản lý tri thức 11

I.2 O NTOLOGY 13

I.2.1 Khái niệm 13

I.2.2 Vòng đời của Ontology 13

I.2.3 Phương pháp xây dựng 14

I.3 W EB NGỮ NGHĨA – S EMANTIC W EB 18

I.3.1 Khái niệm 18

I.3.2 Kiến trúc lớp của Web ngữ nghĩa 19

CHƯƠNG II : PHÂN TÍCH HIỆN TRẠNG CỦA QUẢN TRỊ TRI THỨC DỰA TRÊN ONTOLOGY 21 II.1 C ÁC PHƯƠNG PHÁP DỰA TRÊN O NTOLOGY TRONG QUẢN TRỊ TRI THỨC 21

II.1.1 Công nghệ trong quản trị tri trức 21

II.1.1.1 Hiện trạng về nghiên cứu và công nghệ trong các giải pháp quản trị tri thức 22

II.1.1.2 Các luồng quản trị tri thức 22

II.1.2 Sự đóng góp của Ontology 23

II.1.3 Chiều ngữ nghĩa 23

II.1.3.1 Ontology phục vụ giao tiếp, truyền thông 24

II.1.3.2 Tích hợp các hệ thống 25

II.1.3.3 Suy diễn 25

II.1.4 Chiều Web 25

II.1.4.1 Các giai đoạn phân quyền 25

II.1.4.2 Kịch bản phân quyền cho QTTT dựa trên ontology 26

II.2 C ÁC CÔNG NGHỆ DỰA TRÊN O NTOLOGY 27

II.2.1 Các kiến trúc dựa trên Ontology 28

II.2.2 Tầng Ontology 29

II.2.2.1 Biểu diễn Ontology 29

II.2.2.2 Ngôn ngữ RDF/RDFS 30

II.2.2.3 Các công cụ phát triển Ontology 32

II.2.3 Tầng trung gian - Middleware 34

II.2.3.1 Lưu trữ Ontology 34

II.2.3.2 Ngôn ngữ truy vấn ontology 35

II.2.3.3 Cơ chế suy diễn 37

II.2.4 Tầng ứng dụng - Application 37

II.2.4.1 Tìm kiếm dựa trên Ontology 38

II.2.4.2 Duyệt dựa trên Ontology 38

II.2.4.3 Trực quan thông tin dựa trên ontology 39

II.3 M ỘT SỐ HỆ QUẢN TRỊ TRI THỨC DỰA TRÊN O NTOLOGY 40

II.3.1 On-To-Knowledge 40

II.3.1.1 Mục đích 40

II.3.1.2 Môi trường công cụ cho quản trị tri thức dựa trên Ontology 40

II.3.2 Hệ quản trị tri thức dựa trên ontology của MIRDC 43

II.3.2.1 Mục đích 43

II.3.2.2 Mô hình Ontology của công nghiệp kim loại 43

II.3.2.3 Hệ thống quản lý tri thức dựa trên Ontology 45

II.3.3 Mô hình hóa người dùng dựa trên ontology cho hệ quản trị tri thức 48

Trang 6

II.3.3.1 Giới thiệu 48

II.3.3.2 Kiến trúc mô hình hóa người dùng dựa trên ontology 48

II.4 K ẾT LUẬN 50

CHƯƠNG III : PHÂN TÍCH THIẾT KẾ HỆ THỐNG QUẢN TRỊ TRI THỨC DỰA TRÊN ONTOLOGY CHO DOANH NGHIỆP 51 III.1 M ỤC ĐÍCH VÀ PHẠM VI CỦA HỆ THỐNG 52

III.1.1 Mục đích của hệ thống 52

III.1.2 Phạm vi của hệ thống 53

III.2 P HÂN QUYỀN NGƯỜI DÙNG TRONG HỆ THỐNG 53

III.2.1 Nhân viên 53

III.2.2 Nhân viên mới vào 53

III.2.3 Chuyên gia 53

III.2.4 Kỹ sư tri thức 54

III.2.5 Quản trị hệ thống 54

III.3 C ÁC CHỨC NĂNG CHÍNH CỦA HỆ THỐNG 54

III.4 K IẾN TRÚC CHUNG CỦA HỆ THỐNG 56

III.4.1 Tầng dữ liệu 56

III.4.2 Tầng trung gian 57

III.4.3 Tầng ứng dụng 57

III.5 Đ ẶC TẢ CÁC CHỨC NĂNG CỦA HỆ THỐNG 57

III.5.1 Đăng ký 57

III.5.2 Đăng nhập 59

III.5.3 Phục hồi mật khẩu 60

III.5.4 Tra cứu ontology 61

III.5.5 Quản lý thông tin cá nhân 62

III.5.5.1 Xem thông tin cá nhân 62

III.5.5.2 Sửa thông tin cá nhân 63

III.5.6 Tìm kiếm tri thức 65

III.5.6.1 Tìm kiếm tài liệu 65

III.5.6.2 Tìm kiếm con người 67

III.5.6.3 Tìm kiếm nâng cao 68

III.5.7 Chia sẻ tri thức 70

III.5.7.1 Tạo chú thích ngữ nghĩa 70

III.5.7.2 Sửa chú thích ngữ nghĩa 72

III.5.8 Hỗ trợ nhân viên mới 74

III.5.9 Hỗ trợ cập nhật tri thức mới 75

III.5.10 Hỗ trợ chuyên gia 76

III.5.11 Quản lý người dùng 77

III.5.12 Nhắc việc và sự kiện 78

III.6 C ÁC BIỂU ĐỒ TRÌNH TỰ 79

III.6.1 Tra cứu Ontology 80

III.6.2 Hỗ trợ nhân viên mới 81

III.6.3 Tìm kiếm tài liệu 82

III.6.4 Tìm kiếm con người 83

III.6.5 Tìm kiếm nâng cao 84

III.6.6 Tạo chú thích ngữ nghĩa: 85

III.6.7 Sửa chú thích ngữ nghĩa 86

III.6.8 Nhắc việc và sự kiện 87

III.7 T HIẾT KẾ LỚP CỦA HỆ THỐNG 88

III.8 T HIẾT KẾ DỮ LIỆU 89

III.8.1 Thiết kế ontology 89

III.8.2 Thiết kế cơ sở dữ liệu 95

III.9 T HIẾT KẾ MÀN HÌNH 96

III.9.1 Thiết kế sơ đồ trình bày (layout) 96

III.9.2 Các menu 98

III.9.3 Giao diện tra cứu Ontology 98

III.9.3.1 Giao diện hiển thị và tìm kiếm các lớp 98

Trang 7

III.9.3.2 Giao diện hiển thị thông tin của lớp 100

III.9.3.3 Giao diện chung của chức năng tra cứu ontology 100

III.9.4 Giao diện nhắc việc và sự kiện 101

III.9.5 Giao diện tìm kiếm nâng cao 102

CHƯƠNG IV : XÂY DỰNG HỆ THỐNG QUẢN TRỊ TRI THỨC DỰA TRÊN ONTOLOGY CHO DOANH NGHIỆP 105 IV.1 S Ử DỤNG CORESE ĐỂ NẠP , TÌM KIẾM TRONG O NTOLOGY , A NNOTATION 105

IV.1.1 Tổng quan về Corese 105

IV.1.2 Lập trình với Corese 106

IV.2 S Ử DỤNG S TRUTS FRAMEWORK 109

IV.2.1.1 Kiến trúc của Struts 109

IV.2.1.2 Cấu hình Struts trong Apache Tomcat 111

IV.3 S Ử DỤNG CÁC KỸ THUẬT ĐỂ HIỂN THỊ 114

IV.3.1 Ngôn ngữ XSLT 114

IV.3.2 SVG 114

IV.4 C HI TIẾT CÀI ĐẶT CÁC CHỨC NĂNG 116

IV.4.1 Tổ chức các engine corese để làm việc với nhiều luật 116

IV.4.2 Tra cứu ontology 117

CHƯƠNG V : KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 121 V.1 K ẾT QUẢ ĐẠT ĐƯỢC 121

V.1.1 Lý thuyết 121

V.1.2 Chương trình 121

V.2 Đ ÁNH GIÁ KẾT QUẢ 121

V.2.1 Lý thuyết 121

V.2.2 Chương trình 122

V.3 H ẠN CHẾ 122

V.4 K ẾT LUẬN 122

V.5 H ƯỚNG PHÁT TRIỂN 122

PHỤ LỤC 1: CÚ PHÁP CỦA SPARQL 124

Trang 8

DANH MỤC HÌNH VẼ

Hình 1: Vòng đời của Ontology 15

Hình 2: Phân cấp lớp trong ontology 16

Hình 3: Thuộc tính và các giới hạn của thuộc tính 18

Hình 4: Kiến trúc lớp của web ngữ nghĩa 20

Hình 5: Chiều ngữ nghĩa của ontology 25

Hình 6: Kiến trúc chung của các ứng dụng dựa trên ontology 29

Hình 7: Sự khác nhau giữa RDF và RDFS 33

Hình 8: Giao diện của Protégé cho một Project RDFS/RDF 35

Hình 9: Kiến trúc của lưu trữ ontology 36

Hình 10: Kiến trúc của ứng dụng On-To-Knowledge 42

Hình 11: Mô hình ontology của ứng dụng quản trị tri thức cho công nghiệp kim loại 44

Hình 12: Ontology thông tin 45

Hình 13: Một phần của Ontology lĩnh vực 45

Hình 14: Kiến trúc của hệ quản trị tri thức cho công nghiệp kim loại 46

Hình 15: Mô hình hóa người dùng dựa trên ontology 49

Hình 16: Mục đích của hệ thống BK-KMS 53

Hình 17: Phân quyền người dùng trong hệ thống BK-KMS 54

Hình 18: Use case chính của hệ thống 55

Hình 19: Kiến trúc tổng quan của hệ thống BK-KMS 57

Hình 20: Use case mức 2 của quản lý thông tin cá nhân 63

Hình 21: Use case mức 2 của tìm kiếm tri thức 66

Hình 22: Use case mức 2 của chia sẻ tri thức 71

Hình 23: Use case mức 2 của quản lý người dùng 78

Hình 24: Biểu đồ trình tự của chức năng tra cứu ontology 81

Hình 25: Biểu đồ trình tự của chức năng hỗ trợ nhân viên mới 82

Hình 26: Biểu đồ trình tự của chức năng tìm kiếm tài liệu 83

Hình 27: Biểu đồ trình tự của chức năng tìm kiếm con người 84

Hình 28: Biểu đồ trình tự của chức năng tìm kiếm nâng cao 85

Hình 29: Biểu đồ trình tự của chức năng tạo chú thích ngữ nghĩa 86

Hình 30: Biểu đồ trình tự của chức năng sửa chú thích ngữ nghĩa 87

Hình 31: Biểu đồ trình tự của chức năng nhắc việc và sự kiện 88

Hình 32: Phân cấp lớp trong ontology Mitani 94

Hình 33: Mô hình web-site BK-KMS 97

Hình 34: Giao diện bên ứng dụng cửa trước 98

Hình 35: Giao diện ứng dụng cửa sau 98

Hình 36: Các menu của hệ thống 99

Hình 37: Giao diện chức năng tra cứu ontology 101

Hình 38: Giao diện nhắc việc và sự kiện 102

Hình 39: Giao diện tìm kiếm nâng cao 104

Hình 40: Chế độ gõ trong tìm kiếm nâng cao 105

Hình 41: Mô hình hoạt động của Corese 107

Hình 42: Kiến trúc tổng quan của framework Struts 111

Hình 43: Mô hình hoạt động của XSLT 115

Hình 44: Tổ chức lớp cho các đối tượng QueryCorese 118

Trang 9

: TỔNG QUAN VỀ HỆ QUẢN TRỊ TRI THỨC

DỰA TRÊN ONTOLOGY

Hệ quản trị tri thức

Trước khi tìm hiểu về hệ quản trị tri thức (HQTTT) chúng ta cần trả lời các câu hỏisau:

 Tri thức là gì?

 Vì sao phải quản trị tri thức(QTTT)?

 Quản trị tri thức như thế nào?

Phần sau đây sẽ trả lời các câu hỏi đó

I.1.1 Tri thức.

Trong thế giới ngày nay, tri thức được coi vừa là nguồn lực con người vừa là nguồnđộng lực kinh tế chủ yếu Các nhân tố sản xuất truyền thống như: đất đai, tài nguyênthiên nhiên, vị trí địa lý, vốn, lao động không biến mất nhưng chúng tụt xuống hàngthứ hai Người ta có thể có được chúng, và có một cách dễ dàng nếu có tri thức

Vậy tri thức là gì?

Có rất nhiều quan điểm và định nghiã khác nhau về tri thức, chúng ta có thể hiểu trithức là "những cảm nhận, hiểu biết và bí quyết thực tế mà chúng ta có-là nguồn lực cơbản cho phép chúng ta hành động một cách thông minh." theo Wiig,1996

Hay theo cách giải thích của Thomas Jefferson thì tri thức là "Anh ta nghe ý kiến của tôi và tự nhận lấy kiến thức cho mình mà không hề làm giảm kiến thức của tôi; giống như anh ta thắp sáng ngọn nến của anh ta bằng ngọn nến của tôi và nhận ánh sáng mà không hề làm tôi bị tối đi"

Mặc dù có nhiều khái niệm khác nhau, nhưng các học giả đều có những đặc điểmchung khi nói về tri thức: tri thức được hình thành từ não người, con người sử dụng trithức để tư duy và ra các quyết định tạo ra giá trị Quá trình phát triển tri thức luôn gắnliền với học hỏi, đổi mới và sáng tạo

Sẽ là hữu ích nếu phân biệt được các loại tri thức khác nhau Biết cái gì what), là loại tri thức về sự kiện, ngày nay càng giảm dần tầm quan trọng trong xã hộithông tin và sức mạnh của Internet Biết tại sao (Know-why) là tri thức về thế giới tựnhiên, xã hội và suy nghĩ của con người Biết ai đó (Know-who) là về thế giới của cácquan hệ xã hội, là tri thức về ai biết cái gì và ai đó được những gì Việc biết đượcnhững người cần thiết đôi khi còn quan trọng đối với quản lý hơn là biết được cácnguyên tắc quản lý Biết chỗ và biết thời gian (Know-where và Knowwhen) đang ngàycàng quan trọng trong nền kinh tế linh hoạt và năng động Biết cách làm (Know-how)

(Know-là về các kỹ năng và khả năng thực hành thành thạo công việc

Tri thức tồn tại dưới hai dạng: thứ nhất là dạng tri thức bộc lộ là những tri thức đãđược "mã hoá" và dễ dàng chuyển giao từ người này sang người khác, thường nằmtrong hệ thống văn bản của tổ chức, các quy trình, quy tắc, hướng dẫn công việc, chuẩnmực hoạt động, cơ sở dữ liệu,… những tri thức này thường học được qua giáo dục vàđào tạo chính quy Dạng thứ hai là tri thức ẩn là những tri thức thu được từ sự trải

Trang 10

nghiệm thực tế, dạng tri thức này thường ẩn trong mỗi cá nhân và rất khó "mã hóa",thường bao gồm: niềm tin, giá trị, kinh nghiệm, bí quyết, kỹ năng,…

Như vậy, nếu nhìn nhận tri thức trong phạm vi của tổ chức, chúng ta thấy bất kỳ tổchức nào cũng đều tồn tại hai dạng tri thức trên, chỉ có điều tổ chức có biết mình đangnắm giữ những tri thức nào? chúng nằm ở đâu? ai nắm giữ? và cách thức sử dụng nhưthế nào để khai thác một cách hiệu quả tri thức nhắm phục vụ cho quá trình sản xuấtkinh doanh chính của tổ chức để tạo ra giá trị mà thôi

Đến đây câu hỏi đặt ra là: tại sao cần quản lý tri thức? và quản lý tri thức như thếnào?

I.1.2 Quản trị tri thức.

Tại sao cần quản trị tri thức?

"Tốt hơn, nhanh hơn, rẻ hơn" chắc hẳn là mục tiêu theo đuổi của bất kỳ doanhnghiệp nào nếu muốn tồn tại và phát triển trong thị trường cạnh tranh như ngày nay,khi mà khách hàng có vô số sự lựa chọn và dễ dàng tìm kiếm nhà cung cấp khác chỉtrong khoảng khắc của một click chuột

Các doanh nghiệp ngày nay đang ra sức rút ngắn thời gian để cung cấp sảnphẩm/dịch vụ cho khách hàng kể từ khi nhận được yêu cầu, để biến ý tưởng mới thànhsản phẩm/dịch vụ cụ thể Dưới sức ép của cạnh trạnh, chu kỳ sống của sản phẩm bị rútngắn hơn bao giờ hết, tốc độ đổi mới sản phẩm nhanh đến chóng mặt Trong nhiềunghành công nghiệp dịch vụ thời gian trên chỉ tính bằng giây, phút

Đã không ít doanh nghiệp rơi vào tình trạng khủng hoảng khi cán bộ chủ chốt vềmarketing, tài chính hoặc kỹ thuật rời bỏ doanh nghiệp Doanh thu của một công ty đã

bị giảm 60% khi một giám đốc khách hàng rời bỏ, phải mất 06 tháng sau với nhiều nỗlực thì công ty mới tạm ổn định Rất nhiều bí quyết công nghệ bị mất khi các cán bộ kỹthuật lành nghề ra đi; phải mất rất nhiều thời gian và công sức để tìm kiếm thông tin vềmột khách hàng mà ta đã có quan hệ từ lâu…

Vậy đâu là lời giải cho các vấn đề trên? Phải chăng đó chính nhu cầu cần kiến tạotri thức và quản lý hiệu quả nguồn tri thức

Khái niệm về quản lý tri thức.

Khái niệm quản lý tri thức không còn mới, ở nhiều quốc gia ở Châu Âu, Châu Mỹ,

và kể cả trong khu vực đã áp dụng quản lý tri thức, và có cả một chính sách về kinh tếtri thức quốc gia rõ ràng Nhiều công ty trong các nước này đã áp dụng quản lý tri thứcrất thành công

Định nghĩa cụ thể về QTTT chưa được thống nhất, do có những quan điểm khácnhau ngay từ đầu về tri thức là gì Trong khía cạnh của bài toán quản lý tri thức cho 1doanh nghiệp, trong đó tập trung vào chức năng cung cấp thông tin cần thiết hỗ trợ

người dùng, có thể nhìn nhận quản lý tri thức là: “tập hợp các thước đo hướng tới việc cung cấp luồng kiến thức liên tục tới đúng người, đúng thời điểm trong phạm vi một tổ chức, doanh nghiệp để cực đại hóa lợi nhuận thu được từ tài sản trí tuệ và nguồn thông tin”

Về phương pháp, quản lý tri thức xây dựng nên điểm hội tụ nhanh chóng của côngnghệ thông tin, quy trình kinh doanh và quản lý lưu trình tác nghiệp, quản lý dự án,quản lý nhân lực (HRM), liên lạc và khoa học thư viện

Trang 11

Nội dung cơ bản trong quản lý tri thức mà các chuyên gia đã thống nhất và đúc rúttrong quá trình nghiên cứu qua thực tế triển khai quản lý tri thức tại các doanh nghiệpnhư sau:

 Thứ nhất: Quản lý tri thức là một quá trình bao gồm các hoạt động cơ bản:kiến tạo, khai thác, sử dụng, chia sẻ và phát triển nguồn tài sản tri thức trong

tổ chức nhằm tạo ra giá trị Như vậy quản lý tri thức là một quá trình liên tục

vì bản thân tri thức cũng luôn thay đổi Tri thức không ngẫu nhiên mà có, nó

là quá trình nỗ lực học hỏi không ngừng của từng cá nhân và tổ chức để tìmkiếm các ý tưởng sáng tạo

 Thứ hai: Quản lý tri thức cần phải quan tâm đến cả 02 loại tri thức: tri thứcbộc lộ và tri thức ẩn Ta có thể ví tri thức ẩn trong mỗi con người và tổ chứcgiống như tảng băng trôi 3 nổi 7 chìm, nếu tri thức bộ lộ là phần nổi thì trithức ẩn là phần chìm Việc khai thác tri thức ẩn và biến nó dẫn thành tri thức

bộ lộ phụ thuộc rất nhiều vào môi trường và văn hoá của từng tổ chức

 Thứ 3: Quản lý tri thức cần tiếp cận một cách có hệ thống và mang tínhchiến lược gắn kết chặt chẽ với chiến lược và mục tiêu kinh doanh Đối vớimỗi doanh nghiệp cần xác định thật rõ chiến lược và mục tiêu kinh doanhtrong từng giai đoạn và gắn kết các mục tiêu của quản lý tri thức để hiệnthức hoá các mục tiêu kinh doanh của doanh nghiệp

Các yếu tố cơ bản trong quản lý tri thức

Ba yếu tố cơ bản trong quản lý tri thức cần chú trọng, đó là: Con người, Quá trình

và Công nghệ, trong đó yếu tố con người đóng vai trò then chốt, quyết định Con ngườitạo ra tri thức và sử dụng tri thức để làm việc và tạo giá trị Như vậy một trong nhữngđiều quan trọng của quản lý tri thức trong doanh nghiệp đó tạo môi trường mà trong đótri thức mới được kiến tạo, sử dụng và chia sẻ, các ý tưởng sáng tạo được nuôi dưỡng,

cổ vũ và phát huy

Công nghệ thông tin bao gồm cả phần cứng và phần mềm có vai trò rất quan trọngtrong quản lý tri thức, nó là công cụ để lưu trữ, chuyên chở, chia sẻ tri thức và quá đótăng cường khả năng đóng góp của tri thức cho phát triển

I.1.3 Hệ quản lý tri thức

Hệ quản trị tri thức (HQTTT) có thể được xem là một hệ thống thông tin phục vụcho việc quản trị tri thức trong các tổ chức, hỗ trợ việc sáng tạo, tiếp thu, lưu trữ và phổbiến thông tin

Ý tưởng của hệ quản trị tri thức là cho phép các nhân viên có thể truy cập nhanhchóng và sử dụng các tư liệu cơ sở của tổ chức về các sự kiện, nguồn thông tin và cácgiải pháp Ví dụ: một kỹ sư mới ra trường, được tuyển dụng vào một công ty CNTTcủa Nhật, chưa hề có kinh nghiệm làm việc tại công ty, nhưng thông qua HQTTT cóthể truy cập vào nguồn tri thức của công ty để biết các quy định về làm việc (giờ giấc,chế độ thưởng phạt, quy cách code, …) hay các giải pháp khi gặp một vấn đề khó về

kỹ thuật, hoặc biết các chuyên gia trong công ty về lĩnh vực mình đang tìm hiểu để cóthể tìm được giải pháp tốt nhất và nhanh nhất cho vấn đề của mình Nhân viên đó cũng

có thể chia sẻ tri thức mới mà mình mới phát hiện ra thông qua HQTTT

Theo tổng kết hệ quản trị tri thức có thể là một trong số các hệ sau:

Trang 12

1 Hệ dựa trên tài liệu, ví dụ các công nghệ cho phép tạo/quản lý/chia sẻ các tàiliệu được định dạng như Lotus Notes, web, các cơ sở dữ liệu phân tán,

2 Hệ dựa trên Ontology/Taxonomy: tương tự như các kỹ thuật dựa trên tài liệutrong ngữ cảnh là hệ thống của các thuật ngữ được sử dụng để tóm tắt tàiliệu như tác giả, chủ đề, tổ chức, trong file DAML hoặc các ontology dựatrên xml khác

3 Hệ dựa trên công nghệ trí tuệ nhân tạo, trong đó sử dụng một sơ đồ tượngtrưng để biểu diễn lĩnh vực của vấn đề

4 Cung cấp các sơ đồ mạng của tổ chức và chỉ ra luồng trao đổi giữa các thựcthể và cá thể trong đó

5 Các công cụ tính toán xã hội gia tăng (social computing tools)

Các đặc điểm phân biệt của hệ quản trị tri thức bao gồm:

1 Mục đích: một hệ quản trị tri thức sẽ có một mục tiêu quản trị tri thức rõ

ràng của một số loại tri thức như: cộng tác, chia sẻ các kinh nghiệm quý báuhay sở thích

2 Ngữ cảnh: một cách nhìn trên hệ quản trị tri thức coi tri thức là thông tin

được tổ chức có ý nghĩa, tích lũy và nhúng vào trong một ngữ cảnh sáng tạo

và ứng dụng

3 Quá trình: Hệ quản trị tri thức được phát triển để hỗ trợ và nâng cao các quá

trình, công việc và kế hoạch tập trung vào tri thức như việc sáng tạo, xâydựng, phát hiện, nắm bắt, thu nhận, lựa chọn, đánh giá, tổ chức, liên kết, cấutrúc hóa, mô hình hóa, trao đổi, phân phối, duy trì, bảo quản, tinh chỉnh, ràsoát, phát triển, truy cập, phục hồi, còn được gọi là vòng đời của tri thức

4 Thành viên: Người dùng đóng vai trò chủ động và liên quan trong các mạng

tri thức và cộng đồng được tạo ra và duy trì bởi hệ quản trị tri thức Các thiết

kế của hệ quản trị tri thức phản ánh tri thức được phát triển một cách tập thể,

và sự phân phối tri thức dẫn đến các thay đổi tiếp theo, xây dựng lại và ápdụng trong các ngữ cảnh khác, bởi các thành viên khác với nền tảng và kinhnghiệm khác

5 Công cụ: Hệ quản trị tri thức hỗ trợ các công cụ quản trị tri thức như:

 Thu giữ, tạo ra và chia sẻ các khía cạnh của kinh nghiệm có thể mã hóađược

 Tạo ra các chỉ dẫn, các phân loại hay ontology của tri thức tập thể

 Hệ quản lý kỹ năng

 Kết nối con người dựa trên sở thích

 Tạo ra các cộng đồng hay mạng tri thức



Một số lợi ích của hệ quản trị tri thức:

o Chia sẻ các thông tin quý báu của tổ chức

o Có thể tránh được sự sáng tạo lại, giảm thiểu được các công việc dư thừa

o Có thể giảm được thời gian đào tạo cho các nhân viên mới

o Giữ được các tài sản tri thức cho tổ chức sau khi nhân viên ra đi

Trang 13

Khái niệm.

Ontology được xây dựng như một từ điển các thuật ngữ một chuyên ngành xác định cùng với mối quan hệ giữa các thuật ngữ này (quan hệ ngang hàng, quan hệ cha – con, quan hệ chủ thể - bộ phận…), và được dùng để chia sẻ thông tin trong một lĩnh vực, mà trong đó cả máy tính và con người đều có thể hiểu được.

Khái niệm “Ontology” có nguồn gốc từ nghiên cứu triết học về bản thể học, nómang ý nghĩa về quan hệ giữa các khái niệm, đó là cơ sở để sử dụng Ontology trongcác ngành khoa học, để định nghĩa các thuật ngữ chuyên ngành và mô tả quan hệ giữacác thuật ngữ đó

Về cơ bản, ontology là một tập hợp tất cả các thuật ngữ và định nghĩa các kháiniệm, miêu tả cấu trúc của thông tin trong một lĩnh vực kinh doanh đặc biệt như quản

lý sản xuất, bảo hiểm, thương mại điện tử…

Trong lĩnh vực Công nghệ thông tin, Ontology có một số đặc điểm riêng:

đến tác động của con người, các thuật ngữ lưu trữ trong ontology phải được địnhnghĩa rõ ràng về ngữ nghĩa

gia, và các nhà tạo lập ontology, đều có thể phát triển, chia sẻ và hiểu thông tintrong ontology, không phải chỉ riêng máy tính hiểu cấu trúc của ontology

bao gồm toàn bộ các nghĩa khác nhau của một khái niệm, và có thể tái sử dụng trongcác lĩnh vực khác nhau, không phải chỉ sử dụng trong một ứng dụng chuyên biệt

 Ontology có thể chia sẻ được: các thuật ngữ được xây dựng trongontology đều bắt nguồn từ những khái niệm cơ bản (như “con người”, “tổchức”,”giáo sư”…) Tuy các ontology được xây dựng riêng cho từng lĩnh vực sẽ sửdụng các thuật ngữ có khác nhau, nhưng đều bắt nguồn từ những khái niệm này Do

đó, có thể kết hợp các ontology giữa các chuyên ngành khác nhau để giải quyết cácbài toán lớn hơn, ví dụ: kết hợp ontology của các đại lý du lịch với ontology về cácdịch vụ khách sạn, các phương tiện giao thông, có thể giúp khách du lịch tìm đượchành trình du lịch phù hợp với các yêu cầu về thời gian, giá cả của họ

Vòng đời của Ontology.

Vòng đời của Ontology được mô tả trong hình vẽ 5 [Paul, 2004]

Trang 14

Hình 1: Vòng đời của Ontology

Từ các tài liệu chuyên môn (chủ yếu tồn tại dưới dạng văn bản), các lớp, các quan

hệ giữa các lớp và thuộc tính của các lớp được định nghĩa, cấu trúc hóa và biểu diễntrong Ontology Các lớp mới được thêm vào phải được định vị vị trí của lớp trongOntology đã xây dựng trước, và xác thực tính hợp lệ của các thông tin mới trích rútđược Trong quá trình tìm kiếm, khai thác ontology, các tri thức mới được suy diễn từCSTT sinh ra thông tin có ích mới, phục vụ nhu cầu của hệ thống khai thác Nhờ đó,ontology được nâng cấp dần dần

Phương pháp xây dựng

Cho đến hiện nay chưa có một quy tắc chung nào để xây dựng ontology, tuy nhiênkhi tham khảo một số phương pháp cụ thể của các chuyên gia khi xây dựng ontologythì việc xây dựng Ontology cần thực hiện qua các bước sau:

1 Xác định lĩnh vực và phạm vi của Ontology

Trong giai đoạn này cần xác định mục đích của việc xây dựng ontology là gì? Phục

vụ đối tượng nào? Ontology sắp xây dựng cần có đặc điểm gì, liên quan đến lĩnh vực,phạm vi nào Quá trình khai thác, quản lý và bảo trì ontology được thực hiện ra sao?

2 Xem xét việc sử dụng lại các ontology có sẵn

Cấu trúc của một Ontology bao gồm 3 tầng: tầng trừu tượng (Abstract), tầng miềnxác định (Domain) và tầng mở rộng (Extension) Trong đó tầng trừu tượng có tính tái

sử dụng rất cao, tầng miền xác định có thể tái sử dụng trong một lĩnh vực nhất định.Cộng đồng Ontology cũng đang lớn mạnh và có rất nhiều Ontology đã được tạo ra, vớitâm huyết của nhiều chuyên gia Do đó trước khi bắt đầu xây dựng ontology, cần xétđến khả năng sử dụng lại các ontology đã có Nếu có thể sử dụng lại một phần cácontology đã có, chi phí bỏ ra cho quá trình xây dựng ontology sẽ giảm đi rất nhiều

thác

Trang 15

3 Liệt kê các thuật ngữ quan trọng

Ontology được xây dựng trên cơ sở các khái niệm trong một lĩnh vực cụ thể, vì vậykhi xây dựng ontology cần bắt đầu từ các thuật ngữ chuyên ngành để xây dựng thànhcác lớp trong ontology tương ứng Tất nhiên không phải thuật ngữ nào cũng đưa vàoontology, vì chưa chắc đã định vị được cho thuật ngữ đó Do đó cần phải liệt kê cácthuật ngữ, để xác định ngữ nghĩa cho các thuật ngữ đó, cũng như cân nhắc về phạm vicủa ontology Việc liệt kê các thuật ngữ còn cho thấy được phần nào tổng quan về cáckhái niệm trong lĩnh vực đó, giúp cho các bước tiếp theo được thuận lợi

4 Xác định các lớp và phân cấp của các lớp

Công việc xác định các lớp không chỉ đơn giản là tiến hành tìm hiểu về ngữ nghĩacủa các thuật ngữ đã có để có được các mô tả cho thuật ngữ đó, mà còn phải định vịcho các lớp mới, loại bỏ ra khỏi ontology nếu nằm ngoài phạm vi của ontology hayhợp nhất với các lớp đã có nếu có nhiều thuật ngữ có ngữ nghĩa như nhau (đồng nghĩa,hay đa ngôn ngữ) Ngoài ra không phải thuật ngữ nào cũng mang tính chất như mộtlớp

Một công việc cần phải tiến hành song song với việc xác định các lớp là xác địnhphân cấp của các lớp đó Việc này giúp định vị các lớp dễ dàng hơn

Có một số phương pháp tiếp cận trong việc xác định phân cấp của các lớp:

1 Phương pháp từ trên xuống (top-down): bắt đầu với định nghĩa của các lớp

tổng quát nhất trong lĩnh vực và sau đó chuyên biệt hóa các khái niệm đó Ví dụ: TrongOntology về quản lý nhân sự, ta bắt đầu với lớp Người, sau đó chuyên biệt hóa lớpNgười đó bằng cách tạo ra các lớp con của lớp Người như : Kỹ sư, Công nhân, Bác sỹ,

… Lớp Kỹ sư cũng có thể chuyên biệt hóa bằng cách tạo ra các lớp con như Kỹ sưCNTT, Kỹ sư điện, Kỹ sư cơ khí, …

Ng êi

Küs i C«ng nh©n B¸c sü

Küs CNTT Küs® iÖn Küsc¬ khÝ

Hình 2: Phân cấp lớp trong ontology

2 Phương pháp từ dưới lên (bottom-up): bắt đầu với định nghĩa của các lớp cụ

thể nhất, như các lá trong cây phân cấp Sau đó gộp các lớp đó lại thành các khái tổngquát hơn Ví dụ: ta bắt đầu với việc định nghĩa các lớp như: nhân viên lễ tân, nhân viên

Trang 16

vệ sinh, nhân viên kỹ thuật Sau đó tạo ra một lớp chung hơn cho các lớp đó là lớpnhân viên.

3 Phương pháp kết hợp: kết hợp giữa phương pháp từ trên xuống và từ dướilên: bắt đầu từ định nghĩa các lớp dễ thấy trước và sau đó tổng quát hóa và chuyên biệthóa các lớp đó một cách thích hợp Ví dụ ta bắt đầu với lớp nhân viên trước, là thuậtngữ hay gặp nhất trong quản lý nhân sự Sau đó chúng ta có thể chuyên biệt hóa thànhcác lớp con: nhân viên lễ tân, nhân viên vệ sinh,… hoặc tổng quát hóa lên thành lớpNgười

5 Xác định các thuộc tính

Nếu chỉ xây dựng các lớp đơn độc thì chẳng khác gì xây dựng lại một từ điểnchuyên ngành Do đó mỗi khi định nghĩa một số lớp thì cần phải xác định cấu trúc bêntrong của lớp đó

Để xác định thuộc tính cho các lớp, ta quay trở lại danh sách các thuật ngữ đã liệt

kê được Hầu hết các thuật ngữ còn lại (sau khi đã xác định lớp) là thuộc tính của cáclớp đó Với mỗi thuộc tính tìm được, ta phải xác định xem nó mô tả cho lớp nào Cácthuộc tính đó sẽ trở thành thuộc tính của các lớp xác định Ví dụ lớp Người có cácthuộc tính sau: Họ, Tên, Ngày sinh, Giới tính, Nghề nghiệp, Địa chỉ, Điện thoại,…Nói chung, có các loại thuộc tính sau có thể trở thành thuộc tính trong mộtontology:

o Thuộc tính bên trong: ví dụ “năng lực” của “nhân viên”

o Thuộc tính bên ngoài: ví dụ “tên” hay “địa chỉ” của “nhân viên”

o Thuộc tính thành phần: ví dụ: thuộc tính “món ăn” của lớp “bữa ăn”

o Thuộc tính quan hệ: là mối quan hệ đến cá thể khác Ví dụ: thuộc tính “cóđồng nghiệp” của lớp ”người” biểu diễn mối quan hệ giữa hai người vớinhau

Hình vẽ sau cho ta cái nhìn trực quan về ontology, thuộc tính và các thể hiện

Trang 17

Location

Subject

name is-a

Hình 3: Thuộc tính và các giới hạn của thuộc tính

6 Xác định giới hạn của các thuộc tính (lực lượng, kiểu giá trị).

Các thuộc tính có thể có nhiều giới hạn ràng buộc khác nhau: như kiểu giá trị, cácgiá trị cho phép, số các thuộc tính (lực lượng), và các đặc trưng khác mà giá trị củathuộc tính có thể nhận Ví dụ: “Năm sinh” của một “nhân viên” chỉ có duy nhất và là

số nguyên, có thể nhận giá trị từ 1948 đến 1990

Một số kiểu giới hạn phổ biến bao gồm:

 Số lượng thuộc tính (slot cardinality):

Số lượng các thuộc tính xác định số giá trị mà thuộc tính này có thể có Đaphần các hệ thống chỉ phân biệt giữa các thuộc tính đơn (nhiều nhất 1 giá trị)với thuộc tính đa (một vài giá trị) Như năm sinh của người là thuộc tính đơn,còn thuộc tính địa chỉ email của người là thuộc tính đa

Một vài hệ thống khác, chặt chẽ hơn, thì cho phép đặc tả số lượng tối thiểu

và tối đa để mô tả số lượng thuộc tính Số lượng tối thiểu là N, có nghĩa là thuộctính phải có ít nhất N giá trị Ví dụ: thuộc tính “có bài báo” của một tiến sỹ phải

có ít nhất là 2 giá trị Thuộc tính tối đa là M, nghĩa là thuộc tính chỉ có nhiềunhất M giá trị Nếu M bằng 1 thì tương đương với thuộc tính đơn

 Miền (domain) của thuộc tính

Miền của thuộc tính là lớp mà thuộc tính đó thuộc về, ví dụ: lớp “tổ chức” cóthuộc tính “có nhân viên”, thì thuộc tính có nhân viên có miền là lớp “tổ chức”

 Phạm vi (range) của thuộc tính

Trang 18

Phạm vi của thuộc tính là kiểu giá trị của thuộc tính đó Các kiểu giá trị phổbiến bao gồm: literal (là các giá trị nguyên thủy như xâu, số nguyên, sốthực, ) , thể hiện của một lớp, hoặc một lớp với lớp cha là một lớp nào đó.Cần phải xác định các ràng buộc cho một thuộc tính càng chặt chẽ càng tốt, đểtránh trường hợp nhập dữ liệu sai, dẫn đến đổ vỡ của các ứng dụng sử dụng Ontologynày.

Theo W3C (http://www.w3.org/sw/): “Web ngữ nghĩa là một quan điểm, với ý tưởng các dữ liệu trên web được định nghĩa, liên kết theo cách nào đó có thể sử dụng bởi máy tính, không chỉ cho mục đích hiển thị mà còn cho phép tự động, tích hợp và tái

sử dụng dữ liệu thông qua các ứng dụng”

Nhắc đến Web ngữ nghĩa, ta không thể nào không kể đến Ontology Các Ontologytạo ra xương sống cho các ứng dụng web ngữ nghĩa Ontology cho phép máy móc cóthể hiểu được các thông tin thông qua sự liên kết giữa các nguồn thông tin và các thuậtngữ trong Ontology Hơn thế nữa, các Ontology làm sự tác động qua lại giữa cácnguồn thông tin dễ dàng hơn thông qua liên kết đến cùng một Ontology hay liên kếtgiữa các Ontology với nhau

Trang 19

Kiến trúc lớp của Web ngữ nghĩa.

Hình 4: Kiến trúc lớp của web ngữ nghĩa

Quan điểm về Web ngữ nghĩa thường được mô tả thông qua kiến trúc lớp như trên.Lớp bên dưới cùng – nền tảng của kiến trúc là URI, Unicode và XML, bao gồm cácchuẩn web đang tồn tại, cung cấp các cú pháp cơ sở cho các ngôn ngữ web ngữ nghĩa.Unicode cung cấp các lược đồ mã hóa ký tự cơ bản, cho phép sử dụng tập kí tự quốc tế,được sử dụng trong XML Chuẩn URI (Uniform resource identifier) cung cấp mộtphương tiện để nhận biết duy nhất và đánh địa chỉ cho các tài liệu, các nguồn tin trênweb Tất cả các khái niệm trong ngôn ngữ cao hơn trong mô hình trên đều được mô tảbằng Unicode và được nhận dạng duy nhất qua các URI

Các ngôn ngữ RDF(S), OWL và các luật nẳm ở bên trên, được sử dụng để mô tảcác từ vựng dùng trong web ngữ nghĩa cũng như các đối tượng dựa trên các từ vựng

đó Các đối tượng này được tham chiếu đến bởi những URI

Việc đặt lớp logic lên trên OWL và các luật hơi gây tranh cãi, do ngôn ngữ OWL

và các luật đã có logic bên trong Có một số người đồng ý rằng ngôn ngữ logic có ýnghĩa hơn nên đặt trên ngôn ngữ Ontology Một số khác thì cho rằng đây là một lớpkhông thích hợp, OWL và các luật nên là các ngôn ngữ ở mức trên cùng của ngôn ngữOntology và các ứng dụng có thể truy cập tới lớp này trực tiếp

Các lớp Proof và Trust chưa được xác định rõ, nhưng thường được cho là các ứngdụng và không là một ngôn ngữ cụ thể nào Ví dụ: ứng dụng có thể chứng minh một sốtuyên bố bằng cách sử dụng lập luận suy diễn, và một tuyên bố có thể được tin tưởngnếu nó đã được chứng minh và được xác thực bởi một số các bên thứ 3 đã được tintưởng Người dùng đóng một vai trò quan trọng trong lớp Trust, bởi vì người dùng nênquyết định mặc dù nguồn thông tin đó có thể được tin cậy

Trang 20

: PHÂN TÍCH HIỆN TRẠNG CỦA QUẢN TRỊ TRI

THỨC DỰA TRÊN ONTOLOGY

Các phương pháp dựa trên Ontology trong quản trị tri thức

Việc đo lường ảnh hưởng của công nghệ luôn là một thử thách, đặc biệt là các giảipháp QTTT khi công nghệ chỉ là một phần của chúng Chỉ cần tăng thêm 3% sự chínhxác trong tài liệu có thể làm nên sự khác biệt ở hiệu quả của một tiến trình cụ thể trong

tổ chức, mà không cần tác động gì đến thiết lập khác

Sau khi đã hiểu rõ QTTT, những kịch bản mà trong đó những phương pháp dựatrên ontology đóng vai trò làm tăng đáng kể sự có lợi của các ứng dụng sẽ được kể đến.Cần xem xét kĩ những kịch bản này trong ngữ cảnh cụ thể trước khi chuyển sang việcthực thi chúng

Trong phần này trước tiên chúng ta sẽ có một cái nhìn tổng quan về vai trò củacông nghệ trong QTTT, nhất là các vai trò chính của QTTT Sau đó, chúng ta chuyểnsang sự đóng góp riêng biệt của Ontology và đưa ra một sự phân loại cho các ứng dụngdựa trên Ontology theo hai chiều: chức năng Ontology trong các ứng dụng và cấu trúccủa các ứng dụng

Công nghệ trong quản trị tri trức

QTTT đã từng là mục tiêu của nhiều công nghệ trong quá khứ Đặc biệt công nghệcòn được rao bán như những phương thuốc trị bách bệnh cho mọi nhu cầu tri thức màhầu hết đều do những người bán các sản phẩm quản trị thông tin (những cơ sở dữ liệu

dự án, những cơ sở dữ liệu thực tế tốt nhất, các cách cài đặt Lotus Notes, v.v ), nhữngngười đã hấp tấp cố gắng đặt tên lại sản phẩm của họ như những giải pháp QTTT Lànsóng đưa IT vào thị trường này đã cho thấy sự tiến bộ của cơ sở dữ liệu tích hợp lớn vàcác dự án trí tuệ doanh nghiệp Mặt thứ ba và cũng là mặt hiện tại tập trung vào việcđưa những thông tin ẩn bên trong ra bên ngoài, và đưa thông tin đến từng người dùng,nhân viên và khách hàng bằng intranet, portal,v v Phần mềm để cung cấp công nghệlấy nền tảng con người và tiến trình như các ứng dụng cho tiến trình công việc, khônggian làm việc cộng tác, các công cụ quản lý dự án,v.v cũng đã xuất hiện Vài năm gầnđây, các ứng dụng quản lý nội dung dựa trên phân loại đầu tiên đã xâm nhập vào thịtrường với mầm mống của công nghệ ontology

Tuy nhiên tình trạng hiện tại của QTTT phản ánh một sự vỡ mộng phía sau sự lạmdụng nhiều công nghệ như vậy trong quá khứ Những dự án QTTT thất bại khi côngnghệ bị áp dụng một cách mù quáng mà không hề có sự nhận định đúng mức tới nhữngphạm vi kinh doanh lớn hơn (các vấn đề con người, văn hóa, tiến trình và cấu trúc).Tuy nhiên qua những thất bại này các chuyên gia dần nhận thức rằng QTTT vốn dĩ đãvượt quá việc triển khai phần mềm (Như một chuyên gia QTTT đã từng nói: “Nếucông nghệ giải quyết vấn đề của bạn thì vấn đề đó không phải là vấn đề về QTTT”).Kinh nghiệm này được phản ánh trong các phương pháp luận hiện nay như [SAA+99]

sẽ sắp hàng công nghệ theo phạm vi doanh nghiệp nếu nó cần để giải quyết vấn đề trithức

Trang 21

Hiện trạng về nghiên cứu và công nghệ trong các giải pháp quản trị tri thức

Qua quá trình khảo sát các ứng dụng QTTT thì chỉ có một số ít đề cập đến việc sửdụng ontology Và do vậy ontology được xếp vào loại “những công nghệ QTTT trongtương lai” Với tên gọi này, hầu hết các tài liệu đều thừa nhận rằng ontology chưa từngbước ra khỏi phòng thí nghiệm và vì thế chưa có trường hợp thực tế nào tồn tại ở thờiđiểm hiện tại

Hiện nay có hai luồng phát triển chủ yếu trong công nghệ QTTT: quản trị tri thứcđộng và tĩnh trong doanh nghiệp

Trong QTTT tĩnh (liên quan đến việc mô tả) những tiến bộ lớn được đánh dấu bởinhiều kiểu mẫu tinh vi để tổ chức và kết cấu thông tin lưu trữ cho hệ thống các doanhnghiệp bằng cách sử dụng những ngôn ngữ mô hình hóa từ lược đồ E/R đến các DTD.Trong QTTT động, sự tập trung xoay quanh tri thức trong doanh nghiệp theo cách

mà nó có thể tới đúng người theo đúng thời gian trong một dạng thức đúng Đây làmục tiêu của các hệ thống quản trị thông tin/tài liệu/nội dung, các giải pháp tiến trìnhcông việc, các công cụ hợp tác và làm việc nhóm, các cổng thông tin,v.v Những công

cụ này đưa tri thức vào hoạt động bằng cách kết nối con người với con người (thuậntiện cho trao đổi trực tiếp) hay kết nối con người với các nguồn tri thức tĩnh

Hiện trạng của các giải pháp QTTT toàn diện được đánh dấu bởi những đề nghị xâydựng trên tiến trình ba bước của việc trích xuất thông tin, phân loại dựa trên các thuậtngữ phân cấp và truy xuất thông tin Các thuật ngữ phân cấp (taxonomy) thêm vào nhưmột điểm xuất phát tự nhiên trong việc giải thích lợi ích của các ontology cho QTTTnói chung

Các luồng quản trị tri thức

Ngày nay có một nhất trí chung rằng QTTT là một hệ hòa trộn phức tạp của các vấn

đề liên quan đến con người, tổ chức và công nghệ Hiểu được sự phức tạp này là rấtquan trọng cho các giải pháp phát triển mà tối thiểu là biết các khía cạnh khác nữa củanguyên lý

Xa hơn các nhất trí này, cộng đồng QTTT phân hóa sâu sắc theo các loại công nghệđược sử dụng và vai trò chính xác của nó nằm ở trong các phương pháp Sự phân hóanày phản ánh những cái nhìn khác nhau trên tính tự nhiên của bản thân tri thức vànhững mục tiêu của QTTT

Sau đây là mô tả một số luồng chính trong QTTT:

Tri thức như một tài nguyên với tri thức như một quá trình

Một trong những phân loại chính được nhận ra nằm giữa các cách tiếp cận “dự trữ”

và “luồng” tới QTTT Khởi điểm của tiếp cận “dự trữ” là tri thức có thể tồn tại táchbiệt với trí tuệ con người và có thể được thể hiện và quản lý như các sự vật hay nguồnlực khác Những người cực đoan theo cách nhìn này, tin rằng tất cả hoặc hầu hết hiệuquả tri thức sẽ tăng nhằm đưa ra những hệ thống thông tin tốt được thực thi

Theo hướng “luồng” của tri thức, tri thức không phải là một tài sản có thể chuyểnđổi một cách khách quan Quan điểm đó dựa trên các kinh nghiệm mà tri thức luônđược hiểu trong một số các ngữ cảnh kể cả cá nhân và xã hội Trong cách nhìn đó, tri

Trang 22

thức được tái tạo khi thông tin lấy được từ suy nghĩ của con người và hệ quả thích nghivới các kiểu mẫu tinh thần bao gồm văn hóa, kỳ vọng, kinh nghiệm,v.v

Cấp độ cá nhân và cấp độ tổ chức/xã hội

Sự khác biệt trong QTTT được tạo ra do sự khác biệt về phương pháp quản lý cánhân hay tập thể Người quản lý nhân lực dựa trên phương pháp quản lý các cá nhânriêng lẻ thì cần phải xác định rằng: làm thế nào để phân bố con người để họ sử dụnghết năng lực và trí tuệ của mình, làm thế nào để sắp xếp các nhu cầu của cá nhân và tậpthể một cách phù hợp

Sự đóng góp của Ontology

Giá trị có tính đổi mới của các giải pháp dựa trên ontology bắt nguồn từ các yếu tốphân biệt giữa phương pháp dựa trên ontology với các công nghệ QTTT truyền thống

từ bảng trắng, các cơ sở dữ liệu quan hệ, các hệ chuyên gia đến các giải pháp phân loạinội dung Để có thể thấy rõ hơn các tiềm năng của các phương pháp dựa trên ontology,trước tiên phải nắm bắt những nền tảng của ontology (chương I)

Theo như định nghĩa, ontology khác với các kiểu mẫu trong trí tuệ nhân tạo theohai khía cạnh lớn:

1 Các ontology xây dựng trên một nền tảng hiểu biết chia sẻ trong cộng đồng Sựhiểu biết này đưa ra một sự thỏa thuận trên các khái niệm và mối quan hệ củachúng được thể hiện trong một miền

2 Các ontology sử dụng những sự miêu tả có tiến trình máy móc và dựa trên logic,cho phép máy tính có thể thao tác các Ontology Điều này bao hàm việc chuyểncác ontology giữa các máy tính, lưu trữ, kiểm tra tính nhất quán của cácontology, đưa ra lý lẽ cho các ontology,

Khía cạnh đầu tiên nói lên chức năng của ontology trong QTTT như là cơ sở cho batiến tình phù hợp trực tiếp với QTTT: truyền thông, tích hợp và suy luận, sẽ được trìnhbày dưới đây

Khía cạnh thứ hai cho chúng ta biết về phạm vi ứng dụng của các ontology Ở mặtđối lập, ứng dụng của các ontology bị giới hạn khi hiển thị tri thức Tuy nhiên khi đã

có một số loại tri thức được mô tả rõ ràng và đơn giản thì hoàn toàn có thể tin tưởng đểcho máy tính làm việc với tri thức này Điều này có nghĩa là chúng ta có thể xử lý sựtăng trưởng về kích cỡ của các ontology, nhưng quan trọng hơn, nó cho chúng ta cơ hội

để sử dụng các mạng máy tính (intranet, extranet và internet) để mở rộng tầm vóc củaontology

Chiều ngữ nghĩa

Trang 23

Hình 5: Chiều ngữ nghĩa của ontology

Sau đây chúng ta đi qua ba tiến trình tri thức then chốt mà ontology hỗ trợ trong cácứng dụng QTTT Những tiến trình này được sắp đặt theo hình tháp với ý nghĩa chúngphụ thuộc trực tiếp vào các tiến trình bên dưới Cũng do đó độ phức tạp của các ứngdụng tăng lên tiến tới đỉnh của hình tháp này

Ontology phục vụ giao tiếp, truyền thông

Ontology mô tả những tri thức được chia sẻ giữa các thành viên của cộng đồng vềmột tập các thuật ngữ (các khái niệm - concept) và các mô tả được tạo ra theo nhữngthuật ngữ đó Vì thế ontology có thể đưa ra các ngữ nghĩa tiềm năng trong quá trình xử

lý tri thức, kiểm tra tính mập mờ và tính mâu thuẫn

Việc xây dựng ontology trong doanh nghiệp có thể đảm bảo rằng các thành viêntrong đó có chung cách nhìn trên một miền, tác vụ hay doanh nghiệp Điều này chophép các nhóm làm việc với các thuật ngữ, ngôn ngữ khác nhau có thể làm việc chung.Hơn nữa, thông qua việc xây dựng ontology, một phần tri thức ẩn trở nên rõ ràngmột cách tự nhiên Tuy nhiên rất nguy hiểm khi một ontology quá cứng nhắc và phứctạp có thể kìm hãm tính sáng tạo và sự thử nghiệm Vì vậy việc đưa vào một sự cânbằng chính là vấn đề then chốt Cũng do đó, có nhiều khả năng cho việc ứng dụngontology cỡ nhẹ với từ vựng, các lược đồ phân loại, thuật ngữ phân cấp, đều khá ít giátrị

Một khi ontology đã nằm trong vị trí, nó có thể phục vụ như một nền tảng chotruyền thông, làm tăng khả năng truyền tải tri thức bên trong các tổ chức hay giữa các

tổ chức với nhau Ontology làm được việc đó bằng cách cung cấp các khái niệm quýgiá có thể dùng để soạn thông điệp (truy vấn, câu lệnh,…) cho miền Về bên nhận,ontology giúp hiểu thông điệp bằng cách cung cấp ngữ cảnh giải thích đúng

Ví dụ: Là một đối tác công nghiệp ở một dự án nghiên cứu tri thức Châu Âu, một công

ty bảo hiểm Thụy Sĩ, Swiss Life, dự định tạo ra một hệ thống dựa trên ontology, môphỏng được các Tiêu chuẩn Kế Toán Quốc tế (IAS) IAS chứa các quy tắc sử dụng bởi

Trang 24

các kế toán viên trên toàn châu Âu Tuy nhiên, chỉ những quy tắc phù hợp với SwissLife đã lên đến hơn 1000 trang giấy Bên cạnh đó còn vấn đề là tài liệu sử dụng ngônngữ đặc trưng và các kế toán viên trên toàn thế giới khó chọn ra thứ phù hợp khi tìmtrong tiêu chuẩn này.

Tích hợp các hệ thống

Ontology là tập một số các chú thích được định nghĩa chính xác, điểm mạnh của nótập chung vào điểm thể hiện sự liên hệ giữa các thực thể trong một miền Tim BernersLee đã viết: “Trong cách nhìn bao quát, thế giới không thể mô tả chỉ bằng một liên kết.Chúng ta nghĩ rằng một cuốn từ điển là một cuốn sách tra nghĩa của từ, nhưng các từlại được định nghĩa dựa trên những từ khác Tôi thích ý tưởng rằng một thông tin chỉnên định nghĩa dựa trên các thứ liên quan đến nó và cách liên kết với những thông tinliên quan đấy”

Các Ontology được phát triển đầy đủ sẽ mạnh hơn nhiều các hệ thống cấp bậc cácthuật ngữ phân cấp đơn giản xuất hiện trong các giải pháp QTTT hiện tại bởi vì nhữngliên kết này có thể được dùng hiệu quả để tạo một mạng lưới tích hợp các nguồn trithức hỗn tạp trong doanh nghiệp.(từ “nguồn” dùng ở đây có thể mang nghĩa là mọi thứ

từ các cơ sở dữ liệu, nội dung nguyên văn, các hệ thống thông tin kế thừa cho tới trithức về con người, các dự án, các tác vụ,…) Tuy nhiên ontology phải đủ phức tạp đểbao quát toàn bộ các nguồn được sử dụng Và đây là một bài toán khá khó

I.1.3.1 Suy diễn

Các ứng dụng xây dựng trên cơ sở suy diễn là trường hợp phức tạp nhất củaontology Trong khi hai mức truyền thông và tích hợp xây dựng nên các khái niệm vàmối quan hệ giữa các khái niệm đó thì suy diễn xây dựng các mối quan hệ mới từ cáckhái niệm bằng cách xây dựng các luật và các mẫu luật để áp dụng lên tập các kháiniệm và quan hệ trên

Chiều Web

Bằng việc đưa ra những thông tin có giá trị cao và một giao diện thân thiện, WorldWide Web thay đổi cách tiếp cận với thông tin trong đời sống 1 cách mạnh mẽ Gầnđây các công ty cũng đã bắt đầu áp dụng những kỹ thuật giống nhau để phục vụ chonhu cầu thông tin của những công nhân giỏi, những khách hàng cũng như các nhà cungcấp Nguồn thông tin sinh ra đang quá tải tuy nhiên nó không được lưu tâm nhiều bởinhững phương pháp thiếu hiểu biết về nội dung ngữ nghĩa

Với lý do này, quan điểm về web ngữ nghĩa thường được giải thích bởi cộng đồngontology như là một thế hệ mới của web (web 3.0) Trong quan điểm đó, web ngữnghĩa có thể coi như là một sự mở rộng web hiện tại, nơi những miêu tả về các tàinguyên (nội dung, phần mềm, v.v ) chính xác hơn

I.1.3.2 Các giai đoạn phân quyền

Như Tim Berners Lee, ông tổ của web viết rằng: “cùng với web hiện tại, sự phânquyền hiện đang nằm trong nguyên lý thiết kế sẽ mang đến cho Web ngữ nghĩa nhữngkhả năng để trở nên to lớn hơn sự kết hợp các đơn thuần các thành phần của nó”

Trang 25

Web ngữ nghĩa hiện đang áp dụng các kịch bản dựa trên ontology cho các thiết lậpphân quyền Hiện tại có bốn giai đoạn phân quyền như sau:

1 Các ứng dụng chứng thực đơn lẻ

Đây là những ứng dụng dựa trên Ontology, chúng sẽ hoạt động trong 1 môi trườngkhép kín, nơi nguồn tri thức (Ontology và các tài nguyên khác ) và logic ứng dụng đều

ở trong tầm kiểm soát của 1 thực thể đơn

2 Ontology chia sẻ, và các tài nguyên cục bộ:

Những ứng dụng đánh dấu cho giai đoạn này được xây dựng dựa trên một ontologytrung tâm, nhưng hoạt động trên nguồn cục bộ dưới sự kiểm soát độc lập Kịch bản nàybao hàm sự tồn tại của một số hình thức mạng kết nối các nguồn đến ứng dụng

Cũng cần chú ý là các ứng dụng kiểu này được nhìn nhận khác nhau do định nghĩa

về việc chia sẻ ontology hoặc có nhiều ontology nội bộ được xếp hàng để chia sẻ.Trong những trường hợp này, sự khác nhau xuất phát từ giai đoạn tiếp theo, được biếtđến như là những ontology cục bộ độc lập, đó là sự ánh xạ giữa các ontology được xácđịnh trước tới các mối liên hệ với ontology trung gian chia sẻ

3 Các ontology cục bộ, các tài nguyên cục bộ:

Các ứng dụng ở mức độ phân quyền này dựa trên tài nguyên cục bộ cũng như cácontology cục bộ Không có ontology toàn cục hay ontology chia sẻ để tất cả cácontology có thể được sắp đặt theo như trường hợp trước

4 Logic ứng dụng được phân bố:

Những ứng dụng này được miêu tả bởi sự phân quyền của chính các logic ứngdụng Các nút mạng không chỉ tiếp tục kiểm soát các tài nguyên và ontology mà nó còntạo ra ứng dụng của chính nó từ các thành phần độc lập (các đại lí, dịch vụ, v,v ) đượcphân bố trên mạng Giai đoạn này chính là nơi cả dữ liệu và logic được phân quyền,tạo ra sự mất kiểm soát đáng kể của ứng dụng

I.1.3.3 Kịch bản phân quyền cho QTTT dựa trên ontology

Quản trị tri thức phân tán

QLTT phân tán được định nghĩa là việc quản trị quá trình sáng tạo và trao đổi trithức trong những nhóm người độc lập QLTT phân tán được nhìn nhận từ một số đặcđiểm của tri thức

 Tri thức là chủ thể: tri thức là khái niệm không phụ thuộc vào yếu tố conngười

 Tri thức tập hợp là một sản phẩm của xã hội: tri thức này được tạo ra bởi quátrình chia sẻ tri thức của con người

Bên cạnh những cơ sở về tri thức tự nhiên, cũng có nhiều động cơ thúc đẩy mangtính thực tiễn cho QTTT phân tán phát triển từ nhiều thế hệ phân tán của tri thức Cũng

có nhiều tranh luận về cơ sở lý thuyết cũng như thực tiễn cho QTTT phân tán tuy nhiên

ý kiến có sức thuyết phục nhất là áp dụng công nghệ dựa trên ontology

Thử thách đặt ra với quản trị tri thức phân tán dựa trên ontology

Việc phân quyền mang lại một số thuận lợi cho web ngữ nghĩa, tuy nhiên nó cũngđặt ra thử thách cho đối với QTTT phân tán do sự mất kiểm soát Nếu như theo cáchquản trị cũ thì sẽ không có sự chứng thực trên các mức người dùng Do đó, trước tiêncần phải thay đổi cách nghĩ về kiểm soát: các ứng dụng web ngữ nghĩa cũng như người

Trang 26

dùng chúng sẽ không bị quản trị theo cách cũ, như trong các hệ thống chứng thực đơn

lẻ Vấn đề thay đổi này đang được bàn bạc để đưa ra những lý thuyết và thực tiễn cụthể

Ở các nước phát triển về công nghệ thông tin, nghiên cứu về ontology đã trở thànhchủ đề chính trong các hội nghị về trí tuệ nhân tạo từ nửa cuối những năm 1990 Cũngtại đó, các dự án để phát triển công nghệ, các công cụ, phương pháp và các ứng dụngontology đã được tiến hành Như chương trình công nghệ xã hội thông tin IST(Information Society Technology) ở châu Âu hay tại Mỹ là chương trình DAML khởiđầu do DARPA

Việc các nghiên cứu đã được quan tâm nhiều hơn phản ánh qua sự hành thành vànhững thành công trực tiếp của Hội thảo toàn cầu về web ngữ nghĩa (ISWC) và một bàibáo khoa học: ”Journal on Web Semantics: Science, Services and Agents on the WorldWide Web” Các ấn bản liên quan đến Ontology cũng đã được chia sẻ rộng rãi trongcác hội thảo có uy tín (EKAW, WWW,…) Các công cụ phát triển ontology cũng đangđược chuyển từ nghiên cứu sang phát triển và cài đặt thực tiễn

Với người làm về QTTT đang cố gắng kết hợp công nghệ với các yêu cầu ứng dụngriêng biệt, họ xem xét mỗi trường được phân mảnh đặt ra một thách thức riêng Bêncạnh sự phân mảnh, tốc độ phát triển đòi hỏi các nghiên cứu toàn diện về các công cụ

cụ thể để có thể đạt được quá trình giám sát liên tục sự phát triển

Mục đích của phần này là xem xét và đánh giá các công nghệ dựa trên ontology.Trong đó sự xem xét ở cấp độ công cụ riêng lẻ là không cần thiết Đồng thời cũng đưa

ra thiết kế của một cấu trúc chung cho hệ thống dựa trên ontology

Trang 27

I.2.1 Các kiến trúc dựa trên Ontology.

Hình 6: Kiến trúc chung của các ứng dụng dựa trên ontology

Hình vẽ trên cho thấy một thiết kế modul hóa của các ứng dụng dựa trên ontology.Kiến trúc này bao gồm 3 tầng:

 Tầng ontology: liên quan đến việc tạo ra và duy trì mô hình dữ liệu của ứngdụng

 Tầng middleware: cung cấp các dịch vụ chung liên quan đến ontology

 Tầng ứng dụng: xây dựng trên ontology và các dich vụ liên quan nhằm cungcấp một số chức năng ontology tới người dùng cuối (end user)

Trong giai đoạn phát triển hiện tại, việc tích hợp các thành phần dựa trên ontologyđược cung cấp ở mức độ ontology và ngôn ngữ truy vấn Ngoài ra, phải có sự nhấtquán ở các giao thức dựa trên web (chủ yếu là http) để truyền các thông điệp và dữliệu

Các ứng dụng cụ thể không cần phải sử dụng tất cả các thành phần ở trên đây.Trong thực tế sự chọn lựa các thành phần có thể được xác định bởi chức năng ứngdụng mong muốn Cũng vì thế, các công cụ hiện nay có thể có chức năng của một vàithành phần trừu tượng Ví dụ: các công cụ lưu trữ ontology thường bao gồm một vàikiểu hỗ trợ suy luận và các trình diễn dựa trên ontology; một số hỗ trợ cả chế độ tìmkiếm và duyệt

Điểm nữa cần phải kể đến trong thực tế, việc lựa chọn cho các công cụ cụ thể đượcquyết định bởi các khía cạnh phi chức năng như bản quyền (nguồn mở hay thươngmại), lựa chọn hệ điều hành hoặc ngôn ngữ lập trình cụ thể…

Trang 28

Tầng Ontology.

Các ontology là dữ liệu cho ứng dụng ngữ nghĩa Trong kịch bản đối thoại,Ontology đóng vai trò như một ngôn ngữ giao tiếp chung, biểu hiện qua cách nhìngiống nhau trên lĩnh vực trong câu hỏi Các ngôn ngữ chung đó cũng xuất hiện trongcác ứng dụng truyền thống, ví dụ như định nghĩa kiểu văn bản XML (DTD) dùng đểmang thông điệp trao đổi trong hệ thống và giữa các hệ thống với nhau Tuy nhiên cácontology phức tạp hơn DTD nhiều: chúng mô tả cấu trúc của dữ liệu trong các thuậtngữ của một ngôn ngữ ontology Ngôn ngữ này cung cấp các khái niệm linh động hơn

và chắc chắn hơn qua các chú giải cố định

Ontology trong kịch bản tích hợp có vai trò cung cấp ngôn ngữ mô tả metadata(siêu dữ liệu) Vấn đề trong nhiều trường hợp không phải là bản thân metadata mà làlược đồ dùng để tạo metadata Các mô hình như thế có tính ngầm ẩn cao hoặc khó mãhóa trong các ứng dụng Metadata tự nó không thể được biên dịch và sử dụng lại bởiứng dụng khác nếu không có các cấu trúc được biểu diễn rõ ràng Trong trường hợpnày một ontology cần được tạo sau đó metada cần được sao chép lại dựa vào ontology Ontology trong kịch bản suy luận là phức tạp nhất, chúng chứa các mô tả của cácluật và các mô hình để chi phối dữ liệu Loại dữ liệu này còn gọi là logic nghiêp vụ -luôn khó mã hóa trong các ứng dụng ngày nay

Do đó mục đích chung của các thành phần trong tầng này là thu nhận tri thức chocác ontology, có thể bằng nhận biết tri thức cổ điển hoặc bằng phương pháp tự động đểthu được các ontology

Cách thứ nhất chỉ có thể thực hiện nếu việc khái niệm hóa chưa được thực hiện trước

đó Chức năng này được hỗ trợ bởi các công cụ kỹ nghệ ontology Cách này có nhượcđiểm là nó đòi hỏi sự tham gia tích cực của các chuyên gia về lĩnh vực và họ cần thốngnhất để tạo ra sự chuẩn hóa cho miền tri thức, cách này dẫn đến chi phí cao và tính mởrộng không tốt

Với cách thứ hai, phương pháp tự động, có tính mở rộng và thường dùng khi miêu tảmiền available trong một số dạng máy tinh có thể xử lý (ví dụ văn bản, cơ sở dữ liệu,

hệ thống kế thừa, biểu đồ…)

I.2.1.1 Biểu diễn Ontology

Các biểu diễn Ontology là mô tả tường minh các Ontology được phát biểu bằngngôn ngữ Ontology Rõ ràng, các mô tả chung về ontology là cần thiết để truyền thônggiữa các thành phần của hệ thống nền ontology Trong trường hợp truyền thông bị giántiếp qua hệ thống máy tính, các mô tả cũng cần phải có khả năng xử lý được trên cácmáy Trong khi điều này không loại trừ các mô tả đồ hoạ chính xác (ví dụ như các môhình UML ở định dạng XML), các ontology hầu hết được biểu diễn chung ở dạngnguyên bản, mà các máy có khả năng xử lý tương tự như người đọc

Ngôn ngữ ontology đưa ra một tập các cấu trúc mẫu cho công nghệ ontology màhầu hết bao gồm các chú giải cho các lớp, các thể hiện, các quan hệ, Một số ngôn ngữontology cũng cho phép mô hình hoá các tiên đề thuộc nhiều loại phức tạp khác nhau.Quan trọng nhất, ngôn ngữ ontology đề cao một lý thuyết mô hình chính xác, màchúng sẽ xác định cách những cấu trúc này được có thể hiểu được

Trang 29

Hiểu một ontology có nghĩa là ánh xạ được các thực thể trong ontology với các đốitượng thế giới thực Câu trong ontology xác định một số ràng buộc tương tự như thếgiới bên ngoài.

Hiện tại, có 2 vấn đề khó khăn gặp phải đối với các ngôn ngữ biểu diễn Ontology:

+ Các yêu cầu biểu diễn khác nhau: Theo lý thuyết, một ngôn ngữ ontology

đơn, với khả năng diễn tả cao, có thể được dùng thích hợp với mọi yêu cầu về mô

tả, chỉ trừ những cấu trúc nhiều thông tin diễn tả hơn thì mới bị bỏ qua trong mộtvài ontology hay ứng dụng Tuy nhiên, có vẻ như sẽ luôn tồn tại một ngưỡng màphải đánh đổi giữa độ phức tạp của ngôn ngữ và các thuộc tính hỗ trợ tốt cho tínhtoán

+ Cần có sự trao đổi ontology: Ngôn ngữ ontology lý tưởng là ngôn ngữ mà có

thể biểu diễn được hầu như tất cả các yêu cầu mo tả trong một ứng dụng Tuy nhiêncác Ontology cần phải được trao đổi giữa các thành phần và hệ thống, do đó yêucầu các ngôn ngữ phải được sử dụng rộng rãi Ngôn ngữ ontology phổ biến nhấtđược thiết kế cho môi trường web là RDF/RDFS

Hai tác giả G´omez-P´erez và Corcho đưa ra một so sánh về các ngôn ngữ nổi bậtnhất để tạo một đặc tính ngôn ngữ thường dùng Họ kết luận rằng sự lựa chọn ngônngữ đầu tiên phụ thuộc vào những gì cần thể hiện Với các ontology gọn nhẹ(lightweight ontologies) bao gồm không nhiều hơn một sự phân loại các khái niệm, tất

cả các ngôn ngữ là thích hợp như nhau Do đó sự lựa chọn phụ thuộc nhiều hơn vàonhững hỗ trợ cho ngôn ngữ (tính hữu dụng của các phương pháp luận, các giao diệnhàm, các bộ soạn thảo, các cơ chế suy diễn ) và sự quen thuộc với cơ chế biểu diễn(các khung, các mạng ngữ nghĩa, các đồ thị khái niêm hoặc các logic mô tả) Đối vớicác ontology cỡ lớn, ngôn ngữ cần được chọn lựa cẩn thận hơn vì: các ngôn ngữ có cácđặc tính khác nhau để biểu diễn các ràng buộc phức tạp hơn hoặc sử dụng và thực hiệnxây dựng tương tự ở nhiều cách khác nhau

Resource Description Framework (RDF)

RDF là một mô hình biểu diễn các khái niệm và quan hệ giữa các khái niệm thôngqua các mệnh đề gồm tài nguyên (resource) và liên kết URI Các mệnh đề có một cấutrúc chung gồm 3 phần: subject (chủ ngữ), predicate (vị ngữ) và object (tân ngữ)

Ví dụ: “Quyển sách [subject] có tiêu đề [predicate] Web ngữ nghĩa [object]”

Trong đó, subject là đối tượng (một người, một địa điểm …) được mô tả trongmệnh đề, được xác định duy nhất bởi tham số URI (Universal Resource Indicator),cũng có thể hiểu URI như URL (Universal Resource Locator) Predicate là một thuộctính của đối tượng như tên, thành phố, màu sắc, hình dạng, đặc điểm… của chủ ngữ và

Trang 30

cũng được xác định duy nhất bởi URI Object là giá trị có thể đặc tả thuộc tính của đốitượng Các giá trị này có kiểu dữ liệu phù hợp với kiểu dữ liệu của RDF (RDF hỗ trợ

cả các kiểu dữ liệu có trong XML)

Dùng RDF có thể biểu diễn các phát biểu ở dạng chuẩn mà các tác tử phần mềm cóthể “đọc” và “thực hiện” được Nó cho phép chúng ta biểu diễn một tập các phát biểudưới dạng một sơ đồ, hay ở dạng gồm các bộ ba (chủ ngữ, vị ngữ, tân ngữ), hoặc ởdạng XML.Dạng sợ đồ phù hợp cho giao tiếp giữa con người với nhau, trong khi dạngcác bộ ba phù hợp cho các xử lý, còn dạng XML lại phù hợp cho các tác tử giao tiếpvới nhau

Với ví dụ trên, có 3 cách biểu diễn tương ứng:

hệ giữa hai đối tượng có thể không liên kết trực tiếp với nhau, mà thông qua một chuỗicác đối tượng trung gian trong sơ đồ

Resource Description Framework Schema (RDFS)

RDFS mô tả ngữ nghĩa của thông tin trong lược đồ xây dựng theo chuẩn RDF Mụcđích của RDFS là cung cấp các từ vựng trong XML có thể biểu diễn các lớp và các lớpcon, cũng như quan hệ giữa chúng, đồng thời định nghĩa các thuộc tính liên kết với cáclớp đó RDFS tập trung vào định nghĩa một cấu trúc phân cấp các lớp để phục vụ choquá trình suy diễn và tìm kiếm thông tin

Hình vẽ dưới minh họa sự khác nhau giữa RDF và RDFS:

Quyến sách <tiêu đề> Web ngữ nghĩa

Trang 31

Hình 7: Sự khác nhau giữa RDF và RDFS

Ngôn ngữ RDF chỉ mô tả một mệnh đề: “Nuclear Physics is taught by ProfessorSmith” Còn RDFS mô tả chi tiết cấu trúc phân cấp các lớp trong lược đồ, dựa vào đó,máy tính có thể “hiểu” được “Nuclear Physics” là một khóa học (“course”) có liênquan đến (“involve”) hội đồng khoa học (“academic staff”), trong đó có các giáo sư,trợ giảng, và các giáo sư cộng tác, trong đó Prof Smith là giáo sư

Như vậy, cấu trúc phân cấp được mô tả trong RDFS là công cụ để máy tính có thể hiểu được nội dung của các trang web, là cơ sở để các tác tử phần mềm tự động thực hiện các tác vụ cần thiết mà không cần sự chỉ đạo của con người

I.2.1.3 Các công cụ phát triển Ontology

Các công cụ phát triển Ontology bao gồm các bộ soạn thảo ontology và các công cụ

mô hình hóa Ontology là các ứng dụng người dùng nhằm mục đích tạo và soạn thảocác ontology một cách thủ công bởi các kĩ sư tri thức (Knowledge Engneer) Các bộsoạn thảo ontology là các công cụ chủ yếu được tạo ra để giảm bớt khó khăn trong việctrình bày theo định dạng chuẩn của ontology, bằng cách sử dụng giao diện đồ họa thíchhợp hơn cho việc mô hình hóa Bên cạnh thuận tiện trong việc mô hình hóa, các bộsoạn thảo cung cấp nhiều công cụ hỗ trợ quá trình phát triển, ví dụ như các chức năngđánh giá, hiển thị…

Các công cụ cao cấp hơn đưa ra một cơ chế plug-in để có thể bổ xung thêm cácchức năng Đăc tính này hữu dụng cho việc kết nối dịch vụ ở tầng trung gian(middleware) Ví dụ, ontology versioning là cần thiết cho cộng tác của các tác giảtrong phát triển ontology Các dịch vụ suy luận có thể được sử dụng để kiểm tra ràngbuộc và các mâu thuẫn trong quá trình phát triển hoặc để suy diễn ra thông tin mới.Nhưng hiện nay chỉ có một số ít server ontology và công cụ phát triển hỗ trợ

Trang 32

versioning và hầu hết các editor vẫn đi cùng với các luật tùy chọn, chưa thống nhất vàxây dựng trên engine suy diễn bởi vì sự thiếu hụt các chuẩn.

Có thể thấy rằng các bộ soạn thảo ontology chỉ đóng duy nhất một vai trò trongtoàn bộ quá trình phát triển ontology Một vài bộ soạn thảo được thiết kế để hỗ trợ chomột phương pháp xây dựng ontology nào đó, ontology mức trên hoặc kĩ thuật đánh giáontology

Xu hướng gần đây của các công cụ phát triển là xuất hiện của các công cụ thu thậpOntology được đặc chế để làm việc với một ontology cụ thể Các bộ soạn thảo như thếđược kì vọng trong tương lai sẽ thân thiện hơn với người dùng không biết kỹ thuật đểtạo và làm việc với các ontology lĩnh vưch đặc thù

Bộ soạn thảo Ontology có nhiều dạng trao đổi vào/ra - nghiã là các bộ soạn thảoontology cũng có thể chuyển đổi ontology như từ OWL sang RDF/S Các công cụ tốtcần khả năng lưu trữ ontology thuận tiện

Một số các công cụ phát triển Ontology phổ biến:

1 Swoop (http://www.mindswap.org/2004/SWOOP): công cụ cho phép duyệt và

soạn thảo OWL Là sản phẩm nguồn mở, làm bằng Java, của trường đại họcMaryland

2 IsaViz (http://www.w3.org/2001/11/IsaViz/): công cụ soạn thảo RDF, giao diện

dưới dạng đồ thị RDF Tác giả: Emmanuel Pietriga

3 SemanticWork(http://www.altova.com/products/semanticworks/

semantic_web_rdf_owl_editor.html): là công cụ soạn thảo Ontology có thể nói

là tốt nhất Sản phẩm của công ty Altova Có thể download và dùng thử

4 Protégé (http://protege.stanford.edu/): dựa trên Java, có thể download và sử

dụng miễn phí, kèm theo rất nhiều các Ontology mẫu, là sản phầm nguồn mởcủa trường đại học Stanford Ngoài việc soạn thảo Ontology, Protégé còn có thểtích hợp khá nhiều các công cụ khác để truy vấn, biểu diễn Ontology Đặc biệt

là khả năng chuyển đổi giữa các ngôn ngữ mô tả Ontology như OWL và RDFS/RDF

Trong đồ án này em sử dụng Protégé là công cụ phát triển Ontology

Trang 33

Hình 8: Giao diện của Protégé cho một Project RDFS/RDF

Tầng trung gian - Middleware.

Tầng trung gian theo định nghĩa phổ biến nhất là đoạn chương trình thực hiện côngviệc ghép nối các phần với nhau hoặc trung gian giữa các chương trình riêng biệt và đãtồn tại Tầng trung gian được tạo ra nhằm giấu đi sự không đồng nhất của các thànhphần hay chương trình bên dưới và cung cấp việc truy cập đồng bộ vào các hàm củatầng này Thêm vào đó, hầu hết các hệ thống trung gian cung cấp các dịch vụ ở mứccao hơn, như xử lý thông điệp, giao dịch và bảo mật

Tầng trung gian Ontology, đóng vai trò giấu đi tầng Ontology trong hệ thống vàcung cấp các dịch vụ nâng cao cho các ứng dụng như quản lý Ontology, lưu trữOntology, truy vấn và suy diễn trong Ontology

I.2.1.4 Lưu trữ Ontology

Các công cụ lưu trữ ontology thường được hiểu là Ontology server, cung cấp cácchức năng như cơ sở dữ liệu, để lưu trữ ổn định và sao lưu chọn lọc cho các ontology.Ontology server ở đây khác với các cung cụ cơ sở dữ liệu ở chỗ chúng có thể cho biếtngữ nghĩa của dữ liệu, đấy là khả năng hiểu các cấu tạo chuẩn của ngôn ngữ Ontology.Điều này cho phép ontology server cung cấp các dịch vụ dựa trên ngữ nghĩa như truyvấn ngữ nghĩa

Trong nhiều năm web ngữ nghĩa mới ra đời, các dữ liệu ngữ nghĩa được nhúng vàotrong các trang HTML hay XML hoặc đơn giản trong các file riêng rẽ và phục vụngười dùng thông qua các web server Tuy nhiên, khi ontology đã trở nên rất có giá trị

và các ứng dụng dựa trên ontology bắt đầu xuất hiện Yêu cầu phải có các công cụ lưu

Trang 34

trữ ontology chuyên dụng để tạo ra các truy vấn dữ liệu và xử lý hiệu quả hơn, thuậntiện hơn và cung cấp các dịch vụ nâng cao như theo dõi, quản lý phiên bản, điều khiểntruy cập và bảo mật

Mô hình sau cho thấy vị trí của các công cụ lưu trữ ontology, như một công cụ dựaweb Các công cụ này nhận yêu cầu từ client thông qua các giao thức như HTTP,SOAP, RMI hay TCP/IP nguyên thủy Mỗi công cụ cũng cung cấp các thư viện trênClient bằng Java để có thể kết nối đến chúng Những lập trình viên có thể sử dụng cácAPI trong thư viện đó để truy cập vào các dịch vụ ontology trong các ứng dụng dựatrên ontology của mình mà không cần phải giải quyết kết nối thực tế giữa clien vàserver

Hình 9: Kiến trúc của lưu trữ ontology

Trong các hệ thống nâng cao, các module chức năng truy cập vào kho dữ liệu thậtthông qua một tầng trừu tượng Mục đích của tầng này là giấu đi bản chất thực sự và vàcài đặt của lưu trữ ổn định Lưu trữ ổn định có thể hiểu là lưu trữ các dữ liệu kiểuOntology trong một cơ sở dữ liệu quan hệ, XML, các file hệ thống hoặc các kho lưu trữtrên mạng

I.2.1.5 Ngôn ngữ truy vấn ontology

Mục đích của truy vấn là để cung cấp một truy cập mức cao vào Ontology thôngqua các câu hỏi tuân theo 1 ngôn ngữ truy vấn, làm sao để cho người dùng viết và máy

Trang 35

đánh giá được dễ dàng Truy cập mức cao ở đây nghĩa là các truy vấn được tạo thànhtheo các thuật ngữ của mô hình dữ liệu hoặc ngữ nghĩa của ngôn ngữ Ontology, nhưngtrong tất cả các trường hợp không phụ thuộc vào dạng biểu diễn cụ thể Ví dụ: mộtngôn ngữ truy vấn trên RDF cho phép so khớp các bộ 3, các đường dẫn hay thậm chícác cấu trúc đồ thị phức tạp hơn Ngôn ngữ truy vấn trên RDFS cho phép truy vấn cácthuật ngữ trong ngôn ngữ xây dựng như subclass, instance, domain của các thuộc tính.Các truy vấn được viết bởi các kỹ sư tri thức kết nối trực tiếp đến Ontology serverbằng một ứng dụng truy cập vào Ontology thay cho người dùng Trong cả 2 trườnghợp, truy vần đều được đánh giá bởi một engine truy vấn có trong công cụ các lưu trữ.Một Ontology server có thể cài đặt nhiều ngôn ngữ truy vấn, nhưng nó chỉ thường xemxét một loại ngôn ngữ cụ thể

Có rất nhiều loại ngôn ngữ truy vấn cho RDF(S), trong khi ngôn ngữ truy vấn choDAML + OIL và Topic Maps mới bắt đầu phát triển Ở phần sau đây em xin giới thiệu

về ngôn ngữ truy vấn RDF: SPARQL, là ngôn ngữ truy vấn RDF(S) được sử dụngtrong đồ án của em

Ngôn ngữ truy vấn RDF(S): SPARQL.

SPARQL là một ngôn ngữ truy vấn RDF, tên của ngôn ngữ truy vấn này được viếttắt từ “Giao thức đơn giản và ngôn ngữ truy vấn RDF” (Simple Protocol and RDFQuery Language) Đây là một chuẩn của W3C, được W3C chính thức đưa ra vào tháng

4 năm 2006 và được chuẩn hóa vào tháng 1 năm 2008

Như đã đề cập ở phần trên, RDF là mô hình dữ liệu kiểu đồ thị có hướng và đượcgán nhãn, để mô tả các thông tin trên Web Chính đặc điểm này đã xác định cú pháp vàngữ nghĩa của SPARQL

SPARQL có thể sử dụng để mô tả các truy vấn qua các nguồn dữ liệu khác nhau, dù

dữ liệu được lưu trữ nguyên dạng là RDF hay được xem như là RDF thông qua lớptrung gian Kết quả của truy vấn SPARQL có thể là tập kết quả hoặc các đồ thị RDF.Ngôn ngữ truy vấn SPARQL dựa trên việc so khớp các mô hình đồ thị Mô hình đồthị bao gồm các mô hình bộ 3, giống như các bộ 3 RDF, khác ở chỗ có các biến thaycho các term RDF trong các vị trí chủ ngữ, vị ngữ hay tân ngữ Kết hợp các mô hình bộ

3 này chúng ta được một mô hình đồ thị cơ sở, mà các kết quả nếu có phải so khớp với

đồ thị này

Cú pháp của SPARQL

Sau đây là cú pháp cơ bản của một câu truy vấn SPARQL đơn giản Các cú phápkhác như: cú pháp về thuật ngữ RDF, cú pháp cho biến truy vấn, cho kiểu dữ liệuLiteral, các nút rỗng (blank node) hay các mô hình bộ 3 sẽ được trình bày chi tiết trongphần phụ lục

Về cơ bản một câu truy vấn SPARQL bao gồm 2 phần: SELECT và WHERE.Mệnh đề SELECT sẽ xác định biến xuất hiện trong kết quả truy vấn Mệnh đề WHEREcung cấp mô hình đồ thị cơ sở để so khớp với đồ thị dữ liệu

Ví dụ truy vấn đơn giản tìm tên một người trong dữ liệu ngữ nghĩa của hệ thống:

Dữ liệu:

<http://example.org/Person/Person1> <http://purl.org/dc/elements/1.1/name> "Trần Cảnh Toàn".

Truy vấn:

SELECT ?name

Trang 36

{

<http://example.org/Person/Person1> <http://purl.org/dc/elements/1.1/name> ?name

}

Kết quả truy vấn: name: Trần Cảnh Toàn

Trong câu truy vấn trên, mô hình đồ thị cơ sở bao gồm một mô hình bộ 3, có biếnđơn là ?name tại vị trí TN

Kết quả của truy vấn là một dãy nghiệm, tương ứng với việc mô hình đồ thị củatruy vấn khớp với dữ liệu Có thể không có, có 1 hay có nhiều kết quả cho 1 truy vấnSPARQL

I.2.1.6 Cơ chế suy diễn.

Cơ chế suy diễn xử lý các cấu trúc tri thức thu nhận được trong ontology để suyluận về ontology đó Mục đích của việc suy luận này vừa là tạo ra các tri thức mới hoặcbáo hiệu sự không đồng nhất trong các khái niệm Có 2 cách tiếp cận khác nhau trong

cơ chế suy diễn: dựa trên logic chung và các giải thuật đặc biệt Trong đồ án của em,

em tập trung vào cách tiếp cận thứ nhất, bằng cách sử dụng các luật logic được Coreseengine hỗ trợ

Cơ chế suy diễn dựa trên logic có thể được phân loại dựa vào biểu thức logic màchúng dùng để suy luận, từ các logic bậc cao đến các tập các logic bậc 1 khác nhau.Thông thường, các logic càng có ý nghĩa thì càng khó để suy luận, trường hợp xấu nhất

là không tồn tại chiến lược nào nhằm đảm bảo điều kiện dừng của quá trình suy luận

Để sử dụng cơ chế suy diễn dựa trên logic, ontology cần chuyển sang một biểu diễnlogic Điều này đã được đảm bảo bởi các ngôn ngữ ontology Điểm thuận lợi của việcchuyển đổi này là các ontology có khả năng mở rộng với các tiên đề mà có thể chưađược mô tả trong cấu trúc định nghĩa trước của ngôn ngữ ontology Một điểm nữa cũngcần chú ý, đó là tốc độ suy diễn

Tầng ứng dụng - Application

Tầng ứng dụng là tập các ứng dụng dựa tên ontology, và những phần mềm hỗ trợngười dùng truy cập, tổ chức, trao đổi và tập hợp thông tin thông qua các ontology vớimục đích biểu diễn các tác vụ cụ thể Những ứng dụng này được xây dựng trên nhữngdịch vụ từ tầng ontology và tầng trung gian bằng cách thêm các logic nghiệp vụ xử lýcác dữ liệu ontology và cung cấp giao diện người dùng trực quan Những giao diện nàylàm trung gian giữa người dùng, các logic và dữ liệu (ontology) Chúng giúp ngườidùng hệ thống hoá vấn đề của họ qua các thuật ngữ trong ontology và cũng có thể dùngcác ontology để giúp người dùng hiểu được kết quả, bằng việc cung cấp các định nghĩaontology hay các ngữ cảnh

Cần lưu ý rằng việc tương tác với tầng thấp hơn không bị giới hạn theo luồng thôngtin 1 chiều từ tầng trung gian (middleware) tới các ứng dụng Người dùng có thể đónggóp thông tin quan trọng có thể theo kiểu không tường minh Ví dụ, việc khảo sát hànhđộng của người dùng có thể cung cấp các phản hồi quan trọng cho việc cải tiếnontology, ontology cần được mở rộng hay thu hẹp tại đâu

Sau đây là một số loại ứng dụng dựa trên ontology phổ biến:

Trang 37

I.2.1.7 Tìm kiếm dựa trên Ontology

Tìm kiếm dựa trên ontology liên quan đến ý tưởng chung của việc sử dụngmetadata (dựa trên ontology) để nâng cao hiệu quả của các kỹ thuật phục hồi thông tinhiện tại Metadata có thể được sử dụng để làm phong phú thêm hay loại bỏ đi nhậpnhằng các truy vấn dựa trên từ khóa – nguyên nhân làm giảm độ chính xác của tìmkiếm

Các ứng dụng khác nhau tồn tại trên loại thông tin ontology được yêu cầu và cáchchúng được dùng Trong ứng dụng QuizRDF, các phân loại về tài liệu và giá thuộc tínhliteral được sử dụng Thông tin này được lưu trữ trong một cấu trúc chỉ mục phức tạptheo các kết quả của việc đánh chỉ mục văn bản đầy đủ của tài liệu Dựa trên nền cácmetadata, giao diện cho phép truy vấn cho các lớp cụ thể của tài liệu và các giá trị riêngcho các thuộc tính của lớp đó Các tiêu chí tìm kiếm này có thể kết hợp với nhau (ví dụtruy vấn đưa ra các tài liệu từ lớp “Tranh nghệ thuật” có thuộc tính “Họa sĩ” có giá trịPicasso và thuộc tính “Phong cách” có giá trị “Lập thể”) Tiêu chí tìm kiếm đối vớimetadata cũng có thể được kết hợp theo ý muốn với các tìm kiếm dựa trên từ khoátruyền thống Phương pháp này phải dùng đến tìm kiếm dựa trên từ khóa khi không cóthông tin ontology mô tả về một tài liệu Thuộc tính này sẽ trở nên quan trọng tronggiai đoạn đầu tiên của Web ngữ nghĩa, khi metadata vẫn còn khan hiếm

Trong ứng dụng SHOE Search, phương pháp tiếp cận khá tương tự để truy vấnmetadata nhúng trong các trang web - sử dụng chủ yếu ngôn ngữ SHOE (Simple

trước tiên phải chọn 1 lớp trong ontology để giới hạn câu truy vấn sau đó đưa ra cácgiá trị cho các thuộc tính cụ thể Tuy nhiên SHOE Search cho phép không chỉ cácthuộc tính literal được đối sánh mà còn đối sánh các mối quan hệ đến các lớp khác.SHOE không đưa ra các tìm kiếm dựa trên từ khóa trong nó, nhưng đưa ra các truy vấncho các cơ chế tìm kiếm phổ biến trên yêu cầu người dùng

Trong khi các phương pháp làm cho tìm kiếm dựa trên từ khóa tốt hơn đang được

kỳ vọng, việc tạo ra các tiêu chí đánh giá đồng bộ tỏ ra là khá khó khăn Trong các ứngdụng cụ thể, lợi ích của nó không chỉ xoay quanh hiệu quả của cơ chế tìm kiếm mà cònxoay quanh các nhân tố khác như tính tiện dụng của giao diện và chất lượng củaontology

I.2.1.8 Duyệt dựa trên Ontology

Duyệt qua một tập các phần tử liên quan đến phương thức tìm kiếm thông tin trong

đó người dùng có những lựa chọn lặp lại từ tập các lựa chọn được đưa ra bởi hệ thốngtrái lại với việc phải xác định các tiêu chí tìm kiếm rõ ràng Việc duyệt kết thúc khi cáctiêu chí xác định bởi phần nào những đối thoại với hệ thống phù hợp với mục đích củangười dùng (đủ mức sát nghĩa và/hoặc tập các phần tử khả năng còn lại đủ nhỏ chongười dùng xem xét chúng từng cái một)

Việc duyệt là mẫu khôi phục thông tin tốt nhất cho các cổng thông tin (portal),trong đó nó thường được xác định như là một cổng vào được sắp xếp logic cho cácnguồn thông tin lớn trên mạng intranet hay internet Hầu hết các trang cổng thông tin

Trang 38

hiện nay trên internet làm việc cố định với một cấu trúc điều khiển không đổi, khôngquan tâm dù chúng được chuyên môn hóa ở 1 khu vực hoặc phục vụ cho toàn thể cộngđồng web Taxonomy của chúng có thể được coi như một ontology cỡ nhỏ

Ontology đóng một vai trò kép trong việc làm cho duyệt thuận tiện và tạo các cổngthông tin Trước tiên, chúng hỗ trợ tích hợp thông tin từ các nguồn hỗn tạp bằng cáchcung cấp một hô hình chia sẻ Sau đó và quan trọng nhất, chúng có thể được dùng nhưxương sống cho việc điều khiển qua các thông tin Sử dụng ontology như một nền tảngcho cấu trúc điều khiển có một số điểm thuận lợi hơn cấu trúc điều khiển cố định vàđược sở hữu bởi người tạo trang web đó như sau:

1 Việc truy cập được cung cấp qua những ngôn ngữ chung được chia sẻ bởicộng đồng và được biểu diễn qua ontology Các định nghĩa và các khía cạnhontology có thể được sử dụng để giúp người dùng hiểu được lựa chọn của họbằng việc đưa các thuật ngữ vào trong ngữ cảnh

2 Khi việc ánh xạ được thực hiện động, các điều khiển có thể phản ánh thayđổi lập tức trong quan niệm thêm vào các đặc trưng nâng cao như định hìnhngười dùng hay tác vụ

3 Việc suy diễn qua các thể hiện có thể được sử dụng, ví dụ để xác định cáclựa chọn không nhất quán và hình thành cấu trúc điều khiển thích hợp (trongngữ cảnh tĩnh) hoặc để suy diễn những sự không đồng nhất có thể có với cáctiêu chí xác định bởi người dùng (trong một thiết lập động)

I.2.1.9 Trực quan thông tin dựa trên ontology

Các kỹ thuật trực quan mang tính diễn đạt và tính ứng dụng cao Do đó nó rất hữuích trong suốt vòng đời của một ontology

Trong giai đoạn phát triển đầu tiên của ontology, một lược đồ của ontology đượctạo ra Tại giai đoạn này cần thiết có một trực quan chi tiết của các khái niệm và quan

hệ giữa chúng nhằm hiểu được chi tiết của ontology Khi ontology phát triển, việc hiểu

và bảo trì nó trở lên khó khăn Việc hiểu nó đòi hỏi nhiều miêu tả thô hơn và khả năngthể hiện các mặt khác nhau của mô hình tri thức

Trong giai đoạn tiếp theo, lược đồ trừu tượng của ontology được cụ thể hóa Thôngthường, tiến trình đưa vào một ontology được làm bán tự động bởi các bộ phân loại

Kỹ thuật trực quan giúp phát hiện ra các phân loại bị thiếu

Một vấn đề quan trọng liên quan đến một mặt của ontology được trực quan đượcgọi là lược đồ hay thông tin thực thể Đa số các công cụ sẵn có định vị các trực quanmức lược đồ Một số các công cụ trực quan phổ biến: Hyperbolic Tree, TheBrain,AqauBrowser

Việc trực quan dữ liệu đã mã hóa trong các ngôn ngữ biễu diễn ontology dựa webđang trở nên ngày càng quan trọng Một trực quan đồ thị chung, thành phần GraphViz

là khá thích hợp để biểu diễn mô hình dữ liệu của RDF Các công cụ dựa trênGraphViz như IsaViz hay RDFViz được sử dụng để hiểu dữ liệu RDF Trực quan chophép biểu diễn các loại quan hệ giữa các lớp và các thể hiện, trở nên khá thích hợp choviệc biểu diễn các ontology phức tạp

Trang 39

I.3 Một số hệ quản trị tri thức dựa trên Ontology

I.3.1 On-To-Knowledge

I.3.1.1 Mục đích.

Hệ thống On-To-Knowledge nhằm xây dựng một môi trường công cụ dựa trên

ontology để phát triển quản trị tri thức, áp dụng cho số lượng lớn các tài liệu khôngđồng nhất, phân tán và bán cấu trúc đặc thù trong các mạng nội bộ của công ty lớn haytrên www Mục tiêu của dự án là cho ra :

1 Một tập công cụ cho việc xử lý thông tin ngữ nghĩa và truy cập của ngườidùng

2 OIL (Ontology base Inference Layer) lớp suy diễn trên Ontology cho WWW

3 Một phương pháp luận liên kết và được công nhận bởi các nghiên cứu dựatrên thực tế

I.3.1.2 Môi trường công cụ cho quản trị tri thức dựa trên Ontology

Mục tiêu quan trọng nhất của dự án là tạo ra phần mềm thông minh, hỗ trợ ngườidùng trong cả truy cập thông tin lẫn bảo trì, chuyển đổi, và thu nhận các nguồn thôngtin Các công cụ này được tích hợp theo mô hình 3 tầng như hình vẽ dưới đây, baogồm:

+ Tầng cửa trước cho người dùng, ở trên cùng

+ Tầng trung gian (middleware) ở giữa

+ Tầng extraction ở dưới cùng

Trang 40

Hình 10: Kiến trúc của ứng dụng On-To-Knowledge

a RDFferret – Bộ tìm kiếm RDF

RDFferret kết hợp tìm kiếm văn bản đầy đủ với truy vấn RDF Đây cũng là hướngtiếp cận như trong hệ thống QuizRDF đã trình bày bên trên Với cách tiếp cận này,nguồn thông tin được chú thích RDF có thể được bổ sung bởi các thông tin không đượcchú thích trong một giai đoạn đáng kể để hình thành

b OntoShare: Hỗ trợ của cộng đồng

OntoShare có thể lưu trữ các thông tin thực tiễn quý báu dựa vào một ontology vàphổ biến tự động các thông tin này cho các đồng nghiệp thích hợp Nó cũng cho phépngười dùng duyệt hoặc tìm kiếm trong ontology để tìm ra các thông tin thích hợp nhấtvới vấn đề mà họ đang phải giải quyết

c Spectacle: Trình diễn thông tin

Spectacle là một nền trình diễn nội dung đặc trưng bởi các trình diễn thông tin được

tùy biến, nhằm cung cấp thông tin cần thiết cho người dùng Nghĩa là không chỉ cácthông tin chính xác được cung cấp cho người dùng mà nó cần phải được trình diễn (cấutrúc, khuôn dạng, diễn tả) theo cách thích hợp cho các người dùng cụ thể

Spectacle được sử dụng để mở ra nội dung của các cơ sở dữ liệu, các kho tài liệu,

và các nguồn thông tin doanh nghiệp khác cũng như ngữ nghĩa của thông tin từ cácnguồn web ngữ nghĩa Platform này bao gồm: Spectacle server và các thư viện lậptrình cho việc sinh ra các trình diễn thông tin dựa web và đồ họa

Định dạng
Số trang	132
Dung lượng	4,99 MB

đồ án công nghệ thông tin Tiếp cận web ngữ nghĩa và ontology trong việc phát triển ứng dụng quản trị tri thức cho doanh nghiệp

Mô hình Ontology của công nghiệp kim loại

CÁC CHỨC NĂNG CHÍNH CỦA HỆ THỐNG