T ỔNG QUAN VỀ CÁC NGÔN NGỮ ĐÁNH DẤU NGỮ NGHĨA CHO TÀI NGUYÊN W EB

Một phần của tài liệu Tổng hợp các dịch vụ web có ngữ nghĩa = design and implement a semantic web process composition framnework (Trang 21 - 25)

Phần này tóm lược về lý thuyết biểu diễn tri thức, sự liên quan của việc biểu diễn ngữ nghĩa cho tài nguyên Web với lý thuyết biểu diễn tri thức rồi sau đó đề cập đến các ngôn ngữ đánh dấu ngữ nghĩa cho tài nguyên Web.

Việc biểu diễn ngữ nghĩa cho tài nguyên Web là một trường hợp cụ thể của việc biểu diễn tri thức. Trong biểu diễn tri thức thì thông tin về ngữ cảnh là đặc biệt quan trọng. Có hai khía cạnh cần quan tâm về ngữ cảnh, đó là hiểu biết chung về thế giới cần biểu diễn và hiểu biết chuyên biệt về tình huống cụ thể của tri thức cần biểu diễn.

Hiểu biết chung về thế giới cần biểu diễn là nền tảng cho việc giải quyết nhiều bài toán diễn dịch, mà một trong số các bài toán quan trọng đó là tường minh hóa ngữ nghĩa, tránh mơ hồ hay hiểu nhầm. Hiểu biết chuyên biệt về tình huống cụ thể của tri thức cần biểu diễn là cần thiết để xác định chính xác ngữ nghĩa trong một tình huống cụ thể.

Việc biểu diễn ngữ nghĩa cho tài nguyên Web, cũng giống như biểu diễn tri thức nói chung, phải bao gồm một cơ sở tri thức ở dạng nào đó và một tập các kỹ thuật suy luận.

Các kỹ thuật suy luận được phân loại thành hai kiểu suy luận khác nhau:

suy luận dạng deductive và suy luận dạng nondeductive. Suy luận dạng deductive chỉ đưa ra các kết luận tuân theo một cách logic các sự thật được biết đến. Suy luận dạng nondeductive bao gồm khả năng tổng quát hóa từ các ví dụ (đây là suy luận dạng inductive – inductive inference) và khả năng tìm nguyên nhân khi biết kết quả (suy luận dạng abductive – abductive inference).

Có hai cách xây dựng thành phần suy luận cho một hệ thống biểu diễn tri thức: hướng thủ tục hoặc hướng khai báo.

Trong các hệ thống biểu diễn tri thức sử dụng thành phần suy luận hướng khai báo thì cơ sở tri thức thường biểu diễn dưới dạng các tiên đề, và việc suy luận tiến hành theo dạng deductive, tuân theo những tiên đề đã có. Các hệ thống này nhấn mạnh đến việc xây dựng cơ sở tri thức độc lập với thành phần suy luận.

Ngược lại, trong những hệ thống sử dụng phương thức suy luận hướng thủ tục thì cơ sở tri thức có thể chẳng mang ý nghĩa gì nếu không đi theo phương thức suy luận riêng biệt tương ứng. Các hệ thống này nhấn mạnh vào khía cạnh suy luận khi biểu diễn tri thức. Cách làm này có ưu điểm là có thể đặc biệt hiệu quả trong một số suy luận cụ thể trong các miền trị được định nghĩa rõ. Tuy nhiên nhược điểm của cách làm này là sự phụ thuộc chặt chẽ giữa cơ sở tri thức và thành phần suy luận.

Trong các kỹ thuật biểu diễn ngữ nghĩa, dạng đơn giản nhất thường được đề cập là logic mệnh đề rồi đến logic vị từ. Các kỹ thuật này trong sáng nhưng khả năng biểu diễn bị hạn chế.

Một kỹ thuật có khả năng biểu diễn cao hơn là frame. Trong frame đã có các khái niệm về sự thật (fact), đối tượng, khe (slot) hay còn gọi là vai trò (role) – tương tự như vai trò chủ đề (thematic role) trong một dạng biểu diễn khác là logical form. Khi biểu diễn cơ sở tri thức bằng frame người ta đã dùng đến các ràng buộc, hạn chế để quy định cho các vai trò. Ngoài ra còn có khái niệm biểu diễn hành động (action) bằng cách dùng frame, trong đó nêu tiền điều kiện của hành động, các kết quả (effect) gây ra bởi hành động, cũng như khả năng phân rã (decomposition) hành động thành những hành động nhỏ hơn.

Một kỹ thuật biểu diễn ngữ nghĩa hiệu quả liên quan đến ontology. Mỗi ontology là một đặc tả về một hệ thống các khái niệm cùng với mối quan hệ giữa chúng.

Hiểu một cách đơn giản thì ontology là một tập các định nghĩa của các từ vựng. Một agent sau đó có thể quy định rằng nó sử dụng ontology nào nhằm giúp các agent khác hiểu đúng ngữ cảnh mà agent này muốn đề cập (giúp hiểu đúng ngữ nghĩa). Ví dụ nếu không dùng ontology thì khi tìm kiếm từ khóa

“chip” trên động cơ tìm kiếm của Google, người ta có thể có các kết quả là những thông tin về vi mạch máy tính kèm với các thông tin về khoai tây rán.

Trong khi đó nếu tìm kiếm mà quy định rõ chỉ dùng ontology liên quan đến máy tính thì không còn kết quả không phù hợp là thông tin về khoai tây rán nữa.

Trong các nỗ lực phát triển những ontology thì OIL (Ontology Inference Layer) là đáng chú ý do cung cấp cách biểu diễn trên nền Web các ontology và cách suy luận dựa trên những ontology này.

Để biểu diễn ngữ nghĩa thì ngay cả XML, XML Schema, RDF(Resource Description Framework) và RDF Schema cũng được nhắc đến, nhưng chúng có hạn chế lớn về khả năng biểu diễn và mô hình suy luận.

OIL là sự kết hợp của cả kỹ thuật biểu diễn tri thức bằng frame với cú pháp của XML, RDF và khả năng biểu diễn ngữ nghĩa cũng như suy luận của Description Logic.

Hình 4 OIL hình thành dựa trên 3 nền tảng khác

Trong nỗ lực mở rộng RDF cho mục đích biểu diễn ngữ nghĩa, chính phủ Mỹ đã tài trợ cho dự án DAML (DARPA Agent Markup Language). Những thành viên của nhóm phát triển này nhanh chóng đi đến kết hợp với các thế mạnh của OIL và hình thành DAML+OIL [13]. DAML+OIL mở rộng OIL bằng cách thêm vào một số phương thức biểu diễn phức tạp hơn, giúp biểu diễn ngữ nghĩa mạnh mẽ hơn.

Dựa trên các kỹ thuật biểu diễn ngữ nghĩa đang tiếp tục được hoàn thiện này, hiện có một số khuyến nghị về cách thức đặc tả quá trình Web có ngữ nghĩa.

Nổi bật trong số này là BPEL [2, 3, 6], BPML [4] và OWL-S [13] (tên gọi mới của DAML-S, một phần trong dự án DAML do chính phủ Mỹ tài trợ).

Các trường đại học hàng đầu trên thế giới cũng có nhiều đóng góp quan trọng, trong đó phải kể tới những kết quả của Đại học Georgia trong dự án tổng thể METEOR-S [1]. Có thể tóm tắt tương quan giữa một số cách biểu diễn ngữ nghúa nhử hỡnh veừ sau

OIL

Mô hình hóa của

Frame Ngữ nghĩa và suy luận của

Description Logic Cú pháp của XML, RDF

Hình 5 Các phương pháp biểu diễn ngữ nghĩa

Một phần của tài liệu Tổng hợp các dịch vụ web có ngữ nghĩa = design and implement a semantic web process composition framnework (Trang 21 - 25)

Tải bản đầy đủ (PDF)

(79 trang)