1. Trang chủ
  2. » Luận Văn - Báo Cáo

Tiểu luận MÔN BIỂU DIỄN TRI THỨC VÀ ỨNG DỤNG TÌM HIỂU PROTÉGÉ - ONTOLOGY

42 1,3K 19

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 42
Dung lượng 0,99 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Kiểu biểu diễn này có hình thức tương tự như hàm trong các ngôn ngữ lậptrình, các đối tượng tri thức chính là các tham số của hàm, giá trị mệnh đề chính là kếtquả của hàm thuộc kiểu BOOL

Trang 1

CHƯƠNG TRÌNH ĐÀO TẠO THẠC SĨ CNTTQM

MÃ SỐ: CH1101070

TP.Hồ Chí Minh, Năm 2013

Trang 2

LỜI MỞ ĐẦU



Ngày nay trí tuệ nhân tạo ngày càng phát triển mạnh mẽ, bằng chứng cụ thể là có rấtnhiều công trình đề tài nghiên cứu và đã đưa vào ứng dụng trong rất nhiều lĩnh vựcphát triển kinh tế xã hội, trong đó biểu diễn tri thức là phần không thể thiếu, tri thứcđược con người biểu diễn sao cho máy tính có thu nhận được, diễn đạt, xử lý và suyluận Chính vì vậy biểu diễn tri thức đóng vai trò rất rất quan trọng trong trí tuệ nhântạo

Một trong những phương thức biểu diễn tri thức phổ biến hiện nay là Ontology, tuy rađời hơi muộn so với các phương thức khác nhưng Ontology đã được đón nhận rộngrãi trên thế giới và một trong nhưng công cụ thể hiện Ontology cho người xem dễdàng là Protégé Trong phần này em xin được giới thiệu đôi chút về Ontology và công

cụ Protégé

Em xin chân thành cảm ơn PGS.TS Đỗ Văn Nhơn – Giảng viên môn học Biểu diễntri thức và Ứng Dụng- đã truyền đạt những kiến thức vô cùng quý báu, xin chân thànhcám ơn ban cố vấn học tập và ban quản trị chương trình đào tạo thạc sĩ Công nghệthông tin qua mạng của Đại Học Quốc Gia TPHCM đã tạo điều kiện về tài liệu thamkhảo để em có thể hoàn thành môn học này

Chân thành cám ơn!

Nguyễn Văn Chung

Trang 3

MỤC LỤC

LỜI MỞ ĐẦU 1

BIỂU DIỄN TRI THỨC VÀ ỨNG DỤNG PGS.TS Đỗ Văn Nhơn 2

PHẦN I : BIỂU DIỄN TRI THỨC 4

I TỔNG QUAN 4

I.1 Giới thiệu : 4

I.2 Thông tin, dữ liệu, tri thức: 5

II Các phương pháp biểu diễn tri thức trên máy tính: 7

II.1 Logic mệnh đề: 7

II.2 Logic vị từ 8

II.3 Mạng ngữ nghĩa: 10

PHẦN II : ONTOLOGY 12

I Giới thiệu 12

I.1 Định nghĩa: 12

II Các thành phần của Ontology 12

II.1 Cá thể (Individuals): 12

II.2 Lớp (Classes) 13

II.3 Thuộc tính (Attributes): 14

II.4 Quan hệ (Relationships): 14

III Phân Loại: 16

IV Phương thức xây dựng 17

IV.1 Xác định lĩnh vực quan tâm và phạm vi của Ontology: 18

IV.2 Xem xét việc kế thừa các Ontology có sẵn: 19

IV.3 Liệt kê các thuật ngữ quan trọng trong Ontology: 20

IV.4 Xây dựng các lớp và cấu trúc lớp phân cấp: 20

IV.5 Định nghĩa các thuộc tính và quan hệ cho lớp: 20

IV.6 Định nghĩa các thuộc tính và quan hệ cho lớp: 21

IV.7 Tạo các thực thể cho lớp: 22

V Ngôn ngữ Ontology 22

V.1 RDF (Resource Description Framework): 22

V.2 RDFS (RDF-Schema): 24

V.3 OWL (Ontology Web Language): 27

PHẦN III : PROTÉGÉ 30

I Giới thiệu 30

II Download và cài đặt: 31

III Khám phá Protégé 32

III.1 Màn hình chính 32

III.2 Tổng quan các tab 32

IV Tình huống 33

V Lớp (classes) 34

VI Các thuộc tính của đối tượng (Object Properties) 36

VII Các thuộc tính dữ liệu (Data Properties) 37

VIII Các cá thể (Individuals) 38

Trang 4

KẾT LUẬN 40

Trang 5

PHẦN I : BIỂU DIỄN TRI THỨC

I TỔNG QUAN

I.1 Giới thiệu :

Theo Randall Davis, Howard Shrobe, and Peter Szolovits.

Biểu diễn tri thức là phương pháp mã hóa tri thức, nhằm thành lập cơ sở trithức cho các hệ thống dựa trên tri thức 5 vai trò sau đây nói rõ hơn về cách biểu diễn:

Biểu diễn tri thức là sự thay thế cơ bản nhất, cho phép một thực thể đểxác định kết quả bằng suy nghĩ hơn là hành động, ví dụ, bằng cách lýluận về thế giới chứ không phải là hành động

Đồ thị ý niệm, nghĩa là để trả lời cho câu hỏi: Tôi nên nghĩ về thế giớinhư thế nào?

Lý thuyết rời rạc của lập luận thông minh, thể hiện bằng ba yếu tố:i) Biểu diễn quan niệm cơ bản của các lập luận thông minh

ii) Một bộ các suy luận được công nhận

iii) Tập hợp các suy luận của biểu diễn tri thức được giới thiệu

Là môi trường tính toán thực tế, tức là môi trường tính toán, trong đó tưduy được thực hiện Các hướng dẫn được cung cấp để góp phần tạo nênhiệu quả thực tế, biểu diễn cung cấp cho việc tổ chức thông tin tạothuận lợi để biểu diễn các suy luận

Là môi trường diễn đạt của con người, nghĩa là một ngôn ngữ mà chúng

ta nói những điều về thế giới

Hiểu về vài trò và thừa nhận sự đa dạng của nó mang lại kết quả hữu ích Thứ nhất, mỗi vai trò là yêu cầu sự khác nhau của việc biểu diễn

Thứ hai, vai trò cung cấp một khuôn khổ hữu ích cho việc mô tả tính đadạng của biểu diễn

Thứ ba, một số bất đồng trước đây về việc biểu diễn được gỡ rối hiệu quảkhi tất cả năm vai trò được đưa ra xem xét thích hợp

Cuối cùng, đem lại kết quả cho cả hai nghiên cứu và thực hành, một điềutin rằng quan điển này cũng có thể cải thiện thực hành bằng cách nhắc nhở

Trang 6

các học viên về nhừng nguồn cảm hứng đó là nguồn quan trọng của quyềnlực cho một loại các biểu diễn.

Mục tiêu chính: biểu diễn tri thức trong máy tính là phục vụ cho việc thu nhận tri

thức vào máy tính, truy xuất tri thức và thực hiện các phép suy luận dựa trên những trithức đã lưu trữ

I.2 Thông tin, dữ liệu, tri thức:

Tri thức là một khái niệm rất trừu tượng Do đó, chúng ta sẽ không cố gắngđưa ra một định nghĩa hình thức chính xác ở đây Thay vào đó, chúng ta hãy cùngnhau cảm nhận khái niệm "tri thức" bằng cách so sánh nó với hai khái niệm khác làthông tin và dữ liệu

Trong ngữ cảnh của ngành khoa học máy tính, người ta quan niệm rằng dữliệu là các con số, chữ cái, hình ảnh, âm thanh mà máy tính có thể tiếp nhận và xử

lý Bản thân dữ liệu thường không có ý nghĩa đối với con người Còn thông tin là tất

cả những gì mà con người có thể cảm nhận được một cách trực tiếp thông qua cácgiác quan của mình (khứu giác, vị giác, thính giác, xúc giác, thị giác và giác quan thứ6) hoặc gián tiếp thông qua các phương tiện kỹ thuật như tivi, radio, cassette, Thôngtin đối với con người luôn có một ý nghĩa nhất định nào đó Với phương tiện máy tính(mà cụ thể là các thiết bị đầu ra), con người sẽ tiếp thu được một phần dữ liệu có ýnghĩa đối với mình Nếu so về lượng, dữ liệu thường nhiều hơn thông tin

Cũng có thể quan niệm thông tin là quan hệ giữa các dữ liệu Các dữ liệu đượcsắp xếp theo một thứ tự hoặc được tập hợp lại theo một quan hệ nào đó sẽ chứa đựngthông tin Nếu những quan hệ này được chỉ ra một cách rõ ràng thì đó là các tri thức.Chẳng hạn:

Trang 7

Bản sau đây cho chúng ta biết số đo về điện trở (R), điện thế (U) và cường độdòng điện (I) trong một mạch điện.

Và mối liên hệ này có thể được diễn tả bằng công thức đơn giản sau :

Công thức này là tri thức

 Trong cuộc sống hàng ngày :

Hằng ngày, người nông dân vẫn quan sát thấy các hiện tượng nắng, mưa, râm

và chuồn chuồn bay Rất nhiều lần quan sát, họ đã có nhận xét như sau :

Chuồn chuồn bay thấp thì mưa, bay cao thì nắng, bay vừa thì râm

Lời nhận xét trên là tri thức

Có quan điểm trên cho rằng chỉ những mối liên hệ tường minh (có thể chứngminh được) giữa các dữ liệu mới được xem là tri thức Còn những mối quan hệ khôngtường minh thì không được công nhận Ở đây, ta cũng có thể quan niệm rằng,mọi mốiliên hệ giữa các dữ liệu đều có thể được xem là tri thức, bởi vì, những mối liên hệ nàythực sự tồn tại Điểm khác biệt là chúng ta chưa phát hiện ra nó mà thôi Rõ ràng rằng

"dù sao thì trái đất cũng vẫn xoay quanh mặt trời" dù tri thức này có được Galilê pháthiện ra hay không!

Như vậy, so với dữ liệu thì tri thức có số lượng ít hơn rất nhiều Thuật ngữ ít ởđây không chỉ đơn giản là một dấu nhỏ hơn bình thường mà là sự kết tinh hoặc côđọng lại Bạn hãy hình dung dữ liệu như là những điểm trên mặt phẳng còn tri thứcchính là phương trình của đường cong nối tất cả những điểm này lại Chỉcần một phương trình đường cong ta có thể biểu diễn được vô số điểm! Cũng vậy,

Trang 8

không, chúng ta sẽ ngập chìm trong biển thông tin như nhà bác học Karan Sing đãcảnh báo!

Người ta thường phân loại tri thức ra làm các dạng như sau:

 Tri thức sự kiện: là các khẳng định về một sự kiện, khái niệm nào đó

(trong một phạm vi xác định) Các định luật vật lý, toán học thườngđược xếp vào loại này (Chẳng hạn: mặt trời mọc ở đằng đông, tam giácđều có 3 góc 600 )

 Tri thức thủ tục: thường dùng để diễn tả phương pháp, các bước cần

tiến hành, trình từ hay ngắn gọn là cách giải quyết một vấn đề Thuậttoán, thuật giải là một dạng của tri thức thủ tục

 Tri thức mô tả: cho biết một đối tượng, sự kiện, vấn đề, khái niệm,

được thấy, cảm nhận, cấu tạo như thế nào (một cái bàn thường có 4chân, con người có 2 tay, 2 mắt, )

 Tri thức Heuristic: là một dạng tri thức cảm tính Các tri thức thuộc

loại này thường có dạng ước lượng, phỏng đoán, và thường được hìnhthành thông qua kinh nghiệm

Trên thực tế, rất hiếm có một trí tuệ mà không cần đến tri thức (liệu có thể cómột đại kiện tướng cờ vua mà không biết đánh cờ hoặc không biết các thế cờ quantrọng không?) Tuy tri thức không quyết định sự thông minh (người biết nhiều định lýtoán hơn chưa chắc đã giải toán giỏi hơn!) nhưng nó là một yếu tố cơ bản cấu thànhtrí thông minh Chính vì vậy, muốn xây dựng một trí thông minh nhân tạo, ta cần phải

có yếu tố cơ bản này Từ đây đặt ra vấn đề đầu tiên là … Các phương pháp đưa trithức vào máy tính được gọi là biểu diễn tri thức

II Các phương pháp biểu diễn tri thức trên máy tính:

II.1 Logic mệnh đề:

Đây có lẽ là kiểu biểu diễn tri thức đơn giản nhất và gần gũi nhất đối với chúng

ta Mệnh đề là một khẳng định, một phát biểu mà giá trị của nó chỉ có thể hoặc làđúng hoặc là sai

Ví dụ:

phát biểu "1+1=2" có giá trị đúng

phát biểu "Mọi loại cá có thể sống trên bờ" có giá trị sai

Trang 9

Giá trị của mệnh đề không chỉ phụ thuộc vào bản thân mệnh đề đó Có nhữngmệnh đề mà giá trị của nó luôn đúng hoặc sai bất chấp thời gian nhưng cũng cónhững mệnh đề mà giá trị của nó lại phụ thuộc vào thời gian, không gian và nhiều yếu

tố khác quan khác Chẳng hạn như mệnh đề: "Con người không thể nhảy cao hơn 5mvới chân trần" là đúng khi ở trái đất , còn ở những hành tinh có lực hấp dẫn yếu thì cóthể sai

Ta ký hiệu mệnh đề bằng những chữ cái la tinh như a, b, c,

Có 3 phép nối cơ bản để tạo ra những mệnh đề mới từ những mệnh đề cơ sở là phéphội (È), giao(Ç) và phủ định (¬ )

Bạn đọc chắn hẳn đã từng sử dụng logic mệnh đề trong chương trình rất nhiềulần (như trong cấu trúc lệnh IF THEN ELSE) để biểu diễn các tri thức "cứng"trong máy tính!

Bên cạnh các thao tác tính ra giá trị các mệnh đề phức từ giá trị những mệnh đềcon, chúng ta có được một cơ chế suy diễn như sau :

 Modus Ponens: Nếu mệnh đề A là đúng và mệnh đề A→ B là đúng thì giá trị

Trong logic vị từ, một mệnh đề được cấu tạo bởi hai thành phần là các đốitượng tri thức và mối liên hệ giữa chúng (gọi là vị từ) Các mệnh đề sẽ được biểu diễndưới dạng:

Vị từ (<đối tượng 1>, <đối tượng 2>,…, <đối tượng n>)

Như vậy để biểu diễn vị của các trái cây, các mệnh đề sẽ được viết lại thành :Cam có vị Ngọt Þ Vị (Cam, Ngọt)

Cam có màu Xanh Þ Màu (Cam, Xanh)

Trang 10

Kiểu biểu diễn này có hình thức tương tự như hàm trong các ngôn ngữ lậptrình, các đối tượng tri thức chính là các tham số của hàm, giá trị mệnh đề chính là kếtquả của hàm (thuộc kiểu BOOLEAN)

Với vị từ, ta có thể biểu diễn các tri thức dưới dạng các mệnh đề tổng quát, lànhững mệnh đề mà giá trị của nó được xác định thông qua các đối tượng tri thức cấutạo nên nó

Chẳng hạn tri thức : "A là bố của B nếu B là anh hoặc em của một người concủa A" có thể được biểu diễn dưới dạng vị từ như sau :

Bố (A, B) = Tồn tại Z sao cho : Bố (A, Z) và (Anh(Z, B) hoặc Anh(B,Z))Trong trường hợp này, mệnh đề Bố(A,B) là một mệnh đề tổng quát

Như vậy nếu ta có các mệnh đề cơ sở là:

a) Bố ("An", "Bình") có giá trị đúng (Anh là bố của Bình)

b) Anh ("Tú", "Bình") có giá trị đúng (Tú là anh của Bình)

thì mệnh đề c) Bố ("An", "Tú") sẽ có giá trị là đúng (An là bố của Tú)

Rõ ràng là nếu chỉ sử dụng logic mệnh đề thông thường thì ta sẽ không thể tìmđược một mối liên hệ nào giữa c và a,b bằng các phép nối mệnh đề Ç,È, ¬ Từ đó, tacũng không thể tính ra được giá trị của mệnh đề c Sở dĩ như vậy vì ta không thể thểhiện tường minh tri thức "(A là bố của B) nếu có Z sao cho (A là bố của Z) và (Z anhhoặc em C)" dưới dạng các mệnh đề thông thường Chính đặc trưng của vị từ đã chophép chúng ta thể hiện được các tri thức dạng tổng quát như trên

Thêm một số ví dụ nữa để các bạn thấy rõ hơn khả năng của vị từ :

Câu cách ngôn "Không có vật gì là lớn nhất và không có vật gì là bé nhất!" cóthể được biểu diễn dưới dạng vị từ như sau:

NgườiXấu (x) = ∃y: Bạn(x,y) và NgườiXấu(y)

Công cụ vị từ đã được nghiên cứu và phát triển thành một ngôn ngữ lập trìnhđặc trưng cho trí tuệ nhân tạo

Trang 11

II.3 Mạng ngữ nghĩa:

Mạng ngữ nghĩa là một phương pháp biểu diễn tri thức đầu tiên và cũng làphương pháp dễ hiểu nhất đối với chúng ta Phương pháp này sẽ biểu diễn tri thứcdưới dạng một đồ thị, trong đó đỉnh là các đối tượng (khái niệm) còn các cung chobiết mối quan hệ giữa các đối tượng (khái niệm) này

Chẳng hạn: giữa các khái niệm chích chòe, chim, hót, cánh, tổ có một số mốiquan hệ như sau:

• Chích chòe là một loài chim

• Chim biết hót

• Chim có cánh

• Chim sống trong tổ

Các mối quan hệ này sẽ được biểu diễn trực quan bằng một đồ thị như sau:

Do mạng ngữ nghĩa là một loại đồ thị cho nên nó thừa hưởng được tất cảnhững mặt mạnh của công cụ này Nghĩa là ta có thể dùng những thuật toán của đồ thịtrên mạng ngữ nghĩa như thuật toán tìm liên thông, tìm đường đi ngắn nhất,… để thựchiện các cơ chế suy luận Điểm đặc biệt của mạng ngữ nghĩa so với đồ thị thôngthường chính là việc gán một ý nghĩa (có, làm, là, biết ) cho các cung Trong đồ thịtiêu chuẩn, việc có một cung nối giữa hai đỉnh chỉ cho biết có sựliên hệ giữa hai đỉnh

đó và tất cả các cung trong đồ thị đều biểu diễn cho cùng một loại liên hệ Trongmạng ngữ nghĩa, cung nối giữa hai đỉnh còn cho biết giữa hai khái niệm tương ứng có

sự liên hệ như thế nào Việc gán ngữ nghĩa vào các cung của đồ thị đã giúp giảm bớtđược số lượng đồ thị cần phải dùng để biễu diễn các mối liên hệ giữa các khái niệm.Chẳng hạn như trong ví dụ trên, nếu sử dụng đồ thị thông thường, ta phải dùng đến 4loại đồ thị cho 4 mối liên hệ : một đồ thị để biểu diễn mối liên hệ "là", một đồ thị chomối liên hệ "làm", một cho "biết" và một cho "có"

Trang 12

Một điểm khá thú vị của mạng ngữ nghĩa là tính kế thừa Bởi vì ngay từ trongkhái niệm, mạng ngữ nghĩa đã hàm ý sự phân cấp (như các mối liên hệ "là") nên cónhiều đỉnh trong mạng mặc nhiên sẽ có những thuộc tính của những đỉnh khác Chẳnghạn theo mạng ngữ nghĩa ở trên, ta có thể dễ dàng trả lời "có" cho câu hỏi : "Chíchchòe có làm tổ không?" Ta có thể khẳng định được điều này vì đỉnh "chích chòe" cóliên kết "là" với đỉnh "chim" và đỉnh "chim" lại liên kết "biết" với đỉnh "làm tổ" nênsuy ra đỉnh "chích chòe" cũng có liên kết loại "biết" với đỉnh "làm tổ" (Nếu để ý, bạn

sẽ nhận ra được kiểu "suy luận" mà ta vừa thực hiện bắt nguồn từ thuật toán "loang"hay "tìm liên thông" trên đồ thị!) Chính đặc tính kế thừa của mạng ngữ nghĩa đã chophép ta có thể thực hiện được rất nhiều phép suy diễn từ những thông tin sẵn có trênmạng

Tuy mạng ngữ nghĩa là một kiểu biểu diễn trực quan đối với con người nhưngkhi đưa vào máy tính, các đối tượng và mối liên hệ giữa chúng thường được biểu diễndưới dạng những phát biểu động từ (như vị từ) Hơn nữa, các thao tác tìm kiếm trênmạng ngữ nghĩa thường khó khăn (đặc biệt đối với những mạng có kích thước lớn)

Do đó, mô hình mạng ngữ nghĩa được dùng chủ yếu để phân tích vấn đề Sau đó, nó

sẽ được chuyển đổi sang dạng luật hoặc frame để thi hành hoặc mạng ngữ nghĩa sẽđược dùng kết hợp với một số phương pháp biểu diễn khác

Trang 13

để mô tả một lĩnh vực – nghĩa là một loại đối tượng hay khái niệm hiện hữu, cùng vớicác thuộc tính và quan hệ giữa chúng – và lời đặc tả cho nghĩa của những từ trong bộ

từ vựng Dựa vào độ chính xác của đặc tả này, khái niệm ontology bao gồm một số

mô hình dữ liệu hay mô hình khái niệm, ví dụ, các bảng phân loại (classifications), từđiển chuyên đề (thesauri), lược đồ cơ sở dữ liệu (database schemas), lý thuyết đượctiên đề hoá đầy đủ (fully axiomatized theories)… Ontology có khuynh hướng xuấthiện ở mọi nơi Ontology được sử dụng trong các lĩnh vực trí tuệ nhân tạo, web ngữnghĩa, kỹ thuật phần mềm, sinh-y tin học, khoa học thư viện và kiến trúc thông tinnhư là một dạng biểu diễn tri thức về thế giới hay một phần của nó Ontology là mộtgiải pháp đơn giản nhưng hiệu quả cho nhiều ứng dụng như tích hợp thông tin, các hệthống ngang hàng, thương mại điện tử, các dịch vụ web ngữ nghĩa, các mạng xãhội… Chúng thực sự là những phương tiện thiết thực đểkhái niệm hoá những thức ẩnđược biểu diễn theo định dạng của máy tính

II Các thành phần của Ontology

Các ontology hiện nay đều có nhiều điểm tương tự về mặt cấu trúc, bất kể ngônngữ được dùng để biểu diễn Hầu hết các ontology đều mô tả các đối tượng (thể hiện),lớp (khái niệm), thuộc tính và các quan hệ

II.1 Cá thể (Individuals):

Cá thể (hay thể hiện) là thành phần cơ bản, “mức nền” của một ontology Các cáthể trong một ontology có thể bao gồm các đối tượng rời rạc như con người, con thú,

xe, nguyên tử, hành tinh, trang web, cũng như các đối tượng trừu tượng như con số và

từ (mặc dù có một vài khác biệt về ý kiến liệu các con số và từ là lớp hay là đốitượng) Nói đúng ra, một ontology không cần chứa bất cứ cá thể nào, nhưng một

Trang 14

trong những mục đích chung của ontology là cung cấp một phương tiện để phân loạicác đối tượng, ngay cảkhi các đối tượng này không phải là một phần rõ ràng củaontology.

II.2 Lớp (Classes)

Lớp – khái niệm – có thể được định nghĩa theo cách bên ngoài hay bên trong.

Theo định nghĩa bên ngoài, chúng là những nhóm, bộ hoặc tập hợp các đối tượng.Theo định nghĩa bên trong, chúng là các đối tượng trừu tượng được định nghĩa bởi giátrị của các mặt ràng buộc khiến chúng phải là thành viên của một lớp khác Lớp cóthể phân loại các cá thể, các lớp khác, hay một tổ hợp của cả hai Một số ví dụ củalớp:

Person, lớp của tất cả con người, hay các đối tượng trừu tượng có thể được

mô tả bởi các tiêu chuẩn làm một con người

Vehicle, lớp của tất cả xe cộ, hay các đối tượng trừu tượng có thể được mô

tả bởi các tiêu chuẩn làm một chiếc xe

Car, lớp của tất cả xe hơi, hay các đối tượng trừu tượng có thể được mô tảbởi các tiêu chuẩn làm một chiếc xe hơi

Class, biểu diễn lớp tất cảcác lớp, hay các đối tượng trừu tượng có thểđược mô tả bởi các tiêu chuẩn để làm một lớp

Thing, biểu diễn lớp tất cảmọi thứ, hay các đối tượng trừu tượng có thểđược mô tả bởi các tiêu chuẩn để làm một thứ gì đó (và không phảikhông-là-gì cả)

Một lớp có thể gộp nhiều lớp hoặc được gộp vào lớp khác; một lớp xếp gộp vàolớp khác được gọi là lớp con (hay kiểu con) của lớp gộp (hay kiểu cha)

Ví dụ: Vechicle gộp Car, bởi vì bất cứ thứ gì là thành viên của lớp sau cũng đều

là thành viên của lớp trước Quan hệ xếp gộp được dùng đểtạo nên một cấu trúc phân

cấp các lớp, thông thường có một lớp tổng quát lớn nhất chẳng hạn Anything nằm ở trên cùng và những lớp rất cụ thể như 2002 Ford Explorer nằm ở dưới cùng

Hệ quả cực kỳ quan trọng của quan hệ xếp gộp là tính kế thừa của các thuộc tính

từ lớp cha đến lớp con Do vậy, bất cứthứgì hiển nhiên đúng với một lớp cha cũnghiển nhiên đúng với các lớp con của nó Trong một số ontology, một lớp chỉ được chophép có một lớp cha, nhưng trong hầu hết các ontology, các lớp được cho phép cómột số lượng lớp cha bất kỳ và trong trường hợp sau tất cả các thuộc tính hiển nhiên

Trang 15

của từng lớp cha được kế thừa bởi lớp con Do đó một lớp cụ thể của lớp thú

(HouseCat) có thể là một con của lớp Cat và cũng là một con của lớp Pet.

II.3 Thuộc tính (Attributes):

Các đối tượng trong một ontology có thể được mô tả bằng cách liên hệ chúng vớinhững thứ khác, thường là các mặt hay bộ phận Những thứ được liên hệ này thườngđược gọi là thuộc tính, mặc dù chúng có thể là những thứ độc lập Một thuộc tính cóthể là một lớp hay một cá thể Kiểu của đối tượng và kiểu của thuộc tính xác địnhkiểu của quan hệ giữa chúng Một quan hệ giữa một đối tượng và một thuộc tính biểu

diễn một sự kiện đặc thù cho đối tượng mà nó có liên hệ Ví dụ đối tượng Ford Explorer có các thuộc tính như:

 <có tên> Ford Explorer

 <có bộ phận> door (với số lượng tối thiểu và tối đa: 4)

 <có một trong các bộ phận> {4.0L engine, 4.6L engine}

II.4 Quan hệ (Relationships):

Quan hệ giữa các đối tượng trong một ontology cho biết các đối tượng liên hệ vớiđối tượng khác như thế nào Thông thường một quan hệ là của một loại (hay lớp) cụthể nào đó chỉ rõ trong ngữ cảnh nào đối tượng được liên hệ với đối tượng khác trong

ontology Ví dụ trong ontology chứa khái niệm Ford Explorer và khái niệm Ford Bronco có thể được liên hệ bởi một quan hệ loại <được định nghĩa là một con của>.

Phát biểu đầy đủ của sự kiện như sau:

 Ford Explorer được định nghĩa là một con của: Ford Bronco

Trang 16

Điều này cho ta biết Explorer là mô hình thay thế cho Bronco Ví dụ này cũng

minh họa rằng quan hệ có cách phát biểu trực tiếp Phát biểu ngược biểu diễn cùngmột sự kiện nhưng bằng một ngữ nghịch đảo trong ngôn ngữ tự nhiên

Phần lớn sức mạnh của ontolgy nằm ở khả năng diễn đạt quan hệ Tập hợp cácquan hệ cùng nhau mô tả ngữ nghĩa của domain Tập các dạng quan hệ được sử dụng(lớp quan hệ) và cây phân loại thứ bậc của chúng thể hiện sức mạnh diễn đạt của ngônngữ dùng để biểu diễn ontology

Hình: Một Ontology biểu diễn quan hệ của xe cộ superclass-of, hay ngược lại, ‘là dạng con của’ – is-a-subtype-of – hay ‘là lớp con của’ – is-a-subclass-of) Nó định nghĩa đối tượng nào được phân loại bởi lớp nào Ví

dụ, ta đã thấy lớp Ford Explorer là lớp con của 4-Wheel Drive Car và lớp 4-Wheel Drive Car lại là lớp con của Car Sự xuất hiện của quan hệ ‘là lớp con của’ tạo ra một

cấu trúc phân cấp thứ bậc; dạng cấu trúc cây này (hay tổng quát hơn, là tập có thứ tựtừng phần) mô tả rõ ràng cách thức các đối tượng liên hệ với nhau Trong cấu trúcnày, mỗi đối tượng là ‘con’ của một ‘lớp cha’ (Một số ngôn ngữ giới hạn quan hệ làlớp con của trong phạm vi một cha cho mọi nút, nhưng đa số thì không như thế) Một

dạng quan hệ phổ biến khác là quan hệ meronymy, gọi là ‘bộ phận của’, biểu diễn làm

thế nào các đối tượng kết hợp với nhau đề tạo nên đối tượng tổng hợp Ví dụ, nếu ta

mở rộng ontology trong ví dụ để chứa thêm một số khái niệm như Steering Wheel (vô lăng), ta sẽ nói rằng “Vô lăng được định nghĩa là một bộ phận của Ford Explorer” vì

Trang 17

vô lăng luôn luôn là một trong những bộ phận của xe Ford Explorer Nếu đưa quan

hệ meronymy vào ontology này, ta sẽ thấy rằng cấu trúc cây đơn giản và nhẹ nhàng

trước đó sẽ nhanh chóng trở nên phức tạp và cực kỳ khó hiểu Điều này không khó lýgiải; một lớp nào đó được mô tả rằng luôn luôn có một thành viên là bộ phận của mộtthành viên thuộc lớp khác thì lớp này cũng có thể có một thành viên là bộ phận củalớp thứ ba Kết quả là các lớp có thể là bộ phận của nhiều hơn một lớp Cấu trúc nàyđược gọi là đồ thị chu trình có hướng Ngoài những quan hệ chuẩn như ‘là lớp concủa’ và ‘được định nghĩa là bộ phận của’, ontology thường chứa thêm một số dạngquan hệ làm trau chuốt hơn ngữ nghĩa mà chúng mô hình hóa Ontology thường phânbiệt các nhóm quan hệ khác nhau Ví dụ nhóm các quan hệ về:

hệ của chính nó và phân biệt các nhóm quan hệ khác nhau là ontology Gellish

Ví dụ, trong lĩnh vực xe ô tô, ta cần quan hệ‘được sản xuất tại’ để cho biết xe

được lắp ráp tại chỗ nào Như vậy, Ford Explorer được sản xuất tại Louisville.

Ontology có thể cũng biết được Louisville ‘tọa lạc tại’ Kentucky và Kentucky ‘đượcđịnh nghĩa là’ một bang và ‘là bộ phận của’ Hoa Kỳ Phần mềm sử dụng ontology này

sẽ có thể trả lời một câu hỏi như ‘những xe hơi nào được sản xuất tại Hoa Kỳ?”

III Phân Loại:

Ontology có thể được phân loại dựa trên phương pháp hình thành khái niệm.Theo H.Becketal, có các kiểu ontology như sau:

 Ontology biểu diễn (Representation ontologies hay còn gọi là meta

ontologies) Kiểu ontology này nhằm khái niệm hoá và biểu diễn các trithức theo kiểu hình thức Ontology kiểu này định nghĩa các khái niệm

Trang 18

như là các lớp, các mối quan hệ, các hàm hay các tiên đề được định danh(named-axiom).

 Ontology chung (General ontology) hay còn gọi là ontology mức cao

(upper ontology) Kiểu ontology này nhằm phân loại một tập các thực thểtồn tại trong thế giới vật chất Nó thường biểu diễn các khái niệm chung,không phụ thuộc vào vấn đề hay miền cụ thể nào được mô tả trongontology đó Tri thức định nghĩa trong kiểu ontology này thường là sự vật(thing), sự kiện (event), thời gian (time), không gian(space) hoặc các kháiniệm chung khác

 Ontology miền (Domain ontologies) Tri thức được định nghĩa trong kiểu

ontology này là tri thức xác định một miền nào đó Từ vựng, khái niệmđược mô tả trong kiểu ontology này có mối quan hệ gần gũi với các miềntri thức tổng quát, ví dụ như hàng không, y tế…

 Ontology ứng dụng (Application ontology) Mô tả các phần tri thức phụ

thuộc vào một miền tri thức riêng biệt cũng như nhiệm vụ cụ thể nào đó.Một ontology ứng dụng thường biểu diễn các khái niệm liên quan trực tiếpđến việc giải quyết bài toán

IV Phương thức xây dựng

Có nhiều phương pháp khác nhau để xây dựng một Ontology, nhưng nhìn chungcác phương pháp đều thực hiện hai bước cơ bản là: xây dựng cấu trúc lớp phân cấp vàđịnh nghĩa các thuộc tính cho lớp Trong thực tế, việc phát triển một Ontology để mô

tả lĩnh vực cần quan tâm là một công việc không đơn giản, phụ thuộc rất nhiều vàocông cụ sử dụng, tính chất, quy mô, sự thường xuyên biến đổi của miền cũng như cácquan hệ phức tạp trong đó Những khó khăn này đòi hỏi công việc xây dựng Ontologyphải là một quá trình lặp đi lặp lại, mỗi lần lặp cải thiện, tinh chế và phát triển dần sảnphẩm chứ không phải là một quy trình khung với các công đoạn tách rời nhau Côngviệc xây dựng Ontology cũng cần phải tính đến khảnăng mở rộng lĩnh vực quan tâmtrong tương lai, khả năng kế thừa các hệ thống Ontology có sẵn, cũng như tính linhđộng để Ontology có khả năng mô tả tốt nhất các quan hệ phức tạp trong thế giớithực

Một số nguyên tắc cơ bản của việc xây dựng Ontology thông qua các công đoạnsau đây:

Trang 19

 Xác định miền quan tâm và phạm vi của Ontology

 Xem xét việc kế thừa các Ontology có sẵn

 Liệt kê các thuật ngữ quan trọng trong Ontology

 Xây dựng các lớp và cấu trúc lớp phân cấp

 Định nghĩa các thuộc tính và quan hệ cho lớp

 Định nghĩa các ràng buộc về thuộc tính và quan hệ của lớp

 Tạo các thực thể cho lớp

IV.1 Xác định lĩnh vực quan tâm và phạm vi của Ontology:

Thông thường, các yêu cầu đối với một hệ thống Ontology là mô tả lĩnh vựcquan tâm nhằm phục vụ cơ sở tri thức trong việc giải quyết những mục đích chuyênbiệt Công việc đặc tả để xác định, phân tích, nhận diện chính xác yêu cầu được thựchiện bằng cách trả lời những câu hỏi sau:

 Ontology cần mô tả lĩnh vực nào?

 Ontology phục vụ cho mục đích chuyên biệt gì?

 Cơ sở tri thức trong Ontology sẽ giải quyết những câu hỏi gì?

 Ontology nhằm vục vụ đối tượng nào?

 Ai là người sẽ xây dựng, quản trị Ontology?

Nhìn chung, câu trả lời cho các câu hỏi dạng này có thể sẽ thường xuyên thay đổitrong suốt quá trình xây dựng một Ontology Nhất là khi có sự thay đổi về mục đíchhoặc cần bổ sung tính năng trong việc sử dụng cơ sở tri thức Tuy nhiên, việc trả lờichính xác các câu hỏi trên tại mỗi bước lặp sẽ giúp giới hạn phạm vi của mô hình cần

mô tả và dự trù các kỹ thuật sẽ sử dụng trong quá trình phát triển Lấy ví dụ, nếu dựtrù khả năng xảy ra sự khác biệt về ngôn ngữ giữa người phát triển và người sử dụngthì Ontology phải được bổ sung cơ chế ánh xạ (mapping) qua lại các thuật ngữ giữacác ngôn ngữ khác nhau Hoặc giả sử Ontology cần xây dựng có chức năng xử lýngôn ngữ tự nhiên, ứng dụng dịch tài liệu tự động thì cũng cần thiết phải có kỹ thuậtxác định từ đồng nghĩa

Sau khi đã phát thảo phạm vi Ontology dựa trên việc trả lời những câu hỏi trên,người thiết kế sẽ trả lời các câu hỏi mang tính đánh giá, qua đó tiếp tục tinh chỉnh lạiphạm vi của hệ thống cần xây dựng Các câu hỏi dạng này thường dựa trên cơ sở trithức của Ontology và được gọi là câu hỏi kiểm chứng khả năng (competency

Trang 20

 Ontology đã có đủ thông tin để trả lời cho các câu hỏi được quan tâm trên

cơ sở tri thức hay không?

 Câu trả lời của cơ sở tri thức đã đáp ứng được mức độ, yêu cầu nào củangười sử dụng?

 Các ràng buộc và quan hệ phức tạp trong miền quan tâm đã được biểudiễn hợp lý chưa?

IV.2 Xem xét việc kế thừa các Ontology có sẵn:

Đây là một công đoạn thường hay sử dụng để giảm thiểu công sức xây dựng mộtOntology Bằng cách kế thừa các Ontology tương tự có sẵn, người xây dựng có thểthêm hoặc bớt các lớp, quan hệ giữa các lớp, thực thể để tinh chỉnh tùy theo mụcđích của mình Việc sử dụng lại các Ontology có sẵn cũng rất quan trọng khi cần sựtương tác giữa các ứng dụng khác nhau, các ứng dụng sẽ cần phải hiểu các lớp, thựcthể, quan hệ của nhau để thuận tiện trong việc trao đổi hoặc thống nhất thông tin.Vấn đề xây dựng một Ontology mới bằng cách kế thừa các hệ thống có sẵn liênquan đến một bài toán rất phức tạp là trộn (merging)các Ontology Ví dụ trong trườnghợp tên các khái niệm được định nghĩa trong các Ontology này có thể giống nhautrong khi chúng được dùng để mô tả các loại vật hoàn toàn khác nhau, và cũng có thểxảy ra trường hợp ngược lại, khi tên các khái niệm khác nhau nhưng cùng mô tả một

sự vật, vàmột vấn đề nữa là làm thế nào để bổ sung các quan hệ, thuộc tính có sẵn vàomột hệ thống mới Tuy nhiên, hầu hết các Ontology sử dụng trong ngành khoa họcmáy tính nói chung và Web ngữ nghĩa nói riêng đều được xây dựng trên các hệ thốngxây dựng và quản trị Ontology Tên một số công cụ như: Sesame, Protégé,Ontolingua, Chimaera, OntoEdit, OidEd Hiện nay, đa số các phần mềm này đều hỗtrợ chức năng tự động trộn các Ontology cùng hoặc thậm chí khác định dạng vớinhau Mặc dù vậy, ở mức nào đó, người xây dựng cũng cần phải kiểm tra lại một cáchthủ công, nhưng đây không phải là một công việc phức tạp

Hiện có rất nhiều Ontology được chia sẻ trên Web nổi tiếng như: UNSPSC(www.unspsc.org)do chương trình phát triển của Liên Hiệp Quốc hợp tác với tổ chứcDun & Bradstreet nhằm cung cấp các thuật ngữ của các sản phẩm và dịch vụ thươngmại Các Ontology trong lĩnh vực thương mại khác như: RosettaNet(www.rosettanet.org), DMOZ (www.dmoz.org), eClassOwl Open Biological,

Trang 21

BioPax trong lĩnh vực sinh vật học, UMLS trong lĩnh vực mạng ngữ nghĩa, GO (GeneOntology), WordNet (đại học Princeton)

IV.3 Liệt kê các thuật ngữ quan trọng trong Ontology:

Đây là bước rất hữu ích, làm tiền đề cho hai bước tiếp theo là xây dựng cấu trúclớp phân cấp và định nghĩa các thuộc tính cho lớp Công đoạn này bắt đầu bằng việcliệt kê tất cả các thuật ngữ xuất hiện trong miền quan tâm (có thể đồng nghĩa hoặcchồng nhau)như tên khái niệm, quan hệ, thuộc tính Thông thường, các thuật ngữ làdanh từ sẽ trở thành các lớp, tính từ sẽ trở thành thuộc tính, còn động từ sẽ là quan hệgiữa các lớp

IV.4 Xây dựng các lớp và cấu trúc lớp phân cấp:

Đây là một trong hai bước quan trọng nhất của công việc xây dựng mộtOntology Nhiệm vụ của bước này là định nghĩa các lớp từ một số thuật ngữ đã liệt kêtrong bước trên, sau đó xây dựng cấu trúc lớp phân cấp theo quan hệ lớp cha-lớp con.Lớp ở vị trí càng cao sẽ có mức độ tổng quát càng cao Vị trí đầu tiên thuộc về lớpgốc, tiếp theo là các lớp trung gian, và cuối cùng là lớp lá Lớp lá là lớp không thểtriển khai được nữa và chỉ được biểu hiện bằng các thực thể

Quan hệ giữa thực thể của lớp con với lớp cha là quan hệ “is-a”, nghĩa là mộtthực thể của lớp con cũng “là-một” thực thể của lớp cha Có nhiều hướng tiếp cậnkhác nhau cho vấn đề xây dựng cấu trúc lớp phân cấp Có thể kể ra ba hướng như sau:

 Hướng xây dựng từ trên xuống (top-down): bắt đầu bằng các lớp có mức

độ tổng quát cao nhất, sau đó triển khai dần đến lớp lá

 Hướng xây dựng từ dưới lên (bottom-up): ngược với hướng xây dựng cấu

trúc lớp phân cấp từ trên xuống, hướng này bắt đầu bằng việc xác định cáclớp được cho là cụ thể nhất, sau đó tổng quát hóa đến khi được lớp gốc

 Cách kết hợp (combination): cách này kết hợp cả hai hướng xây dựng

trên Đầu tiên chọn các lớp nổi bật nhất trong lĩnh vực quan tâm, sau đótổng quát hóa và cụ thể hóa cho đến khi được cấu trúc mong muốn

IV.5 Định nghĩa các thuộc tính và quan hệ cho lớp:

Bản thân các lớp nhận được ở bước trên chỉ mới là những thuật ngữ phân biệt vớinhau bằng tên gọi Về cơ bản, chúng chưa đủ để phục vụ cho việc biểu diễn tri thức.Muốn như vậy, các thuộc tính của lớp cần được định nghĩa Thuộc tính của lớp là các

Ngày đăng: 10/04/2015, 11:08

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w