Tại một trong những hội thảo ấn tượngnhất của thập kỉ, Margaret Masterman đã giới thiệu một kí hiệu dựa trên đồ thị được gọi là mạng ngữ nghĩa bao gồm một dàn những kiểu khái niệm.. Nhữn
Trang 1Đại Học Quốc Gia Thành Phố Hồ Chí Minh Trường Đại Học Công Nghệ Thông Tin Lớp Cao Học khóa 5 ngành Khoa Học Máy Tính
12.2012
BÀI THU HO CH MÔN H C ẠCH MÔN HỌC ỌC
Biểu diễn tri thức
Đề tài
Tìm hiểu về đồ thị khái niệm
Giảng viên hướng dẫn: PGS.TS Đỗ Văn Nhơn
Người thực hiện: Nguyễn Thế Thắng (CH1001128)
Trang 2Mục lục
1 Giới thiệu 1
2 Từ đồ thị hiện sinh đến đồ thị khái niệm 1
3 Logic tổng quát (Common Logic) 8
4 Lập luận với đồ thị 15
5 Mệnh đề, tình huống và siêu ngữ 22
6 Kết luận 25
7 Tài liệu tham khảo 25
Trang 31 Giới thiệu
Đồ thị khái niệm (conceptual graph) là sự biểu diễn đồ thị cho logic dựa trên những mạngngữ nghĩa của trí tuệ nhân tạo và những đồ thị hiện sinh của Charles Sanders Peirce Vài phiên bản của đồ thị khái niệm đã được thiết kế và hiện thực hơn ba mươi năm qua Cái đơn giản nhất là những đồ thị lõi không có kiểu mà tương ứng với đồ thị hiện sinh
nguyên thủy của Peirce Tổng quát hơn là đồ thị khái niệm mở rộng là một tập lớn có
kiểu của đồ thị lõi Đồ thị khái niệm nghiên cứu đã khám phá những kĩ thuật mới lạ cho lập luận, biểu diễn tri thức, và ngữ nghĩa ngôn ngữ tự nhiên Ngữ nghĩa của đồ thị khái
niệm lõi và mở rộng được xác định bởi việc ánh xạ hình thức đến và từ chuẩn ISO của
logic tổng quát nhưng đồ thị khái niệm nghiên cứu được định nghĩa bởi nhiều sự mở rộnghình thức và không hình thức
2 Từ đồ thị hiện sinh đến đồ thị khái niệm
Trong suốt thập kỉ 60, biểu diễn ngữ nghĩa dựa trên đồ thị nổi tiếng trong cả hai nghành ngôn ngữ học lí thuyết và ngôn ngữ học máy tính Tại một trong những hội thảo ấn tượngnhất của thập kỉ, Margaret Masterman đã giới thiệu một kí hiệu dựa trên đồ thị được gọi
là mạng ngữ nghĩa bao gồm một dàn những kiểu khái niệm Silvio Ceccato đã giới thiệu những mạng động quan hệ dựa trên 56 quan hệ khác nhau và những loại thuộc tính khác nhau David Hays đã trình bày về đồ thị phụ thuộc hình thức hóa kí hiệu được phát triển bởi nhà ngôn ngữ học Lucien Tesniere Những kí hiệu đồ thị trước đây đã biểu diễn
những cấu trúc quan hệ bên dưới ngữ nghĩa ngôn ngữ tự nhiên nhưng không có cái nào
có thể biểu thị được logic cấp một đầy đủ
Cuối thập kỉ 70, nhiều kí hiệu đồ thị đã được thiết kế để biểu diễn logic cấp một hoặc tập con được định nghĩa hình thức Sowa đã phát triển một phiên bản của đồ thị khái niệm
như một ngôn ngữ trung gian cho việc ánh xạ những câu hỏi ngôn ngữ tự nhiên và những phát biểu đến một cơ sở dữ liệu Hình 2.1 trình bày một đồ thị khái niệm cho câu “John isgoing to Boston by bus” Hình chữ nhật được gọi là khái niệm (concepts) và hình tròn
được gọi là quan hệ khái niệm (conceptual relations) Cung trỏ đến nút hình tròn cho biết
Trang 4đối số đầu tiên của quan hệ và một cung đi ra từ nút hình tròn cho biết đối số cuối cùng Nếu quan hệ chỉ có một đối số duy nhất, cung sẽ không có mũi tên Nếu quan hệ có nhiềuhơn hai đối số, đầu mũi tên được thay thế bằng những số nguyên
Hình 2.1 dạng hiển thị đồ thị khái niệm cho câu “John is going to Boston by bus”.
Đồ thị khái niệm trong hình 2.1 biểu diễn một phiên bản có kiểu hoặc được sắp xếp của logic Mỗi khái niệm trong bốn khái niệm có một nhãn kiểu (type label) biểu diễn cho
kiểu của thực thể là Person, Go, Boston hoặc Bus Hai khái niệm có tên xác định ám chỉ
là John hoặc Boston Mỗi quan hệ khái niệm có một nhãn kiểu mà biểu diễn loại quan hệ:agent (Agnt), nơi đên (Dest), phương tiện (Inst) Đồ thị khái niệm trên mô tả rằng con
người John là một agent của instance của việc đi, thành phố Boston là nơi đến và xe buýt
là phương tiện Hình 2.1 có thể được dịch thành công thức sau đây:
Toán tử tồn tại và toán tử giao là toán tử tổng quát nhất trong việc dịch từ ngôn ngữ tự
nhiên và nhiều mạng ngữ nghĩa trước đây không thể biểu diễn
Với Begriffsschrift, Frege thông qua kí hiệu cây cho việc biểu diễn đầy đủ logic cấp một chỉ sử dụng 4 toán tử: khẳng định cửa xoay ), phủ định (biểu diễn bằng đường thẳng dọc đứng), suy ra (biểu diễn bằng hình như cái móc) và với mọi (biểu diễn bằng một cái
Trang 5cốc chứa biến ràng buộc) Hình 2.2 là biểu diễn Begriffsschrift tương đương với hình 2.1.Dưới đây là biểu diễn dạng vị từ:
Hình 2.2 Begriffsschrift của Frege cho câu “John is going to Boston by bus”.
Sự lựa chọn toán từ của Frege đơn giản hóa những luật suy luận nhưng dẫn đến những
diễn giải vụng về: không đúng với mọi x và y, nếu x là instance của going thì nếu John là người thì nếu Boston là thành phố thì nếu y là xe bus thì nếu agent của x là John thì nếu nơi đến của x là Boston thì phương tiện của x không phải là y
Không giống như Frege, Peirce đã phát triển kí hiệu đại số cho logic bậc nhất như sự tổngquát hóa của các toán tử kiểu Boolean Từ khi Boole xem sự phân rã như việc cộng logic
và sự kết hợp như nhân logic, Peirce biểu diễn toán tử tồn tại bằng Σ cho việc phân rã lặp
đi lặp lại và toán từ với mọi bằng Π cho việc kết hợp lặp đi lặp lại Sơ đồ hình 2.1 được
biểu diễn theo kí hiệu của Peirce như sau:
Trang 6Thông qua kí hiệu của Peirce, Peano đã tạo ra những biểu tượng mới vì muốn kết hợp
những kí hiệu toán học và logic trong công thức Trong khi đó, Peirce bắt đầu thử nghiệmvới đồ thị quan hệ cho việc biểu diễn logic như trong hình 2.3 Trong đồ thị đó, lượng từ tồn tại được biểu diễn bằng một đường nhận diện và sự kết hợp là toán tử Boolean mặc
định Vì đồ thị của Peirce không phân biệt những tên đúng, những vị từ monadic isJohn
và isBoston có lẽ được sử dụng để biểu diễn những tên Sau đây là kí hiệu đại số của cho hình 2.1:
Hình 2.3 đồ thị quan hệ của Peirce cho câu “John is going to Boston by bus”.
Peirce đã thử nghiệm với nhiều phương pháp đồ thị khác nhau cho việc biểu diễn những toán tử khác của kí hiệu đại số của ông nhưng giống như những nhà nghiên cứu AI của
thập kỉ 60 ông ta không thể tìm ra cách hay để thể hiện được phạm vi của những lượng từ
và phép phủ định Tuy nhiên vào năm 1897 ông ta đã phát hiện ra một sự đổi mới đơn
giản nhưng lỗi lạc của cho phiên bản mới của ông về đồ thị hiện sinh (Existential
Graphs): một bao đóng hình bầu dục cho việc trình bày phạm vi Toán tử mặc định cho
hình bầu dục không đánh dấu khác là phủ định nhưng bất kì quan hệ metadata có thể
được liên kết với hình bầu dục Sowa thông qua qui ước của Peirce cho đồ thị khái niệm
Trang 7nhưng với hình chữ nhật thay vì hình bầu dục: hình chữ nhật lồng tốt hơn hình bầu dục vàquan trọng hơn mỗi hộp ngữ cảnh có thể được thông dịch như hộp khái niệm mà chứa đồ thị khái niệm lồng nhau Việc lồng hai phủ định chỉ ra một sự suy ra như trong hình 2.4
thể hiện một đồ thị hiện sinh và đồ thị khái niệm cho câu “If a farmer owns a donkey,
then he beats it”
Hình 2.4 EG và CG cho câu “If a farmer owns a donkey, then he beats it.”
Sự khác biệt chính giữa đồ thị hiện sinh và đồ thị khái niệm như trong hình 2.4 là sự diễn dịch của những liên kết Trong đồ thị hiện sinh, mỗi đường nhận dạng biểu diễn một biến lượng từ tồn tại gắn liền với những quan hệ Trong đồ thị khái niệm, những hộp khái
niệm biểu diễn những lượng từ tồn tại và những cung đơn thuần liên kết những nút quan
hệ đến những đối số của chúng Một điểm khác biệt khác là những nhãn kiểu đồ thị khái niệm trở thành những quan hệ monadic trong đồ thị hiện sinh Không giống đồ thị hiện
sinh mà một hình bầu dục không đánh dấu biểu diễn phủ định, biểu tượng ∼ đánh dấu
một ngữ cảnh phủ định đồ thị khái niệm Cả hai đồ thị hiện sinh và đồ thị khái niệm có
thể được biểu diễn bởi công thức sau:
Nhằm bảo toàn tầm vực đúng của những lượng từ, toán từ suy ra ⊃ không thể được sử
dụng để biểu diễn cấu trúc if-then trừ phi những lượng từ tồn tại được chuyển đến trước
và được chuyển thành với mọi
Trang 8Biểu này có thể được đọc như sau: Với mỗi x và y, nếu x là nông dân mà sở hữu con lừa
y, thì x đánh bại y Bản chất bất thường của diễn giải này đưa Kamp phát triển những cấutrúc biểu diễn ngôn ngữ (Discourse Presentation Structures (DRSs)) mà cấu trúc hợp lí là đẳng cấu với những đồ thị của Peirce (hình 2.5)
Hình 2.5 EG và DRS cho câu “If a farmer owns a donkey, then he beats it”.
Những toán tử bình thường của Kamp giống như của Peirce: lượng từ mặc định là tồn tại,toán từ Boolean mặc định là kết hợp; phủ định được biểu diễn bởi một hộp ngữ cảnh và suy ra được biểu diễn bởi hai hộp ngữ cảnh Như trong hình 2.5 trình bày, việc lồng của những ngữ cảnh của Peirce cho phép những lượng từ trong tiền đề của phép suy ra bao
gồm kết quả bên trong tầm vực của lượng từ Mặc dù Kamp đã kết nối những hộp với
mũi tên, một giả sử được tạo ra một cách chính xác về tầm vực của lượng từ Kamp và
Reyle đã đi xa hơn Peirce trong phân tích ngôn ngữ và tạo ra những luật cho việc diễn
dịch những tham chiếu trùng lặp nhưng luật bất kì phát biểu trong những thuật ngữ của kíhiệu DRS cũng có thể được áp dụng cho kí hiệu EG hoặc CG
CG trong hình 2.4 đại diện cho những động từ “owns” và “beats” như quan hệ cặp đôi
Đó là sự lựa chọn những quan hệ được lưa chọn bởi Kamp và nó cũng có thể được sử
dụng với kí hiệu EG hoặc CG Tuy nhiên, Peirce lưu ý rằng các sự kiện hoặc trạng thái
được thể hiện bởi một động từ cũng là một thực thể có thể được tham chiếu bởi một biến định lượng Điểm đó được tìm thấy lại một cách độc lập bởi những nhà ngôn ngữ học,
Trang 9những nhà ngôn ngữ máy tính và những nhà triết học Đồ thị khái niệm trong hình 2.6
trình bày một biểu diễn mà xem những sự kiện và những trạng thái như những thực thể
liên kết với những thành phần tham gia của chúng bởi những quan hệ trường hợp hoặc
vai trò theo chủ đề
Hình 2.6 đồ thị khái niệm với những quan hệ trường hợp được trình bày một cách tường
minh
Những nhãn kiểu If và Then trong hình 2.6 được định nghĩa như những từ đồng nghĩa
cho những ngữ cảnh bị phủ định Trạng thái của việc sở hữu được liên kết với những
thành phần tham gia của nó bởi những quan hệ (Expr) và (Thme) và hoạt động đánh bại bởi những quan hệ (Agnt) và (Ptnt)
3 Logic tổng quát (Common Logic)
Logic tổng quát phát triển từ hai dự án nhằm phát triển những chuẩn ANSI song song chocác đồ thị khái niệm và định dạng trao đổi tri thức (Knowledge Interchange Format).Cuối cùng hai dự án được sát nhập thành một dự án ISO để phát triển cú pháp trừu tượngchung và nền tảng lí thuyết mô hình cho một họ những kí hiệu dựa trên logic Ngoài cúpháp trừu tượng và lí thuyết mô hình, chuẩn CL đặc tả 3 thuật ngữ cụ thể mà có khả năng
Trang 10thể hiện ngữ nghĩa CL đầy đủ: định dạng trao đổi logic tổng quát (Common LogicInterchange Format (CLIF), định dạng trao đổi đồ thị khái niệm (Conceptual GraphInterchange Format (CGIF)) và kí hiệu dựa trên XML cho CL (XML-based notation for
CL (XCL)) RDF và OWL cũng có thể được xem như những thuật ngữ mà thể hiệnnhững tập con của ngữ nghĩa CL: bất kì phát biểu trong RDF hoặc OWL có thể được dịchthành CLIF, CGIF hoặc XCL nhưng chỉ một tập con có thể được dịch trở lại RDF hoặcOWL
Cú pháp CL cho phép những lượng từ trong phạm vi hàm và quan hệ những CL giữ lạiphong cách bậc nhất của lí thuyết mô hình và lí thuyết chứng minh Để hỗ trợ cú phát bậccao hơn nhưng không có sự phức tạp tính toán của ngữ nghĩa bậc cao, lí thuyết mô hình
CL sử dụng một miền D bao gồm những cá nhân, những hàm và những quan hệ
Đồ thị khái niệm là một phiên bản được định kiểu của logic từ khi ấn bản đầu tiên trongnăm 1976 nhưng đồ thị hiện sinh không định kiểu của Peirce đủ tổng quát để thể hiệnngữ nghĩa CL đầy đủ Do đó, hai phiên bản của định dạng trao đổi đồ thị khái niệm đượcđịnh nghĩa trong chuẩn ISO như sau:
- CGIF nòng cốt: Một phiên bản không định kiểu của logic thể hiện ngữ nghĩa CLđầy đủ Thuật ngữ này tương ứng với đồ thị hiện sinh của Peirce: chỉ những tác tửnguyên thủy của nó là kết hợp, phủ định và lượng từ tồn tại Nó cho phép nhữnglượng từ nằm trên nhiều quan hệ những Peirce cũng đã thử nghiệm với tùy chọn
đó cho đồ thị hiện sinh
- CGIF mở rộng: Một phần mở rộng tương thích của phần cốt lõi mà thêm vàolượng từ với mọi; những nhãn kiêu cho việc hạn chế phạm vi của những lượng từ;ngữ cảnh dạng Boolean với những nhãn kiêu If, Then, Either, Or, Equivalence vàIff; và tùy chọn của việc nạp vào văn bản bên ngoài vào trong văn bản CGIF bất
kì
Mặc dù CGIF được mở rộng là một ngôn ngữ được định kiểu, nó không được định kiểumạnh vì những nhãn kiểu chỉ được sử dụng để hạn chế phạm vi của những lượng từ
Trang 11Đồ thị khái niệm trong hình 2.1 biểu diễn câu “John is going to Boston by bus” có thểđược viết ở dạng CGIF mở rộng:
Trong CGIF, khái niệm được đánh dấu bằng những dấu ngoặc vuông và quan hệ kháiniệm được đánh dấu bằng dấu ngoặc đơn Một chuỗi kí tự bắt đầu với dấu sao, chẳng hạnnhư *x đánh dấu một nút định nghĩa mà có thể được tham chiếu bởi cùng một chuỗi bắtđầu với dấu hỏi, ?x Những chuỗi này được gọi là chuỗi tên trong Logic tổng quát biểudiễn những nhãn cùng tham chiếu trong CGIF và những biến trong những phiên bản logickhác Sau đây là biểu thức tương đương trong CLIF:
Trong chuẩn CL, CGIF mở rộng được xác định bằng việc biên dịch sang CGIF cốt lõiđược định nghĩa bằng việc biên dịch thành cú pháp trừu tượng CL Sau đây là CGIF cốtlõi không định kiểu và CLIF tương ứng cho những ví dụ trên:
Mặc dù CGIF và CLIF nhìn tương tự nhau, chúng có vài sự khác nhau cơ bản:
- Vì CGIF là một biểu diễn tuần tự của đồ thị, những nhãn như x hoặc y biểu diễnnhững kết nối giữa những nút trong CGIF nhưng lại la biểu diễn những biến trongCLIF hoặc tính toán vị từ
Trang 12- Vì các nút của đồ thị không có trật tự vốn có, một câu CGIF là một danh sáchkhông có thứ tự của nút Trừ phi được nhóm bởi dấu ngoặc ngữ cảnh, danh sách
có thể được hoán vị mà không ảnh hưởng đến ngữ nghĩa
- Toán từ trong CLIF không xuất hiện trong CGIF bởi vì sự kết hợp của những nútbên trong ngữ cảnh nào đó là không tường minh Bỏ qua những toán tử kết hợptrong CGIF có xu hướng giảm số lượng của các dấu ngoặc đơn
- Vì những nhãn trong CGIF hiển thị những kết nối của nút, chúng có lẽ được bỏqua khi chúng không cần thiết Một cách để giảm số lượng những nhãn là chuyểnnhững nút khái niệm bên trong những dấu ngoặc của những nút quan hệ
Khi được viết theo cách này, CGIF trông giống như kí hiệu khung (frame) Tuynhiên nó tổng quát hơn khung vì nó có thể biểu diễn ngữ nghĩa đầy đủ của CL
Hình 3.1 đồ thị khái niệm cho câu “If a cat is on a mat, then it is a happy pet”.
Trang 13Xem xét hình 3.1, đường nét đứt mà kết nối khái niệm [Cat] đến khái niệm [Pet] được gọi
là liên kết cùng tham chiếu mô tả rằng cả hai khái niệm tham chiếu cùng một thực thể.Quan hệ Attr mô tả rằng mèo cũng được gọi là thú cưng có một thuộc tính là thể hiện của
sự hạnh phúc
Liên kết cùng tham chiếu trong hình 3.1 được thể hiện trong CGIF bằng nhãn định nghĩa
*x trong khái niệm [Cat: *x] và nhãn ràng buộc ?x trong khái niệm [Pet: ?x] Sau đây làCGIF mở rộng và CGIF cốt lõi:
Trong đồ thị khái niệm, những hàm được biểu diễn bằng những quan hệ khái niệm đượcgọi là actor Hình 3.2 là dạng hiển thị đồ thị khái niệm cho phương trình sau đây đượcviết dưới dạng kí hiệu đại số:
Ba hàm trong phương trình này sẽ được biểu diễn bởi 3 actor được trình bày trong hình3.2 như những nút hình bình hành với những nhãn Add, Sqrt và Divide Những nút kháiniệm chứa giá trị đầu vào và đầu ra của actor Hai nút khái niệm trống chứa những giá trịđầu ra của Add và Sqrt
Trang 14Hình 3.2 những hàm CL được biểu diễn bởi những nút actor.
Trong CGIF, những actor được biểu diễn như những quan hệ với 2 loại cung: một chuỗinhững cung đầu vào và một chuỗi những cung đầu ra được tách ra bởi một thanh dọc:
Trong dạng hiển thị, những cung đầu vào của Add và Divide được đánh số 1 và 2 để mô
tả trật tự trong đó những cung được viết trong CGIF Biểu diễn sau đây là CLIF tươngứng:
Không có biến CLIF cần để biểu diễn những nhãn cùng tham chiếu *u và *v vì kí hiệuchức năng được sử dụng trong CLIF trình bày những kết nối trực tiếp
CLIF chỉ cho phép những hàm có một đầu ra nhưng CGIF mở rộng cho phép những actor
có nhiều đầu ra Actor của IntegerDivide sau đây có 2 đầu vào: số nguyên x và số nguyên
7 Cũng có 2 đầu ra: thương số u và số dư v
Khi actor này được dịch thành CGIF hoặc CLIF cốt lõi, thanh đứng được loại bỏ và actortrở thành một quan hệ thông thường với 4 đối số; việc phân biệt giữa đầu vào và đầu ra bịmất Nhằm khẳng định sự ràng buộc mà hai đối số cuối cùng phụ thuộc chức năng trênhai đối số đầu tiên, câu CGIF sau đây khẳng định rằng tồn tại 2 hàm được xác định bởinhững nhãn Quotient và Remainder mà đối với mỗi sự kết hợp của giá trị đầu vào và đầu
ra là tương đương về logic với một actor của IntergerDivide với những giá trị đầu vào vàđầu ra giống nhau: