Gần đây, Lawry [1] đã giới thiệu một khung thức mới cho mô hình ngôn ngữ, trong đó các nhãn ngôn ngữ giả sử được chọn từ một tập hữu hạn các nhãn được định nghĩa trước và tập các nhãn th
Trang 1TRƯỜNG ĐẠI HỌC BÁCH KHOA
NGUYỄN VĂN NỐI
NGHIÊN CỨU LÝ THUYẾT LẬP TRÌNH LOGIC NGÔN NGỮ DỰA TRÊN BIỂU DIỄN MỜ VÀ DIỄN DỊCH XÁC SUẤT CỦA CÁC NHÃN NGÔN NGỮ
Chuyên ngành : CÔNG NGHỆ THÔNG TINMã số ngành : 01.02.10
LUẬN VĂN THẠC SĨ
TP HỒ CHÍ MINH, tháng 12 năm 2003
Trang 2ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH
Cán bộ hướng dẫn khoa học : Tiến sĩ CAO HOÀNG TRỤ
Cán bộ chấm nhận xét 1 : Tiến sĩ DƯƠNG TUẤN ANH
Cán bộ chấm nhận xét 2 : Phó Giáo sư Tiến sĩ TRẦN VĂN HẠO
Luận văn thạc sĩ được bảo vệ tại HỘI ĐỒNG CHẤM BẢO VỆ LUẬN VĂN THẠC SĨ
TRƯỜNG ĐẠI HỌC BÁCH KHOA, ngày 08 tháng 01 năm 2004
Trang 3Tp HCM, ngày 09 tháng 01 năm 2004
NHIỆM VỤ LUẬN VĂN THẠC SĨ
Họ và tên học viên : NGUYỄN VĂN NỐI Phái : Nam
Ngày, tháng, năm sinh : Ngày 10 tháng 11 năm 1976 Nơi sinh : Tiền GiangChuyên ngành : Công Nghệ Thông Tin MSHV : 6003.11.003
I- TÊN ĐỀ TÀI :
Nghiên cứu lý thuyết lập trình logic ngôn ngữ dựa trên biểu diễn mờ và diễn dịch xác suất của các nhãn ngôn ngữ
II- NHIỆM VỤ VÀ NỘI DUNG :
và lập trình logic xác suất, đưa ra đặc tả của một ngôn ngữ lập trình logic ngôn ngữ
chương trình
III- NGÀY GIAO NHIỆM VỤ : Ngày 01 tháng 07 năm 2003
IV- NGÀY HOÀN THÀNH NHIỆM VỤ : Ngày 08 tháng 01 năm 2004
V- HỌ VÀ TÊN CÁN BỘ HƯỚNG DẪN : Tiến sĩ Cao Hoàng Trụ
CÁN BỘ HƯỚNG DẪN
Ts Cao Hoàng Trụ
CHỦ NHIỆM NGÀNH
Ts Dương Tuấn Anh
BỘ MÔN QUẢN LÝ NGÀNH
Nội dung và đề cương luận văn thạc sĩ đã được Hội Đồng Chuyên Ngành thông qua
Ngày tháng năm
Trang 4“ Kính gởi lời cảm ơn chân thành nhất đến Tiến sĩ Cao Hoàng Trụ, Quý Thầy Cô, bạn bè và gia đình đã tận tình hướng dẫn, giảng dạy, giúp đỡ và động viên để luận văn này được hoàn thành !“
12/2003 - Nguyễn Văn Nối
Trang 5Abstract
Several approaches have been proposed for modeling and computing with linguistic information in natural language, among which Lawry’s label semantics provides a clear interpretation of linguistic expressions and thus a transparent model for real-world applications Meanwhile annotated logic programs have been developed as an extension of classical logic programs offering a powerful computational framework for handling uncertain and imprecise data within logic programs This paper proposes annotated linguistic logic programs (ALLPs) that embeds Lawry’s label semantics into the annotated logic program syntax, providing a formalism for development of automated reasoning systems involving soft data as vague and imprecise concepts occurring frequently in natural language The basic notions of ALLPs are introduced, and their syntax and declarative semantics are defined And the ALLP proof procedure is developed and proved to be sound and complete with respect to the declarative semantics of ALLPs
Trang 6MỤC LỤC
Danh mục các hình vẽ 4
Chương 1 GIỚI THIỆU 5
1.1 Động cơ 5
1.2 Phạm vi nghiên cứu 7
1.3 Định nghĩa cơ bản 7
1.4 Ký hiệu quy ước 8
Chương 2 KHUNG THỨC BIỂU DIỄN NGÔN NGỮ 9
2.1 Phép gán khối 9
2.2 Ngữ nghĩa nhãn ngôn ngữ 9
2.3 Biểu thức nhãn ngôn ngữ 11
2.4 Giải mờ và độ tương hợp giữa hai biểu thức nhãn ngôn ngữ 14
Chương 3 NGỮ NGHĨA KHAI BÁO 16
3.1 Tính chất dàn của tập các biểu thức nhãn ngôn ngữ 16
3.2 Cú pháp của ALLP 18
3.3 Lý thuyết mô hình của ALLP 21
3.4 Ngữ nghĩa điểm bất động của ALLP 25
Chương 4 NGỮ NGHĨA THỦ TỤC 34
4.1 Mệnh đề thu giảm và ràng buộc 34
4.2 Thủ tục chứng minh chương trình 36
Chương 5 HIỆN THỰC 44
5.1 XSB và chương trình logic chú thích tổng quát 44
5.2 Hiện thực chương trình logic chú thích ngôn ngữ 45
5.3 Các khối chức năng của chương trình nguồn XSB 46
5.4 Chương trình minh họa 48
Chương 6 KẾT LUẬN 50
6.1 Kết quả 50
6.2 Hướng nghiên cứu trong tương lai 50
TÀI LIỆU THAM KHẢO 56
PHỤ LỤC - Chương trình nguồn 57
Trang 7Danh mục các hình vẽ
Hình 3-1 Dàn ngôn ngữ cho tập nhãn LA= {L1, L2} 18
Hình 3-2 Độ thích hợp cho SAL và YRS 21
Hình 3-3 Bước lặp lên Rp 33
Hình 5-1 Các khối chức năng của chương trình nguồn 47
Hình 5-2 Sơ đồ gọi của ALLP meta-interpreter 48
Hình 6-1 Độ thích hợp cho LAscore 55
Trang 8Chương 1 GIỚI THIỆU
1.1 Động cơ
Con người sử dụng ngôn ngữ tự nhiên như là một phương tiện quan trọng và chính yếu trong giao tiếp Việc bộ não người xử lý thông tin được thể hiện trong ngôn ngữ tự nhiên như thế nào vẫn còn là một thách thức đối với khoa học nói chung, đặc biệt là lĩnh vực trí tuệ nhân tạo Hơn nữa, trong ngôn ngữ tự nhiên, các khái niệm không chính xác, không rõ ràng và không chắc chắn xuất hiện rất thường xuyên Để máy tính có thể xử lý và tính toán trên các khái niệm này ở cấp ngôn ngữ, cần thiết phải có một khung thức để biểu diễn và cũng cần phải có một dạng thức logic cho quá trình suy diễn dựa trên khung thức này
Một phương pháp tổng quát cho việc tính toán với từ (computing with words)
do Zadeh ([9], [10]) đề xuất lấy ý tưởng tính toán dựa trên các thuật ngữ và biểu thức của ngôn ngữ tự nhiên là tính toán trên lý thuyết tập mờ và logic mờ, đặc biệt là dựa trên ý tưởng biến ngôn ngữ Biến ngôn ngữ là bộ tứ <L, T(L), Ω, M> trong đó L là tên của biến ngôn ngữ, T(L) là tập hữu hạn các nhãn (giá trị của biến ngôn ngữ), Ω là tập vũ trụ (tập khảo sát) và M là luật ngữ nghĩa Luật ngữ
nghĩa M được định nghĩa là ánh xạ kết hợp một tập con mờ của Ω với mỗi từ w trong T(L), nghĩa là tập mờ M(w) được xem là giải mã ngữ nghĩa của w∈ T(L)
sao cho x ∈Ω thì giá trị thành viên (membership value) χM(w)(x) định lượng được
độ thích hợp của từ w cho giá trị x Luật ngữ nghĩa M có thể được xác định bằng
mô hình bầu cử nhóm Việc sử dụng tập mờ rõ ràng là trung tâm của việc tính toán với từ Tập mờ cung cấp mô hình không chính xác và không rõ ràng cho hầu hết các thuật ngữ của ngôn ngữ tự nhiên Tuy nhiên, vấn đề chính trong áp dụng của phương pháp này là các hàm thành viên không có một diễn dịch rõ và vấn đề ngữ nghĩa không giải quyết được trong logic mờ chính là những định nghĩa tiên đề của những hàm t-norm và t-conorm và tính chất của những toán tử này Kết quả là rất khó xem xét bằng cách nào để tính toán được các hàm thành viên của các biểu thức ngôn ngữ
Gần đây, Lawry ([1]) đã giới thiệu một khung thức mới cho mô hình ngôn ngữ, trong đó các nhãn ngôn ngữ giả sử được chọn từ một tập hữu hạn các nhãn được định nghĩa trước và tập các nhãn thích hợp cho một giá trị được định nghĩa là tập ngẫu nhiên từ tập số đông các cá nhân bầu chọn vào tập các tập con của các nhãn Sau đó độ thích hợp của một giá trị đối với một nhãn được dẫn xuất ra từ phân bố xác suất, chính là phép gán khối trên tập các tập con các nhãn Khung
Trang 9thức này một cung cấp cách tính toán chặt chẽ cho các biểu thức ngôn ngữ được thành lập từ các toán tử kết nối logic trên các nhãn ngôn ngữ Tuy nhiên, khung thức này vẫn còn thiếu một dạng thức cho việc phát triển các chương trình logic ngôn ngữ để xây dựng các hệ thống suy diễn tự động cho tính toán mềm
Để phục vụ cho suy diễn tự động, Lloyd ([6]) đã xây dựng cơ sở lý thuyết cho ngôn ngữ lập trình logic dựa trên logic vị từ cấp một Hai khía cạnh quan trọng trong lập trình logic là ngữ nghĩa khai báo và ngữ nghĩa thủ tục Ngữ nghĩa khai báo của lập trình logic bao gồm các kiến thức cơ bản của logic vị từ cấp một, lý thuyết điểm bất động Các khái niệm trong ngữ nghĩa khai báo là các khái niệm về mệnh đề, chương trình logic, mô hình, điểm bất động, giải thuật hợp nhất… Ngữ nghĩa thủ tục trong lập trình logic liên quan đến thủ tục chứng minh phân giải SLD đúng và đầy đủ Tuy nhiên, ngữ nghĩa của chương trình logic cho rằng các lý thuyết mâu thuẫn (inconsistent theories) không có mô hình
Trong lúc đó, chương trình logic chú thích ([7]) cung cấp một dạng thức tính toán cho việc suy diễn định lượng Yù tưởng chính của chương trình logic chú thích
là chú thích các atom bằng các giá trị chân lý đa trị Một chương trình logic chú
thích là tập hợp các mệnh đề tương tự mệnh đề Horn có dạng: A:µ ← B1:µ1 &
B2:µ2 & …& Bn:µn trong đó A:µ và các Bi:µi’s là các atom được chú thích Các
thành phần chú thích µ, µi thuộc một dàn các giá trị chân lý Mỗi phần tử của dàn được xem như là hệ số tin cậy (confidence factor), hoặc là độ tin tưởng (degree of belief ), hoặc là giá trị đúng tương tự như giá trị đúng trong logic đa trị Mỗi dàn tồn tại một quan hệ thứ tự riêng phần, toán tử chặn trên nhỏ nhất, toán tử chặn dưới lớn nhất, phần tử lớn nhất và phần tử nhỏ nhất Diễn dịch tựa Herbrand là
một ánh xạ từ Herbrand base, tập các ground atom, vào một dàn chú thích Trong ([8]), khung thức này được mở rộng trong đó cả atom và term được xem là các đối
tượng được chú thích bởi các tập mờ trên các miền khác nhau Tuy nhiên, chương trình logic chú thích được xây dựng trên khái niệm dàn tổng quát vì vậy các thành phần chú thích chưa phải là giá trị đại diện thật sự cho các nhãn ngôn ngữ tự nhiên mà bộ não người tư duy và suy diễn trên các nhãn ngôn ngữ này
Với đề tài ”Nghiên cứu lý thuyết lập trình logic ngôn ngữ dựa trên biểu diễn mờ và diễn dịch xác suất của các nhãn ngôn ngữ”, luận văn này đề xuất
ra chương trình logic chú thích ngôn ngữ (ALLP) nhúng ngữ nghĩa nhãn ngôn ngữ của Lawry vào cú pháp của chương trình logic chú thích phục vụ cho việc suy diễn tự động với dữ liệu mờ và không chính xác thể hiện bằng các biểu thức nhãn ngôn ngữ
Trang 101.2 Phạm vi nghiên cứu
Mục tiêu nghiên cứu của luận văn là tập trung vào các vấn đề sau:
1 Tìm hiểu khung thức biểu diễn ngôn ngữ, diễn dịch và độ thích hợp của biểu thức nhãn ngôn ngữ, tính chất dàn của tập biểu thức nhãn ngôn ngữ
2 Đưa ra đặc tả cú pháp và ngữ nghĩa khai báo của chương trình logic chú thích ngôn ngữ bao gồm thành phần chú thích, đối tượng được chú thích, mệnh đề của chương trình, diễn dịch, các quan hệ thỏa mãn, mô hình và ngữ nghĩa điểm bất động của chương trình logic chú thích ngôn ngữ, là cầu nối liên kết giữa ngữ nghĩa khai báo và ngữ nghĩa thủ tục của chương trình
3 Nghiên cứu ngữ nghĩa thủ tục của chương trình logic chú thích ngôn ngữ bao gồm ý tưởng về mệnh đề thu giảm và ràng buộc, là cơ sở cho thủ tục chứng minh của chương trình logic chú thích ngôn ngữ, thủ tục chứng minh kiểu phân giải SLD đúng và đầy đủ
4 Hiện thực chương trình logic chú thích ngôn ngữ bao gồm định nghĩa văn phạm, biên dịch và thực thi chương trình logic chú thích ngôn ngữ
Sau chương này, chương 2 sẽ nêu tổng quan về khung thức biểu diễn nhãn ngữ của Lawry Chương 3 giới thiệu ngữ nghĩa khai báo của chương trình logic chú thích ngôn ngữ Chương 4 nghiên cứu về ngữ nghĩa thủ tục của chương trình logic chú thích ngôn ngữ Chương 5 hiện thực chương trình logic chú thích ngôn ngữ sử dụng ngôn ngữ XSB Và cuối cùng, chương 6 đưa ra kết luận và một số gợi ý nghiên cứu trong tương lai
1.3 Định nghĩa cơ bản
1 Quan hệ thứ tự riêng phần
Quan hệ R trên tập S là một thứ tự riêng phần nếu :
(a) R là phản thân : xRx ∀x∈S
(b) R là phản đối xứng : xRy và yRx ⇒ x = y ∀x,y∈S
(c) R là truyền : xRy và yRz ⇒ xRz ∀x,y,z∈S
2 Chặn trên và chặn dưới
Cho S là một tập với thứ tự riêng phần ≤
(a) a ∈ S là chặn trên (upper bound) của X ⊆ S nếu x ≤ a ∀x ∈ X
(b) b ∈ S là chặn dưới (lower bound) của X ⊆ S nếu b ≤ x ∀x ∈ X
Trang 11(c) a ∈ S là chặn trên nhỏ nhất (least upper bound) của X ⊆ S nếu a là chặn trên của X và với mọi chặn trên a’ của X : a’≥ a Chặn trên nhỏ
nhất của X nếu có là duy nhất, ký hiệu là lub(X)
(d) b ∈ S là chặn dưới lớn nhất (greatest lower bound) của X ⊆ S nếu b là chặn dưới của X và với mọi chặn dưới b’ của X : b ≥ b’ Chặn dưới lớn nhất của X nếu có là duy nhất, ký hiệu là glb(X)
3 Dàn đầy đủ
(a) Tập L thứ tự riêng phần là một dàn đầy đủ (complete lattice) nếu tồn tại lub(X) và glb(X) với mọi tập con X của L
(b) Tập L thứ tự riêng phần là một bán dàn trên (upper semi-lattice) nếu tồn tại lub(X) với mọi tập con X của L
(c) X là tập con của dàn đầy đủ L X là có định hướng (directed) nếu mọi tập con hữu hạn của X đều có một chặn trên thuộc X
4 Đơn điệu và liên tục
Cho L là một dàn đầy đủ và ánh xạ T: L→ L
(a) T là đơn điệu (monotonic) nếu x≤y thì T(x) ≤ T(y)
(b) T là liên tục (continuous) nếu T(lub(X))=lub(T(X)) với mọi tập con X có định hướng của L Aùnh xạ liên tục thì đơn điệu
5 Điểm bất động
Cho L là một dàn đầy đủ và ánh xạ T: L→ L
(a) a là điểm bất động (fixpoint) của T nếu T(a) = a
(b) a là điểm bất động nhỏ nhất (least fixpoint) của T nếu a là một điểm bất động và với mọi điểm bất động b của T thì a ≤ b Ký hiệu a= lfp(T)
(c) a là điểm bất động lớn nhất (greatest fixpoint) của T nếu a là một điểm bất động và với mọi điểm bất động b của T thì a ≥ b Ký hiệu a= gfp(T)
1.4 Ký hiệu quy ước
Các ký hiệu sau được sử dụng trong luận văn:
⊆ Quan hệ tập con
∪ Phép hội tập hợp
∩ Phép giao tập hợp
iff Nếu và chỉ nếu
Lτ Quan hệ thứ tự thông tin (A Lτ B: B cụ thể, nhiều thông tin hơn A)
N Tập hợp các số nguyên không âm
ALLP Chương trình logic chú thích ngôn ngữ
(Annotated Linguistic Logic Programs)
Trang 12Chương 2 KHUNG THỨC BIỂU DIỄN NGÔN NGỮ
Nhiều cách tiếp cận được đề nghị để mô hình và tính toán với những thông tin ngôn ngữ trong ngôn ngữ tự nhiên, trong đó cách tiếp cận của Lawry ([1]) về ngữ nghĩa của các nhãn ngôn ngữ cung cấp một diễn dịch rõ của các biểu thức nhãn ngôn ngữ và từ đó đưa ra một mô hình trong suốt cho các ứng dụng của thế giới thực Khung thức biểu diễn ngôn ngữ này dựa trên mô hình tập ngẫu nhiên của độ thích hợp của nhãn Phép gán khối trên các nhãn được dùng để tính độ thích hợp của một nhãn đối với một giá trị nào đó
2.1 Phép gán khối
Lý thuyết phép gán khối ([5]) được giới thiệu để cung cấp một dạng thức hình thức để thao tác sự không chắn mờ và không chắc chắn xác suất
Trên tập vũ trụ Ω, một tập con mờ A (A ⊆f Ω) với hàm thành viên là χA thì
χA : Ω → [0,1]
Phép gán khối m trên tập hữu hạn Ω là ánh xạ:
] 1 , 0 [ 2 :
m Ω → sao cho m(S) 1
S
=
∑Ω
⊆
Phép gán khối m trên Ω chính là một phân bố xác suất trên 2Ω
Phép gán khối cho một khái niệm mờ có thể được diễn dịch như là một phân xác suất trên những định nghĩa có thể của khái niệm Những định nghĩa này được cung cấp bởi tập những người bầu chọn khi họ được hỏi để cho định nghĩa rõ của khái niệm
Khung thức biểu diễn nhãn ngôn ngữ của Lawry bắt đầu trực quan với một
phát biểu “Bill is tall“ có nghĩa là tall là một nhãn thích hợp (appropriate label)
cho chiều cao của Bill Sau đó độ thích hợp (appropriate degree) của biểu thức nhãn đối với một giá trị được tính toán từ phân bố xác suất trên tập các tập con của các nhãn ngôn ngữ đối với giá trị đó Các định nghĩa sau đây đã được nêu trong ([1])
2.2 Ngữ nghĩa nhãn ngôn ngữ
Vấn đề diễn dịch ngôn ngữ tự nhiên quan tâm đến chiều cao của Bill được thể hiện bằng biến x trong miền khảo sát Ω Cho LA là một tập hữu hạn các nhãn
có thể ví dụ như small, medium, tall, để gán nhãn cho giá trị x và V={I1, I2 ,
Im} là một tập số đông các cá nhân bầu chọn để tạo ra hay diễn dịch cho phát biểu liên quan đến chiều cao của Bill Tất cả các nhãn trong LA phải được biết
Trang 13đầy đủ và đồng nhất đối với bất kỳ cá nhân I ∈ V Cho a ∈ Ω, mỗi cá nhân I ∈ V sẽ xác định một tập I
a
D ⊆ LA tiêu biểu cho mô tả của a ∈ Ω được cho bởi I I
a
D là
tập các nhãn thích hợp để gán nhãn cho a Ví dụ, một phát biểu có dạng “Bill is
tall ” xác nhận bới cá nhân I, được diễn dịch theo nghĩa tall ∈ I
h
D trong đó h chỉ giá trị độ cao của Bill Cho I thay đổi trên tập số đông các cá nhân V được một tập ngẫu nhiên từ V vào tập con của LA trong đó Dx(I) = I
x
D Tập ngẫu nhiên Dx
có thể được xem như là mô tả của biến x trong các nhãn của tập LA Định nghĩa phép gán khối kết hợp với Dx phụ thuộc vào xác suất ưu tiên PV trên V
Định nghĩa 2.2.1 Cho x ∈ Ω và Dx là một tập ngẫu nhiên từ V vào 2LA, phép gán
LA S : S L
I x V
D
L(x) m x(S) P ({I V|L D }) x , L LA
Rõ ràng µL là một ánh xạ từ Ω vào [0,1] và về kỹ thuật µL có thể được xem như là một hàm thành viên của tập mờ nhưng nó phản ánh chính xác ngữ nghĩa phía dưới của L và phần nào làm nổi bật cách tính toán rất riêng biệt của hàm này
Ví dụ 2.2.3 (cf [3,4]) Cho rằng 3 giáo sư được hỏi để phân loại sinh viên là yếu
(weak), trung bình (average) và giỏi (good) dựa vào điểm (SCORE) luận án từ 1 đến 5 Trong trường hợp này thì Ω= {1, 2, 3, 4, 5}, LA= {weak, average, good} và
V={I1,I2,I3} Một phép gán có thể của các tập các nhãn thích hợp như sau :
Trang 14S
L
I x I
x V
D
V
} D L
| V I { }) D L
| V I ({
P ) S ( m )
2.3 Biểu thức nhãn ngôn ngữ
Suy diễn ngôn ngữ tổng quát cần phái có một cơ chế đánh giá các biểu thức nhãn phức hợp được thành lập bằng cách sử dụng các toán tử kết nối logic như ∧,
∨, → và ¬ Ví dụ như làm thế nào để diễn dịch cho một phát biểu có dạng “Bill is
{tall} » Dx Phép phủ định được sử dụng để diễn tả khả năng không thích hợp (non-suitability) của một nhãn Phép giao (conjunction) và phép hội (disjunction)
cũng gán những ý nghĩa rõ ràng để cho phát biểu “Bill is tall and medium” được diễn dịch là cả tall và medium thích hợp đối với x, nghĩa là {tall, medium} ⊆ Dx
và phát biểu “Bill is tall or medium” được diễn dịch tall là một nhãn thích hợp đối với x hoặc medium một nhãn thích hợp đối với x, nghĩa là {tall} ⊆ Dx hoặc
{medium} ⊆ Dx Trong trường hợp phép kéo theo (implication), phát biểu “very
x thì tall cũng là một nhãn thích hợp đối với x Các toán tử logic được diễn dịch
theo ý nghĩa như sau:
(i) ¬L : L không là một nhãn thích hợp
(ii) L1∧L2 : cả L1 và L2 đều là nhãn thích hợp
(iii) L1∨L2 : L1 hoặc L2 là nhãn thích hợp
(iv) L1→L2: L2 là nhãn thích hợp nếu L1 là nhãn thích hợp
Trang 15Định nghĩa 2.3.1 Cho LA = {L1, L2, , Ln} và L(x) là nhãn thích hợp của x Tập
các biểu thức nhãn ngôn ngữ (linguistics expression) của LA, ký hiệu là LE,
được định nghĩa đệ quy như sau:
(i) Li(x) ∈ LE với i=1 n
(ii) Nếu ϕ, ρ ∈ LE thì ¬ϕ, ϕ ∧ ρ, ϕ ∨ ρ, ϕ → ρ ∈ LE
Trong phần 2.2, một nhãn sẽ xác định một tập các tập con của LA để nắm bắt ngữ nghĩa của nhãn Với bất kỳ biểu thức nhãn ngôn ngữ nào, định nghĩa hình thức này cũng được mở rộng như sau :
Định nghĩa 2.3.2 Tập nhãn thích hợp (appropriate label set) của ϕ ∈ LE là một
tập các tập con của LA (tập con của 2LA), ký hiệu λ(ϕ), được định nghĩa đệ quy như sau:
Ví dụ 2.3.3
Cho LA = {weak, average, good}, các tập nhãn thích hợp được tính như sau: λ(weak) = {{weak}, {weak, average}, {weak, good}, {weak, average, good}} λ(average) = {{average}, {average, weak}, {average, good}, {weak, average,
λ(weak∧average) = {{weak, average}, {weak, average, good}}
λ(weak∨average) = {{weak}, {average}, {weak, average}, {weak, good},
{average, good}, { weak, average, good}}
λ(weak→ average) = {{weak, average}, {weak, average, good}, {average, good}, {average}, {good}, ∅}
λ(¬weak) = {{average}, {good},{average, good}, ∅}
Trang 16Khái niệm độ thích hợp cũng được mở rộng cho biểu thức nhãn ngôn ngữ Về trực giác, µϕ(x) định lượng cho mức độ mà ϕ là một mô tả thích hợp cho x
Định nghĩa 2.3.4 Cho ϕ∈LE và x∈Ω, độ thích hợp (appropriateness degree) của
biểu thức nhãn ϕ đối với x được cho bởi:
µweak ∧average (1)=m D1({weak, average})+ m D1( {weak, average, good}) = 0,
µweak ∧average (2)=m D2({weak, average})+ m D2( {weak, average, good}) = 1
+m D1{weak, good} + m D1{average, good}+ m D1{ weak, average, good}= 1,
µweak ∨average(2) = µ weak ∨ average (3)= 1,
µweak ∨average (4) = 1
3, µ weak ∨ average (5) = 0
Trong khung thức biểu diễn ngôn ngữ của Lawry thì
µϕ∧ρ(x) ≠ min (µϕ(x), µρ(x)) và µϕ ∨ρ(x) ≠ max (µϕ(x), µρ(x))
Trang 172.4 Giải mờ và độ tương hợp giữa hai biểu thức nhãn ngôn ngữ
Để hiểu nội dung thông tin của biểu thức ngôn ngữ, chúng ta phải xem đặc
điểm ràng buộc mà biểu thức đó gán cho biến Nếu chúng ta đã biết “Bill is tall”
nhưng với nhu cầu cho biết thêm chiều cao ước lượng của Bill là bao nhiêu thì
phép giải mờ cho nhãn tall là cần thiết Trong lý thuyết tập mờ, giả sử tall được
kết hợp với tập mờ với hàm thành viên là µtall, một phương pháp giải mờ khối để đánh giá cho chiều cao của Bill là ( )
( )
tall x
tall x
x x x
µµ
Trong cách tiếp cận dựa trên ngữ nghĩa nhãn đối với ràng buộc ngôn ngữ của Lawry, phép giải mờ được kết hợp với một phân bố xác suất, nghĩa là từ một biểu thức nhãn ngôn ngữ sẽ cho ra một phân bố xác suất và từ phân bố xác suất này có thể tính được giá trị thực bằng phương pháp lấy giá trị trung bình Thật vậy, thông tin chứa trong một biểu thức nhãn ngôn ngữ ϕ có nghĩa là Dx∈λ(ϕ) Vì vậy, xác xuất của a∈Ω trong điều kiện xảy ra của phát biểu ϕ là p(a|ϕ) được đánh giá theo công thức Bayes dựa trên phân bố xác suất của Ω, PΩ, như sau:
∀ a ∈ Ω, p(a|ϕ) = Pr( x=a |ϕ) =
x
Pr( | x a)P (a)Pr( | x)P (x)
Ω Ω
∈Ω
ϕ
trong trường hợp Ω rời rạc
Và theo ngữ nghĩa nhãn ngôn ngữ thì :
ϕ Ω
ϕ Ω
∈Ω
µ µ
∑ trong trường hợp Ω rời rạc
Giả sử Ω là rời rạc và phân bố xác suất trên Ω là đồng nhất thì :
∀ a ∈ Ω, p(a|ϕ) =
x
(a) (x)
ϕ ϕ
∈Ω
µ µ
Với phân bố xác suất này, giá trị thực cho ϕ có thể được ước lượng bằng phương pháp lấy giá trị trung bình :
Trang 18|x(p.xx
Ngoài ra, sự suy diễn sắp xỉ và không chính xác cần có cơ chế đánh giá và ước lượng sai biệt về thông tin của hai biểu thức nhãn Lawry đưa ra định nghĩa độ tương hợp loại I (matching degree of type I) của biểu thức nhãn ϕ trong điều kiện xảy ra ρ, πϕ |ρ, được đánh giá theo công thức :
a a
∑
∑ trong trường hợp Ω rời rạc Tuy nhiên trong một số trường hợp thì πϕ|ϕ ≠ 1 và πϕ |¬ϕ ≠ 0, Lawry đã đưa ra định nghĩa độ tương hợp loại II (matching degree of type II) thoả mãn điều kiện này được định nghĩa như sau:
∑ trong trường hợp Ω rời rạc
Theo định nghĩa của p(a|ρ) ở trên, độ tương hợp loại II được tính như sau:
∑ trong trường hợp Ω rời rạc
Tóm lại, chương 2 đã trình bày tổng quan về khung thức biểu diễn nhãn ngôn ngữ của Lawry về ngữ nghĩa nhãn, biểu thức nhãn ngôn ngữ, độ thích hợp của biểu thức nhãn ngôn ngữ, phép giải mờ, độ tương hợp của hai biểu thức nhãn Các chương sau sẽ tiếp tục xây dựng và phát triển một dạng thức logic phục vụ cho suy diễn tự động dựa trên khung thức này – chương trình logic chú thích ngôn ngữ (ALLP)
Trang 19Chương 3 NGỮ NGHĨA KHAI BÁO
Để suy diễn và tính toán trên các nhãn ngôn ngữ vốn xuất hiện rất thường xuyên trong ngôn ngữ tự nhiên, cần phải có một khung thức (framework) để biểu diễn các nhãn ngôn ngữ và sau đó cũng phải có một dạng thức (formalism) logic
cho quá trình suy diễn tự động Ví dụ như phát biểu “Nếu tải nặng thì nước
tiếp theo sẽ xây dựng chương trình logic chú thích ngôn ngữ (ALLP) phục vụ cho quá trình suy diễn này bao gồm việc định nghĩa cú pháp, ngữ nghĩa và thủ tục chứng minh chương trình Ngữ nghĩa khai báo cho chương trình logic chú thích ngôn ngữ đã được trình bày trong RIVF’04 ([13])
3.1 Tính chất dàn của tập các biểu thức nhãn ngôn ngữ
Định nghĩa 3.1.1 Cho LE là tập các biểu thức nhãn được thành lập từ tập hữu
hạn các nhãn LA Trên LE, định nghĩa quan hệ Lτ như sau:
∀ϕ, ρ∈ LE: ϕ Lτ ρ (hoặc tương đương ρ Mτ ϕ) iff λ(ρ) ⊆ λ(ϕ)
Quan hệ “Lτ “ là một quan hệ thứ tự riêng phần do ⊆ là một quan hệ thứ tự riêng phần
Định lý 3.1.2 Cho S = {ϕ1, ϕ2,…, ϕn} ⊆ LE và ϕ = ϕ1∧ ϕ2 ∧…∧ ϕn = ∧i (ϕi)
(i) ϕi Lτ ϕ ∀i=1 n (ϕ là chặn trên của S)
(ii) Nếu ρ ∈LE: ϕi Lτ ρ ∀i=1 n thì ϕ Lτ ρ (ϕ là chặn trên nhỏ nhất của S)
Trang 20Định lý 3.1.3 Cho S = {ϕ1, ϕ2,…, ϕn} ⊆ LE và ϕ = ϕ1∨ ϕ2 ∨…∨ ϕn = ∨i (ϕi)
(i) ϕ Lτ ϕi ∀i=1 n (ϕ là một chặn dưới của S)
(ii) Nếu ρ ∈ LE : ρ Lτ ϕi ∀i=1 n thì ρ Lτ ϕ.(ϕ là chặn dưới lớn nhất của S)
Định lý 3.1.5 Tập các biểu thức nhãn ngôn ngữ được thành lập từ tập hữu hạn
các nhãn LA trên tập vũ trụ Ω tạo thành một dàn đầy đủ T:
(i) Quan hệ thứ tự riêng phần “Lτ”:
Trang 22Định nghĩa 3.2.1 Cơ sở chú thích là tập hợp các dàn biểu thức nhãn ngôn ngữ
theo định lý 3.1.5 trên các tập vũ trụ khảo sát khác nhau
thuộc một dàn trong cơ sở chú thích gọi là hằng chú thích (c-annotation), hoặc là
biến chú thích (v-annotation) , hoặc là một hàm chú thích (annotation) Một
(i) Một c-annotation
(ii) Một v-annotation
(iii) τ(τ1, τ2, ,τm ), trong đó mỗi τi (1 ≤ i ≤ m) là t-annotation và τ(τ1, τ2, ,τm ) là một công thức được thành lập từ các τi’s bằng cách sử dụng
các toán tử kết nối ¬, ∧ và ∨ sao cho nếu τ(τ1, τ2, ,τm ) được đưa về dạng chuẩn (CNF hoặc DNF) thì τ(τ1, τ2, ,τm) không chứa dạng phủ định của bất kỳ v-annotation
Thành phần chú thích có thể được xem như là một công thức trong logic mệnh đề sao cho nó không được chứa phủ định của biến chú thích nếu được đưa về dạng chuẩn Thành phần chú thích là các hàm liên tục như định lý 3.2.2 sau đây
Định lý 3.2.2 Cho τ là một ánh xạ từ T m vào T sao cho τ(τ1, τ2, ,τm ) không chứa phủ định của bất kỳ biến τi (1 ≤ i ≤ m) trong dạng chuẩn thì τ(lub(S1), lub(S2), , lub(Sm)) = lub{τ(S1,S2, ,Sn)} trong đó Si ⊆ T ∀ i=1 m Vì thế τ là hàm liên tục
Trang 23Khi đó τ(τ1, τ2, ,τm ) có dạng τk+1(τ1, τ2, ,τk+1) = (τk+1 ∨ k
β
τ (τ1, τ2, ,τk))
= lub (τk+1(τ1, τ2, ,τk,ϕ1)) ∧ ∧ lub (τk+1(τ1, τ2, ,τk,ϕn))
= lub (τk+1(τ1, τ2, ,τk,τk+1)) ■
Định nghĩa 3.2.3 Một ngôn ngữ ALLP bao gồm ngôn ngữ cấp một ([5]), thành
phần chú thích và quan hệ tương thích ánh xạ mỗi ký hiệu hàm hay vị từ của ngôn ngữ cấp một vào một dàn của cơ sở chú thích Cũng giống như AFLP, trong
ngôn ngữ ALLP, cả atom và term của ngôn ngữ cấp một được gọi là các đối
tượng (object)
đó Obj là một đối tượng và ϕ là thành phần chú thích thỏa mãn quan hệ tương
thích chú thích đối tượng của ngôn ngữ
Định nghĩa 3.2.4 Một mệnh đề ALLP là một mệnh đề tương tự mệnh đề Horn có
dạng Obj:ϕ ← Obj1:ϕ1 & Obj2:ϕ2 & & Objn:ϕn trong đó ϕ là một t-annotation, các ϕi là c- hoặc v-annotation và bất kỳ biến chú thích nào nếu xuất hiện trong ϕ thì cũng phải xuất ít nhất trong một ϕi nào đó
Một chương trình ALLP là một tập hữu hạn các mệnh đề ALLP
Trang 24Hình 3-2 Độ thích hợp cho SAL và YRS
Các luật ngôn ngữ được diễn tả trong một chương trình logic chú thích ngôn ngữ P như sau:
“Senior project managers have good or very good salaries.”
sal(X): good ∨ very good ← yrs(X) : senior (1)
“Experienced project managers have moderate salaries.”
sal(X): moderate ← yrs(X) : experienced (2)
“John has worked as a project manager for about fifteen years.”
3.3 Lý thuyết mô hình của ALLP
Đối với chương trình logic chú thích tổng quát ([6]), có hai khai niệm của ngữ nghĩa khai báo: hạn chế (restricted) và tổng quát (general) Sự khác nhau của
chúng là trong diễn dịch hạn chế, mỗi ground atom được ánh xạ đến một giá trị trong dàn chú thích trong khi đó trong diễn dịch tổng quá, mỗi ground atom được
ánh xạ đến một Iđêan của dàn chú thích Sự khác nhau nữa rất quan trọng của ngữ nghĩa khai báo hạn chế và tổng quát ở chỗ với ngữ nghĩa tổng quát đối với những những chương trình logic trên cơ sở dàn sẽ tồn tại một thủ tục chứng minh tự động đúng và đầy đủ, nhưng với ngữ nghĩa hạn chế thì điều này không đúng
Trang 25Hai khái niệm ngữ nghĩa khai báo này cũng được ứng dụng và nghiên cứu trong ALLP
Trong lý thuyết dàn ([11]), một Iđêan của một bán dàn trên (upper lattice) L với quan hệ thứ tự riêng phần Lτ là bất kỳ tập con S của L thỏa:
semi-(1) Nếu s∈ S và t Lτ s thì t ∈ S (S bị đóng dưới )
(2) Nếu s, t∈ S thì lub(s,t) ∈ S (S bị đóng với toán tử lub)
Với mỗi phần tử a∈ L, tập { x ∈ L | x Lτ a} được gọi là Iđêan chính (principal ideal) Bởi vì Iđêan chính được định nghĩa bởi phần tử lớn nhất trong nó, để đơn giản, a được ký hiệu cho Iđêan chính {x ∈ L| x Lτ a} Một tính chất quan trọng là một cho Iđêan chính p và một tập các Iđêan J nếu p Lτ lub(J) thì p
Lτ lub(F) với F là một tập con hữu hạn của J
Phép giao tập hợp của hai Iđêan cũng là một Iđêan và Iđêan nhỏ nhất (least ideal) chứa tất cả các Iđêan trong tập cho trước các Iđêan là duy nhất Vì vậy tập tất cả các Iđêan của L tạo thành một dàn đầy đủ với quan hệ tập con là thứ tự riêng phần, cũng được ký hiệu là Lτ , nghĩa là với hai Iđêan cho trước s và t, s Lτ
t iff s ⊆ t glb và lub của một tập các Iđêan chính là giao các Iđêan và Iđêan nhỏ nhất chứa chúng Phần tử lớn nhất chính là L và phần tử nhỏ nhất chính là ∅
Định lý 3.3.1 Cho S = {ϕ1, ϕ2, …, ϕn}⊆T, ϕmax = ϕ1∧ϕ2∧…∧ϕn = ∧ϕ ∈S(ϕ)=lub(S) và S={ϕ | ϕ ∈ T và ϕ Lτ ϕmax}:
(i) S là Iđêan nhỏ nhất chứa S
(ii) lub(S)= lub(S)= ∧ϕ ∈S(ϕ )
(iii) Cho ρ Lτ lub(S), tồn tại một thứ tự ρ1, ρ2, , ρk sao cho ρ = lub(ρ1,
Ta còn chứng minh S là một Iđêan nhỏ nhất
Giả sử tồn tại S’ là một Iđêan nhỏ nhất chứa S sao cho S’⊆S
Trang 26Gọi ϕm = lub(S’)
Do S’ ⊆ S ⇒ ϕm Lτ ϕmax. (1)
Mà S ⊆ S’ ⇒ ∀ϕi ∈ S : ϕi Lτ ϕm ⇒ ϕ1∧ ϕ2 ∧…∧ ϕn Lτ ϕm ⇒ ϕmax Lτ ϕm (2) Từ (1) và (2) ⇒ ϕmax = ϕm hay S’ = S
Vậy S là một Iđêan nhỏ nhất chứa S
Theo định nghĩa chặn trên nhỏ nhất của một tập con X của dàn S thì lub(X)∈
S nhưng có thể lub(X) ∉ X Ví dụ xét dàn S=[0,+∞) với quan hệ thứ tự ≤ và toán
tử lub là max Xét tập hợp X=[0,1) Rõ ràng X là một Iđêan và X⊆S nhưng
lub(X)=1∉ X Trong dàn T các biểu thức nhãn ngôn ngữ do kết quả của định lý 3.3.1 thì với mọi Iđêan S ⊆ T ta có lub(S)∈ S Hơn nữa với mọi Iđêan S sao cho
ϕ Lτ lub(S), thì sẽ tồn tại các ϕj cũng thuộc S sao cho ϕ = lubj(ϕj)
Ví dụ 3.3.2 Với dàn ngôn ngữ T ở ví dụ 3.1.6, một Iđêan S của T là S={L1∧L2,
L1, L2, L1∨¬L2, L1∨L2, ¬L1∨L2, }
Định nghĩa 3.3.3 L là chương trình logic chú thích ngôn ngữ A L là tập tất cả các
biểu thức ngôn ngữ của cơ sở chú thích Ideal(A L) là tập tất cả các Iđêan của
dàn đầy đủ tạo nên A L
tạo thành từ các ký hiệu hàm, hằng và vị từ của ngôn ngữ cấp một của L
Trang 27Định nghĩa 3.3.4 Một diễn dịch ALLP hạn chế (r-interpretation) là một ánh xạ:
I r : B L → A L
Một diễn dịch ALLP tổng quát (g-interpretation) là một ánh xạ:
I g : B L → Ideal(A L )
Định nghĩa 3.3.5 Tập các diễn dịch hạn chế tạo thành một dàn đầy đủ :
(i) Quan hệ thứ tự riêng phần cũng được ký hiệu là “Lτ”
I r1 Lτ I r2 iff ∀Obj∈ B L I r1(Obj) Lτ I r2(Obj)
(ii) lub và glb của tập S các diễn dịch hạn chế được định nghĩa :
∀Obj∈ BL : lub(S)(Obj) = lubI ∈ S{I(Obj)}
∀Obj∈ BL : glb(S)(Obj) = glbI ∈ S{I(Obj)}
(ii) Phần tử lớn nhất I⊥ : ∀Obj∈ BL : I⊥(Obj) = ⊥
Phần tử nhỏ nhất I : ∀Obj∈ BL : I⊥(Obj) =
I r2 = { ysr(john) → experienced ∧ senior,
sal(john) → good ∨ very good } Và Ir1 Lτ Ir2
Định nghĩa 3.3.7 Tập các diễn dịch tổng quát tạo thành một dàn đầy đủ:
(i) Quan hệ thứ tự riêng phần cũng được ký hiệu là “Lτ”
I g1 Lτ I g2 iff ∀Obj∈ B L I g1(Obj) Lτ I g2(Obj)
(ii) lub và glb của tập S các diễn dịch tổng quát được định nghĩa :
∀Obj∈ BL : lub(S)(Obj)= lubI ∈ S{I(Obj)}
Trang 28∀Obj∈ BL : glb(S)(Obj)= glbI ∈ S{I(Obj)}
(iii) Phần tử lớn nhất IT : ∀Obj∈ B L : IT(Obj) = T
Phần tử nhỏ nhất I∅ : ∀Obj∈ B L : I∅(Obj) = ∅
Định nghĩa 3.3.8 Cho I r là một diễn dịch hạn chế, ϕ∈T và Obj là một ground
object Quan hệ thoả mãn hạn chế được định nghĩa như sau:
(i) I r Obj:ϕ iff ϕ Lτ I r(Obj)
(ii) I r F1 & F2 &…& Fn iff I r Fi ∀i=1 n
(iii) I r (F← F1 & F2 &…& Fn) iff I r F hoặc I r F1 & F2 &…& Fn
Một diễn dịch hạn chế I r được gọi là mô hình hạn chế của công thức F nếu và
chỉ nếu I r F I r là mô hình hạn chế của chương trình P nếu và chỉ nếu I là mô
hình hạn chế của mọi công thức trong P
Định nghĩa 3.3.9 Cho I g là một diễn dịch tổng quát, ϕ∈T và Obj là một ground
object Quan hệ thoả mãn tổng quát được định nghĩa như sau:
(i) I g Obj:ϕ iff ϕ ∈ I g(Obj)
(ii) I g F1 & F2 &…& Fn iff I g Fi ∀i=1 n
(iii) I g (F← F1 & F2 &…& Fn) iff I g F hoặc I g F1 & F2 &…& Fn
Một diễn dịch tổng quát I g được gọi là mô hình tổng quát của công thức F
nếu và chỉ nếu I g F I g là mô hình tổng quát của chương trình P nếu và chỉ nếu
I g là mô hình tổng quát của mọi công thức trong P
3.4 Ngữ nghĩa điểm bất động của ALLP
Cũng giống như chương trình logic truyền thống và các chương trình logic chú thích tổng quát, mỗi chương trình logic chú thích ngôn ngữ P được kết hợp với một hàm Rp ánh xạ một diễn dịch hạn chế vào một diễn dịch hạn chế cho ngữ nghĩa hạn chế và một hàm Tp ánh xạ một diễn dịch tổng quát vào một diễn dịch tổng quát cho ngữ nghĩa tổng quát
Định nghĩa 3.4.1 Cho I là một diễn dịch hạn chế và Obj ∈ BL RP((I)(Obj) =
lub{τ(ϕ1, ϕ2, ,ϕn)| Obj:τ(ϕ1, ϕ2, ,ϕn) ← Obj1:ϕ1 & Obj2:ϕ2 & Objn:ϕn là một
Trang 29thể hiện không biến (ground instance) của một mệnh đề trong P và I Obj1:ϕ1 & Obj2:ϕ2 & Objn:ϕn} Cho rằng lub({})=
Định nghĩa 3.4.2 Cho I là một diễn dịch tổng quát và Obj ∈ BL TP((I)(Obj) =
Iđêan nhỏ nhất chứa tập {τ(ϕ1, ϕ2, ,ϕn)| Obj:τ(ϕ1, ϕ2, ,ϕn) ← Obj1:ϕ1 & Obj2:ϕ2
& Objn:ϕn là một thể hiện không biến của một mệnh đề trong P và I Obj1:ϕ1
& Obj2:ϕ2 & Objn:ϕn}
Định nghĩa 3.4.3 Các bước lặp lên của Rp và Tp được định nghĩa như sau:
1 RP↑0 = I (∀Obj∈ B L : I (Obj)= )
RP↑α = RP(RP↑(α-1)) nếu α là phần tử thứ tự kế tiếp
RP↑α = lub(RP↑β | β< α) nếu α là giới hạn thứ tự
2 TP↑0 = I∅ (∀Obj∈ B L : I∅(Obj) = {} )
TP↑α = TP (TP↑(α-1)) nếu α là phần tử thứ tự kế tiếp
TP↑α = lub(TP↑β | β<α) nếu α là giới hạn thứ tự
Định lý 3.4.4 Rp và Tp đơn điệu, nghĩ là:
(i) Nếu I r1 Lτ I r2 thì RP (I r1) Lτ RP (I r2 ) với I r1 , I r2 là các diễn dịch hạn chế (ii) Nếu I g1 Lτ I g2 thì TP (I g1) Lτ TP (I g2 ) với I g1 , I g2 là các diễn dịch tổng quát
Chứng minh:
(i) I g1 Lτ I g2 ⇒ TP (I g1) Lτ TP (I g2)
ϕ= τ(ϕ1, ,ϕn )
S1 = {ϕ | Obj:ϕ ← Obj1:ϕ1 ,…, Obj2:ϕ2 và I g1 Obj1:ϕ1 ,…, Obj2:ϕ2}
= τ(I g1(Obj1), ,I g1(Objn))
S2 = {ϕ | Obj:ϕ ← Obj1:ϕ1 ,…, Obj2:ϕ2 và I g2 Obj1:ϕ1 ,…, Obj2:ϕ2}
= τ(I g2(Obj1), ,I g2(Objn))
Do I g1 (Obji) ⊆ I g2 (Obji) nên S1 ⊆ S2 (tính chất của ánh xạ A ⊆ B ⇒ f(A)⊆ f(B))
⇒ S1 ⊆ least Ideal (S2)
⇒ least Ideal (S1) ⊆ least Ideal(S2)
⇒ TP (I g1) Lτ TP (I g2)
Trang 30(ii) I r1 Lτ I r2 ⇒ RP (I r1) Lτ RP (I r2)
ϕ= τ(ϕ1, ,ϕn )
S1 = {ϕ | Obj:ϕ ← Obj1:ϕ1 ,…, Obj2:ϕ2 và I r1 Obj1:ϕ1 ,…, Obj2:ϕ2}
= τ(I r1(Obj1), ,I r1(Objn))
S2 = {ϕ | Obj:ϕ ← Obj1:ϕ1 ,…, Obj2:ϕ2 và I g2 Obj1:ϕ1 ,…, Obj2:ϕ2}
= τ(I r2(Obj1), ,I r2(Objn))
Do I r1 (Obji) ⊆ I r2 (Obji) nên S1 ⊆ S2 (tính chất của ánh xạ A ⊆ B thì f(A) ⊆ f(B) )
⇒ ϕ Lτ lub(S2) ∀ϕ ∈ S1
⇒ lub(S1) Lτ lub(S2)
⇒ RP (I r1) Lτ RP (I r2) ■
Vì RP↑0 = I là diễn dịch hạn chế nhỏ nhất nên RP↑0 Lτ RP↑1 và RP↑1 =
RP(RP↑0) Lτ RP( RP↑1) = RP↑2 do tính đơn điệu của RP Bằng cách quy nạp,
RP↑n Lτ RP↑(n+1) với mọi n∈N Tương tự , TP↑n Lτ TP↑(n+1) với mọi n∈N
Định lý 3.4.5 Cho P là một chương trình logic chú thích ngôn ngữ, I g là một diễn
dịch tổng quát và I r là một diễn dịch hạn chế
(i) I g là mô hình tổng quát của P nếu và chỉ nếu TP(I g) Lτ I g
(ii) I r là mô hình hạn chế của P nếu và chỉ nếu RP(I r) Lτ I r
Chứng minh:
(i)
I g là mô hình của P nếu và chỉ nếu với mỗi mệnh đề Obj:ϕ ←Obj1:ϕ1 ,…, Objn:ϕn trong P ta có I g Obj:ϕ ←Obj1:ϕ1 ,…, Objn:ϕn hay nếu I g Obj1:ϕ1 ,…, Objn:ϕn thì I g Obj:ϕ ⇒ ϕ ∈ I g (Obj) Xét tất cả các mệnh đề thì {ϕ} ⊆ I g(Obj)
và do I g (Obj) là một Iđêan nên Iđêan nhỏ nhất chứa {ϕ} cũng là tập con của I g
(Obj) hay TP(I g )(Obj) ⊆I g(Obj) hay TP(I g) Lτ I g
(ii)
Trang 31I r là mô hình của P nếu và chỉ nếu với mỗi mệnh đề Obj:ϕ ←Obj1:ϕ1,…,Objn:ϕn
trong P ta có I r Obj1:ϕ1 ,…, Objn:ϕn hay nếu I r Obj1:ϕ1 ,…, Objn:ϕn thì I r
Obj:ϕ ⇒ ϕ Lτ I r (Obj) Xét tất cả các mệnh đề thì lub{ϕ}Lτ I r (Obj) hay
RP((I)(Obj) Lτ I r(Obj).■
Định lý 3.4.6 Cho P là một chương trình logic chú thích ngôn ngữ
(i) lfp(RP)=glb{I | RP(I)=I}= glb{I | RP(I)Lτ I} =MrP là mô hình hạn chế nhỏ nhất của P
(ii) lfp(TP)=glb{I | TP(I)=I}= glb{I |TP(I) Lτ I}=MgP là mô hình tổng quát nhỏ nhất của P
Chứng minh:
Sử dụng tính đơn điệu của RP và TP
(i)
Đặt GI = { I | RP(I)LτI } và G= glb (GI) Ta chứng minh G ∈ GI
G Lτ I ∀I ∈ GI ⇒ RP(G) Lτ RP (I) ∀I ∈ GI (do RP đơn điệu )
Mà RP(I)Lτ I nên RP(G) Lτ I ∀I∈GI ⇒ RP(G) Lτ G ( do G là glb của GI)
Vậy G ∈ GI
Tiếp tục, chứng minh G là điểm bất động , chỉ cần chứng minh G Lτ RP (G)
Ta có RP(G) Lτ G (do G ∈ GI từ chứng minh trên)
Do RP là đơn điệu ⇒ RP(RP(G)) Lτ RP(G)
⇒ RP(G) ∈ GI ⇒ G Lτ RP(G) ⇒ G = RP(G) : G là điểm bất động
Do G là glb nên G cũng là least điểm bất động Vậy lfp(RP)= glb{I | RP (I) Lτ I} Đặt G’= glb{I | RP(I)=I} Do G’ là điểm bất động ⇒ G Lτ G’
Hơn nữa {I | RP(I)=I} ⊆ { I | RP(I) Lτ I } ⇒ G’ Lτ G ⇒ G’≡ G
(ii) Chứng minh tương tự ■
Trang 32Định lý 3.4.7 Tp liên tục, nghĩa là Tp(lubi {I i}) =lubi{Tp(I i)}
Chứng minh:
Gọi I 1 , I 2 ,…,I n là thứ tự có định hướng các diễn dịch của P (mỗi thứ tự con
hữu hạn I i1 , I i2 , … I ik có chặn trên là I i : I ij Lτ I i, j=1 k)
Đối với bất kỳ tập diễn dịch {J k }, lub(J k) là một diễn dịch mà đối với mỗi
ground object Obj thì J(Obj) là Iđêan nhỏ nhất chứa tập ∪J i (Obj) I kLτ lub(I i) ∀k và do TP là đơn điệu nên TP(I k)LτTP(lub(I i)) ∀k Vì với mọi ground object Obj thì
TP(lub(I i))(Obj) là một Iđêan nên lub(TP(I i))Lτ TP(lub(I i)) (*)
Cho Obj là một ground object sao cho ϕ ∈ TP(lub(I i))(Obj) Tồn tại một ground instance của một mệnh đề trong P có dạng Obj:τ(ϕ1, ϕ2, … ϕn) ← Obj1:ϕ1
& Obj2:ϕ2 &…& Objn:ϕn với ϕ = τ (ϕ1, ϕ2, … ϕn) và Objj:ϕj thoả lub(I i) Điều này có nghĩa là với mọi j = 1 n tồn tại νj1,…,νjkj sao cho :
1 Objj :νjl thỏa mãn I i nào đó (1)
2 ϕi = lub(νj1,…, νjkj)
Vì diễn dịch I i là có định hướng nên tồn tại I io nào đó thoả Objj :νjl Do (1)
nên I io Obj1 : ν1 m1 &….& Objn:νnmn với bất kỳ m1,…, mn sao cho 1 ≤ m1 ≤ k1,
… 1≤ mn ≤ kn Vì vậy :
τ(ν1 m1,…,νnmn) ∈ TP(I io)(Obj) (2)
Từ định lý 3.2.2, ta có thành phần chú thích τ là hàm liên tục, nghĩa là:
Obj:τ(ϕ1,…ϕn) = Obj:τ(lub(ν11,…,ν k1 ),…,lub(νn1,…,νnkn ))
= Obj:lub(τ(ν1 m1,… νnmn))
TP(I io)(Obj) là một Iđêan nên bị đóng với toán tử lub và do (2) nên :
τ(ϕ1, …ϕn) ∈ lub(TP(I i)(Obj)) ⇒ TP (lub(I i )) Lτ lub(TP(I i)) (**)
Từ (*) và (**) ⇒ TP (lub(I i)) = lub(TP(I i)) ⇒ TP là liên tục ■
Định lý 3.4.8 Cho P là một chương trình logic chú thích ngôn ngữ :
TP ↑ω=lfp(TP) =MgP
Chứng minh:
Trước hết chứng minh ∀α TP↑α Lτ lfp(TP)
Trang 33Nếu α là thứ tự kế tiếp, TP↑α = TP(TP↑(α -1)) Lτ TP(lfp(TP))= lfp(TP) do tính đơn điệu của TP và giả thiết qui nạp
Nếu α là giới hạn thứ tự , TP↑α = lub (TP↑β :β <α) Lτ lfp( TP ) theo giả thiết qui nạp Vậy ∀α TP↑α Lτ lfp(TP) (*)
Tiếp theo chứng minh TP↑ω là điểm bất động
Ta có {TP↑n:n ∈ω} là tập có định hướng vì TP là đơn điệu
TP (TP↑ω) = TP( lub(TP↑n:n∈ω)) = lub(TP(TP↑n:n∈ω)) = TP↑ω do TP liên tục Vậy TP↑ω là điểm bất động (**)
Từ (*) và (**) ⇒ TP↑ω = lfp (TP) = MgP (do Định lý 3.4.3 ) ■
Định lý 3.4.9 Cho P là chương trình logic chú thích ngôn ngữ
(i) ∀ Obj:ϕ , P Obj:ϕ iff ϕ∈TP↑ω(Obj)
(ii) Nếu Obj là một object sao cho ϕ ∈TP↑ω (Obj) thì tồn tại một số nguyên n sao cho ϕ ∈TP↑n(Obj)
Chứng minh:
(i)
∀ Obj:ϕ , P Obj:ϕ nếu và chỉ nếu ϕ ∈TP↑ω(Obj)
P Obj:ϕ ⇒ Nếu I là mô hình của P thì I Obj:ϕ ⇒ ϕ ∈ I(Obj)
MgP = TP↑ω là mô hình nhỏ nhất của P ⇒ ϕ ∈ TP↑ω (Obj)
Ngược lại nếu ϕ ∈ TP↑ω (Obj) = MgP (Obj)
Với mọi diễn dịch I sao cho TP(I) Lτ I thì MgP Lτ Ido MgP = glb{I | TP(I) Lτ I}
nên MgP (Obj) ⊆ I(Obj) ⇒ ϕ ∈ I(Obj) hay I Obj:ϕ Hơn nữa nếu TP (I) Lτ I thì I là mô hình của P Vậy với mọi I là mô hình của P thì I Obj:ϕ hay P Obj:ϕ
(ii)
Vì TP↑0=I∅ là diễn dịch nhỏ nhất nên TP↑0LτTP↑1 Hơn nữa TP↑1 = TP(TP↑0) Lτ
TP (TP↑1)= TP↑2 do TP là đơn điệu Bằng cách qui nạp TP↑n Lτ TP↑n+1 ∀n >0 Vì vậy (TP↑ω)(Obj) = ∪TP↑n(Obj) mà ϕ ∈(TP↑ω)(Obj) nên ϕ phải thuộc một trong những thành phần TP↑n(Obj) ■
Trang 34Theo định lý 3.4.7, TP thì liên tục nhưng RP thì không liên tục Sau đây là ví dụ Rp không liên tục
Ví dụ 3.4.10
Cho LA1= {l 1 , l 2} với dàn T1 = {⊥, l 1 ∧¬l 2 , l 1 ∧l 2, ¬l 1 ∧l 2, ¬l 1 ∧¬l 2 , l 1 , l 2, ¬l 1,
¬l 2 , l 1 ∨¬l 2 , l 1 ∨l 2, ¬l 1 ∨l 2, ¬l 1 ∨¬l 2, } là thành phần chú thích cho vị từ Q và
Từ (*) và (**), Rp(lub(I 1 ,I 2)) ≠ lub(Rp(I 1), Rp (I 2))
Định lý 3.4.10 Cho P là chương trình logic chú thích ngôn ngữ
Trang 35Ta chứng minh lub(TP↑ω) Lτ RP↑ω và ngược lại
lub(TP↑ω) Lτ RP↑ω được chứng minh bằng qui nạp theo k: lub(TP↑k) Lτ RP↑k Với k=0 : TP↑0 = I∅ Lτ I = RP ↑0
Giả sử TP↑k Lτ RP ↑k
Ta có TP↑(k+1)= TP(TP↑k) Lτ RP(TP↑k) Lτ RP(RP↑k) =RP↑(k+1) do TP(I)(Obj) ⊆
RP(I)(Obj) và RP là đơn điệu Vậy với mọi k thì TP↑k (Obj) ⊆ RP↑ω (Obj)
⇒ lub(TP↑ω) (Obj) ⊆ RP↑ω (Obj)
⇒ lub (TP↑ω) Lτ RP ↑ω (*)
Chứng minh chiều ngược lại, ta chứng minh ∀i lub(TP↑ω)(Obj) ⊇ RP↑i (Obj) và sau đó với ∀Obj lub(TP↑ω)(Obj) ⊇ lub{RP↑ i(Obj) | i=1 n} = RP↑ω (Obj)
Theo định nghĩa lub{}= ⇒ I = lub(I∅)
Giả sử lub(TP↑ω)(Obj) ⊇ RP↑k (Obj), ta chứng minh điều này đúng với k+1 Theo định nghĩa của RP , RP(RP↑k)(Obj)=lub( Obj:τ(ϕ1, ϕ2, ,ϕn) ← Obj1:ϕ1 & Obj2:ϕ2 & Objn:ϕn thuộc P và RP↑k Obj1: ϕ1 & Obj2: ϕ2 & Objn: ϕn)
Theo giả thiết quy nạp thì lub(TP↑ω) Obj1:ϕ1 & Obj2:ϕ2 & Objn:ϕn hay ϕi Lτ
lub((TP↑ω)(Obji)) Theo định lý 3.3.1, với Iđêan (TP↑ω)(Obji) sẽ tồn tại các j
i
ϕ ∈ (TP↑ω)(Obji) sao cho lubj( j
1
ϕ , j 2
ϕ , , j
n
ϕ )|j=1,2,…} = τ(ϕ1, ϕ2, ,ϕn) Vì vậy RP(RP↑k)(Obj) ⊆ lub(TP↑ω)(Obj) hay RP↑(k+1)(Obj) ⊆ lub(TP↑ω)(Obj)
Vậy ∀k (RP↑k)(Obj) ⊆ lub(TP↑ω)(Obj)
⇒ lub(TP↑ω)(Obj) ⊇ lub{(RP↑k)(Obj)|k=1,2 } = (RP↑ω)(Obj)
Trang 36⇒ RP (Rp↑i) (Obj) = lub (Tp↑(i+1) (Obj)) Lτ lub (Tp↑ω (Obj)) = Rp ↑ ω (Obj) ∀ i
⇒ RP (Rp↑i) (Obj) Lτ Rp↑ω (Obj) ⇒ RP (Rp↑ω) Lτ Rp↑ω (2)
Từ (1) và (2) , ta được Rp(Rp↑ω )= Rp↑ω
(iii) RP ↑ω = lfp (RP)
Theo (ii) thì RP ↑ω = RP(RP ↑ω) ⇒ RP ↑ω là điểm bất động Ta chứng minh
RP↑ω là điểm bất động nhỏ nhất
Gọi I rf là một điểm bất động của Rp nghĩa là Rp(I rf ) = I rf
Ta có I Lτ I rf và do Rp đơn điệu nên I Lτ Rp(I ) Lτ Rp(I rf ) = I rf hay RP↑1
Lτ I rf, tương tự lặp k lần ta có RP↑k ≤ I rf ∀k ⇒ lub({RP ↑k | k=1,2…}) Lτ I rf hay RP↑ω Lτ I rf ⇒ RP↑ω là một least điểm bất động của RP hay RP↑ω = lfp (RP)
Do định lý 3.4.6 thì lfp(RP) = MrP Vậy RP↑ω = lfp(RP) = MrP ■
Ví dụ 3.4.11 Cho P là chương trình logic chú thích ngôn ngữ ở ví dụ 3.2.5, Bước
lặp lên của RP được tính như sau:
R P↑0
R P ↑1 (3) experienced ∧ senior
R P ↑2 (1) experienced ∧ senior good ∨ very good
R P ↑3 (2) experienced ∧ senior moderate ∧ (good ∨ very good)
R P↑ω experienced ∧ senior moderate ∧ (good ∨ very good)
Hình 3-3 Bước lặp lên Rp
Vì vậy, P sal(john) : moderate ∧ (good ∨ very good)
Nếu cần thiết, giá trị thực của sal(john) có thể được giải mờ từ biểu thức
ngôn ngữ moderate∧(good∨very good) được định nghĩa ở chương 2
Tóm lại, chương này đã trình bày cú pháp và ngữ nghĩa khai báo cho chương trình logic chú thích ngôn ngữ bao gồm các định nghĩa về cú pháp, lý thuyết mô hình, quan hệ thỏa mãn và lý thuyết điểm bất động Điểm bất động là cầu nối liên kết giữa ngữ nghĩa khai báo và ngữ nghĩa thủ tục trong chương trình logic chú thích ngôn ngữ