Trong luận văn này tác giả đề ra một cách tiếp cận mới cho việc tích hợp tri thức nhằm khắc phục những hạn chế của các tiếp cận hiện có. Ý tưởng chính của tiếp cận này như sau: Để đạt được thỏa thuận giữa các bên, ta sẽ để cho các bên tranh luận với nhau, tức là các bên sẽ dùng lý lẽ, lập luận để bảo vệ cho các đòi hỏi của mình đồng thời phản bác lại các đòi hỏi của đối phương, bên nào có nhiều chứng cứ, lập luận tốt hơn thì bên đó sẽ giành được nhiều lợi ích hơn.
Trang 1i
LỜI CAM ĐOAN Tôi xin cam đoan luận văn “Tích hợp tri thức sử dụng các kỹ thuật tranh cãi" là công trình nghiên cứu của riêng tôi Các số liệu,
kết quả được trình bày trong luận văn là hoàn toàn trung thực Tôi đã trích dẫn đầy đủ các tài liệu tham khảo, công trình nghiên cứu liên quan Ngoại trừ các tài liệu tham khảo này, luận văn hoàn toàn là công việc của riêng tôi
Luận văn được hoàn thành trong thời gian tôi là học viên tại Khoa Công nghệ Thông tin, Trường Đại học Công nghệ, Đại học Quốc gia
Hà Nội
Hà Nội, ngày 19 tháng 9 năm 2016
Học viên
Trang 2LỜI CAM ĐOAN i
MỞ ĐẦU iv
Chương 1 Tổng quan về logic và tích hợp tri thức 1
1.1 Tổng quan về logic 1
1.1.1 Logic cổ điển 1
1.1.2 Logic khả năng 2
1.2 Tổng quan về tích hợp tri thức 3
1.2.1 Biểu diễn tri thức 3
1.2.2 Duyệt tri thức 6
1.2.2.1 Mô hình AGM 6
1.2.2.1.1 Bộ định đề AGM cho duyệt tri thức 6
1.2.2.1.2 Bộ định đề AGM cho loại bỏ tri thức 7
1.2.2.2 Hàm lựa chọn 7
1.2.2.3 Cố thủ tri thức 7
1.2.2.4 Hệ thống các khối cầu tri thức 7
1.2.3 Tích hợp tri thức 8
1.2.3.1 Một mô hình cho tích hợp với ràng buộc toàn vẹn 8 1.2.3.2 Tích hợp ở mức cú pháp 9
1.2.3.3 Phương pháp dựa trên khoảng cách 10
Chương 2 Mô hình tranh luận 12
2.1 Sự chấp nhận của tranh luận 12
2.1.1 Mô hình tranh luận 12
2.1.2 Ngữ nghĩa cố định và ngữ nghĩa cơ sở (hoài nghi) 13 2.1.3 Điều kiện cho sự trùng giữa ngữ nghĩa khác nhau 15 2.2 Tranh luận, trò chơi n-người và bài toán hôn nhân bền vững 16 2.2.1 Tranh luận trong trò chơi n-người 16
2.2.2 Tranh luận và bài toán hôn nhân bền vững 16
Chương 3 Tích hợp tri thức có ưu tiên trong mô hình logic khả năng 17
Trang 3iii
3.1 Tích hợp tri thức bằng tranh luận trong logic khả năng
17
3.2 Định đề và một số tính chất 20
Chương 4 Thực nghiệm và đánh giá 21
4.1 Môi trường thực nghiệm 22
4.2 Quá trình thực nghiệm 22
4.2.1 Giới thiệu về chương trình 22
4.2.2 Tập dữ liệu thực nghiệm 22
4.2.3 Kết quả thực nghiệm thu được của tập dữ liệu thứ nhất 22 4.2.4 Kết quả thực nghiệm thu được của tập dữ liệu thứ hai 22 4.2.5 Đánh giá kết quả thực nghiệm và hướng nghiên cứu tiếp theo 23 Kết luận 24
Trang 4MỞ ĐẦU
Ngày nay tích hợp tri thức là một trong các vấn đề nghiên cứu với các ứng dụng quan trọng trong Khoa học máy tính Mục tiêu chính của tích hợp tri thức là nhằm đạt được các tri thức chung từ các nguồn tri thức riêng lẻ Vấn đề này được ứng dụng rộng rãi trong nhiều lĩnh vực của khoa học máy tính như tích hợp dữ liệu [1], khôi phục thông tin [2], gộp dữ liệu cảm biến [3], các hệ đa tác tử [4] và các hệ thống
đa phương tiện (Multimedia) [5, 6]
Vấn đề tích hợp tri thức bắt đầu được quan tâm, nghiên cứu, phát triển và áp dụng cho một số lĩnh vực trong đời sống, xã hội, kinh tế,
an ninh quốc phòng, Một trong các ví dụ thực tế đó là hiện nay đã có một số hệ thống dự báo kinh tế của Việt Nam như hệ thống của CIA1,
hệ thống của WordBank2 , mỗi hệ thống đưa ra một bộ các chỉ số phát triển của nền kinh tế nước ta Tuy nhiên bộ Kế hoạch đầu tư không thể lấy ngay kết quả của dự báo từ một trong các hệ thống này
để báo cáo lên Chính phủ hay Quốc hội được Thay vào đó Trung tâm Thông tin và Dự báo kinh tế - xã hội quốc gia của bộ Kế hoạch và đầu
tư phải tổng hợp thông tin từ các nguồn đó thành một thông tin duy nhất mà phản ánh được thực trạng kinh tế của Việt Nam rồi sau đó mới báo cáo kết quả này lên Chính phủ hay Quốc hội
Hiện nay có nhiều cách tiếp cận để tích hợp tri thức khác nhau như [7, 8] Tuy nhiên tất cả các cách tiếp cận này đều dựa trên giả thuyết là các bên tham gia đều có tính cộng tác, tức là để các bên đạt được thỏa thuận chung khi mà mỗi bên đều có một số đòi hỏi và các đòi hỏi này mâu thuẫn nhau thì các bên cần thỏa thuận với nhau để mỗi bên hy sinh đi một số đòi hỏi của mình nhằm đạt được sự đồng
1 https://www.cia.gov/library/publications/the-world-factbook/geos/vm.html.
2 http://www.worldbank.org/en/country/vietnam.
Trang 5v
thuận Các tiếp cận này chưa phản ánh được đúng cách làm việc trong thực tế Chẳng hạn như bên A có các đòi hỏi là hoàn toàn hợp lý và có đầy đủ bằng chứng, lập luận để bảo vệ ý kiến của mình còn bên B các đòi hỏi hoàn toàn vô lý và không có bằng chứng lập luận gì cả Nếu theo các tiếp cận truyền thống, hai bên sẽ cùng bớt đi một số đòi hỏi nào đó của mình để đạt được một thỏa thuận chung, điều này là vô lý
vì bên B sẽ được hưởng lợi mặc dù mọi đòi hỏi đều không hợp lý và bên A sẽ bị mất một phần quyền lợi chính đáng của mình
Trong luận văn này tôi đề ra một cách tiếp cận mới cho việc tích hợp tri thức nhằm khắc phục những hạn chế của các tiếp cận hiện có
Ý tưởng chính của tiếp cận này như sau: Để đạt được thỏa thuận giữa các bên, ta sẽ để cho các bên tranh luận với nhau, tức là các bên sẽ dùng lý lẽ, lập luận để bảo vệ cho các đòi hỏi của mình đồng thời phản bác lại các đòi hỏi của đối phương, bên nào có nhiều chứng cứ, lập luận tốt hơn thì bên đó sẽ giành được nhiều lợi ích hơn
Để làm được điều này, một mô hình tích hợp cơ sở tri thức khả năng được đề xuất dựa trên một mô hình tranh luận nổi tiếng được đề xuất bởi GS Phạm Minh Dũng [24] Bên cạnh đó, một tập các tiên đề cho tích hợp tri thức bằng tranh luận cũng được giới thiệu và các tính chất logic của nó cũng được đem ra thảo luận Một chương trình thực nghiệm tích hợp tri thức dựa trên mô hình đã đề xuất và các đánh giá
về nó được tiến hành Nội dung chính của luận văn bao gồm các phần: Tổng quan về logic và tích hợp tri thức Chương này trình bày các kiến thức cơ sở về logic và tích hợp tri thức bao gồm: logic cổ điển, logic khả năng, biểu diễn tri thức, duyệt tri thức và tích hợp tri thức
Mô hình tranh luận Chương này trình bày về mô hình tranh luận của GS Phạm Minh Dũng cùng với các ngữ nghĩa của mô hình này
Các mô hình tích hợp tri thức bằng tranh cãi Chương này là nội dung chính của luận văn, trong đó trình bày cách tiếp cận để giải
Trang 6quyết thông tin mâu thuẫn bằng tích hợp tri thức có ưu tiên trong mô hình logic khả năng
Thực nghiệm và đánh giá Trong chương này tôi tiến hành cài đặt một chương trình tích hợp tri thức như trong mô hình đề xuất và đánh giá các kết quả đạt được
Tóm lược những kết quả đã đạt được của luận văn và đưa ra định hướng nghiên cứu trong tương lai
Trang 7Một mô hình của công thức 𝜙 là một thế giới có thể 𝜔 làm
cho 𝜙 đúng, ký hiệu là 𝜔 ⊨ 𝜙 Với Φ là một tập của các công thức, [Φ] biểu diễn tập các mô hình của Φ, nghĩa là [Φ] = {𝜔 ∈ 𝒲 |∀𝜙 ∈ Φ (𝜔 ⊨ 𝜙)} Chúng ta sử dụng ký hiệu [𝜙] để thay thế cho[{𝜙}] Chúng ta cũng sử dụng ký hiệu ⊢ để biểu diễn cho mối quan hệ hệ quả, ví dụ {𝜙, 𝜓} ⊢ 𝜃 nghĩa là 𝜃 là hệ quả logic của {𝜙, 𝜓}
Một cơ sở tri thức (phẳng) 𝐾 tập hữu hạn các công thức, nó
có thể xem là tương đương về logic với công thức khi nó là kết hợp của tất cả các công thức của K Cho K1,,K n là n cơ
Trang 8sở tri thức và một số trong số chúng có thể tương đương logic
với nhau, một tập tri thức E của n cơ sở tri thức là một đa tập
𝜙 ít nhất bằng 𝑎 (𝑁(𝜙) ≥ 𝑎) Chúng ta ký hiệu B* là cơ sở tri thức phẳng liên kết với B, cụ thể là các cơ sở tri thức thu được từ B bằng
cách loại bỏ đi các trọng số của công thức (𝐵∗= {𝜙𝑖|(𝜙𝑖, 𝑎) ∈ 𝐵})
Cho một cơ sở tri thức khả năng (PKB) B, chúng ta có thể tạo ra
một hàm phân bố có thể duy nhất ký hiệu là 𝜋𝐵 như sau [26]:
Trang 93
độ chắc chắn ít nhất bằng a (Ba={B*|(,b)B,ba})
(tương ứng, lớn hơn a (B>a={B*|(,b)B,b>a}))
Định nghĩa 1.3 Cho B1 và B2 là hai PKB B1 và B2 được gọi là
2
1 = B
Định nghĩa 1.4 (Độ không nhất quán) Độ không nhất quán của PKB
𝐼𝑛𝑐(𝐵) = max {𝑎𝑖: 𝐵≥𝑎𝑖 là không nhất quán}
Định nghĩa 1.5 (Ngưỡng) Cho (,a) là một công thức trong B
)
,
( a được gọi là ngưỡng trong B nếu: (B(,a))a và (,a)
được gọi là ngưỡng chặt trong B nếu: B>a
Định nghĩa 1.6 (Suy luận hợp lý) Cho B là một PKB Công thức
được gọi là kết luận hợp lý của B nếu: B>Inc(B)
Định nghĩa 1.7 (Suy luận khả năng) Cho B là một PKB Công thức
)
,
)(
>
(2),(1)B>Inc(B) a Inc B và b>a,B>b
1.2 Tổng quan về tích hợp tri thức
1.2.1 Biểu diễn tri thức
Tích hợp tri thức là một khái niệm chung Trong các vấn đề kinh
tế - xã hội, tích hợp tri thức liên quan đến vấn đề nghiên cứu của các lĩnh vực: kinh tế, chính trị, văn hóa, giáo dục Trong trí tuệ nhân tạo, khái niệm về tri thức đôi khi được hiểu với khái niệm về niềm tin và tích hợp tri thức được hiểu là quá trình duyệt tri thức hay tích hợp niềm tin [11] Duyệt tri thức (Mục 1.2.2) nghiên cứu về quá trình thay
Trang 10đổi tri thức Có rất nhiều công trình nghiên cứu về vấn đề này, trong
đó có [11, 12] Tích hợp tri thức (Mục 1.2.3) nghiên cứu phương pháp
để tổng hợp các cơ sở tri thức của các đối tượng thành một tri thức chung [13, 14]
Trong trí tuệ nhân tạo, có hai cách tiếp cận chính để đối phó với các thông tin mâu thuẫn đã được phân biệt:
- Cách tiếp cận thứ nhất bao gồm việc tích hợp các thông tin và xây dựng một tập thông tin nhất quán có thể biểu diễn cho kết quả của việc tích hợp
- Cách tiếp cận thứ hai đó là "sống chung" với mâu thuẫn bằng cách sử dụng các paraconsistent logics [29, 30]
Trong luận văn này tôi tập trung vào cách tiếp cận thứ nhất Đó là giải quyết mâu thuẫn bằng kỹ thuật tích hợp tri thức
Một cách tổng quát, bài toán tích hợp tri thức dựa trên cấu trúc logic được phát biểu như sau: Cho một tập các cơ sở tri thức, mỗi có
sở tri thức được biểu diễn bằng một tập các công thức lôgic Hãy xác định một cơ sở tri thức chung là đại diện tốt nhất cho tập các cơ sở tri thức đã cho Các cấu trúc logic đã được nghiên cứu trong lĩnh vực này gồm có logic mệnh đề, logic mờ, logic vị từ, logic mô tả và logic khả năng
Để tiện cho việc diễn đạt và giải thích, luận văn sử dụng ví dụ như sau:
Ví dụ 1.2.1 Vừa qua, một cuộc khủng hoảng môi trường nghiêm
trọng đã gây ra hiện tượng cá chết (a) hàng loạt tại các tỉnh ven biển miền Trung Việt Nam Có một số chuỗi ý kiến về nguyên nhân của hiện tượng này như sau:
- Công chúng và các nhà khoa học: Cá chết (a) hàng loạt là do
vấn đề nước xả thải ô nhiễm của nhà máy gang thép (b): (𝑏 → 𝑎)
Trang 115
- Nhà máy gang thép: Nhà máy đã đầu tư một hệ thống xử lý nước thải hiện đại (𝑐), do đó nước đã được xử lý trước khi thải ra biển: (𝑐, 𝑐 → ¬𝑏)
- Cơ quan truyền thông: Nhà máy đã nhập hàng trăm tấn hóa
chất độc hại (d) đồng thời hệ thống xử lý nước thải đặt ống xả thải
ngầm sai quy định (f): (d, f)
- Công chúng và các nhà khoa học: Một thợ lặn tham gia xây
dựng nhà máy đã chết (g) do nước biển quanh khu vực nhà máy bị nhiễm độc (b): (𝑔, 𝑏 → 𝑔)
- Nhà máy: Chúng tôi nhập khẩu chất hóa học (d) để tẩy rửa
đường ống, tuy nhiên nước thải đã được xử lý trước khi xả ra biển ): ¬( 𝑏 → 𝑑) Ống xả thải ngầm đã được cấp phép xây dựng nhưng chưa được hoàn thành, do đó không thể xả thải tại thời điểm hiện tại ): (¬𝑓)
- Nhà chức trách: Có hai nguyên nhân dẫn đến hiện tượng cá
chết hàng loạt Nó có thể do chất độc hóa học (𝑑) hoặc do hiện tượng tảo nở hoa (𝑒): (𝑑 → 𝑎) ∨ (𝑒 → 𝑎) Ngoài ra chưa thấy có bất kỳ mối quan hệ nào giữa nhà máy với hiện tượng cá chết
- Công chúng và các nhà khoa học: Cá chết không thể do hiện
tượng tảo nở hoa bởi vì không có dấu hiệu của hiện tượng này như là tảo dạt vào bờ gây ô nhiễm, tảo nở dày đặc gây đổi màu nước và cá chết ở dưới đáy: (¬𝑒)
Từ tiến triển của các sự kiện trên, chúng ta có các tập tri thức như sau:
},,
,{
,,
=
Trang 12Ví dụ này sẽ được sử dụng để minh họa cho các công việc được
đề cập trong suốt luận văn này
1.2.2 Duyệt tri thức
Nghiên cứu quá trình duyệt tri thức là một lĩnh vực nghiên cứu thú
vị và được bắt đầu từ những năm 1980 Các bài viết được phổ biến đánh dấu sự ra đời của lĩnh vực này là các chuyên đề, các hội thảo, các báo cáo của Gardenfors, Alchourron và Makinson [15] Mô hình được phát triển từ [15] được gọi là mô hình AGM (là tên viết tắt của ba người sáng lập) và ngày nay mô hình này chiếm ưu thế trong duyệt tri thức
1.2.2.1 Mô hình AGM
Trong mô hình AGM, tri thức được biểu diễn như là một câu của
L và một bộ tri thức là một lý thuyết của L Quá trình duyệt tri thức được mô phỏng là một hàm * ánh xạ một lý thuyết K và một câu 𝜑 đến một lý thuyết mới 𝐾 ∗ 𝜑 Quá trình duyệt tri thức tuân theo nguyên tắc thay đổi tối thiểu, tức là một tác nhân phải thay đổi tri thức của mình càng ít càng tốt để phù hợp với thông tin mới
1.2.2.1.1 Bộ định đề AGM cho duyệt tri thức
Cho K là một lý thuyết của L và một câu φ Hàm * là một hàm loại bỏ tri thức nếu nó thỏa mãn các định đề sau:
Trang 137
1.2.2.1.2 Bộ định đề AGM cho loại bỏ tri thức
Cho K là một lý thuyết của L và một câu φ Hàm ∸ là một hàm loại bỏ tri thức nếu nó thỏa mãn các định đề sau:
1.2.2.4 Hệ thống các khối cầu tri thức
Hình 1.2 tóm tắt những kết quả chính đầu tiên của mô hình
AGM
Trang 14Hình 1.2 Mô hình AGM
1.2.3 Tích hợp tri thức
Tích hợp tri thức nghiên cứu cách hợp các thông tin độc lập, không nhất quán và đến từ nhiều nguồn khác nhau thành một thông tin nhất quán
Một mô hình lý thuyết mô tả các định đề và các toán tử kết hợp được đưa ra bởi Lin và Mendelzon [18]
Một tập các định đề mới cho các toán tử tích hợp tri thức đã được phân biệt (đối với các tiên đề nó thỏa mãn) giữa toán tử trọng tài và toán tử đa số đã được giới thiệu bởi Konieczny và Pino Pérez [10]
1.2.3.1 Một mô hình cho tích hợp với ràng buộc toàn vẹn
Konieczny và cộng sự đã đưa ra các mệnh đề cho toán tử tích hợp
IC trong [23] như sau:
Định nghĩa 1.2.1 ( Toán tử tích hợp IC) Cho E,E1,E2 là các hồ
sơ tri thức , K1, K2 là các cơ sở tri thức nhất quán, và IC,IC1,IC2
toàn vẹn nếu nó thỏa mãn các định đề sau đây:
(IC0) IC(E)IC
(IC1) Nếu IC nhất quán, thì IC (E) cũng nhất quán
(IC2) Nếu E là nhất quán với IC, thì IC(E)EIC
Trang 152 1 2
Định nghĩa 1.2.3 Cho MAXCONS(K,IC) là tập con nhất quán lớn
Trang 16Định nghĩa 1.2.4 Cho E là một hồ sơ tri thức và IC là một cơ sở tri thức:
),(M
C
}{ và),(M
AXCONS M
AXCONS M
IC M
tương ứng với Comb1(E,IC),
Comb [21]) Các toán tử C5 là một sửa đổi nhỏ của C3 để có thuộc tính hợp lý hơn [22]
1.2.3.3 Phương pháp dựa trên khoảng cách
Chúng ta thấy rằng toán tử đa số được đặc trưng bằng cách cố gắng để giảm thiểu tổng số không hài lòng, trong khi toán tử trọng tài
cố gắng giảm thiểu sự không hài lòng của từng đối tượng Do đó chúng ta có thể thấy khoảng cách như là một cách để nắm bắt những khái niệm về sự không hài lòng Mục đích là lựa chọn các diễn giải có khoảng cách nhỏ nhất giữa mô hình của IC và các mô hình của hồ sơ tri thức E Nó có thể được xác định như sau:
)),((
=))(( IC E min mod IC d
Định nghĩa 1.2.5 ( Khoảng cách) Một khoảng cách giữa các diễn