Với cách biểu diễn giá trị mệnh đề bởi một khoảng, không những giúp ta xác định được độ chính xác của mệnh đề đó mà ta còn có thể đánh giá được lượng thông tin mà ta biết về tính đúng đắ
Trang 1bộ giáo dục và đào tạo
trường đại học Bách khoa hà nội
Người hướng dẫn khoa học:
PGS TS Nguyễn Thanh Thủy
Hà Nội - 2010
Trang 22.3 Tính dừng, ổn định, mâu thuẫn của các hệ tri thức F-luật 34
Trang 32.5 Ví dụ áp dụng 39
3.2.1 Định nghĩa hệ tri thức F-luật đơn điệu mạnh 48 3.2.2 Tính ổn định của hệ tri thức F-luật đơn điệu mạnh 49
3.4 Hệ tri thức F-luật đơn điệu với phép lập luận bộ phận
Trang 4LỜI CẢM ƠN
Luận văn được hoàn thành dưới sự hướng dẫn của PGS TS Nguyễn Thanh Thủy, Trường Đại học Bách khoa Hà Nội Em xin được bày tỏ lòng biết ơn chân thành và sâu sắc tới thầy hướng dẫn, người đã định hướng đề tài và chỉ bảo tận tình
để có được những kết quả trong luận văn này
Em xin trân trọng cảm ơn Ban lãnh đạo, các thầy cô giáo, cán bộ viên chức của Viện Sau đại học và Viện Công nghệ Thông tin và Truyền thông, Trường Đại học Bách khoa Hà Nội về sự quan tâm, giảng dạy và giúp đỡ tận tình
Em xin chân thành cảm ơn lãnh đạo, cán bộ viên chức Trường Đại học Sư phạm Hà Nội 2, các thầy cô giáo, các bạn đồng nghiệp Khoa Công nghệ Thông tin, Trường Đại học Sư phạm Hà Nội 2 đã tạo điều kiện thuận lợi và giúp đỡ trong suốt quá trình học tập và công tác
Xin được gửi lời tri ân tới các bạn trong lớp Cao học Công nghệ Thông tin khóa 2008-2010, Trường Đại học Bách khoa Hà Nội đã sẻ chia, giúp đỡ trong quá trình học tập và nghiên cứu
Trang 5LỜI CAM ĐOAN
Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi, dưới sự hướng dẫn khoa học của PGS TS Nguyễn Thanh Thủy, Trường Đại học Bách khoa
Hà Nội
Các căn cứ, số liệu, trích dẫn và kết quả nêu trong luận văn là trung thực
Hà Nội, ngày 28 tháng 9 năm 2010
Tác giả
Ngô Thị Hiền
Trang 6MỞ ĐẦU
Tri thức luôn là một nhân tố quan trọng trong sự phát triển kinh tế xã hội Tri thức tác động đến mọi lĩnh vực hoạt động khoa học, văn hóa, kinh tế Vì vậy, con người luôn muốn tìm kiếm, thu thập thật nhiều tri thức với mục đích làm tăng lượng kiến thức về mọi lĩnh vực trong cuộc sống, để sáng tạo ra những thành tựu mới nhằm nâng cao chất lượng cuộc sống
Ngày nay khi khoa học kĩ thuật và công nghệ đã phát triển đến trình độ rất cao, con người ngày càng chuyển giao cho máy móc không chỉ các thao tác hoạt động cơ bắp mà còn truyền cho nó cả các thao tác hoạt động trí tuệ Kết quả là tạo
ra những máy móc có tính thông minh Những máy móc có khả năng đưa ra những tín hiệu điều khiển dựa trên việc phân tích các tín hiệu phản hồi, mô phỏng theo các hoạt động tư duy của bộ não con người được gọi là trí tuệ nhân tạo Với độ thông minh nhất định, mặc dù không dự báo trước được tương lai, nhưng máy tính thực sự
có ảnh hưởng lớn tới cuộc sống ngày nay và tương lai phát triển của văn minh nhân loại Nó sẽ luôn là công cụ hữu hiệu trợ giúp con người trong một số loại hoạt động trí óc để tạo ra những tri thức mới phù hợp với nhu cầu của thời đại Nhiều phương pháp khoa học và giải pháp công nghệ khác nhau để biểu diễn, thu thập, tìm kiếm,
xử lí và quản trị tri thức đã được đề xuất nhằm tiếp cận tới những tri thức đa dạng, đặc trưng riêng cho các ứng dụng của thực tế
Giai đoạn đầu tiên trong ứng dụng máy tính điện tử vào mô phỏng và trợ giúp các hoạt động trí tuệ gắn với quan điểm tất định luận trong nhận thức, một quan điểm đã thống trị trong khoa học suốt nhiều thế kỉ Trong các lí thuyết khoa học, mỗi tri thức phải là một chân lí mà tính đúng đắn của nó phải được thừa nhận là hoàn toàn chắc chắn và một phán đoán đưa ra luôn có giá trị chân lí hoặc đúng, hoặc sai Ngôn ngữ thông dụng biểu diễn tri thức có thể quy về dạng ngôn ngữ của logic mệnh đề và logic tân từ Các phương pháp suy luận nhằm tìm ra các phán đoán đúng mới từ các phán đoán ban đầu, tuân theo các quy luật của logic hình thức
cổ điển, về cơ bản đã được hình thành từ thời Aristotle với các quy luật đồng nhất,
Trang 7phi mâu thuẫn, bài trung, phủ định kép, các quy luật quy định mối quan hệ giữa các loại phán đoán phổ biến, đặc thù và đơn nhất, và với phép suy luận diễn dịch kiểu tam đoạn luận hay modus ponens Sơ đồ chung của các bài toán được đặt ra như sau: Cho một số tri thức ban đầu (có thể là tập các điều kiện, một tiên đề, …), và một mệnh đề đích Vấn đề là xây dựng một phương pháp chung để từ đó tìm một chuỗi suy luận hợp logic sao cho từ các tri thức ban đầu suy ra được mệnh đề đích Những phương pháp chung như vậy được xây dựng rất công phu và chủ yếu dựa vào các kết quả nghiên cứu logic Các phương pháp chung này đã được đưa vào ứng dụng và thu được nhiều thành tựu trong các lĩnh vực khác nhau
Hướng nghiên cứu về xử lí trong các hệ tri thức chắc chắn đã, đang và vẫn sẽ tiếp tục phát triển mạnh mẽ Tuy vậy, khi mở rộng phạm vi ứng dụng sang các lĩnh vực đa dạng của cuộc sống thì gặp nhiều vấn đề mới Đây chính là lí do cần có những quan điểm mới về tri thức và các quá trình lập luận trên các tri thức đó Trong nhiều lĩnh vực của thực tế, việc yêu cầu mọi tri thức đều có tính chân lí chắc chắn như trong các hệ tri thức chắc chắn nói chung khó được đáp ứng Phần lớn tri thức mà con người có được trong cuộc sống hàng ngày đều là dạng hoặc không chắc chắn, hoặc không đầy đủ Đối với những loại tri thức này, khó có thể xác định được chân lí của nó là đúng hay sai Nhiều loại hệ tri thức đã được đưa ra nhằm tiếp cận gần hơn với những tri thức trong thực tế trên
Tri thức không chắc chắn có thể do chỉ biết một cách mơ hồ về các khái niệm,
có thể là do không biết chính xác điều gì đã xảy ra Trong trường hợp mơ hồ về khái niệm, một trong những cách tiếp cận đáng chú ý là tập mờ của Zadeh Ví dụ nói:
“con gái có tóc dài thì xinh” là mơ hồ do không thể nói đúng sai về các khái niệm
“tóc dài” và “xinh” Theo Zadeh, những khái niệm như vậy là những tập mờ và được cho một cách chủ quan bởi các hàm thuộc trên những tập giá trị thích hợp Từ việc biểu diễn những khái niệm mơ hồ đó, Zadeh cũng như các nhà nghiên cứu sau này đã xây dựng logic tập mờ và đã có nhiều ứng dụng Các tri thức không chắc chắn có thể được mô tả bởi lí thuyết xác suất Nguồn gốc của lí thuyết xác suất liên quan chủ yếu đến các trò chơi cá cược và những bài toán tổ hợp Xác suất có thể
Trang 8được nhìn từ hai góc độ khác nhau, đó là: xác suất theo nghĩa tần suất hay thống kê được xem là xác suất khách quan; xác suất chủ quan xuất phát từ những đánh giá chủ quan của một cá nhân về mức độ đúng đắn của một số phán đoán nào đó
Từ những năm đầu của thập kỉ 80, mô hình xác suất mới thực sự được chấp nhận để xử lí thông tin không chắc chắn, mặc dù có lịch sử phát triển lâu dài Mô hình logic xác suất và lập luận trong [6] đã đề xuất việc kết hợp logic và xác suất cổ điển, dựa trên việc xác định phân bố xác suất cho tập các thế giới có thể Mỗi thế giới có thể được hiểu như là một phép gán phi mâu thuẫn giá trị chân lí cho các mệnh đề trong cơ sở tri thức Cụ thể hơn, từ các tri thức ban đầu ta có thể xác định
hệ ràng buộc cho phân bố xác suất trên các thế giới có thể Hệ ràng buộc này chưa
đủ thông tin để có thể xác định được giá trị cho phân bố xác suất trên các thế giới có thể Do đó, người ta đã đề nghị một số phương pháp bổ sung thêm thông tin để xác định được cụ thể giá trị phân bố xác suất này Cách tiếp cận này khá phức tạp và đòi hỏi phải giải bài toán quy hoạch phi tuyến Nếu như không bổ sung thêm thông tin thì nhờ việc giải bài toán quy hoạch tuyến tính (tuy đơn giản hơn nhiều nhưng vẫn phức tạp), ta có thể rút ra được giá trị đúng của mệnh đề đích nằm trong một khoảng giá trị Vì vậy, trong [3] đã phát triển mô hình logic giá trị khoảng dựa trên mô hình của [6] Trong mô hình này, thuận lợi ở chỗ, cho phép đưa vào các mệnh đề ban đầu với giá trị khoảng (xác suất đúng của mệnh đề nằm trong một khoảng giá trị) Với cách biểu diễn giá trị mệnh đề bởi một khoảng, không những giúp ta xác định được
độ chính xác của mệnh đề đó mà ta còn có thể đánh giá được lượng thông tin mà ta biết về tính đúng đắn của mệnh đề đó (khoảng càng hẹp thì lượng tin càng lớn) Cách biểu diễn này tiếp cận gần hơn đến các tri thức thực tiễn
Cùng với mong muốn tiếp cận tới những tri thức trong thực tế và các phương pháp suy diễn trong các hệ tri thức đó Trong luận văn này, chúng tôi nghiên cứu về vấn đề suy diễn xác suất trong các hệ tri thức F-luật, một loại hệ tri thức không chắc chắn Ý tưởng xây dựng hệ tri thức này được đề xuất ban đầu bởi [9] và được phát triển tiếp trong [5, 8, 11] Trong hệ tri thức F-luật, giá trị chân lí của một mệnh đề hay một câu cũng được biểu diễn bởi một khoảng, biểu thị niềm tin của ta về tính
Trang 9đúng đắn của mệnh đề đó Mỗi F-luật cho ta quan hệ về giá trị chân lí của một mệnh
đề với một số các mệnh đề khác, quan hệ này biểu diễn bởi một hàm Từ việc biểu diễn tri thức như vậy đã có một số phương pháp suy diễn được đề xuất dựa trên các toán tử suy diễn
Vấn đề suy diễn xác suất khoảng nhằm rút ra giá trị khoảng cho một câu đích
từ một cơ sở tri thức xác suất khoảng đã cho Bài toán này được đưa về bài toán quy
hoạch tuyến tính: Tìm max (min) của một biểu thức tuyến tính trên miền lồi xác định
với các bất đẳng thức tuyến tính cho bởi cơ sở tri thức ban đầu
Suy diễn để rút ra giá trị xác suất khoảng của một câu từ cơ sở tri thức xác suất với những câu có độ chắc chắn ngoài gọi là suy diễn ngoài Giá trị xác suất ngoài gán cho một câu σ nào đó nhằm nắm bắt đánh giá chủ quan của một người về tính đúng đắn của phán đoán σ Khi biểu diễn mối liên quan phụ thuộc trực tiếp giữa độ chắc chắn của một câu đối với độ chắc chắn của các câu khác thì gọi là độ chắc chắn trong Độ chắc chắn trong được xem xét từ quan điểm của lập trình logic bởi Raymond Ng và Subrahmanian [9] Ở đây, ta quan tâm đến những dạng biểu diễn
và cách xây dựng phương pháp suy diễn từ những dạng tri thức với độ chắc chắn trong, cụ thể là F-luật Suy diễn trong phần cơ sở tri thức với độ chắc chắn trong này sẽ là một thủ tục lặp các F-luật và gọi là suy diễn trong
Mục đích của luận văn là nghiên cứu và phát triển các cách tiếp cận xác suất đối với việc biểu diễn tri thức và các phương pháp suy diễn của logic xác suất dựa vào việc khai thác hệ tri thức F-luật với các tính chất trên nó, cụ thể như sau:
(1) Khảo sát một số đặc trưng của suy diễn xác suất: suy diễn xác suất (khoảng) ngoài, suy diễn xác suất trong
(2) Nghiên cứu các tính chất của hệ tri thức F-luật: hệ tri thức là ổn định nếu quá trình suy diễn dừng và phi mâu thuẫn Nếu hệ ổn định, tìm các phương pháp suy diễn hiệu quả để khai thác hệ
(3) Nghiên cứu tính chất và các phương pháp suy diễn trong các hệ tri thức F-luật đơn điệu
Trang 10(4) Đề xuất giải pháp trong trường hợp hệ không ổn định vẫn có thể kết luận giá trị chân lí của các biến mệnh đề (atom) sau quá trình suy diễn với cơ
sở tri thức F-luật ban đầu Khi đó, hệ tri thức không ổn định này vẫn có ý nghĩa trong một phạm vi nhất định nào đó
Đối với vấn đề thứ nhất, luận văn xem xét cách gán ngữ nghĩa xác suất của một câu nhờ phân bố xác suất trên tập các lớp thế giới có thể; mô hình logic xác suất giá trị khoảng; các cách biểu diễn C-luật và F-luật và các toán tử suy diễn của chúng Vấn đề thứ hai và thứ ba, luận văn xem xét dựa trên hai cách tiếp cận chính: cấu trúc cơ sở tri thức (đồ thị biểu diễn, tính chất luật) và các phương pháp lập luận dựa trên các toán tử suy diễn Đối với vấn đề thứ tư, luận văn thu nhỏ lớp bài toán
và xét ở trường hợp bước thứ n thỏa mãn điều kiện cụ thể, từ đó có thể kết luận giá trị khoảng xấp xỉ của các atom Giá trị này được gọi là n-ổn định
Luận văn ngoài phần mở đầu và kết luận bao gồm 4 chương
Chương 1, tổng quan các vấn đề về suy diễn xác suất Luận văn tập trung xem xét phương pháp suy diễn trong các cơ sở tri thức logic xác suất giá trị khoảng, bao gồm suy diễn ngoài và suy diễn trong
Chương 2, giới thiệu chung về hệ tri thức dạng F-luật Phần đầu bao gồm các định nghĩa về việc biểu diễn tri thức, các toán tử suy diễn và các tính chất của hệ Phần thứ hai, đề cập tới đồ thị tương ứng với hệ tri thức F-luật Bằng cách đưa ra
khái niệm đồ thị bị rạn đã khẳng định được tính dừng của các hệ tri thức F-luật với toán tử suy diễn tổng thể có đồ thị tương ứng là bị rạn
Chương 3, tập trung nghiên cứu suy diễn trong các hệ tri thức F-luật đơn điệu Phương pháp tiếp cận ở đây là thu hẹp dần hoặc mở rộng dần không gian bài toán Trước tiên xem xét tính đơn điệu, cùng với nó thu hẹp phạm vi nghiên cứu trong các hệ tri thức đơn điệu Với việc thừa nhận tính đúng đắn của phép đơn điệu hóa, luôn có thể đưa một hệ tri thức bất kì về hệ tri thức đơn điệu Bằng cách thu hẹp đáng kể lớp đơn điệu, chúng ta thu được một lớp hệ tri thức đơn điệu mạnh Hệ tri thức đơn điệu yếu lại là một sự mở rộng từ hệ tri thức đơn điệu mạnh với sự ràng
Trang 11buộc luật ít chặt chẽ hơn Trong chương này cũng chỉ ra dấu hiệu phát hiện tính dừng của hệ tri thức đơn điệu mạnh và đưa ra kết luận về mối quan hệ giữa các phép lập luận là: các phương pháp lập luận cho kết quả tương đương đối với các hệ
ổn định, từ đây, cho phép tìm các phương pháp suy diễn nhanh dựa vào toán tử suy diễn bộ phận
Chương 4 đề xuất giải pháp khắc phục trường hợp hệ tri thức không ổn định
Hệ tri thức F-luật không ổn định được đánh giá là không tốt và do đó, hoặc ta phải hiệu chỉnh nó, hoặc ta bỏ đi không xét Việc nghiên cứu quá trình suy diễn trong các
hệ tri thức F-luật thực sự có ý nghĩa trong trường hợp hệ là ổn định Khi đó, luôn kết luận được giá trị của các atom sau quá trình suy diễn, do đó luôn mong muốn có được những hệ tri thức ổn định Xuất phát từ điều này, chúng tôi đề xuất giải pháp trong trường hợp hệ không ổn định thì hệ vẫn có ý nghĩa trong một phạm vi nhất
định nào đó Bằng cách đưa ra một giá trị gọi là n-ổn định, có thể kết luận được giá
trị chân lí xấp xỉ của các atom sau quá trình suy diễn, với giả thiết hệ tri thức là phi
mâu thuẫn, không dừng Tại bước thứ n, dựa vào giá trị khoảng xấp xỉ của các
atom, có thể xác định được lượng thông tin về tính đúng đắn của các atom đó (giá trị khoảng càng hẹp thì lượng tin càng lớn) Trường hợp hệ tri thức F-luật mâu
thuẫn ở bước thứ n của quá trình suy diễn, đề xuất giải pháp để kết luận hệ phi mâu thuẫn ở bước thứ m (0 ≤ m < n)
Mỗi chương đều có phần kết luận chương và đưa ra một số ví dụ áp dụng Phần kết luận chung, trình bày tóm tắt kết quả chính đã đạt được và đưa ra các hướng phát triển tiếp theo của đề tài
Trang 12Chương 1
SUY DIỄN XÁC SUẤT
Một trong những đề tài thu hút được nhiều nhà nghiên cứu trí tuệ nhân tạo (Artificial Intelligence) đó là mối liên kết giữa các phương pháp tiếp cận biểu diễn tri thức dựa trên logic trong trí tuệ nhân tạo và lí thuyết xác suất trong toán học Bài
báo logic xác suất (Probabilistic logic) của Nilsson [6] đã thực sự đánh dấu một
bước quan trọng cho các nhà nghiên cứu về mối quan tâm này Mô hình của Nilsson
đã được phát triển lên thành mô hình logic xác suất giá trị khoảng trong [3] bởi
Phan Đình Diệu
Chương này sẽ trình bày tổng quan mô hình logic xác suất giá trị khoảng và đưa ra một số phương pháp suy diễn với các hệ tri thức logic xác suất giá trị khoảng, cụ thể là suy diễn xác suất ngoài, suy diễn xác suất trong, suy diễn với C-luật và F-luật mà ban đầu là các dạng biểu diễn và các toán tử suy diễn
1.1 Biểu diễn tri thức theo cách tiếp cận xác suất
Chúng ta nhắc lại một số khái niệm cơ bản của lí thuyết xác suất
Cho (Ω, ε) là một không gian mẫu, trong đó Ω là tập hữu hạn những phán đoán loại trừ lẫn nhau (hay còn gọi là không gian sự kiện), ε = 2Ω Một hàm tập giá
trị thực P: ε → [0,1] gọi là (hàm) xác suất nếu nó thỏa mãn những điều kiện sau: (i) P(A) ≥ 0 với ∀A ∈ε;
(ii) P(Ω) = 1; P(φ) = 0;
(iii) P(A∪B) = P(A) + P(B), với ∀A, B ∈ ε thỏa mãn A∩B = φ
(Với A ⊆ Ω ⇒ P(A) ∈ [0, 1])
Trang 13Một phân phối xác suất là một hàm số p: Ω → [0,1] sao cho ∑ ( )=1
Ω ω
P
ω
ω)()
) ( )
| (
B P
B A P B A
Ví dụ 1.1 Tung một đồng xu, xảy ra hai khả năng: đồng xu xuất hiện mặt sấp; đồng
xu xuất hiện mặt ngửa
Khi đó, Ω = {sấp, ngửa} P: 2Ω → [0,1] Ta có P({sấp}) = P({ngửa}) =
2
1
Đối với các dạng tri thức không chắc chắn dựa trên luật, chúng ta đưa vào mức
độ chắc chắn của các luật hoặc các sự kiện trong cơ sở tri thức Chúng ta sẽ gán cho mỗi luật hoặc sự kiện một mức độ chắc chắn nào đó, mức độ chắc chắn này là một
số nằm trong đoạn [0, 1], hay còn gọi là xác suất
Cú pháp:
If <A1, P1> ∧ <A2, P2> ∧ … ∧<A n , P n > then <B, P>
Trong đó, P i là xác suất xảy ra A i hay mức độ chắc chắn của A i , P là xác suất xảy ra
Trang 14S = {<S1, P1>, <S2, P2>, …, <S n , P n>},
trong đó S i là biểu thức logic bất kì, P i là xác suất tương ứng với S i , i = 1 ,n
Ví dụ 1.3 S = {<A, 0.5>, <B, 0.6>}, <A ∧ B,?>: nghĩa là, xác suất của A là 0.5, xác suất của B là 0.6; cần tìm xác suất của A ∧ B?
S = {<A, 0.8>, <A → B,0.5>}, <B → A, ?>
S = {<A ∨ B, 0.9>, <A ∧ B, 0.5>}, {<A, ?>, <B, ?>}
1.2 Thế giới có thể và xác suất trên lớp thế giới có thể
1.2.1 Thế giới có thể
Cách tiếp cận dựa trên khái niệm thế giới có thể (possible world) được xem là
khuôn mẫu chuẩn tắc để xây dựng ngữ nghĩa của nhiều logic như logic xác suất, logic khả năng, modal logic, …
Về mặt trực giác, khái niệm thế giới có thể được hiểu như thế nào? Chúng ta
thường nói một phán đoán, một phát biểu nào đó đúng trong tình huống, thời điểm hay ngữ cảnh này nhưng không đúng trong tình huống, thời điểm hay ngữ cảnh
khác Có thể coi mỗi tình huống, thời điểm hay ngữ cảnh đó là một thế giới có thể
Từ “có thể” ở đây được hiểu là ngoài trạng thái thực sự hiện thời mà mỗi cá nhân
đang xem xét, có những trạng thái hay thế giới khác mà cá nhân này xem là có thể
Chúng ta xem tập các thế giới mà một cá nhân xem là có thể như là cách định tính để đo độ chắc chắn của anh ta Càng nhiều thế giới mà anh ta xem là có thể thì anh ta càng không chắc chắn về trạng thái thực của thế giới và anh ta càng biết ít hơn Khi có một tập thế giới có thể như vậy, định lượng độ không chắc chắn bằng cách thêm phân bố xác suất trên tập các thế giới đó
Khái niệm thế giới có thể trong ngôn ngữ của logic mệnh đề sẽ được hình thức
hóa như sau: Giả sử ∑ = {S1, , S l } là tập các câu Gọi A = {A1, , A m} là tập các
biến mệnh đề (atom) xuất hiện trong các câu của ∑, và L∑ là ngôn ngữ mệnh đề sinh
Trang 15ra bởi các atom trong A với các phép toán mệnh đề đã biết: ¬ ,∧ ,∨ ,→ ,↔ Kí hiệu
true là mệnh đề hằng đúng, false là mệnh đề hằng sai
Một “thể hiện” trong logic mệnh đề là phép gán những giá trị chân lí đúng (1) hay sai (0) cho các atom Có thể xem mỗi thể hiện là một thế giới có thể cho tập các
câu trong ∑ Một vector Bool (σ1 , ,σl) (σi nhận giá trị 0 hoặc 1, với ∀i = 1 ,l) gọi
là ∑-phi mâu thuẫn nếu có một thế giới có thể ω sao cho S i nhận giá trị chân lí
i
σ với ∀i = 1 ,l Kí hiệu val ω(Si) = σi , (i = 1 ,l)
Rõ ràng mỗi vector ∑-phi mâu thuẫn tương ứng với một số hữu hạn các phép gán giá trị chân lí cho các atom trong A Ngược lại mỗi phép gán như vậy xác định một vector ∑-phi mâu thuẫn
Hai thế giới có thể ω 1 và ω 2 được gọi là ∑- tương đương nếu
) ( )
1 S i val S i
valω = ω với ∀i = 1 ,l Dễ dàng kiểm chứng được rằng ∑-tương đương là
một quan hệ tương đương Quan hệ này xác định một phân hoạch trên tập các thế
giới có thể thành các lớp tương đương Như vậy, mỗi ∑- tương đương các thế giới
có thể ω tương ứng với một vector ∑-phi mâu thuẫn (σ1 , ,σl) và ngược lại Do
đó, có thể gọi lớp ∑- tương đương các thế giới có thể là lớp các thế giới có thể và vector các giá trị chân lí ∑-phi mâu thuẫn là vector các giá trị chân lí phi mâu
thuẫn
Giả sử có k-vector các giá trị chân lí phi mâu thuẫn khác nhau Khi đó, tập Ω gồm k-lớp tương đương các thế giới có thể {ω1, ,ωk}, nghĩa là Ω ={ω1, ,ωk} Kí hiệu ωi=α biểu thị rằng ω i thỏa mãn α hay câu α là đúng trong thế giới có thể ω i
1.2.2 Xác suất trên lớp thế giới có thể
Mục này sẽ xem xét xác suất được xây dựng trên khái niệm thế giới có thể như thế nào Kí hiệu Ω = {ω1, ,ωk} là tập các lớp thế giới có thể, ở đó mỗi lớp ωi đặc trưng bởi vector biểu diễn những giá trị chân lí của những câu trong Σ Xác suất của một câu, theo [6], được xác định bởi phân bố xác suất trên tập các lớp thế giới
Trang 16có thể Ω Giả sử p là phân bố xác suất như vậy Khi đó, xác suất của câu σ∈ ∑được định nghĩa là tổng của những xác suất trên những lớp thế giới có thể trong đó σ
đúng, nghĩa là:
∑
= Ω
=
σ ω ω
ω α
i i
(
Tất cả những câu xét ở đây là những câu mệnh đề nên giá trị chân lí của nó hoặc đúng hoặc sai và xác suất của câu σ không phải giá trị chân lí của nó mà là độ chắc chắn hay độ tin cậy vào tính đúng đắn của σ
1.3 Suy diễn xác suất ngoài
Mục này trình bày tổng quan về mô hình lập luận xác suất ngoài trong logic xác suất giá trị khoảng Trước hết, chúng ta xem xét một số kiến thức về logic xác suất giá trị khoảng
1.3.1 Logic xác suất giá trị khoảng
Logic xác suất trong [6] là một sự kết hợp giữa logic cổ điển và lí thuyết xác
suất, trong đó đã sử dụng khái niệm lớp thế giới có thể để xây dựng không gian mẫu
cho phân bố xác suất Dựa trên mô hình của Nilsson, một logic xác suất giá trị khoảng đã được phát triển trong [3] bởi Phan Đình Diệu Độ chắc chắn của một câu
trong logic xác suất giá trị khoảng thay bởi cho bằng một giá trị đơn là một giá trị
khoảng Nghĩa là, khi cho khoảng xác suất của câu X là khoảng [a, b]⊆[0,1], kí
hiệu <X, [a, b]>, độ tin cậy vào tính đúng đắn của câu X hay xác suất đúng của X nằm trong khoảng [a, b] Trong đó, a được gọi là mức độ nhất thiết và b gọi là mức
độ có thể của độ tin cậy của một tác nhân nào đó về tính đúng đắn của câu X
Với kí hiệu <X, [a, b]>, từ nay về sau sẽ gọi [a, b] là độ chắc chắn ngoài hay
xác suất ngoài của X
Một số trường hợp đặc biệt:
Trang 17¾ <X, [a, a]>: Xác suất của một câu X là một giá trị điểm a.
¾ <X, [0, 0]>: Câu X có độ tin cậy là 0, hay hiểu là câu X chắc chắn sai
¾ <X, [1, 1]>: Câu X có độ tin cậy là 1, hay câu X chắc chắn đúng
¾ <X, [0, 1]>: Biểu diễn mức độ không biết của một tác nhân nào đó về câu X, hay tác nhân đó không biết gì về X
1.3.2 Toán tử suy diễn xác suất ngoài
Bài toán lập luận xác suất có thể được phát biểu như sau: Cho một cơ sở tri
thức xác suất khoảng B gồm một tập hợp các câu cùng với các giá trị xác suất tương ứng của nó Hãy rút ra giá trị xác suất khoảng cho một câu đích bất kì
Giả sử cho một cơ sở tri thức xác suất khoảng ngoài B bao gồm tập các câu
∑= {S1,…,S l } và các khoảng giá trị tương ứng I i = [a i , b i ], (i = 1 ,l) biểu diễn những
độ chắc chắn ngoài về những câu trên Kí hiệu:
cột X-phi mâu thuẫn tương ứng Mỗi vector cột V i biểu diễn các giá trị chân lí của
những câu trong X trong lớp thế giới có thể tương ứng ωi Kết hợp các vector cột
V1,…,V k nhận được một ma trận V gồm n dòng, k cột (V nxk ) và được gọi là ma trận
cơ bản của X
Trang 18Giả sử p = (p1, …, p k) là phân bố xác suất trên Ω và Π = (π1, ,πn) là các giá
trị xác suất của S i (i = 1 ,n), nghĩa là π( )S i =πi với i = 1 ,n Lúc này ta có phương trình ma trận sau:
Π = VP (1)
Trong đó, Π = (π1, ,πn)t , V là ma trận k cột V1,…,V k và P = p t = (p1, …, p k)t
Phương trình (1) được gọi là phương trình xác suất của tập các câu trong X
Gọi U i , (i = 1 ,n ) là các vector dòng trong ma trận V tương ứng với các câu trong X, khi đó:
U i = (u i1 , …, u ik),
với u ij (nhận giá trị 0 hoặc 1) là giá trị chân lí của S i trong lớp thế giới có thể ωj,
(i = 1 ,n ; j = 1 ,k)
Giá trị π ∈[ ]0 , 1 được gọi là chấp nhận được cho xác suất đúng của S tương
ứng với cơ sở tri thức B nếu tồn tại một phân bố xác suất P = (p1, …, p k)t và các giá trị πi , (i = 1 ,n), sao cho π1∈I1, ,πl ∈I l,πn =π và phương trình (1) thỏa mãn
Gọi F(S, B) là tập tất cả các giá trị chấp nhận được cho xác suất đúng của S tương ứng với B Khi đó F(S, B) là tập những giá trị của hàm:
k nk n
i k ik i
i
k j p
p
l i I p v p
v
1
1 1
) , 1 ( , 0 , 1
) , 1 ( ,
π
Ràng buộc xác định miền lồi ∆ có thể biểu diễn bởi phương trình ma trận:
Π* = V*P (3)
Trang 19Trong đó V* là ma trận có được từ V bằng cách bỏ dòng giá trị chân lí của S trong V
và thêm dòng các giá trị 1; Π* có được từ Π bằng cách bỏ dòng giá trị πn và thêm dòng giá trị 1 sao cho Π*t
∈ {1} × I1 ×…× I l
Ta gọi (3) là phương trình ma trận điều kiện hay ngắn gọn là phương trình
điều kiện Biểu thức (2) xác định ánh xạ tuyến tính πn từ miền lồi ∆ trong R k vào R
Do đó, F(S,B) là tập lồi đóng trong R tức là khoảng con đóng [a, b] của khoảng đơn
vị [0, 1] Ta gọi khoảng này là giá trị khoảng (cho xác suất đúng) của S suy diễn từ
cơ sở tri thức B và viết: B |– <S, F(S, B)> Dễ dàng nhận thấy rằng F(S, B) ≠ φ khi
và chỉ khi cơ sở tri thức B là phi mâu thuẫn
Như vậy, việc suy diễn ra giá trị khoảng F(S, B) của câu S từ cơ sở tri thức B
dẫn về bài toán tối ưu sau đây:
Tìm a = minP∈∆πn( P ), b=Max P∈∆πn (P) với πn (P) xác định bởi (2) và ∆
là miền xác định bởi (3)
Chúng ta gọi suy diễn để rút ra giá trị khoảng cho một câu từ cơ sở tri thức
khoảng ngoài là suy diễn ngoài để tiện trình bày và phân biệt với suy diễn trong sẽ
được đề cập sau này
Toán tử suy diễn xác suất ngoài được xác định như sau:
Cho một cơ sở tri thức xác suất khoảng B và một tập hợp các câu X bất kì (X
có thể chứa các câu trong B) Gọi Λ là tập tất cả các ánh xạ từ X vào C[0, 1], với
C[0, 1] là tập các khoảng con đóng của khoảng [0, 1] Ánh xạ I ∈ Λ xác định một
giá trị khoảng I(Q) ∈ C[0, 1] cho mỗi câu Q ∈ X Lúc này I và B xác định một cơ sở
tri thức và từ cơ sở tri thức mới này có thể suy diễn được giá trị xác suất cho các
câu trong X Khi đó, ta thu được một ánh xạ I’ mới từ kết quả suy diễn
Với mỗi I ∈ Λ, một cơ sở tri thức mới B’ = B ∪ {<Q, I(Q)> │Q ∈ X} được
lập ra theo quy tắc sau:
<S i, I ' i> ∈ B’ (i = 1 ,n), với I ' i = I i ∩ I(Q) nếu Q = Si
Trang 20<Q, I(Q)> ∈ B’, nếu Q ≠ S i
Khi đó, khoảng xác suất mới của P suy diễn từ cơ sở tri thức mới B’ có dạng:
I’(Q) = F(Q, B’) với Q ∈ X, I’ là ảnh của ánh xạ I qua toán tử R, hay I’ = R(I)
Nhận xét: Bài toán lập luận xác suất được đưa về bài toán quy hoạch tuyến tính:
Tìm max (min) của một biểu thức tuyến tính trên miền lồi xác định bởi các bất đẳng thức tuyến tính cho bởi cơ sở tri thức ban đầu
1.4 Suy diễn xác suất trong
Như đã trình bày ở mục trên đây, giá trị xác suất ngoài [a, b] gán cho câu S
nhằm nắm bắt đánh giá chủ quan của một tác nhân nào đó về tính đúng đắn của
phán đoán S Mục này nghiên cứu kiểu biểu diễn tri thức dưới dạng luật, nhằm nắm
bắt sự phụ thuộc trực tiếp giữa độ chắc chắn của một câu với độ chắc chắn của các
câu khác và ta gọi là độ chắc chắn trong
Việc nghiên cứu độ chắc chắn trong đã được nhiều người trong cộng đồng trí tuệ nhân tạo quan tâm (xem [2], [7], [8], [9]) Trong tác phẩm nổi tiếng [7], J Pearl
đã chỉ ra rằng: “Một người ngần ngại khi đánh giá khả năng của hai biến cố nhưng
sẽ cảm thấy tin tưởng để phán đoán rằng hai biến cố này là có liên quan với nhau hay không”
Theo quan điểm của lập trình logic bởi Raymond Ng và Subrahmanian [9],
mỗi atom trong ngôn ngữ có dạng <X, [a, b]> và một ngữ nghĩa của lập trình logic
xác suất được xây dựng từ ngôn ngữ như vậy
Ví dụ sau đây được đưa ra bởi Raymond Ng và Subrahmanian [9] cho thấy
được sự cần thiết của biểu diễn tri thức dưới dạng độ chắc chắn trong
Ví dụ 1.4 Một công ty điện thoại đường dài, khi nhận yêu cầu nối liên lạc của
khách hàng, cố gắng tìm những đường tin cậy trong mạng các trung tâm tiếp vận Giả sử rằng độ tin cậy được hiểu là xác suất không có sai sót trong thời gian liên
Trang 21lạc Công ty có hai kiểu nối liên lạc trực tiếp giữa các trung tâm tiếp vận Giả sử những cuộc điều tra cung cấp một số thông tin sau đây:
(i) Kiểu nối A có độ tin cậy 90% ± 5%
(ii) Kiểu nối B đáng tin cậy hơn, có độ tin cậy trên 90%
(iii) Giả sử X, Y, Z là ba trung tâm, X và Z nối theo kiểu A trong khi Z và Y được nối bởi đường với độ tin cậy ít nhất 85% Khi đó đường từ X đến Y có độ tin
<a(X, Y), [1, 1]> → <path(X, Y), [0.85, 0.95]>
<b(X, Y), [1, 1]> → <path(X, Y), [0.9, 1]>
<a(X, Z), [1, 1]> & <path(Z, Y), [0.85, 1]> → <path(X , Y), [0.8, 0.95]>
<b(X, Y), [1, 1]> & <path(Z, Y), [0.75, 1]> → <path(X , Y), [0.85, 1]>
Việc biểu diễn sự phụ thuộc giữa các độ chắc chắn đã được quan tâm nghiên cứu theo nhiều quan điểm khác nhau Ví dụ như MYCIN, là một hệ lập luận trong y học của Đại học Stanford, Hoa Kì, một hệ chuyên gia dựa trên luật Đây là hệ đầu tiên chú trọng đến việc xử lí thông tin không chắc chắn, sử dụng khái niệm
Certainty Factor (CF) để biểu thị độ chắc chắn của một phán đoán CF(X) là hàm có
giá trị nằm trong khoảng [-1, 1] Độ chắc chắn của một công thức khi đó được xác định một cách duy nhất bởi một hàm của những độ chắc chắn của các công thức con
và những phép toán thích hợp Chẳng hạn, độ chắc chắn của A ∧ B là minimum của
độ chắc chắn của A và B, một luật như thế có thể biểu diễn dưới dạng:
<A, a> ∧ <B, b> → <A ∧ B, min(a, b)>
Trang 22Rõ ràng, ở dạng biểu diễn này, mối liên hệ giữa độ chắc chắn của một câu với các độ chắc chắn của những câu khác được biểu diễn nhờ quan hệ giữa những phép toán logic giữa các câu đó
Đối với tri thức dạng nếu A thì B với độ chắc chắn m (còn gọi là luật sản xuất hay luật sinh), có thể biểu diễn dưới dạng luật: A ⎯→⎯m B Ở dạng luật này, nếu a
là độ chắc chắn của A thì độ chắc chắn của B sẽ là m×Max(0, a)
Dựa trên cách tiếp cận mạng Bayes của J Pearl, luật A ⎯→⎯m B được thể hiện
dưới dạng xác suất có điều kiện:
P(B|A) = m
Một cách thể hiện khác của dạng luật trên là sử dụng tập xác suất có điều kiện với luật xác suất toàn phần Ví dụ, giả sử:A→B với độ chắc chắn [l, u]; ¬A→B
với độ chắc chắn [l’, u’]; P(A) ∈ [s, t], P(¬A) ∈ [1-t, 1-s] Áp dụng luật xác suất
toàn phần (hay xác suất đầy đủ) ta có:
P(B) = P(B|A)P(A) + P(B|¬A)P(¬A)
Người ta tính được:
P(B) ∈ [min(ls + l’(1-s), lt + l’(1-t)), Max(us + u’(1 - s), ut + u’(1 - t))] Tương tự với cách tiếp cận khi xem xét luật như trên, trong [8] đã đề xuất hai dạng luật: C-luật và F-luật Trong khi C-luật biểu diễn sự phụ thuộc hằng giữa độ
chắc chắn của một câu với các độ chắc chắn của những câu khác, F-luật biểu diễn
sự phụ thuộc này dưới dạng hàm Lập luận trong phần cơ sở tri thức với độ chắc chắn trong này sẽ là một thủ tục lặp các C-luật và F-luật, đươc gọi là suy diễn xác
suất trong
1.4.1 Biểu diễn tri thức với C-luật, F-luật
C-luật được biểu diễn như sau:
<S 1 , I 1 > ∧ … ∧ <S n , I n > → <S, I>,
Trang 23với S1, …, S n , S là những câu trong logic mệnh đề thông thường và I1, …, I n , I là
những khoảng con đóng của khoảng đơn vị [0, 1]
F-luật được biểu diễn như sau:
<S 1 , I 1 > ∧ … ∧ <S n , I n > → <S, f(I 1 , …, I n )>,
với S1, …, S n , S là những câu mệnh đề; I1, …, I n là những biến khoảng và f(I1, …,I n)
là hàm của những biến khoảng I1, …, I n
1.4.2 Toán tử suy diễn trong với C-luật, F-luật
Trước tiên, chúng ta xem xét toán tử suy diễn với C-luật
Xét cơ sở tri thức bao gồm các C-luật B C = {J j | j = 1, …, M},
m j
j j
j
1 1
Gọi X là tập các câu trong cơ sở tri thức B C Đặt Λ là tập tất cả các ánh xạ từ X vào
C[0, 1], với C[0, 1] là tập tất cả các khoảng con đóng của khoảng [0, 1] Mỗi ánh xạ
I ∈ Λ như vậy gán mỗi câu Q ∈ X một khoảng I(Q) ∈ C[0, 1]
Quan hệ thứ tự trên Λ được xác định như sau:
Với hai ánh xạ bất kì I1, I2 ∈ Λ, ta nói rằng I1 I2 khi và chỉ khi I1(Q) ⊆ I2(Q) với mọi Q ∈ X
Luật J j bất kì gọi là thỏa mãn được bởi ánh xạ I ∈ Λ nếu I(A jk) ⊆ Ijk, với mọi
k=1, …, m j
Suy diễn trong cơ sở tri thức gồm các C-luật được xác định bởi toán tử suy
diễn trong T C: Λ → Λ như sau:
Với bất kì I ∈ Λ,
)(
)())(
Q
j
E j C
C I Q I Q I T
∈
∩
Trang 24trong đó, E Q = {j | A = Q và J C j j thỏa mãn được bởi I} Giả sử rằng khi EQ = φ thì
I , khi này, T C (I)(Q) = I(Q) với mọi Q ∈ X
Đặt I’ = T C (I), I’ ∈ Λ Áp dụng lặp lại toán tử suy diễn T C cho I’, sau n lần thu
T là dãy hội tụ và sẽ hội tụ về I*(Q), với I*(Q) ⊆ C[0, 1]:
)()
)(
T n n C
Tiếp theo, chúng ta xem xét toán tử suy diễn với F-luật
Xét cơ sở tri thức bao gồm các F-luật B F = {r j | j = 1 ,m } Mỗi phần tử r j là một luật có dạng:
1 j j m j j m j j F j j j m j j
m j lần
C[0, 1] × … × C[0, 1] vào C[0, 1]
Trang 25Ta kí hiệu: ( ) ( , , )
1 j m j j
Q
E j j
F I Q I Q f I T
Q
E j j
Tương tự như đối với toán tử suy diễn với C-luật, định nghĩa dãy { n( )}n≥0
F I T
một cách đệ quy như sau:
(i) T F0 (I) = I;
(ii) T + I =T T n I ∀I∈Λ
F F
T là dãy hội tụ và sẽ hội tụ về I*(Q), với I*(Q) ⊆ C[0, 1]
)()
)(
T n n F
¾ Suy diễn trong với F-luật không phải luôn dừng với mọi cơ sở tri thức
BF, nghĩa là, không phải bao giờ cũng tồn tại một số tự nhiên n:
Trang 26Khi đó, ( )( ) [ , 1 ] [ 2 , 1 ] 1 ( )( )
1 2
1
1
A I T a
a A I
F
n F
Phần còn lại của mục này được dành để tìm hiểu về toán tử suy diễn từ một cơ
sở tri thức bao gồm cả C-luật và F-luật
Xét cơ sở tri thức B = B C ∪ BF , trong đó B C là tập hợp gồm các C-luật và B F là
tập gồm các F-luật Giả sử giống như những phần trên đây, kí hiệu X là tập các câu trong cơ sở tri thức B, Λ là tập tất cả các ánh xạ từ tập X vào tập C[0,1] Kí hiệu T là
toán tử suy diễn trong với cơ sở tri thức phức hợp này và được định nghĩa:
T
BnÕu
BnÕu
F
C F
trong,
,T
,T
F C
Trong đó T C , T F là các toán tử được định nghĩa trong mục 1.4.2 Kí hiệu (o) là phép hợp thành của các hàm theo nghĩa thông thường, nghĩa là
)) ( ( )
Ví dụ 1.5 Cho ∑ ={S1 = A→B,S2 = A,S3 =B}, A = {A, B} là tập các atom xuất
hiện trong các câu của ∑ Do có 2 atom nên có 22=4 thế giới có thể:
θ1 = (A, B) θ2 = (A, ¬B)
θ = (¬A , B) θ = (¬A, ¬B)
Trang 27Kí hiệu θ2 = (A, ¬B ) có nghĩa là atom A nhận giá trị chân lí là 1, atom B nhận
giá trị chân lí là 0 Ta cũng kí hiệu tương tự cho các trường hợp khác Giá trị chân lí của các câu trong ∑ đã cho tương ứng với các thế giới có thể được cho bởi ma trận sau đây:
Ở cột thứ 4 của ma trận trên chẳng hạn, vector cột (1, 0, 0)t chỉ ra giá trị chân
lí của các câu S1, S2, S3 trong thế giới θ4 Dễ thấy có 4 lớp thế giới có thể Ω = (ω1,
ω2, ω3, ω4) được đặc trưng bởi 4 vector cột phi mâu thuẫn θ1 = (1, 1, 1)t , θ2 = (0,
1, 0)t, θ3 = (1, 0, 1)t, θ4 = (1, 0, 0)t Trong đó, valω(S i ) là giá trị chân lí gán cho S i
dựa trên một thế giới có thể ω, chẳng hạn, với thế giới θ1:
valθ1(S1) = valθ1 (A→B)=1,
valθ1(S2) = valθ1 (A)=1,
valθ1(S3) = valθ1 (B)=1
Ví dụ 1.6 Cho ∑={S1 = A,S2 = A∧B,S3 = A→C}, A = {A, B, C} là tập các atom
xuất hiện trong các câu của ∑ Do có 3 atom nên có 23=8 thế giới có thể:
Trang 28Ở đó, kí hiệu θ3 =(A, B, ¬C ) có nghĩa là atom A nhận giá trị chân lí là 1, atom
B nhận giá trị chân lí là 1 và atom C nhận giá trị chân lí là 0 Tương tự cho các
trường hợp khác
Giá trị chân lí của các câu trong ∑ đã cho tương ứng với các thế giới có thể được cho bởi ma trận sau đây:
Ở cột thứ 2 của ma trận trên, vector cột (1, 0, 1)t chỉ ra giá trị chân lí của các
câu S1, S2, S3 trong thế giới θ2 (S1 nhận giá trị 1, S2 nhận giá trị 0, S3 nhận giá trị 1) Những trường hợp khác tương tự
Dễ thấy lớp các thế giới được xác định bởi ∑- phi mâu thuẫn (0, 0, 1)t là
ω4={θ4, θ5, θ6, θ8}, tương tự ω1={θ1}, ω2={θ2}, ω3={θ3}, ω5={θ7}
Như vậy tập Ω có 5 lớp tương đương các thế giới có thể, hay Ω={ω1, ω2, ω3,
ω4, ω5} , xác định bởi các vector phi mâu thuẫn được cho dưới dạng ma trận sau:
Trang 29Ví dụ 1.7 Cho cơ sở tri thức khoảng ngoài:
B = {< P, [a,A] > , <Q, [b,B] >} Cần tìm xác suất đúng của câu S = P∧Q
Tập các câu Σ và tập các atom L trong B là:
, , ,
Giả sử p = (p1, p2, p3, p4) là phân bố xác suất trên Ω Khi đó, π(P) = p3 + p4,
π(Q) = p2 + p4, π(S) = π(P ∧ Q) = p4 Ta cần tính Max(π(S)) và min(π(S)) trong
miền xác định bởi:
(6)
(5)
(4) 1
4 2
4 3
4 3 2 1
≤
≤+
≤
=+++
B p p b
A p p a
p p p p
Lấy (5)+(6) ta được:
B A p p
p b
a+ ≤ 2 + 3 +2* 4 ≤ + (7)
từ (4) ta có p2 + p3 + p4 = 1 – p1, thay vào (7) ta có:
B A p p
Trang 30B A p b
a+ − ≤ ≤ +
Từ (5)
A p a
p A p a p
≤
≤+
−
⇔
4
3 4
2
Từ (6)
B p b
p B p b p
≤
≤+
−
⇔
4
2 4
−
≤
≤ +
B p b
A p a
B A p b
a
4 4 4
1 1 1
Từ hệ trên ta có: a+b−1≤π(S)=π(P∧Q)= p4 ≤min(A,B)
Ta có π(P∧Q)= p4 nên a+b−1≤π(P∧Q)≤min(A,B), vì π(P ∧ Q)≥0 nên
),min(
)()1,
Trang 31Cách 2 : Áp dụng luật (12), ta được: <A, [0.15, 0.5]>
Trong chương này, chúng ta chỉ ra một dạng tri thức nhằm biểu diễn mối quan
hệ phụ thuộc trực tiếp giữa độ chắc chắn của một câu với độ chắc chắn của các câu khác, còn gọi là độ chắc chắn trong Sự phụ thuộc hằng giữa giá trị xác suất của một câu vào những câu khác gọi là C-luật; khi sự phụ thuộc này biểu diễn dưới dạng hàm thì gọi là F-luật Ở chương này, chúng ta đề cập tới hai dạng biểu diễn tri thức
đó là: biểu diễn tri thức với C-luật và biểu diễn tri thức với F-luật, đồng thời đưa ra phương pháp lập luận trong phần cơ sở tri thức với độ chắc chắn trong mà gọi là suy diễn xác suất trong đó là: suy diễn xác suất trong với C-luật, F-luật mà ban đầu mới là dạng các toán tử suy diễn của nó Chúng ta sẽ đi sâu nghiên cứu các tính chất, mối quan hệ của các loại toán tử suy diễn cũng như những tính chất của quá trình suy diễn xác suất với cơ sở tri thức này ở những chương tiếp theo
Trang 32Chương 2
HỆ TRI THỨC F-LUẬT
Trong chương 1 đã xem xét vấn đề lập luận trong phần cơ sở tri thức với độ
chắc chắn trong, cụ thể đề cập tới hai dạng luật: C-luật và F-luật, và gọi là suy diễn
xác suất trong Bước đầu chúng ta quan tâm tới mô hình và toán tử suy diễn của hai dạng luật này Cùng với các kết quả nghiên cứu trong [8], nhận thấy rằng suy diễn với C-luật luôn luôn dừng và về cơ bản, các C-luật không đem lại nhiều thông tin, trong khi đó, lập luận với F-luật tính dừng phụ thuộc vào rất nhiều vấn đề Chương này sẽ đi sâu vào nghiên cứu hệ tri thức dạng F-luật, cụ thể là mô hình, các toán tử suy diễn và các tính chất của hệ tri thức F-luật
2.1 Các định nghĩa về hệ tri thức F-luật
Gọi tập các khoảng con đóng của đoạn [0, 1] là C[0, 1] = {[a, b]│0≤a≤b≤1}
Sự kiện là một cặp gồm một atom A và một khoảng I là giá trị của atom A,
I ∈C[0,1], kí hiệu là <A, I>, được hiểu là độ tin cậy rằng A đúng nằm trong khoảng
trong đó, A1, …, A m , A là các atom, I1, …, I m là các biến khoảng, f(I1, …, I m) là hàm
của những biến khoảng và cũng là một khoảng con đóng của đoạn [0, 1] Đặt I =
f (I1, …, I m ), như vậy <A, I>, <A i , I i > (i = 1 ,m) là các sự kiện
Định nghĩa 2.2 Cơ sở tri thức F-luật B bao gồm hai thành phần: tập các sự kiện B f
= {<A, I>} và tập các luật B r = {r i}
Gọi X là tập các atom xuất hiện trong các luật của cơ sở tri thức B, Λ là tập các ánh xạ từ X vào C[0, 1]
Trang 33Nhận xét:
¾ Giá trị khoảng của một hay một số sự kiện trong tập các sự kiện B f sẽ
thay đổi khi một hay một số luật trong tập các luật B r được áp dụng
¾ Mỗi I ∈ Λ được xem như một phép gán giá trị cho các atom trong X
2.2 Các toán tử suy diễn
2.2.1 Toán tử suy diễn tổng thể
Toán tử suy diễn tổng thể TR: Λ → Λ được xác định như sau:
X.
A íi
) ( ) )(
E i
i i i
T
Trong đó I ∈ Λ, E A = {i│A = A i } là tập các luật có vế phải là A
Dễ nhận thấy rằng, mỗi một lần áp dụng toán tử T R là một lần tất cả các luật
trong cơ sở tri thức B đồng thời áp dụng toán tử T R Trong khi đó, trong số các luật
thuộc tập E A có thể chỉ có một số luật tham gia vào việc biến đổi giá trị khoảng của
atom A Giả sử có m luật trong B r, vấn đề đặt ra, nếu tại một thời điểm thay vì áp
dụng đồng thời tất cả m luật trong cơ sở tri thức B chỉ áp dụng k luật nhất định (1 ≤
k ≤ m) thì toán tử suy diễn lúc này được xác định ra sao? Khi này, ta đưa vào khái niệm toán tử suy diễn bộ phận ở mục sau đây
2.2.2 Toán tử suy diễn bộ phận
Toán tử suy diễn bộ phận T E: Λ → Λ được xác định như sau:
X, A íi
) ( ) )(
E E i
i i i
T
trong đó I ∈ Λ, E A = {i│A = A i } là tập các luật có vế phải là A, E là tập các chỉ số luật (E ⊆ R)
Trang 34Định nghĩa 2.3 Hệ tri thức F-luật bao gồm cơ sở tri thức F-luật B và toán tử suy
diễn bộ phận T E, kí hiệu là ∆P B
Trường hợp chỉ sử dụng toán tử suy diễn tổng thể thì hệ tri thức F-luật được kí hiệu là ∆B
Trong hệ tri thức F-luật, giá trị của các atom được xác định như sau:
- Kí hiệu I0 là phép gán giá trị ban đầu cho các atom, I0 ∈ Λ được xác định như sau:
( )
i i i f i
- Kí hiệu v(n) là vết suy diễn Vết suy diễn v(n) = E1…E n tương ứng với việc
áp dụng toán tử suy diễn bộ phận theo thứ tự T E TE n
1 Sau khi suy diễn theo vết
v (n), phép gán giá trị của các atom kí hiệu là I v(n) (I v(n) ∈ Λ) được xác định như sau:
+ ( 1 ) ( 0)
1 I T
I v = E
+ ( ) = ( v(k− 1 ))
E k
v T I
Nếu E i = R, ∀i = 1 ,n thì sẽ viết I n thay cho I v(n) Khi đó, ta hiểu phép gán giá trị
này tương ứng với việc lặp n lần toán tử suy diễn tổng thể
Chúng ta sẽ gọi v(n) là vết suy diễn đơn nếu E i chỉ gồm một chỉ số
Nhận xét:
¾ Khi áp dụng toán tử T E , giá trị của một số sự kiện trong B f được giữ nguyên, một số được gán giá trị mới
¾ T R chính là toán tử suy diễn bộ phận T E khi E = R Do đó, các định nghĩa
chung cho các toán tử suy diễn bộ phận có thể áp dụng cho toán tử suy diễn tổng thể
Trang 35¾ Quá trình suy diễn sẽ nhanh hơn, tiết kiệm được thời gian tính toán và không gian nhớ nếu suy diễn bằng toán tử suy diễn bộ phận mà tại mỗi bước chọn
2.3 Tính dừng, ổn định, mâu thuẫn của các hệ tri thức F-luật
j m j
j j
j
r
trong cơ sở tri thức B
Một F-luật r j được gọi là F-luật không tăng nếu với ∀I1, I2 ∈ Λ, I1 I2 thì
f j (I2) ⊆ fj (I1), với là quan hệ thứ tự được định nghĩa trong mục 1.4.2
Nhận xét: Vấn đề đặt ra, đối với các lớp hàm còn lại trong các tri thức dạng F-luật
thì tính dừng của nó được xem xét ra sao Chúng ta đi nghiên cứu về tính dừng của
hệ tri thức dạng F-luật nói chung đối với các vết suy diễn Từ đó chỉ ra tính ổn định của hệ tri thức
Kí hiệu giá trị khoảng của atom A ∈ Λ với phép gán giá trị I n , I v(n) lần lượt là
1
n v i n
Trang 36Định nghĩa 2.5 Hệ tri thức F-luật ∆P B được gọi là dừng đối với vết v(n) nếu thỏa
mãn:
) ( )
( )
Nghĩa là, với suy diễn bộ phận khi áp dụng toán tử suy diễn tổng thể lên I v(n)
thì giá trị của các atom không thay đổi
Định nghĩa 2.6 Hệ tri thức F-luật ∆P B được gọi là phi mâu thuẫn đối với vết v(n)
nếu thỏa mãn:
A ,
) (n ≠φ ∀ ∈Χ
v A I
Định nghĩa 2.7 Hệ tri thức F-luật ∆P B được gọi là ổn định đối với vết v(n) khi hệ
P
B
∆ vừa là hệ dừng vừa là hệ phi mâu thuẫn đối với vết v(n)
Định nghĩa 2.8 Hệ tri thức ∆P B là ổn định nếu và chỉ nếu tồn tại vết v(n) để ∆P B là
ổn định đối với vết v(n) Khi đó, v(n) được gọi là một vết suy diễn ổn định và giá trị
chân lí các atom đối với hệ ∆P B đúng bằng giá trị chân lí các atom đối với vết v(n)
Nhận xét:
¾ Một hệ tri thức F-luật ổn định sẽ giúp khai thác được tối đa hệ, tìm được vết suy diễn đưa hệ về trạng thái dừng và cho kết quả chứa đựng nhiều thông tin nhất
¾ Một hệ tri thức không ổn định (mâu thuẫn hoặc không dừng với vết suy
diễn v(n) nào đó) sẽ được coi là một hệ tri thức không tốt, trường hợp này có thể
dừng lại không xét hoặc hiệu chỉnh lại hệ tri thức này
2.4 Biểu diễn hệ tri thức F-luật
Đồ thị luôn là một công cụ hữu hiệu để áp dụng vào việc biểu diễn tri thức, đặc biệt trong xử lí thông tin không chắc chắn Bằng cách xây dựng một đồ thị có