MỞ ĐẦU Trong Trí tuệ nhân tạo, để phân tích, thiết kế và xây dựng các hệ thống ứng dụng thông minh như hệ chuyên gia, hệ trợ giúp quyết định, hệ giải toán dựa trên tri thức, ta phải quan
Trang 1ĐẠI HỌC QUỐC GIA TP.HCM
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN
Trang 2ĐẠI HỌC QUỐC GIA TP.HCM
-TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN
PHẢN BIỆN ĐỘC LẬP:
1 PGS.TS Trần Văn Lăng
2 PGS.TS Phạm Thế Bảo NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS TS Đỗ Văn Nhơn
Trang 3LỜI CAM ĐOAN
Tôi xin cam đoan đây là công trình nghiên cứu khoa học độc lập của riêng tôi Các kết quả nghiên cứu trong luận án do tôi tự tìm hiểu, phân tích một cách trung thực, khách quan và đã công bố theo đúng quy định Các kết quả này chưa từng được công bố trong bất kỳ nghiên cứu nào khác
Nghiên cứu sinh
Nguyễn Đình Hiển
Trang 4LỜI CÁM ƠN
Trước hết, em xin gửi lời cảm ơn sâu sắc đến thầy PGS.TS Đỗ Văn Nhơn, người trực tiếp hướng dẫn khoa học, đã luôn dành nhiều thời gian, công sức hướng dẫn em trong suốt quá trình thực hiện nghiên cứu và hoàn thành luận án này
Để thực hiện và hoàn thành luận án này, em đã nhận được sự hỗ trợ, giúp đỡ từ
GS Katsumi Inoue (NII), GS Ali Selamat (UTM), GS Chiaki Sakama (Wakayama) Em cũng xin cám ơn sự góp ý của thầy Thái, thầy Bảo, thầy Thơ, thầy Phúc, thầy Nguyên… trong quá trình thực hiện luận án Nghiên cứu này cũng được hoàn thành dựa trên sự tham khảo, học tập kinh nghiệm từ các kết quả nghiên cứu liên quan, các sách, báo chuyên ngành của nhiều tác giả ở các trường Đại học, các tổ chức nghiên cứu
Em cũng xin chân thành gửi lời cảm ơn đến các thầy cô trong khoa Khoa học máy tính và trường Đại học Công Nghệ Thông Tin, ĐHQG-HCM đã tận tình dạy dỗ, chỉ bảo nhiều kiến thức quý báu giúp em hoàn thành luận án
Cuối cùng, em xin cám ơn sự giúp đỡ, tạo điều kiện về vật chất và tinh thần từ phía bạn bè và các đồng nghiệp Đặc biệt, xin chân thành cảm ơn gia đình, cha mẹ, và vợ đã khích lệ, động viên, tạo điều kiện thuận lợi cho em trong suốt thời gian làm nghiên cứu sinh
Nghiên cứu sinh
Nguyễn Đình Hiển
Trang 5MỤC LỤC
MỞ ĐẦU 6
CHƯƠNG 1: BIỂU DIỄN TRI THỨC VÀ CÁC PHƯƠNG PHÁP SUY LUẬN 7
1.1 Tổng quan về biểu diễn tri thức 7
1.1.1 Các phương pháp biểu diễn tri thức 8
1.1.1.1 Các phương pháp biểu diễn các miền tri thức mang tính cục bộ 8
1.1.1.2 Các phương pháp biểu diễn cho các miền tri thức tổng quát 8
1.1.1.3 Các phương pháp biểu diễn cho các ứng dụng 9
1.1.2 Các hệ thống ứng dụng dựa trên cơ sở tri thức 10
1.1.2.1 Hệ chuyên gia 11
1.1.2.2 Hệ hỗ trợ giải bài tập thông minh trong giáo dục 11
1.2 Biểu diễn tri thức theo tiếp cận đại số 17
1.2.1 Phương pháp logic 17
1.2.2 Biểu diễn sử dụng ontology 18
1.2.3 Một số phương pháp biểu diễn khác theo tiếp cận đại số 20
1.3 Các phương pháp suy diễn 25
1.3.1 Suy diễn tiến 25
1.3.2 Suy diễn lùi 26
1.3.3 Lập luận dựa trên tình huống 27
1.3.4 Suy diễn dựa trên tri thức Bài toán mẫu và Mẫu bài toán 27
1.3.5 Suy diễn với heuristic 29
1.4 Mục tiêu luận án 30
1.4.1 Mục tiêu chung của luận án 30
1.4.2 Các vấn đề giải quyết trong luận án 30
Trang 61.4.2.1 Xây dựng phương pháp biểu diễn tri thức quan hệ 31
1.4.2.2 Xây dựng phương pháp biểu diễn tri thức toán tử 32
1.4.2.3 Xây dựng phương pháp biểu diễn tri thức có cả quan hệ và toán tử 32
1.5 Phương pháp nghiên cứu 33
1.6 Tóm tắt các kết quả của luận án 33
Chương 2: MÔ HÌNH TRI THỨC QUAN HỆ 36
2.1 Mô hình tri thức quan hệ 36
2.1.1 Cấu trúc các thành phần trong Rela-model 37
2.1.2 Đối tượng và các hành vi 41
2.1.3 Hợp nhất sự kiện 41
2.1.3 Ngôn ngữ đặc tả 42
2.2 Mô hình bài toán và thuật giải 44
2.2.1 Bài toán trên đối tượng và các thuật giải 44
2.2.2 Bài toán trên mô hình Rela-model 51
2.2.3 Ví dụ 55
2.2.4 Các quy tắc heuristic 56
2.3 Ứng dụng xây dựng Hệ giải bài tập thông minh kiến thức hình học không gian cấp Trung học phổ thông 58
2.3.1 Thiết kế hệ thống 58
2.3.2 Kết quả thực nghiệm 61
2.4 Kết luận chương 2 66
Chương 3: MÔ HÌNH TRI THỨC TOÁN TỬ 68
3.1 Mô hình tri thức toán tử 68
Trang 73.1.2 Thành phần khái niệm 69
3.1.3 Thành phần toán tử 70
3.1.4 Phân loại các sự kiện và Sự hợp nhất các sự kiện 72
3.2 Mô hình bài toán và thuật giải 73
3.2.1 Mô hình bài toán 73
3.2.2 Thuật giải giải quyết các vấn đề 77
a) Thuật giải suy diễn trên đối tượng 77
b) Thuật giải cho bài toán xác định một đối tượng hay giá tri một biểu thức 78
c) Thuật giải rút gọn biểu thức 79
d) Thuật giải chứng minh một đẳng thức: 81
e) Thuật giải biến đổi một đối tượng 82
3.2.3 Định lý 83
3.3 Ứng dụng xây dựng hệ hỗ trợ giải bài tập kiến thức Đại số vector 85
3.3.1 Thiết kế cơ sở tri thức Đại số vector 85
3.3.2 Thiết kế động cơ suy diễn 85
3.3.3 Kết quả thực nghiệm 87
3.4 Kết luận chương 3 91
Chương 4: MÔ HÌNH TRI THỨC QUAN HỆ VÀ TOÁN TỬ 92
4.1 Mô hình tri thức quan hệ và toán tử 92
4.1.1 Cấu trúc các thành phần của mô hình 92
4.1.2 Thành phần khái niệm 92
4.1.3 Sự kiện trong mô hình tri thức quan hệ và toán tử 93
4.1.3.1 Cấu trúc của mệnh đề 93
4.1.3.2 Cấu trúc của vị từ 94
Trang 84.1.3.3 Hợp nhất sự kiện 95
4.1.4 Thành phần luật 96
4.2 Các lớp bài toán và Thuật giải 96
4.2.1 Mô hình bài toán 96
4.2.1.1 Bài toán trên một đối tượng 96
4.2.1.2 Bài toán trên mô hình tri thức quan hệ và toán tử 97
4.2.2 Thuật giải cho bài toán trên mô hình tri thức quan hệ và toán tử 97
4.2.2.1 Thuật giải cho bài toán dạng 1 97
4.2.2.2 Thuật giải cho bài toán dạng 2 99
4.3 Ứng dụng xây dựng hệ hỗ trợ giải bài toán kiến thức Đại số tuyến tính 100
4.3.1 Thiết kế hệ thống 100
4.3.2 Thực nghiệm chương trình 101
4.4 Kết luận chương 4 102
CHƯƠNG 5: KẾT LUẬN 103
5.1 Kết quả của luận án 103
5.2 Hướng phát triển 105
CÁC BÀI BÁO KHOA HỌC CỦA LUẬN ÁN 107
TÀI LIỆU THAM KHẢO 109
Trang 9DANH MỤC HÌNH VẼ
Hình 1.1: Cấu trúc hệ giải bài tập thông minh trong giáo dục 12
Hình 1.2: Sơ đồ phương pháp suy diễn dựa trên tri thức bài toán mẫu 29
Hình 2.1: Cấu trúc mô hình tri thức quan hệ (Rela-model) 37
Hình 2.2: Kiến trúc hệ giải bài tập thông minh 58
DANH MỤC BẢNG Bảng 1.1: Các mức độ của các tiêu chuẩn cho phương pháp biểu diễn tri thức 15
Bảng 1.2: So sánh các phương pháp biểu diễn 25
Bảng 2.1: Cơ sở tri thức của hệ thống 63
Bảng 2.2: Khả năng giải bài tập của các chương trình 65
Bảng 2.3: So sánh các hệ thống giải bài tập hình học không gian 65
Bảng 3.1: Kết quả thực nghiệm của chương trình 90
Bảng 3.2: Kết quả khảo sát 91
Bảng 4.1: Kết quả việc giải các bài tập thử nghiệm trong sách 102
Bảng 5.1: Các mô hình tri thức đối với các tiêu chuẩn của mô hình tri thức 105
Trang 10MỞ ĐẦU
Trong Trí tuệ nhân tạo, để phân tích, thiết kế và xây dựng các hệ thống ứng dụng thông minh như hệ chuyên gia, hệ trợ giúp quyết định, hệ giải toán dựa trên tri thức, ta phải quan tâm đến hai vấn đề cơ bản, quan trọng nhất, đó là thiết kế một cơ sở tri thức cho
hệ thống và một động cơ suy diễn, tìm kiếm lập luận dựa trên tri thức
Tiếp cận đại số là phương pháp biểu diễn chặt chẽ về mặt lý luận Phương pháp này
là cơ sở khoa học cho việc thiết kế các hệ cơ sở tri thức và phương pháp suy luận để giải quyết các vấn đề trong hệ thống Kết quả của việc tiếp cận đại số cho ta một công cụ toán học để biểu diễn, lập luận và chứng minh các tính chất một cách chặt chẽ và chuẩn mực Trong luận án này, chúng tôi sẽ xây dựng các mô hình tri thức theo tiếp cận đại số Các
mô hình tri thức này có thể biểu diễn các dạng tri thức khác nhau, phổ biến trong thực tế Cấu trúc các mô hình gồm các thành phần tri thức, như thành phần khái niệm, tri thức quan hệ, tri thức toán tử, các luật suy diễn Các mô hình được xây dựng trong luận án gồm: mô hình biểu diễn tri thức quan hệ (Rela-model), mô hình biểu diễn tri thức toán tử (Ops-model), mô hình biểu diễn sự kết hợp tri thức quan hệ và toán tử (Rela-Ops model) Các thành phần trong mô hình là những tập hợp có cấu trúc và các tính chất nhất định Thông qua cấu trúc của mô hình tri thức, chúng tôi cũng nghiên cứu và mô hình hóa các lớp vấn đề (bài toán) của miền tri thức Các thuật giải suy luận để giải quyết các lớp vấn
đề được nghiên cứu dựa trên cấu trúc của mô hình tri thức Các thuật giải này cũng được chứng minh về tính hữu hạn và tính hiệu quả
Bên cạnh đó, các phương pháp biểu diễn tri thức trong luận án được ứng dụng trong việc xây dựng các hệ thống hỗ trợ giải bài tập thông minh, đặc biệt là các kiến thức về toán học, vật lý Các mô hình này thức đáp ứng được các tiêu chuẩn của một mô hình tri thức cho hệ thống thông minh hỗ trợ giải bài tập trong giáo dục
Trang 11CHƯƠNG 1: BIỂU DIỄN TRI THỨC VÀ CÁC PHƯƠNG PHÁP
SUY LUẬN
1.1 Tổng quan về biểu diễn tri thức
Trong khoa học Trí tuệ nhân tạo, biểu diễn tri thức và phương pháp suy diễn đóng một vai trò quan trọng, quyết định trong quá trình xây dựng và cài đặt hệ thống thông minh, đặc biệt là các hệ chuyên gia Biểu diễn tri thức giúp cho hệ thống trở nên thông minh và dễ dàng tương tác hơn với người dùng [67] Để xây dựng các hệ thống trên, chúng ta phải thiết kế một cơ sở tri thức cho hệ thống và một động cơ suy diễn để giải quyết các vấn đề dựa trên tri thức Chất lượng hoạt động của các hệ này phụ thuộc rất lớn vào tri thức đã có cũng như cách biểu diễn và tổ chức [84] Việc xây dựng mô hình biểu diễn cho phép chúng ta có thể mô phỏng các tri thức, đồng thời có thể xác định được các kết quả có thể suy luận được từ tri thức
Hiện nay, về biểu diễn tri thức có một số quan điểm nổi bật như sau:
Trong [59], tác giả đã định nghĩa biểu diễn tri thức qua hai khái niệm “tri thức” và “biểu diễn” Tri thức chính là sự mô tả thế giới quan, và biểu diễn chính là việc
mã hóa tri thức đó để có thể lưu trữ được trên máy tính Những loại tri thức khác nhau sẽ cần phải có những cách biểu diễn tương ứng
Theo Crisp-Bright [49], tri thức là kết quả của quá trình nhận thức, học tập và
lý luận Nói cách khác, để có quá trình nhận thức tốt hơn, tri thức phải được tạo ra, biểu diễn và lưu trữ
Bên cạnh đó, theo R Danvis và các cộng sự [16], biểu diễn tri thức là sự thay thế của một sự vật, cho phép thực thể ấy xác định được kết quả của suy nghĩ, đồng thời biểu diễn tri thức cũng là cơ sở của lý thuyết thông minh, là phương tiện cho việc tính toán một cách hiệu quả
Theo [28], biểu diễn tri thức chính là việc nghiên cứu sử dụng các ký hiệu hình thức để biểu diễn tập hợp các mệnh đề Tuy nhiên, định nghĩa này chỉ có thể áp dụng cho các dạng tri thức dưới dạng logic mệnh đề
Trang 12Biểu diễn tri thức chính là nghiên cứu các phương pháp mô hình các tri thức thực tế lên hệ thống máy tính để xác lập cách tổ chức lưu trữ tri thức trên máy tính, thông qua đó
hệ thống có thể thực hiện một số tác vụ nhất định của con người, đặc biệt là hoạt động suy luận [84] Một phương pháp biểu diễn tri thức bao gồm mô hình tri thức, các lớp bài toán của cơ sở tri thức và các kỹ thuật suy diễn tự động Nghiên cứu biểu diễn tri thức đóng góp cho sự phát triển của khoa học máy tính, đồng thời giúp cho sự phát triển trong các ứng dụng thực tế từ các lĩnh vực trong trí tuệ nhân tạo đến công nghệ phần mềm
1.1.1 Các phương pháp biểu diễn tri thức
1.1.1.1 Các phương pháp biểu diễn các miền tri thức mang tính cục bộ
Các phương pháp biểu diễn tri thức này bao gồm các phương pháp cổ điển như: biểu diễn bằng logic, hệ luật dẫn, mạng ngữ nghĩa [38, 40], kết hợp với các phương pháp tìm kiếm trên đồ thị để tìm kiếm mục tiêu của bài toán như: BFS, DFS, A*,…[48] Các phương pháp này hướng đến việc xây dựng các hệ thống giải quyết vấn đề tổng quát (General problem solver) [1], trong đó các miền tri thức của hệ thống mang tính cục bộ Các phương pháp này chỉ hướng đến việc giải quyết các vấn tri thức mang tính đơn lẻ Các hệ thống xây dựng các cấu trúc dữ liệu để giải quyết mục tiêu của bài toán bằng cách phân rã mục tiêu thành các mục tiêu nhỏ hơn, từ đó xây dựng các chiến lược để giải quyết các mục tiêu nhỏ hơn này
Các phương pháp biểu diễn tri thức này được sử dụng trong việc giải quyết các bài toán về chứng minh định lý tự động (automated theorem proving) như QA3, QA4 [2, 3],
hệ thống giải quyết bài toán lập kế hoạch (planning problem) như QLISP [5], NOAH (Nets of Action Hierarchies) [7], các hệ thống DDPP, LDPP để giải bài toán SAT (satisfiability problem) dựa trên giải thuật Davis-Putnam [23], biểu diễn các luật logic bằng các ma trận và tensors [71, 85, 88], KLAUS cho các hệ thống suy diễn ngôn ngữ tự nhiên [13]
1.1.1.2 Các phương pháp biểu diễn cho các miền tri thức tổng quát
Các hệ thống thông minh trong trí tuệ nhân tạo hướng đến việc xây dựng các hệ
Trang 13chính là các hệ chuyên gia [19] Các hệ thống này gồm 2 thành phần chính [10]: Cơ sở tri thức và động cơ suy diễn Các phương pháp biểu diễn tri thức cho việc tổ chức cơ sở tri thức được hướng đến việc có thể ứng dụng trong nhiều miền tri thức để đáp ứng các nhu cầu tổ chức cơ sở tri thức trong các hệ chuyên gia khác nhau
Một số phương pháp biểu diễn tiêu biểu như: biểu diễn dựa trên logic mô tả [24], xây dựng các đồ thị khái niệm trên cơ sở mạng ngữ nghĩa [6], biểu diễn bằng frame và script [4, 57] Bên cạnh đó, các nhà nghiên cứu cũng xây dựng các phương pháp theo tiếp cận ontology dựa trên các framework [9, 42], cũng như các các mô hình hình thức (symbolic model) theo tiếp cận đại số [44, 60]
Các phương pháp biểu diễn tri thức này đã đạt được một số kế quả nhất định, như xây dựng hệ thống chẩn đoán trong y khoa cho bệnh nhiễm trùng máu MYCIN [11], chương trình xác định công thức hóa học hữu cơ Dendral [8] Bên cạnh đó, các nhà nghiên cứu cũng đã xây dựng các hệ thống để tổ chức cơ sở tri thức như: Prolog để tổ chức cơ sở tri thức dưới dạng logic [12], KADS (Knowledge Acquisition and Documentation Structuring) cho các hệ thống suy diễn [15], hệ thống EcoCyc để biểu diễn các thông tin
về bộ gene của vi khuẩn E Coli hỗ trợ cho các nhà sinh học trong việc phân tích các tính toán [20]
1.1.1.3 Các phương pháp biểu diễn cho các ứng dụng thực tiễn mang tính hệ thống
Các phương pháp biểu diễn tri thức hướng đến việc xây dựng các hệ thống thực tiễn mang tính hệ thống hơn, trong đó các phương pháp tập trung việc biểu diễn các khái niệm một cách chuẩn xác [60, 67] Các phương pháp này giúp cho việc tìm kiếm, xử lý các thông tin chính xác hơn Một số các phương pháp biểu diễn tri thức được nghiên cứu: biểu diễn bằng mạng neural, biểu diễn bằng các ontology [18, 22], xây dựng các các mô hình hình thức cho việc biểu diễn tri thức [60, 18]
Việc nghiên cứu các phương pháp biểu diễn theo ontology dẫn đến sự ra đời các công
cụ hỗ trợ cho biểu diễn theo ontology như Protégé [45], hệ thống tiêu chuẩn cho biểu diễn web ngữ nghĩa OWL (Ontology Web Language) dựa trên logic mô tả [24, 31], RDF (Resourse Description Framework) [75] Bên cạnh đó, nhiều ứng dụng sử dụng tri thức
Trang 14cũng được xây dựng như: Ocelot hỗ trợ cho việc quản trị cơ sở tri thức [21], xây dựng mạng ConceptNet của dự án Open Mind Common Sense (MIT Media Lab) giúp cho máy tính có thể nắm bắt được ý nghĩa các từ mà con người sử dụng [90]
Hiện nay, các nhà nghiên cứu hướng đến việc xây dựng các hệ thống tích hợp dựa trên sự phối hợp các phương pháp biểu diễn tri thức [67] Tri thức của hệ thống được thu thập từ các nguồn khác nhau như: mạng xã hội, hành vi và kiến thức con người thông qua các tương tác trên Internet, thông tin dưới dạng văn bản (text) như sách, báo chí, và thông tin từ các tập dữ liệu lớn (big data) Điều này dẫn đến đòi hỏi cần phải có các phương pháp biểu diễn tri thức thích hợp cho các nguồn tri thức này, chẳng hạn như phương pháp
sử dụng đồ thị tri thức [43, 74] Vì vậy, bên cạnh việc biểu diễn các tri thức chắc chắn, các phương pháp biểu diễn tri thức không chắc chắn cũng được nghiên cứu [76]
Các ứng dụng biểu diễn tri thức hiện nay rất đa dạng trong nhiều lĩnh vực như: Các hệ thống hỏi đáp ứng dụng cho trợ lý ảo như Siri, Microsoft Cortana [68, 83]; hệ thống IBM Watson ứng dụng trong các lĩnh vực như: giáo dục, y tế, IoT, … [91]; Hệ thống AlphaGo-Zero có thể tự học để tự huấn luyện khả năng chơi cờ vây [80] Các công cụ hỗ trợ cho việc xây dựng tri thức cho hệ thống cũng được nghiên cứu như Knowledge Graph [81, 74, 95], WordNet cho việc xây dựng các ontology từ vựng [37, 63], FrameNet [54]
1.1.2 Các hệ thống ứng dụng dựa trên cơ sở tri thức
Tri thức thường bao gồm nhiều thành phần trừu tượng, cùng với những mối liên hệ rất
đa dạng và phức tạp giữa các thành phần [38, 48] Các thành phần tri thức thường gặp bao gồm thành phần tri thức khái niệm, thành phần tri thức quan hệ, thành phần tri thức toán tử, thành phần tri thức hàm, các sự kiện và các luật; trong đó thành phần tri thức khái niệm cùng với các quan hệ cơ bản trên khái niệm là phần nền tảng của tri thức Tri thức còn bao gồm cả kinh nghiệm và các quy tắc hỗ trợ cho quá trình suy luận giải quyết các vấn đề liên quan đến tri thức trong một lĩnh vực hay phạm vi tri thức nhất định Các hệ thống thông minh cần được trang bị một cơ sở tri thức đủ mạnh để giải quyết các vấn đề trong lĩnh vực Các hệ cơ
sở tri thức có thể được phân loại dựa vào các khía cạnh với những tiêu chuẩn đặc trưng nhất
Trang 15định như dựa vào tính đóng mở, dựa vào phương pháp biểu diễn tri thức, hay phân loại dựa theo lĩnh vực ứng dụng
1.1.2.1 Hệ chuyên gia
Hệ chuyên gia (expert system) là một hệ thống xây dựng dựa trên cơ sở tri thức có thể mô phỏng kỹ năng và hành động của một chuyên gia Hệ chuyên gia sử dụng các tri thức của những chuyên gia để giải quyết các vấn đề khác nhau trong lĩnh vực Một hệ chuyên gia gồm hai thành phần chính là cơ sở tri thức và động cơ suy diễn, cùng với
thành phần để hệ thống giao tiếp với người sử dụng [10]
Cơ sở tri thức biểu diễn các sự kiện là những gì đã biết hay những thông tin có ích của chuyên gia Hiện nay, cơ sở tri thức của hệ chuyên gia được xây dựng trên cấu trúc của của tri thức lĩnh vực và các khái niệm của tri thức theo tiếp cận hướng đối tượng Động cơ suy diễn là một hệ thống suy diễn tự động dựa trên cơ sở tri thức thông qua việc áp dụng các luật của tri thức được đặc tả Bên cạnh việc suy diễn, động cơ suy diễn cũng có khả năng giải thích một kết luận cụ thể cho người sử dụng thông qua một chuỗi các lý luận Người dùng sẽ cung cấp sự kiện, giả thiết cho hệ thống thông qua bộ giao tiếp của hệ chuyên gia và nhận được những câu trả lời là những lời khuyên hay những gợi
ý từ hệ thống
Một hệ chuyên gia cần phải có các đặc trưng sau: tính hiệu quả cao, thời gian trả lời thích hợp, có độ tin cậy cao và dễ hiểu Vì cơ sở tri thức chính là thành phần trung tâm của một hệ chuyên gia, do đó quá trình phát triển hệ chuyên gia đi cùng với sự phát triển của các phương pháp biểu diễn tri thức Hiện nay, hệ chuyên gia đã có nhiều ứng dụng trong các lĩnh vực như: hóa học (DENDRAL, SECS), điện tử (ACE, SOPHIE), hệ chẩn đoán y khoa (MYCIN, AI/COAG, ONCOCIN), hệ thống máy tính (XCON, TIMM, BDS) [53]
1.1.2.2 Hệ hỗ trợ giải bài tập thông minh trong giáo dục
a) Yêu cầu của hệ thống:
Các ứng dụng trong lĩnh vực giáo dục khoa học kỹ thuật, công nghệ và toán học (Science Technology Engineering and Math - STEM) là một trong những thách thức lớn
Trang 16trong việc nghiên cứu các phương pháp biểu diễn tri thức [67, 82] Các ứng dụng này có giá trị thực tiễn rất lớn, đòi hỏi phải có một giao tiếp tự nhiên giữa người dùng và hệ thống, do đó việc nhập và xuất thông tin của hệ thống phải tương tự như cách con người tiếp nhận và giải quyết vấn đề
Trong giáo dục, hệ thống cần phải có một hệ cơ sở tri thức đầy đủ để có thể hướng dẫn, hỗ trợ người học, đặc biệt là các hệ thống hỗ trợ giải bài tập thông minh (Intelligent Problem Solver – IPS) Trong hệ thống này, người học chỉ cần khai báo các giả thiết và mục tiêu của bài toán theo một ngôn ngữ đặc tả nhất định Người dùng có thể yêu cầu hệ thống giải hoặc đưa ra các hướng dẫn giải cho các bài tập đó [62] Vì vậy, các hệ thống
hỗ trợ giải bài tập thông minh cần phải có một cơ sở tri thức đầy đủ để có thể giải được các bài tập thông dụng ở mức độ cơ bản và nâng cao trong kiến thức của môn học
Hình 1.1: Cấu trúc hệ giải bài tập thông minh trong giáo dục [62]
Bên cạnh đó, các lời giải hay hướng dẫn của hệ thống này còn phải mang tính sư phạm, giúp người dùng hiểu rõ hơn về bài học và phương pháp giải các bài tập [36, 62]
Hệ thống này cần phải đảm bảo các yêu cầu sau [36, 86]:
(RQ1) Chương trình có thể giải được các bài tập thông dụng của môn học: Dựa
trên cơ sở tri thức của hệ thống, chương trình có thể tự động giải được các bài tập cơ bản và các dạng bài tập nâng cao thông dụng trong kiến thức môn học
(RQ2) Bài toán phải được đặc tả bằng ngôn ngữ gần với ngôn ngữ tự nhiên của
con người Đồng thời, lời giải của bài toán cũng phải rõ ràng, từng bước, tương
Trang 17(RQ3) Quá trình giải hay hướng dẫn giải bài tập cần phải tương tự như quá trình người học suy luận để giải quyết bài toán Lời giải phải được trình bày một cách
dễ hiểu, phù hợp với trình độ kiến thức của người học
b) Các hệ thống ứng dụng hỗ trợ giải bài tập thông minh:
Hiện nay, có rất nhiều ứng dụng trong lĩnh vực hệ hỗ trợ giải bài tập thông minh, tuy nhiên các hệ thống chưa đáp ứng được các yêu cầu của một hệ thống hỗ trợ trong giáo dục:
Các hệ chứng minh định lý tự động (automated theorem proving) [64] có thể chứng minh được các định lý hình học; tuy nhiên, lời giải của chương trình lại dùng các phương pháp đại số, như cơ sở Grobner [27], phương pháp Wu [41], cấu trúc đại số [29] Các phương pháp này không mô phỏng được quá trình suy nghĩ cuả con người trong việc giải quyết vấn đề, lời giải không phù hợp với trình độ của người học nên người học cũng rất khó để hiểu được
Các website hỗ trợ giải bài tập, như: Mathway [92], Symbolab [93], có thể giải các bài tập một cách tự động Lời giải của chương trình tự nhiên, từng bước Tuy nhiên, cơ sở tri thức của các hệ thống này ở dạng frame, do đó chỉ giải được các dạng bài tập đơn giản, được cài đặt sẵn và không thể giải được các bài tập cần phải vận dụng kiến thức chuyên sâu
Bên cạnh đó, trong [35], tác giả cũng đã xây dựng một chương trình rút gọn các biểu thức lượng giác bằng các luật kết hợp (combination rules) Tuy nhiên, chương trình chỉ biểu diễn được các biểu thức lượng giác dưới dạng đa thức, và còn nhiều hạn chế trong việc giải các bài tập về biểu thức lượng giác
Trong [69], tác giả đã sử dụng mô hình tri thức về các đối tượng tính toán trong [62, 70] (Computational Objects Knowledge Base - COKB) để xây dựng hệ thống hỗ trợ học
tập môn Toán cấp THCS Trong hệ thống này, tác giả đã xây dựng ba phân hệ: 1/ Phân
hệ hỗ trợ giải bài tập toán tự động: Chương trình cho lời giải các bài tập môn Toán cấp
Trung học cơ sở theo ngôn ngữ tự nhiên, từng bước, rõ ràng như cách viết tay của một
người làm bài; 2/ Phân hệ hỗ trợ tra cứu kiến thức: Chương trình đáp ứng được một số
Trang 18yêu cầu tra cứu kiến thức thông dụng của người sử dụng; 3/ Phân hệ hỗ trợ kiểm tra đánh giá kiến thức: Chương trình có hỗ trợ chức năng đánh giá kiến thức thông qua kết quả của
bài kiểm tra, giúp người dùng xác định, đánh giá những kiến thức liên quan còn yếu c) Các tiêu chuẩn của phương pháp biểu diễn tri thức cho hệ thống:
Trong hệ thống IPS trong giáo dục, việc thiết kế cơ sở tri thức và bộ suy diễn đóng vai trò quan trọng trong việc xây dựng hệ thống Vì vậy, để đáp ứng được yêu cầu (RQ1) của
hệ thống, cơ sở tri thức cần phải đầy đủ Cơ sở tri thức phải được tổ chức một cách chính xác và đầy đủ các kiến thức của môn học Hơn nữa, phương pháp biểu diễn tri thức cần phải tiện lợi đối với việc học của người dùng Việc biểu diễn ấy cần phải giúp cho người học có thể nắm bắt và hiểu được các phương pháp giải bài tập Điều này giúp cho hệ thống có thể đáp ứng được yêu cầu (RQ2) và (RQ3) Vì vậy, một phương pháp biểu diễn tri thức cho hệ thống hỗ trợ giải bài tập thông minh cần phải thỏa các tiêu chuẩn sau [BB10, 86]:
- Tính khả dụng (Usability):
Phương pháp biểu diễn có thể diễn đạt được hoàn toàn tri thức muốn biểu diễn Quá trình này có thể được thực hiện thông qua những cải tiến nhỏ, là những điều chỉnh không ảnh hưởng đến cấu trúc của tri thức
Phân loại được các yếu tố, thành phần cơ bản của một miền tri thức, đặc biệt là các thành phần: Khái niệm, quan hệ, toán tử và luật
Cơ sở tri thức có thể dùng để suy luận giải quyết các vấn đề hướng tới giải quyết các vấn đề thực tiễn của một hệ thống hỗ trợ giải bài tập
Trang 19- Tính hình thức (Formality):
Các thành phần trong mô hình được nghiên cứu một cách hình thức, thông qua các cấu trúc đại số hoặc các cấu trúc toán học khác
Các lớp bài toán trên mô hình cũng phải được mô hình hóa
Cơ sở để chứng minh cho tính đúng đắn của các thuật giải suy diễn một cách chặt chẽ
Mỗi tiêu chuẩn này có 4 mức độ, mỗi mức độ của tiêu chuẩn tương ứng với các tiêu chí được đánh giá như trong bảng 1.1
Bảng 1.1: Các mức độ của các tiêu chuẩn cho phương pháp biểu diễn tri thức cho hệ
Được xây dựng cho một miền tri thức giáo dục cụ thể
Ứng dụng cho các dạng miền tri thức
có những đặc trưng nhất định
Có thể ứng dụng vào các miền tri thức giáo dục trong thực tế, đặc biệt là cho các hệ thống hỗ trợ giải bài tập thông minh
Tính khả
dụng
- Mô hình chưa
đủ để áp dụng vào các miền tri thức thực
- Sự suy luận trên
mô hình còn mang tính máy móc
- Mô hình được xây dựng
để biểu diễn một miền tri thức cụ thể
- Hệ thống chỉ giải được một
số bài toán cụ
- Mô hình có thể biểu diễn các thành phần tri thức cơ bản của các miền tri thức giáo dục, đặc biệt
là các tri thức về khái niệm
- Mô hình có thể biểu diễn đầy đủ các thành phần tri thức giáo dục trong thực tế
- Giải được các bài toán thường gặp của miền tri thức Bên cạnh đó, hệ thống có
Trang 20thể - Giải được một
số lớp bài toán tổng quát với lời giải tự nhiên, tương tự như cách giải của con người
thể giải được các bài tooán khó, đòi hỏi việc vận dụng tri thức được đặc tả một cách linh hoạt trong quá trình suy luận
- Quá trình suy luận trên mô hình tương tự như cách suy diễn của con người trên tri thức thực tế
- Phương pháp biểu diễn chưa thể giải được các bài toán thông dụng của môn học
- Ngôn ngữ đặc tả tri thức chưa tự nhiên, chưa phù hợp với cách đặc tả của con người
- Phương pháp biểu diễn có thể giải được một số các bài toán thông dụng của môn học
- Ngôn ngữ đặc tả tri thức tương tự như cách biểu diễn của con người
- Phương pháp biểu diễn có thể giải được các bài toán thông dụng của môn học
- Các bước suy luận của lời giải phù hợp với phương pháp giải, trình độ của người học
- Phương pháp biểu diễn đáp ứng được các yêu cầu hệ hỗ trợ giải bài tập thông minh trong giáo dục
- Bên cạnh khả năng giải được các bài tập,
cơ sở tri thức của hệ thống còn hướng đến việc hướng dẫn giải cho các bài tập của miền tri thức môn học
Tính
hình
thức
- Mô hình chưa đáp ứng được tính chặt chẽ về mặt toán học
- Chưa có mô hình để biểu diễn các lớp bài toán
- Mô hình tri thức được xây dựng trên cơ
sở các cấu trúc toán học xác định
- Các lớp bài toán được mô hình hóa dựa trên mô hình biểu diễn tri thức
- Mô hình tri thức được xây dựng một cách một cách chặt chẽ từ các cấu trúc toán học
- Mô hình hóa được các lớp bài toán của miền tri thức
- Các thuật giải được xây dựng từ kiến trúc của mô hình bài toán và
mô hình tri thức
- Mô hình tri thức được xây dựng một cách chặt chẽ từ các cấu trúc toán học
- Các lớp bài toán được mô hình một cách rõ ràng
- Các thuật giải trên
mô hình được chứng minh một cách chặt chẽ về tính đúng đắn,
độ phức tạp
Trang 211.2 Biểu diễn tri thức theo tiếp cận đại số
Ngày nay, nhiều phương pháp biểu diễn tri thức đã được xây dựng và nghiên cứu Các phương pháp này có thể phân thành các loại sau: Biểu diễn tri thức theo dạng mạng, biểu diễn theo dạng Frame-Script, biểu diễn bằng ontology và biểu diễn tri thức theo tiếp cận đại số Trong mục này, chúng tôi chỉ đề cập đến một số phương pháp biểu diễn theo tiếp cận đại số: logic, ontology và các phương pháp khác dựa trên các cấu trúc đại số
1.2.1 Phương pháp logic
Dựa trên nền tảng toán học về logic mệnh đề và logic vị từ, các phương pháp này
sử dụng các biểu thức logic hình thức [28, 50] để diễn đạt các sự kiện và các luật trong cơ
sở tri thức Các thủ tục chứng minh sẽ áp dụng kiến thức vào các bài toán cụ thể
Mô hình cho phương pháp biểu diễn tri thức bằng logic [38]: (P, R)
Trong đó, P là tập hợp các mệnh đề và các vị từ, mỗi mệnh đề biểu diễn bằng một kí hiệu
và R là các luật biểu diễn bởi các biểu thức logic và quy tắc logic
Ví dụ 1.1: Kiến thức liên quan đến các số tự nhiên gồm các phát biểu:
(1) Bất kỳ a nào cũng là ước của 0
(2) 1 là ước của bất kỳ số tự nhiên nào
(3) Với mọi số tự nhiên là ước số của chính nó
(4) Quan hệ ước số có tính chất bắc cầu
(5) UCLN của a bất kỳ với 0 là a (UCLN: Ước chung lớn nhất)
(6) UCLN của 0 và a bất kỳ là a
(7) UCLN của a và b trong trường hợp a > b thì UCLN(a, b) = UCLN(a-b, b) (8) UCLN của a và b trong trường hợp a b thì UCLN(a, b) = UCLN(a, b-a) Xét 02 vị từ sau: US(a, b) = b chia hết cho a
UCLN(a, b) = max{ d N* | US(d, a) US(d, b) }
Khi đó, tri thức có thể được biểu diễn bằng mô hình logic vị từ (P, R) như sau:
P = {US(int, int), UCLN(int, int)}
R = {r1: a , US(a, 0)
Trang 22
C.Yang và W Cai [39] đã xây dựng cơ sở lý thuyết toán học trong việc biểu diễn tri thức dựa trên hệ luật mở rộng, các luật này được nghiên cứu trong việc giải quyết bài toán về kiểm tra sự mâu thuẫn trong các mô hình hình thức
Trong [32], tác giả đã trình bày một cấu trúc đại số cho tri thức cơ sở (elementary knowledge) trên cơ sở của logic vị từ cấp 1, dựa trên cấu trúc này, tác giả đã giải quyết bài toán về sự tương đương thông tin của tri thức Cùng một mục tiêu giải quyết bài toán này, trong [61], tác giả sử dụng cách tiếp cận đại số để biểu diễn tri thức thông qua việc xây dựng các tự đồng cấu (automorphic) của cơ sở tri thức
Tuy nhiên, phương pháp logic hình thức không hữu hiệu cho việc thiết kế các các cơ sở tri thức phức tạp gồm nhiều thành phần trong thực tế
Trong quá trình phát triển của biểu diễn tri thức, các nhà nghiên cứu đã phát triển phương pháp logic thành logic mô tả Logic mô tả là một dạng hình thức hóa cho việc biểu diễn các tri thức có ngữ nghĩa hình thức [66] Logic mô tả xây dựng các cấu trúc để biểu diễn các thuật ngữ của miền tri thức một cách trực quan
Hiện nay, logic mô tả vẫn đang được nghiên cứu và phát triển và ứng dụng rộng rãi, đặc biệt là trong lĩnh vực về web ngữ nghĩa
1.2.2 Biểu diễn sử dụng ontology
Ontology là lĩnh vực nghiên cứu phổ biến có mặt trong nhiều lĩnh vực từ xử lý ngôn ngữ tự nhiên, công nghệ tri thức, các hệ thống trao đổi, tích hợp thông tin cho đến biểu
Trang 23Cấu trúc Ontology gồm 5 thành phần được định nghĩa như sau [18, 34]:
∶= ( , ℋ , ℛ, , )
Trong đó:
- là tập các khái niệm mô tả đối tượng
- ℛ là tập các mối quan hệ
- ℋ là tập các phân cấp khái niệm: ℋ ⊆ × ví dụ ℋ ( , ) nghĩa là
là đối tượng con (subconcept) của
- Hàm : → × là tập quan hệ không hình thành cây phân cấp trên các khái niệm thuộc tập
Hàm : ℛ → với ( ) = ∏ ( ) cho kết quả là lĩnh vực của quan
vi của quan hệ Một hàm ( ) = ( , ) có thể viết là ( , )
- là tập các tiên đề ontology được diễn đạt dưới dạng một ngôn ngữ logic thích hợp, ví dụ logic thủ tục
Ví dụ 1.2: Xét một cấu trúc ontology của tri thức: “Nhân viên là một người làm việc tại một công ty” Giả sử ta có tập các khái niệm ∶= { , , }, quan hệ ℛ ≔ { }, một quan hệ phân cấp ℋ ( , ) và một quan hệ không phân cấp ( , ) Tập lexicon
ℒ ={“Người”, “Nhân viên”, “Công ty”} và ℒℛ= {“làm việc tại công ty”} Hàm ℱ và ánh xạ các mục từ vựng đến các khái niệm và quan hệ của ontology
Ta có:
- ℛ ≔ { }
Trang 24- ℒ = {“Người”, “Nhân viên”, “Công ty”}
- ℒℛ = {“làm việc tại công ty”}
- ℱ ⊆ ℒ × = {(“Người”, ), (“Nhân viên”, ), … (“Công ty”, )}
Hay: ℱ = {(“Người”, ), (“Nhân viên”, ), … (“Công ty”, )}
- ⊆ ℒℛ × ℛ = {(“làm việc tại công ty”, )}
Hay: = {(“làm việc tại công ty”, )}
Theo [34], ontology là phương thức biểu diễn tri thức nhằm biểu diễn tất cả các thực thể cùng với các mối quan hệ giữa chúng Hiện nay, có rất nhiều định nghĩa của ontology trong lĩnh vực trí tuệ nhân tạo, tuy nhiên nói chung các tác giả đều đưa ra định nghĩa ontology theo cách mà họ xây dựng ontology của họ [34] Ontology hiện nay được
sử dụng trong rất nhiều ứng dụng Các ontology tích hợp được sử dụng trong việc xây dựng các kho tri thức cho các hệ thống hỗ trợ quyết định Trong giáo dục thông minh, ontology cũng được sử dụng như một nền tảng cho việc biểu diễn các nội dung kiến thức của môn học [62] Tuy nhiên, các miền tri thức trong các nghiên cứu này còn khá đơn giản, các vấn đề đòi hỏi khả năng suy luận của hệ thống chưa được đề cập và giải quyết trong mô hình
1.2.3 Một số phương pháp biểu diễn khác theo tiếp cận đại số
Tiếp cận đại số là phương pháp biểu diễn tri thức dựa trên các cấu trúc toán học,
Trang 25các cấu trúc đó [51, 58] Các phương pháp này được xây dựng chặt chẽ trên cơ sở lý thuyết toán học Hiện nay có rất nhiều phương pháp biểu diễn tri thức theo tiếp cận đại
số, như: đại số khái niệm [73], cơ sở Groebner [27, 47]…
Tiếp cận đại số xây dựng mô hình dựa trên các cấu trúc đại số cổ điển hoặc những cấu trúc toán học khác [46, 58], cấu trúc này có thể là sự lai ghép giữa các cấu trúc đại số
cổ điển với những khái niệm mới, cấu trúc mới được định nghĩa trong quá trình nghiên cứu [17] Bên cạnh đó, các lớp bài toán cũng được hình thức hóa dựa trên cấu trúc mô hình, để từ đó có thể xây dựng thuật giải cho các lớp bài toán ấy và được kiểm chứng về phương diện lý thuyết Với mục tiêu có thể xây dựng một công cụ lý thuyết để phục vụ cho việc biểu diễn tri thức, đồng thời việc biểu diễn này có thể áp dụng tương đối trực tiếp vào các ứng dụng thực, thì hướng tiếp cận đại số là một phương pháp mang lại nhiều tính năng hữu ích
Với cấu trúc mô hình được xây dựng một cách chặt chẽ, phương pháp biểu diễn tri thức theo tiếp cận đại số giúp cho ta xây dựng cơ sở lý thuyết về các khái niệm, và các thành phần trong tri thức Đây cũng chính là công cụ để thiết kế, lập luận và chứng minh tính đúng đắn của phương pháp một cách chuẩn xác về mặt lý thuyết [17, 58]
Các công trình nghiên cứu hiện nay về biểu diễn tri thức theo tiếp cận đại số đã có một số kết quả nghiên cứu nhưng chúng đều có những hạn chế nhất định:
Biểu diễn tri thức bằng logic là phương pháp biểu diễn chặt chẽ về mặt lý thuyết, có nhiều mô hình cho phương pháp biểu diễn này như: sử dụng các mệnh đề Horn, logic vị
từ, logic mô tả Các mô hình tri thức dạng logic này đi cùng với các kỹ thuật suy luận: suy diễn tiến, suy diễn lùi để xây dựng các ứng dụng Tuy nhiên, các mô hình này không thể biểu diễn được các cơ sở tri thức trong thực tế một cách hoàn chỉnh
Trong [47, 52], tác giả trình bày một phương pháp đại số để biểu diễn tri thức hệ luật, trong đó tri thức được biểu diễn dưới dạng các logic vị từ Phương pháp này dựa trên việc sử dụng cơ sở Groebner Tuy nhiên, các kết quả này chỉ mang tính lý luận và rất khó
để áp dụng cho các hệ thống thông minh trong thực tế
Trang 26Trong [33], tác giả đã phân loại các quan hệ trong miền tri thức và áp dụng xây dựng các ontology hình thức trong logic mệnh đề và logic mô tả Tuy nhiên, phương pháp không biểu diễn được các tri thức phức tạp của con người
Trong [46], các tác giả đã nghiên cứu mô hình toán học cho việc biểu diễn tri thức dạng quan hệ, mô hình biểu diễn này có các dạng sau:
Dạng 1: Khi các quan hệ được xác định, khi đó tri thức có dạng <B, X, Y, R> với B là kiến thức nền tảng, X là tập đầu vào, Y là tập đầu ra và R là một
quan hệ
Dạng 2: Khi chỉ có mô hình quan hệ được xác định, khi đó tri thức được biểu diễn dưới dạng < B, X, Y, A, Ra> với A là tập các tham số chưa biết, Ra là một mô hình của quan hệ
Mô hình này đã được áp dụng cho việc tiếp nhận tri thức (knowledge acquisition) Tuy nhiên, các khái niệm trong mô hình này chỉ là các tập hợp số đơn giản, vì vậy mô hình không thể sử dụng để xây dựng các hệ thống thông minh trong thực tế
Các tác giả trong [58] đã sử dụng lý thuyết Galois để định nghĩa sự đối xứng của cơ
sở tri thức Thông qua cấu trúc đối xứng này, bài toán về sự tương đương thông tin giữa các miền tri thức đã giải quyết Bài toán này cũng đã được nghiên cứu trong [32] Trong nghiên cứu này, tác giả đã sử dụng đại số phổ dụng (universal algebra) để biểu diễn tri thức và thiết kế các thuật toán hình thức để xác định sự tương đương tri thức Trong [61], các tác giả sử dụng cách tiếp cận đại số để biểu diễn tri thức thông qua việc xây dựng các
tự đồng cấu (automorphic) của cơ sở tri thức Tuy nhiên, tri thức trong các nghiên cứu này chỉ là các miền tri thức đơn giản dưới dạng thông tin; vì vậy các phương pháp này không thể áp dụng cho việc giải quyết các vấn đề đòi hỏi khả năng suy luận của hệ thống Phân tích khái niệm hình thức (formal concept analysis) có nguồn gốc từ lý thuyết đại số của tập hợp Phương pháp này cung cấp một nền tảng toán học để phân tích dữ liệu
và khám phá tri thức Phương pháp cũng được ứng dụng trong rất nhiều lĩnh vực khác nhau như khai phá dữ liệu, truy xuất thông tin, máy học Hiện nay có nhiều phương pháp
để biểu diễn cấu trúc khái niệm, trong đó có phương pháp biểu diễn bằng mô hình đại số
Trang 27khái niệm [73] Các khái niệm trong mô hình đại số khái niệm là một cấu trúc toán học
mô hình hóa các tính chất của một khái niệm Các khái niệm này được chia sẻ dựa trên một tập các khái niệm nhỏ hơn Trong [77], các tác giả đã phát triển các tính chất và các luật của các phép toán trên đại số khái niệm Các kết quả này được sử dụng để thiết kế cơ
sở tri thức cho hệ thống nhận thức của máy tính [87] Tuclenau cũng đã sử dụng mô hình này để thiết kế một hệ suy diễn trên tập ảnh [78] Mô hình đại số khái niệm đã biểu diễn
và giải quyết các vấn đề trên mô hình một cách hình thức Tuy nhiên, các kết quả nghiên cứu còn mang tính lý thuyết; việc ứng dụng mô hình cho việc thiết kế các hệ thống thông minh trong thực tế còn rất khó, đặc biệt là các hệ giải bài tập thông minh
Bên cạnh đó, khái niệm cũng được nghiên cứu bằng các phương pháp: giàn khái niệm [51], lý thuyết đồ thị [79]; tuy nhiên, các phương pháp biểu diễn này không thể biểu diễn đầy đủ các miền tri thức thực tế
Bài báo [55] trình bày cách thức biểu diễn tri thức bằng các lớp chương trình logic khác nhau, đồng thời cũng ứng dụng việc sử dụng chương trình logic để giải thích cho các quan sát dựa vào các quy luật suy diễn tri thức Tuy nhiên các kết quả này chỉ mang tính lý thuyết
Kết quả về phương pháp tiếp cận đại số cho biểu diễn tri thức hiện nay còn những khiếm khuyết nhất định Tri thức của con người gồm nhiều thành phần tri thức khác nhau như các khái niệm cùng với các thuộc tính của chúng, tri thức về quan hệ giữa các khái niệm đó, tri thức về các luật suy diễn của miền tri thức; ngoài ra, trong các miền tri thức tính toán, còn có các tri thức về toán tử Tuy nhiên, các mô hình tri thức theo tiếp cận đại
số hiện nay chỉ biểu diễn được cho những miền tri thức đơn giản, như trong [32, 58, 61], miền tri thức được xem xét chỉ ở dạng thông tin, không có các cấu trúc phức tạp như tri thức thực của con người, trong [73, 77], miền tri thức xem xét không đề cập đến thành phần tri thức về luật suy diễn trong các miền tri thức thực tế Vì vậy, các phương pháp hiện nay chưa đáp ứng được các yêu cầu của việc biểu diễn tri thức một cách hoàn chỉnh
Do đó, lý thuyết biểu diễn tri thức theo cách tiếp cận đại số cần phải được nghiên cứu phát triển hơn để có thể trở thành một nền tảng khoa học cho biểu diễn tri thức và có khả năng ứng dụng trong các hệ thống thông minh
Trang 28Hiện nay, việc sử dụng tiếp cận đại số để xây dựng cơ sở tri thức cho các hệ giải bài tập thông minh trong giáo dục còn rất hạn chế Các phương pháp chưa đáp ứng được các tiêu chuẩn của của mô hình biểu diễn tri thức cho hệ thống [86] Bảng 1.2 so sánh các phương pháp BDTT trong việc xây dựng các hệ thống này
Phương pháp logic hình thức được sử dụng trong việc xây dựng các hệ thống chứng minh định lý tự động (automated theorem proving) [64] và các hệ thống chứng minh logic tự động [28, 59] Mặc dù các phương pháp này có thể giải được các bài tập trong các kiến thức tương ứng, nhưng không đáp ứng tiêu chuẩn về việc suy diễn phù hợp với kiến thức của người học Các phương pháp logic này không biểu diễn được các tri thức
có mối liên hệ phức tạp trong kiến thức của môn học Do đó, các phương pháp này không thể áp dụng cho việc thiết kế cơ sở tri thức của một thống IPS trong giáo dục
Logic mô tả là một dạng logic hình thức để biểu diễn ngữ nghĩa của kiến thức [66] Tuy nhiên, logic mô tả vẫn còn có những hạn chế khi ứng dụng cho các hệ thống IPS, đó chính là khả năng có thể ứng dụng một cách trực tiếp vào các miền tri thức thực, lớn, gồm nhiều loại khái niệm với những quan hệ phức tạp
Trong các hệ thống hỗ trợ học tập thông minh, ontology được sử dụng như là một nền tảng để biểu diễn nội dung các môn học [57] Tuy nhiên các hệ thống này chưa có khả năng giải bài tập một cách tự động Mô hình tri thức các đối tượng tính toán (Computational Network Object Knowledge Base - COKB) là một ontology có thể áp dụng cho việc xây dựng các hệ thống IPS trong giáo dục [62] Tuy nhiên, cấu trúc của các thành phần trong mô hình COKB chưa được trình bày rõ về mặt toán học, đồng thời các mối liên kết giữa các thành phần trong mô hình cần phải được nghiên cứu một cách chi tiết hơn
Các phương pháp tiếp cận đại số hiện nay chưa đáp ứng được việc biểu diễn tri thức một cách đầy đủ, hoàn chỉnh, đặc biệt là cho các miền tri thức của hệ thống IPS Vì vậy, hiện nay chúng chưa được áp dụng vào việc xây dựng cơ sở tri thức cho các hệ thống IPS trong giáo dục
Trang 29Bảng 1.2: So sánh các phương pháp biểu diễn dựa trên các tiêu chuẩn của biểu diễn tri
thức cho hệ thống thông minh trong giáo dục
STT Phương pháp Tính phổ
quát
Tính khả dụng
Tính thực tiễn
Tính hình thức hóa
1.3 Các phương pháp suy diễn
Bên cạnh mô hình biểu diễn tri thức, việc suy diễn để giải quyết các bài toán dựa trên tri thức cũng là một vấn đề quan trọng Trong các phương pháp suy diễn tự động nhằm vận dụng kiến thức đã biết trong quá trính lập luận giải quyết vấn đề, quan trọng nhất là các chiến lược điều khiển giúp phát sinh những sự kiện mới từ các sự kiện đã có Trong thực tế, suy luận của con người gồm các loại suy luận sau [28, 48]:
Suy diễn dạng diễn dịch (Deductive Reasoning): là phương pháp suy lận dựa vào các quy luật của tri thức để rút ra kết luận từ một hay nhiều mệnh đề
Suy diễn dạng quy nạp (Inductive Reasoning): là phương pháp suy luận đưa ra kết luận có tính khái quát từ những tri thức riêng lẻ, ít khái quát hơn
Suy diễn loại suy (Analogical Reasoning): Trong [25], tác giả đã định nghĩa đây là dạng suy diễn đi từ những dữ liệu chắc chắn để suy diễn cho một giả thuyết có liên quan
Dựa trên các loại suy luận ấy, trong lĩnh vực công nghệ tri thức, đã đề xuất các dạng suy luận để sử dụng cho các mô hình biểu diễn tri thức [84]:
1.3.1 Suy diễn tiến
Phương pháp suy diễn tiến (forward chaining): Phương pháp này mô phỏng tư duy suy diễn diễn dịch của con người Theo [48], suy diễn tiến bắt đầu bằng tập sự kiện đã biết, rút ra các sự kiện mới nhờ dùng các luật mà phần giả thiết khớp với sự kiện đã biết,
Trang 30và tiếp tục quá trình này cho đến khi thấy trạng thái mục tiêu, hoặc cho đến khi không còn luật nào khớp được các sự kiện đã biết
Ưu điểm của phương pháp này chính là dễ cài đặt và mô phỏng tự nhiên quá trình suy nghĩ của con người Tuy nhiên suy diễn tiến là một dạng mò mẫm, vét cạn nên dễ dẫn đến sự phát sinh các bước suy luận không cần thiết cho việc đạt đến mục tiêu, do đó lời giải tìm được thường có những lời giải thừa Để hệ thống có thể thông minh hơn trong quá trình suy diễn, chúng ta cần phải cải thiện phương pháp thông qua việc sử dụng các heuristic cũng như sử dụng các tri thức về bài toán mẫu và mẫu bài toán
1.3.2 Suy diễn lùi
Phương pháp suy diễn lùi (Backward chaining): Phương pháp này được tiến hành bằng cách truy ngược từ mục tiêu cần đạt được trở về phần giả thiết của bài toán bằng cách áp dụng các luật trong cơ sở tri thức [48] Quá trình suy diễn lùi xuất phát từ sự kiện cần chứng minh và thay vào đó là những sự kiện ở vế trái của một luật dạng A B có vế phải là sự kiện cần chứng minh Quá trình này được thực hiện cho đến khi đưa về các sự kiện là tập con của tập sự kiện giả thiết
Ưu điểm của phương pháp này là các sự kiện được sinh ra đều có thể cần đến trong quá trình suy luận để đạt tới mục tiêu Tuy nhiên, quá trình này không kiểm soát sự phát
sinh của các sự kiện mục tiêu, dễ dẫn đến sự bùng nổ tổ hợp trong quá trình suy luận
So với suy diễn lùi, suy diễn tiến đơn giản hơn, song quá trình suy diễn tiến phải sử dụng mọi luật có thể áp dụng được, mà không lưu ý đến sự hiệu quả của luật đối với kết luận mong muốn Do vậy, đối với các cơ sở tri thức lớn với số luật ngày càng tăng, thuật giải này dẫn tới bùng nổ tổ hợp Ngược lại, suy diễn lùi phức tạp hơn, nhưng có ưu điểm
là chỉ chọn những luật hướng tới đích đặt ra Cơ chế suy diễn lùi được cài đặt tương ứng với tìm kiếm sâu trên đồ thị và biểu diễn tập luật Mỗi phương pháp suy diễn tiến và lùi đều có ưu nhược điểm Do đó, phương pháp suy diễn kết hợp hai phương pháp này một cách thích hợp cho ta một phương pháp suy diễn hiệu quả trong ứng dụng cụ thể
Trang 311.3.3 Lập luận dựa trên tình huống
Theo Kolodner [14], lập luận dựa trên tình huống (Case-based Reasoning - CBR) chính là phương pháp tìm lời giải của một bài toán trên cơ sở hiệu chỉnh lời giải của các bài toán khác đã có
Hoạt động của hệ thống suy luận theo phương pháp CBR:
Trước một bài toán mới, hệ thống CBR sẽ tìm kiếm lại một hoặc một vài bài toán mẫu tương tự với bài toán đó từ tập các bài toán mẫu Nếu lời giải của mẫu lập luận tìm được phù hợp với bài toán mới thì sẽ được sử dụng lại Ngược lại, hệ thống sẽ tìm cách hiệu chỉnh lời giải cũ để đưa ra một lời giải mới Việc hiệu chỉnh phụ thuộc nhiều vào miền ứng dụng và mỗi hệ thống CBR sẽ có một cơ chế hiệu chỉnh riêng
Các ưu điểm của phương pháp CBR [84]:
Khả năng biểu diễn tri thức: Khác với lập luận theo luật chỉ giới hạn cho một
dạng tri thức tổng quát có cấu trúc xác định, do chỉ giải quyết với từng trường hợp cụ thể nên CBR có thể diễn tả tri thức ở nhiều dạng khác nhau
Khả năng duy trì tri thức: Trong thực tế, các bài toán không phải bao giờ cũng
bất biến dẫn tới cơ sơ tri thức luôn phải biến đổi Đối với các hệ lập luận theo luật truyền thống, các luật thường tổng quát và phụ thuộc chặt chẽ với nhau nên việc thêm hay sửa các luật thường gặp khó khăn Ngược lại, CBR chỉ lưu các bài toán lập luận cụ thể độc lập với nhau nên việc mở rộng và hiệu chỉnh cơ sở tri thức sẽ trở nên đơn giản hơn
Tăng hiệu quả giải quyết bài toán: Tái sử dụng lời giải có sẽ hiệu quả hơn
nhiều so với việc giải lại một bài toán mà trước đó đã được giải rồi
Tăng chất lượng lời giải: Lời giải cho các bài toán được biểu diễn bằng các bài
toán lập luận cụ thể sẽ dễ hiểu và chính xác hơn so với được biểu diễn
bằng một chuỗi các luật suy diễn trừu tượng
1.3.4 Suy diễn dựa trên tri thức Bài toán mẫu và Mẫu bài toán
Trong thực tế, khi giải quyết một bài toán, chúng ta thường không tìm ngay một lời giải mới mà theo G Polya [30], trước tiên chúng ta cần phải tìm kiếm lại những bài toán,
Trang 32những dạng toán đã được gặp để từ đó đề xuất cách giải quyết cho phù hợp Bên cạnh đó, khi tìm thấy bài toán liên quan, thì việc tìm lời giải sẽ cho kết quả nhanh hơn Các bài toán liên quan đó sẽ được gọi là các mẫu bài toán và bài toán mẫu
Mẫu bài toán là những bài toán có lời giải ngắn gọn và có tần suất xuất hiện cao
trong miền tri thức Đây là những bài toán nhỏ, lời giải không quá phức tạp, tuy nhiên trong quá trình giải quyết các vấn đề trong miền tri thức, thì các bài toán này thường hay xuất hiện và phải giải quyết [70] Các mẫu bài toán phải đáp ứng các tiêu chuẩn sau:
- Tiêu chuẩn 1: Tần suất sử dụng bài toán P trong miền tri thức là cao (trong tập các bài toán thực nghiệm, tần suất sử dụng bài toán P lớn hơn )
- Tiêu chuẩn 2: Bài toán P đơn giản (số đối tượng trong bài toán nhỏ hơn )
- Tiêu chuẩn 3: Lời giải của bài toán P ngắn (số bước giải của bài toán nhỏ hơn
bước)
Trong đó, (, , ) là các hằng số phụ thuộc vào miền tri thức đang được biểu diễn
Bài toán mẫu thể hiện những dạng bài toán mà nếu sử dụng phương pháp suy diễn
chung thì rất tốn thời gian, những dạng này sẽ được chúng ta ghi lại các bước giải để có thể giải quyết các bài toán Khi gặp những bài toán tương tự, chúng ta sẽ sử dụng các bài toán mẫu này để giải quyết hoặc nếu gặp bài toán khác có “lệch” một chút, dựa trên các
bước giải đã có, có thể nhanh chóng cập nhật một lời giải cho bài toán hiện tại [56]
Trong [56, 70], tác giả trình bày phương pháp suy diễn dựa trên bài toán mẫu và mẫu bài toán, đây là một phương pháp suy diễn trên máy tính dựa vào những bài toán và những dạng toán cơ bản đã biết có liên quan với bài toán cần giải quyết Với phương pháp suy luận này, khi đó hệ thống suy diễn sẽ mô phỏng được xác thực hơn cách suy nghĩ của con người trong quá trình giải quyết vấn đề và sẽ cho kết quả tốt hơn so với các phương pháp suy diễn khác
Trang 33Hình 1.2: Sơ đồ phương pháp suy diễn dựa trên tri thức bài toán mẫu [84]
1.3.5 Suy diễn với heuristic
Hiện nay, các phương pháp suy diễn đều không đạt được hiệu quả tốt nhất nếu không kết hợp với các tri thức thực tế, các kinh nghiệm của con người trong quá trình giải quyết vấn đề Vì vậy, để tăng sự hiệu quả trong suy diễn, các phương pháp đều cần phải sử dụng kết hợp với các quy tắc heuristic Việc sử dụng các heuristic này giúp cho quá trình suy luận nhanh hơn, mô phỏng được tư duy của con người tốt hơn, đồng thời cho lời giải của vấn đề một cách chính xác hơn Các phương pháp CBR và suy diễn dựa trên Bài toán mẫu và mẫu bài toán cũng chính là các phương pháp suy diễn dựa trên các heuristic
Vì vậy, để động cơ suy diễn của hệ thống hoạt động dựa trên cơ sở tri thức có thể hoạt động hiệu quả cần phải tích hợp với việc nghiên cứu các heuristic cụ thể của miền tri thức được biểu diễn trong hệ thống Thông qua quá trình khảo sát tri thức cũng như khảo sát các ý kiến của chuyên gia, các heuristic sẽ được thiết lập Trên cơ sở đó, chúng ta sẽ
áp dụng các heuristic này vào quá trình thiết kế các thuật giải suy diễn của hệ thống
Trang 341.4 Mục tiêu luận án
1.4.1 Mục tiêu chung của luận án
Biểu diễn tri thức theo tiếp cận đại số là phương pháp biểu diễn chặt chẽ về mặt lý luận Phương pháp này là một cơ sở khoa học cho việc thiết kế các hệ cơ sở tri thức và phương pháp suy luận để giải quyết các vấn đề trong hệ thống Kết quả của việc tiếp cận đại số vừa có giá trị khoa học, vừa cho ta một công cụ toán học để biểu diễn, lập luận và chứng minh các tính chất một cách chặt chẽ và chuẩn mực
Mục tiêu luận án là dựa trên công cụ toán học, đặc biệt là các cấu trúc đại số, đại số quan hệ, đại số về các toán tử, xây dựng những mô hình toán học được định nghĩa mang tính hình thức, nghĩa là các thành phần của mô hình phải được biểu diễn một cách chặt chẽ về lý thuyết Các mô hình này có thể vận dụng gần như là tương đối trực tiếp để thiết
kế cơ sở tri thức cho các miền tri thức thực, đặc biệt là các tri thức cho các hệ thống IPS trong giáo dục Dựa trên cấu trúc của mô hình, ta sẽ thiết kế các phương pháp suy luận trên mô hình, và các thuật toán suy luận này cũng phải được nghiên cứu về độ phức tạp
từ đó làm cơ sở để xây dựng các thuật giải suy diễn để giải quyết các vấn đề được đặt ra
1.4.2 Các vấn đề giải quyết trong luận án
Trong thực tế, tri thức về quan hệ và tri thức toán tử là các thành phần tri thức thường gặp Vì vậy, các mô hình biểu diễn tri thức phải biểu diễn được các thành phần tri thức có dạng này Do đó, luận án sẽ phải giải quyết các vấn đề sau:
Trang 35i/ Nghiên cứu và xây dựng phương pháp biểu diễn tri thức quan hệ: Xây dựng cấu trúc của mô hình biểu diễn tri thức quan hệ, mô hình này có nền tảng là các khái niệm, quan hệ và luật suy diễn; đồng thời nghiên cứu việc suy luận giải quyết các vấn đề của cơ sở tri thức được xây dựng bởi mô hình tri thức này, gồm: các bài toán trên một đối tượng và các bài toán tổng quát trên cơ
sở tri thức
ii/ Nghiên cứu và xây dựng phương pháp biểu diễn tri thức toán tử: Xây dựng cấu trúc mô hình tri thức toán tử có nền tảng là các khái niệm, toán tử và luật suy diễn; đồng thời nghiên cứu việc suy luận giải quyết các vấn đề của
cơ sở tri thức được xây dựng bởi mô hình tri thức này, gồm: các bài toán trên một đối tượng và các bài toán tổng quát của cơ sở tri thức
iii/ Nghiên cứu và xây dựng phương pháp biểu diễn tri thức tri thức vừa có tri thức quan hệ, vừa có tri thức toán tử: Xây dựng cấu trúc mô hình biểu diễn tri thức có cả tri thức quan hệ và toán tử Nghiên cứu sự kết hợp của tri thức quan hệ và tri thức toán tử trong quá trình giải quyết các vấn đề của cơ sở tri thức được xây dựng bởi mô hình tri thức này
1.4.2.1 Xây dựng phương pháp biểu diễn tri thức quan hệ
Trong luận án, chúng tôi sẽ nghiên cứu cấu trúc của mô hình tri thức quan hệ dựa trên sự khảo sát một số miền tri thức dạng quan hệ Mô hình này có nền tảng là các khái niệm, quan hệ và các luật suy diễn Các thành phần của mô hình được xây dựng dựa trên nền tảng toán toán học về lý thuyết tập hợp, quan hệ Mô hình tri thức được thiết kế theo hướng đối tượng, trong đó các khái niệm là một lớp các đối tượng có các hành vi giải quyết các vấn đề nội tại
Trên cơ sở mô hình tri thức quan hệ được xây dựng, các lớp bài toán sẽ được nghiên cứu và giải quyết: Bài toán suy diễn trên một đối tượng, bài toán tổng quát trên mô hình tri thức quan hệ, như: Xác định một đối tượng, một thuộc tính, xác định một quan hệ giữa các đối tượng Các thuật giải giải quyết vấn đề được nghiên cứu về tính dừng, tính hiệu quả và độ phức tạp Mô hình tri thức quan hệ được xây dựng có thể ứng dụng để tổ chức
Trang 36cơ sở tri thức cho hệ thống IPS trong giáo dục, đặc biệt là các miền kiến thức có dạng quan hệ Mô hình tri thức này có thể đáp ứng được các tiêu chuẩn của phương pháp biểu diễn tri thức cho hệ thống IPS trong giáo dục
1.4.2.2 Xây dựng phương pháp biểu diễn tri thức toán tử
Trong luận án, chúng tôi sẽ nghiên cứu cấu trúc của mô hình tri thức có chứa toán
tử Mô hình này sẽ có nền tảng là các khái niệm, toán tử và các luật suy diễn Bên cạnh
đó, các vấn đề liên quan đến cấu trúc của mô hình cũng được nghiên cứu: định nghĩa biểu thức và chiều dài biểu thức, các sự kiện, hợp nhất sự kiện, bao đóng sự kiện, các hành vi trên đối tượng của khái niệm Trên cơ sở mô hình tri thức toán tử được xây dựng, các lớp bài toán sẽ được nghiên cứu và giải quyết: Bài toán suy diễn trên một đối tượng, bài toán tổng quát trên mô hình tri thức toán tử, như: Xác định giá trị một biểu thức, rút gọn một biểu thức, biến đổi một biểu thức, chứng minh sự tương đương giữa hai biểu thức Các lớp bài toán này sẽ được mô hình hóa và giải quyết dựa trên các cấu trúc toán học của mô hình tri thức toán tử Các thuật giải giải quyết vấn đề được nghiên cứu về tính dừng, tính hiệu quả và độ phức tạp Mô hình tri thức toán tử được xây dựng có thể ứng dụng để tổ chức cơ sở tri thức cho hệ thống IPS trong giáo dục, đặc biệt là các miền tri thức tính toán Mô hình tri thức này có thể đáp ứng được các tiêu chuẩn của phương pháp biểu diễn tri thức cho hệ thống IPS trong giáo dục
1.4.2.3 Xây dựng phương pháp biểu diễn tri thức có cả quan hệ và toán tử
Vấn đề nghiên cứu tiếp theo, chúng tôi sẽ nghiên cứu cấu trúc của mô hình biểu diễn tri thức gồm quan hệ và toán tử Các tri thức quan hệ và toán tử này sẽ được vận dụng kết hợp trong quá trình giải quyết các vấn đề trên mô hình Mô hình này sẽ có nền tảng là các khái niệm, quan hệ, toán tử và các luật suy diễn Bên cạnh đó, các vấn đề liên quan đến cấu trúc của mô hình cũng được nghiên cứu: cấu trúc các thành phần, các sự kiện, hợp nhất sự kiện, các hành vi trên đối tượng của khái niệm Trên cơ sở mô hình tri thức gồm quan hệ và toán tử được xây dựng, các lớp bài toán sẽ được nghiên cứu và giải quyết: Bài toán suy diễn trên một đối tượng, bài toán tổng quát trên mô hình
Trang 37Mô hình tri thức quan hệ và toán tử này sẽ được ứng dụng để tổ chức cơ sở tri thức cho hệ thống IPS trong giáo dục, đặc biệt là các miền tri thức vừa có quan hệ và toán tử
Mô hình tri thức này có thể đáp ứng được các tiêu chuẩn của phương pháp biểu diễn tri thức cho hệ thống IPS trong giáo dục
1.5 Phương pháp nghiên cứu
Phương pháp biểu diễn tri thức theo tiếp cận đại số đáp ứng được các yêu cầu của biểu diễn tri thức Tuy nhiên, các nghiên cứu hiện nay cho phương pháp này vẫn chưa được thỏa đáng, và còn rất nhiều hạn chế cho việc ứng dụng vào các miền tri thức thực tế
Do đó, chúng ta cần phải nghiên cứu phương pháp này trên cơ sở phải đảm bảo được các tiêu chuẩn của việc biểu diễn tri thức và đồng thời mô hình tri thức được nghiên cứu phải
có khả năng có thể áp dụng vào các miền tri thức thực một cách tương đối trực tiếp
Luận án sẽ thu thập tri thức từ các miền tri thức thực tế để xây dựng nguồn tri thức nghiên cứu Trên cơ sở nguồn tri thức thu thập được, đề tài sẽ nghiên cứu cách biểu diễn tri thức đó theo hướng tiếp cận đại số phù hợp với tri thức và từ đó khái quát hóa thành một mô hình cho việc biểu diễn tri thức Mô hình được xây dựng sẽ bao gồm các thành phần tri thức, mỗi thành phần sẽ là một tập hợp có cấu trúc Bên cạnh đó, trong quá trình nghiên cứu, đề tài sẽ đưa ra các khái niệm, và các định lý để chứng minh cho sự tồn tại lời giải của các vấn đề trong các cấu trúc mô hình được xây dựng Từ đó, thiết kế các thuật giải suy luận trên máy tính giải quyết các vấn đề được đặt ra
1.6 Tóm tắt các kết quả của luận án
Trong luận án, đã đạt được một số kết quả sau:
Xây dựng phương pháp biểu diễn tri thức quan hệ:
Xây dựng cấu trúc mô hình tri thức quan hệ, Rela-model, là một bộ gồm 03 thành phần: (C, R, Rules) [BB1, BB5, BB9] Trong đó, C là tập các khái niệm, mỗi khái
niệm là một lớp đối tượng, các đối tượng có cấu trúc (Attrs, Facts, RulObj) và các hành
vi nội tại; R là tập các quan hệ giữa các khái niệm, các quan hệ này gồm hai loại là quan
hệ phân cấp và quan hệ hai ngôi không có dạng phân cấp; Rules là tập các luật suy diễn
Trang 38của tri thức Dựa trên cấu trúc này, chúng tôi định nghĩa các loại sự kiện, hợp nhất sự kiện, mô hình bài toán, quy tắc suy luận, lời giải [BB5, BB9]
Trên mô hình tri thức quan hệ này, chúng tôi đã mô hình hóa các lớp bài toán trên
mô hình: Bài toán trên một đối tượng gồm các vấn đề xác định bao đóng tập thuộc tính, bao đóng tập sự kiện, diễn giải suy luận; bài toán trên mô hình gồm các vấn đề xác định một đối tượng, một quan hệ giữa các đối tượng [BB9] Thông qua cấu trúc của mô hình, các thuật giải để giải các bài toán và các vấn đề trên đã được nghiên cứu Các thuật giải này cũng đã được chứng minh tính dừng, tính hiệu quả và độ phức tạp [BB1, BB9]
Mô hình tri thức quan hệ và các thuật giải được ứng dụng tổ chức cơ sở tri thức và động cơ suy diễn cho các hệ thống trong thực tế, như các hệ giải bài tập thông minh trong các miền tri thức toán: hình học phẳng [BB1], hình học không gian [BB5, BB9]
Xây dựng phương pháp biểu diễn tri thức có chứa toán tử:
Xây dựng cấu trúc mô hình tri thức toán tử, Ops-model, là một bộ gồm 03 thành phần: (C, Ops, Rules) [BB2, BB3, BB4, BB8] Trong đó, C là tập các khái niệm, mỗi
khái niệm là một lớp đối tượng, các đối tượng có cấu trúc (Attrs, EqObj, RulObj) và các
hành vi nội tại của đối tượng; Ops là tập các toán tử giữa các khái niệm, các phép toán này gồm hai loại là toán tử một ngôi và toán tử hai ngôi; Rules là tập các luật suy diễn của tri thức [BB8] Dựa trên cấu trúc này, định nghĩa các loại sự kiện, bao đóng tập sự kiện, biểu thức, độ dài biểu thức, biến đổi biểu thức, quy tắc suy luận, lời giải [BB6, BB8]
Trên mô hình tri thức toán tử, bên cạnh các bài toán trên một đối tượng, chúng tôi đã
mô hình hóa các lớp bài toán trên mô hình: Xác định một đối tượng, tính giá trị một biểu thức, rút gọn một biểu thức, chứng minh đẳng thức giữa các biểu thức, biến đổi biểu thức tương đương Thông qua cấu trúc của mô hình, các thuật giải để giải các bài toán và các vấn đề trên đã được nghiên cứu Các thuật giải này cũng đã được chứng minh tính dừng, tính hiệu quả và độ phức tạp [BB2, BB6, BB8]
Mô hình Ops-model và các thuật giải được ứng dụng tổ chức cơ sở tri thức và động
cơ suy diễn cho các hệ thống thực tế Một số hệ giải bài tập thông minh cho một số môn
Trang 39cấp trung học cơ sở) [BB3, BB4], Đại số vector (toán cấp Trung học phổ thông) [BB8], Toán rời rạc (toán cao cấp ở đại học) [BB6]
Xây dựng phương pháp biểu diễn tri thức gồm cả quan hệ và toán tử:
Mô hình tri thức gồm cả quan hệ và toán tử, Rela-Ops model, là một bộ gồm các thành phần: (C, R, Ops, Rules) [BB7, BB10] Các khái niệm trong cấu trúc các đối tượng trong thành phần C là một lớp các đối tượng có cầu trúc và hành vi nhất định Thành phần tập luật Rules và các sự kiện được định nghĩa và phân loại một cách cụ thể Bên cạnh đó, cấu trúc các thành phần khác trong mô hình cũng được xây dựng dựa trên kiến trúc trong các mô hình Rela-model và Ops-model [BB10] Ngoài ra, mối liên hệ giữa các thành phần cũng được làm rõ, đặc biệt là quan hệ giữa thành phần R (tập các quan hệ) và Ops (tập các toán tử) [BB7, BB10]
Mô hình tri thức quan hệ và toán tử này được ứng dụng cho việc tổ chức cơ sở tri thức và thiết kế động cơ suy diễn cho hệ giải bài tập thông minh trong miền tri thức Đại
số tuyến tính với các kiến thức về ma trận, hệ phương trình tuyến tính, không gian vector [BB10]
Trang 40Chương 2: MÔ HÌNH TRI THỨC QUAN HỆ
2.1 Mô hình tri thức quan hệ
Một số các ký hiệu được sử dụng trong chương này:
: tập các số thực
var(u): Tập các biến trong biểu thức u
card(S): số phần tử trong S với S là một tập hợp hay S là một danh sách
Định nghĩa 2.1: Mô hình tri thức quan hệ, Rela-model, là một bộ gồm 03 thành phần:
(C, R, Rules)
Trong đó, C là tập các khái niệm, mỗi khái niệm là một lớp các đối tượng Mỗi đối
tượng có các thuộc tính và các quan hệ nội tại giữa các thuộc tính đó, đối tượng cũng có
các hành vi giải quyết các lớp vấn đề trên bản thân nó R là tập các quan hệ hai ngôi giữa các khái niệm trong C Tập Rules là tập các luật của tri thức
Trong hình 2.1: Rela-model là một bộ gồm ba thành phần (C, R, Rules) như (I) Cấu trúc của các thành phần sẽ được trình bày trong mục 2.1.1 Mỗi khái niệm trong C là một lớp các đối tượng, các đối tượng này có cấu trúc và hành vi giải quyết các vấn đề của đối tượng như (II) Các vấn đề trên một đối tượng sẽ được trình bày và giải quyết trong mục 2.2.1 Bên cạnh đó, mô hình Rela-model có các bài toán tổng quát trên mô hình như (III) Phương pháp suy luận để giải quyết các bài toán này sẽ được trình bày trong mục
2.2.2