Tuy nhiên, việc học khái niệm trong ngữ cảnh logic mô tả khác vớihọc máy truyền thống ở điểm, các đối tượng không chỉ được đặc tả bằng các thuộctính mà còn được đặc tả bằng các mối quan
Trang 1ĐẠI HỌC HUẾ TRƯỜNG ĐẠI HỌC KHOA HỌC
TRẦN THANH LƯƠNG
HỌC KHÁI NIỆM CHO CÁC HỆ THỐNG THÔNG TIN
DỰA TRÊN LOGIC MÔ TẢ
CHUYÊN NGÀNH: KHOA HỌC MÁY TÍNH
MÃ SỐ: 62.48.01.01
LUẬN ÁN TIẾN SĨ MÁY TÍNH
HUẾ, NĂM 2015
Trang 2Công trình này được hoàn thành tại:
Trường Đại học Khoa học - Đại học Huế
Người hướng dẫn khoa học:
1 PGS TSKH Nguyễn Anh Linh, Trường Đại học Warsaw, Ba Lan
2 TS Hoàng Thị Lan Giao, Trường Đại học Khoa học, Đại học Huế
Phản biện 1: GS TSKH Hoàng Văn Kiếm
Trường Đại học CNTT, ĐHQG TP Hồ Chí MinhPhản biện 2: PGS TS Đoàn Văn Ban
Viện Công nghệ Thông tin, Viện Hàn lâm KH&CN Việt NamPhản biện 3: PGS TS Nguyễn Mậu Hân
Trường Đại học Khoa học, Đại học Huế
Luận án sẽ được bảo vệ tại Hội đồng chấm luận án cấp Đại học Huế
họp tại Đại học Huế vào lúc giờ ngày tháng năm 2015
Có thể tìm hiểu luận án tại thư viện:
• Thư viện Quốc gia Việt Nam
• Thư viện Trường Đại học Khoa học, Đại học Huế
Trang 3MỞ ĐẦU
Vấn đề học khái niệm trong logic mô tả tương tự như phân lớp nhị phân trong họcmáy truyền thống Tuy nhiên, việc học khái niệm trong ngữ cảnh logic mô tả khác vớihọc máy truyền thống ở điểm, các đối tượng không chỉ được đặc tả bằng các thuộctính mà còn được đặc tả bằng các mối quan hệ giữa các đối tượng Bài toán học kháiniệm được đặt ra theo ba ngữ cảnh chính như sau:
• Ngữ cảnh (1): Cho cơ sở tri thức KB trong logic mô tả L và các tập các cá thể
E+, E− Học khái niệm C trong L sao cho:
1 KB |= C(a) với mọi a ∈ E+, và
2 KB |= ¬C(a) với mọi a ∈ E−
trong đó, tập E+ chứa các mẫu dương và E− chứa các mẫu âm của C
• Ngữ cảnh (2): Ngữ cảnh này khác với ngữ cảnh đã đề cập ở trên là điều kiệnthứ hai được thay bằng một điều kiện yếu hơn:
1 KB |= C(a) với mọi a ∈ E+, và
2 KB 6|= C(a) với mọi a ∈ E−
• Ngữ cảnh (3): Cho một diễn dịch I và các tập các cá thể E+, E− Học kháiniệm C trong logic mô tả L sao cho:
1 I |= C(a) với mọi a ∈ E+, và
2 I |= ¬C(a) với mọi a ∈ E−
Chú ý rằng I |= ¬C(a) tương đồng với I 6|= C(a)
Học khái niệm trong logic mô tả đã được nhiều nhà khoa học quan tâm nghiêncứu và chia thành ba hướng tiếp cận chính
Hướng tiếp cận thứ nhất tập trung vào khả năng học trong logic mô tả [4], [8].Cohen và Hirsh nghiên cứu lý thuyết về khả năng học trong logic mô tả và đề xuấtthuật toán học khái niệm LCSLearn dựa trên các “bao hàm chung nhỏ nhất” [4].Frazier và Pitt đã nghiên cứu về khả năng học trong logic mô tả Classic bằng cách
sử dụng các truy vấn trên mô hình học PAC [8]
Trong hướng tiếp cận thứ hai nghiên cứu học khái niệm trong logic mô tả sử dụngtoán tử làm mịn Badea và Nienhuys-Cheng [1] nghiên cứu học khái niệm trong logic
mô tả ALER, Iannone và cộng sự [9] cũng nghiên cứu các thuật toán học trên mộtlogic mô tả giàu ngữ nghĩa hơn, ALC Cả hai công trình trên đều nghiên cứu việchọc khái niệm trong logic mô tả với Ngữ cảnh (1) Fanizzi cùng cộng sự [?]iới thiệu hệthống DL-Foil cho việc học khái niệm trong logic mô tả hỗ trợ ngôn ngữ logic mô tảOWL [7] Lehmann và Hitzler đề xuất thuật toán học DL-Learner theo phương pháplập trình đệ quy và có khai thác thêm các kỹ thuật về lập trình di truyền [10] Cáccông trình này nghiên cứu việc học khái niệm trong logic mô tả với Ngữ cảnh (2).Hướng tiếp cận thứ ba nghiên cứu học khái niệm trong logic mô tả sử dụng môphỏng hai chiều [6] Nguyen và Sza las đã áp dụng mô phỏng hai chiều vào trong logic
mô tả để mô hình hóa tính không phân biệt được của các đối tượng [14] Các tác giả
Trang 4đã đề xuất một phương pháp tổng quát để học khái niệm cho các hệ thống thông tintrong logic mô tả Divroodi [5] và cộng sự đã nghiên cứu khả năng học trong logic
mô tả sử dụng mô phỏng hai chiều Các công trình này nghiên cứu bài toán học kháiniệm trong logic mô tả với Ngữ cảnh (3)
Ngoại trừ công trình của Nguyen và Sza las [14], Divroodi [5] sử dụng mô phỏnghai chiều trong logic mô tả để hướng dẫn việc tìm kiếm khái niệm kết quả, tất cả cáccông trình nghiên cứu còn lại đều sử dụng toán tử làm mịn như trong lập trình logic
đệ quy và/hoặc các chiến lược tìm kiếm dựa vào các hàm tính điểm mà không sử dụng
mô phỏng hai chiều Các công trình này chủ yếu tập trung vào vấn đề học khái niệmvới Ngữ cảnh (1) và Ngữ cảnh (2) trên các logic mô tả khá đơn giản ALER, ALN
và ALC Trong khi đó công trình [14] và [5] sử dụng mô phỏng hai chiều cho việc họckhái niệm trong các logic mô tả chỉ với Ngữ cảnh (3) Hai công trình trên không đềcập đến vấn đề học khái niệm trong logic mô tả với Ngữ cảnh (1) và Ngữ cảnh (2)
Từ các khảo sát như đã nêu ở trên, chúng ta nhận thấy rằng học khái niệm tronglogic mô tả là một vấn đề quan trọng trong việc xây dựng các khái niệm hữu ích phục
vụ cho các hệ thống ngữ nghĩa nói chung và ontology nói riêng Từ đó, nó tác độnglên nhiều ứng dụng trong thực tế có áp dụng Web ngữ nghĩa vào hệ thống Do đó,luận án tập trung nghiên cứu các phương pháp học khái niệm trong logic mô tả dựatrên mô phỏng hai chiều với các mục tiêu chính đặt ra là:
• Nghiên cứu cú pháp, ngữ nghĩa đối với một lớp lớn các logic mô tả giàu ngữnghĩa hơn so với các công trình đã có bằng cách cho phép sử dụng các thuộc tínhnhư là các phần tử cơ bản của ngôn ngữ, các quan hệ thông qua các vai trò dữliệu và đề cập đến đặc trưng F, N Lớp các logic này bao phủ những logic mô
tả hữu ích như ALC, SHIF, SHIQ, SHOIN, SHOIQ, SROIQ,
• Xây dựng, mở rộng các định nghĩa, định lý, bổ đề về mô phỏng hai chiều tronglớp các logic mô tả đã đề cập ở trên và sử dụng nó để mô hình hóa tính khôngphân biệt được của các đối tượng làm cơ sở cho các thuật toán học khái niệmtrong logic mô tả;
• Phát triển thuật toán học khái niệm dựa trên mô phỏng hai chiều cho các hệthống thông tin trong logic mô tả với Ngữ cảnh (3);
• Xây dựng phương pháp làm mịn phân hoạch miền của các diễn dịch trong logic
mô tả dựa trên mô phỏng hai chiều sử dụng các bộ chọn hợp lý và độ đo gialượng thông tin;
• Đề xuất các thuật toán học khái niệm cho các cơ sở tri thức trong logic mô tảvới Ngữ cảnh (1) và Ngữ cảnh (2) sử dụng mô phỏng hai chiều
Trang 5Chương 1.
LOGIC MÔ TẢ VÀ CƠ SỞ TRI THỨC
1.1 Tổng quan về logic mô tả
1.1.1 Giới thiệu
Logic mô tả được xây dựng dựa vào ba thành phần cơ bản gồm tập các cá thể, tậpcác khái niệm nguyên tố và tập các vai trò nguyên tố
1.1.2 Biểu diễn tri thức
Từ các cá thể, các khái niệm và các vai trò, người ta có thể xây dựng một hệ thống
để biểu diễn và suy luận tri thức dựa trên logic mô tả gồm: bộ tiên đề vai trò, bộ tiên
đề thuật ngữ, bộ khẳng định, hệ thống suy luận, giao diện người dùng
1.1.3 Ngôn ngữ logic mô tả ALC
Định nghĩa 1.1 (Cú pháp của ALC) Cho ΣC là tập các tên khái niệm và ΣR là tậpcác tên vai trò (ΣC∩ ΣR = ∅) Các phần tử của ΣC được gọi là khái niệm nguyên tố.Logic mô tả ALC cho phép các khái niệm được định nghĩa một cách đệ quy như sau:
• nếu A ∈ ΣC thì A là một khái niệm của ALC,
• nếu C, D là các khái niệm và r ∈ ΣR là một vai trò thì >, ⊥, ¬C, C u D,
C t D, ∃r.C và ∀r.C cũng là các khái niệm của ALC Định nghĩa 1.2 (Ngữ nghĩa củaALC) Một diễn dịch trong logic mô tảALC là một
bộ I = h∆I, ·Ii, trong đó ∆I là một tập khác rỗng được gọi là miền của I và ·I làmột ánh xạ, được gọi là hàm diễn dịch của I, cho phép ánh xạ mỗi cá thể a ∈ ΣI
thành một phần tử aI ∈ ∆I, mỗi tên khái niệm A ∈ ΣC thành một tập AI ⊆ ∆I vàmỗi tên vai trò r ∈ ΣR thành một quan hệ hai ngôi rI ⊆ ∆I× ∆I Diễn dịch của cáckhái niệm phức được xác định như sau:
(∃r.C)I = {x ∈ ∆I | ∃y ∈ ∆I [rI(x, y) ∧ CI(y)]}, (C u D)I = CI ∩ DI,
(∀r.C)I = {x ∈ ∆I | ∀y ∈ ∆I [rI(x, y) ⇒ CI(y)]}, (C t D)I = CI ∪ DI
1.1.4 Khả năng biểu diễn
Khả năng biểu diễn tri thức của logic mô tả phụ thuộc vào các tạo tử khái niệm
và tạo tử vai trò mà nó được phép sử dụng Logic sử dụng càng nhiều tạo tử thì càng
có khả năng biểu diễn tốt
1.1.5 Logic mô tả và các tên gọi
• ALC - logic mô tả cơ bản ALC là ngôn ngữ khái niệm thuộc tính có phủ định
• S - ALC + tính chất bắc cầu của vai trò • F - tính chất hàm
• N - hạn chế số lượng không định tính • R - bao hàm vai trò phức
Trang 6• H - bao hàm vai trò • I - vai trò nghịch đảo.
• Q - hạn chế số lượng có định tính • O - định danh
1.2 Cú pháp và ngữ nghĩa của logic mô tả
1.2.1 Ngôn ngữ logic mô tả ALCreg
Định nghĩa 1.3 (Cú pháp của ALCreg) Cho ΣC là tập các tên khái niệm và ΣR làtập các tên vai trò (ΣC∩ ΣR = ∅) Các phần tử của ΣC được gọi là khái niệm nguyên
tố và các phần tử của ΣR được gọi là vai trò nguyên tố Logic mô tả động ALCreg chophép các khái niệm và các vai trò được định nghĩa một cách đệ quy như sau:
• nếu r ∈ ΣR thì r là một vai trò của ALCreg,
• nếu A ∈ ΣC thì A là một khái niệm của ALCreg,
• nếu C, D là các khái niệm và R, S là các vai trò thì
– ε, R ◦ S, R t S, R∗, C? là các vai trò của ALCreg,
– >, ⊥, ¬C, C u D, C t D, ∃R.C và ∀R.C là các khái niệm của ALCreg Diễn dịch của các vai trò phức trong ALCreg được xác định như sau:
(R ◦ S)I = RI ◦ SI, (R t S)I = RI ∪ SI, (R∗)I = (RI)∗,
εI = {hx, xi | x ∈ ∆I}, (C?)I = {hx, xi | CI(x)}
1.2.2 Ngôn ngữ logic mô tả LΣ,Φ
Một bộ ký tự logic mô tả là một tập hữu hạn Σ = ΣI ∪ ΣdA∪ ΣnA ∪ ΣoR ∪ ΣdR,trong đó ΣI là tập các cá thể, ΣdA là tập các thuộc tính rời rạc, ΣnA là tập các thuộctính số, ΣoR là tập các tên vai trò đối tượng và ΣdR là tập các vai trò dữ liệu Tất cảcác tập ΣI, ΣdA, ΣnA, ΣoR và ΣdR rời nhau từng đôi một
Xét các đặc trưng của logic mô tả gồm I (vai trò nghịch đảo), O (định danh), F
(tính chất hàm), N (hạn chế số lượng không định tính), Q (hạn chế số lượng có địnhtính), U (vai trò phổ quát), Self (tính phản xạ cục bộ của vai trò) Tập các đặc trưngcủa logic mô tả Φ là một tập rỗng hoặc tập chứa một số các đặc trưng nêu trên.Định nghĩa 1.4 (Ngôn ngữ LΣ,Φ) Cho Σ là bộ ký tự logic mô tả, Φ là tập các đặctrưng của logic mô tả và Lđại diện cho ALCreg Ngôn ngữ logic mô tả LΣ,Φ cho phépcác vai trò đối tượng và các khái niệm được định nghĩa một cách đệ quy như sau:
• nếu r ∈ ΣoR thì r là một vai trò đối tượng của LΣ,Φ,
• nếu A ∈ ΣC thì A là một khái niệm của LΣ,Φ,
• nếu A ∈ ΣA\ ΣC và d ∈ range(A)thì A = d và A 6= d là các khái niệm củaLΣ,Φ,
• nếu A ∈ ΣnA và d ∈ range(A) thì A ≤ d, A < d, A ≥ d và A > d là các kháiniệm của LΣ,Φ,
• nếu R và S là các vai trò đối tượng của LΣ,Φ, C và D là các khái niệm của LΣ,Φ,
r ∈ ΣoR, σ ∈ ΣdR, a ∈ ΣI và n là một số tự nhiên thì
– ε, R ◦ S , R t S, R∗ và C? là các vai trò đối tượng của LΣ,Φ,
Trang 7– >, ⊥, ¬C, C u D, C t D, ∃R.C và ∀R.C là các khái niệm của LΣ,Φ,– nếu d ∈ range(σ) thì ∃σ.{d} là một khái niệm của LΣ,Φ,
– nếu I ∈ Φ thì R− là một vai trò đối tượng của LΣ,Φ,
– nếu O ∈ Φ thì {a} là một khái niệm của LΣ,Φ,
– nếu F ∈ Φ thì ≤ 1 r là một khái niệm của LΣ,Φ,
– nếu {F , I} ⊆ Φ thì ≤ 1 r− là một khái niệm của LΣ,Φ,
– nếu N ∈ Φ thì ≥ n r và ≤ n r là các khái niệm của LΣ,Φ,
– nếu {N , I} ⊆ Φ thì ≥ n r− và ≤ n r− là các khái niệm của LΣ,Φ,
– nếu Q ∈ Φ thì ≥ n r.C và ≤ n r.C là các khái niệm của LΣ,Φ,
– nếu {Q, I} ⊆ Φ thì ≥ n r−.C và ≤ n r−.C là các khái niệm của LΣ,Φ,
– nếu U ∈ Φ thì U là một vai trò đối tượng của LΣ,Φ,
Định nghĩa 1.5 (Ngữ nghĩa củaLΣ,Φ) Một diễn dịch trongLΣ,Φlà một bộI = h∆I, ·Ii,trong đó ∆I là một tập khác rỗng được gọi là miền của I và ·I là một ánh xạ đượcgọi là hàm diễn dịch của I cho phép ánh xạ mỗi cá thể a ∈ ΣI thành một phần
tử aI ∈ ∆I, mỗi tên khái niệm A ∈ ΣC thành một tập AI ⊆ ∆I, mỗi thuộc tính
A ∈ ΣA \ ΣC thành một hàm từng phần AI : ∆I → range(A), mỗi tên vai trò đốitượng r ∈ ΣoR thành một quan hệ hai ngôi rI ⊆ ∆I × ∆I và mỗi vai trò dữ liệu
σ ∈ ΣdR thành một quan hệ hai ngôi σI ⊆ ∆I × range(σ) Hàm diễn dịch ·I được
mở rộng cho các vai trò đối tượng phức và các khái niệm phức như trong Hình 1.1,
(R ◦ S)I = RI ◦ S I
(R t S)I = RI ∪ S I
(C u D)I = CI∩ D I
(R∗)I = (RI)∗(R−)I = (RI)−1(C t D)I = CI ∪ D I
(C?)I = {hx, xi | CI(x)}
εI = {hx, xi | x ∈ ∆I} {a} I = {aI} UI = ∆I× ∆ I
1.3.1 Dạng chuẩn phủ định của khái niệm
Khái niệm C được gọi là ở dạng chuẩn phủ định nếu toán tử phủ định chỉ xuấthiện trước các tên khái niệm có trong C
Trang 81.3.2 Dạng chuẩn lưu trữ của khái niệm
Dạng chuẩn lưu trữ khái niệm được xây dựng dựa trên dạng chuẩn phủ định và tậphợp Khái niệm ở dạng này được biểu diễn dưới dạng tập hợp của các khái niệm con
1.3.3 Dạng chuẩn nghịch đảo của vai trò
Vai trò đối tượng R được gọi ở dạng chuẩn nghịch đảo nếu tạo tử nghịch đảo chỉ
áp dụng cho các tên vai trò đối tượng có trong R (không xét đến vai trò U)
Đặt Σ±oR = ΣoR ∪ {r− | r ∈ ΣoR} Một vai trò đối tượng cơ bản là một phần tửthuộc Σ±oR (tương ứng, ΣoR) nếu ngôn ngữ được xem xét cho phép vai trò nghịch đảo(tương ứng, không cho phép vai trò nghịch đảo)
1.4 Cơ sở tri thức trong logic mô tả
1.4.1 Bộ tiên đề vai trò
Định nghĩa 1.6 (Tiên đề vai trò) Một tiên đề bao hàm vai trò trong ngôn ngữ LΣ,Φ
là một biểu thức có dạng ε v r hoặc R1◦ R2◦ · · · ◦ Rk v r, trong đó k ≥ 1, r ∈ ΣoR
và R1, R2, , Rk là các vai trò đối tượng cơ bản của LΣ,Φ khác với vai trò phổ quát
U Một khẳng định vai trò trong ngôn ngữ LΣ,Φ là một biểu thức có dạng Ref(r),
Irr(r), Sym(r), Tra(r) hoặc Dis(R, S), trong đó r ∈ ΣoR và R, S là các vai trò đốitượng của LΣ,Φ khác với vai trò phổ quát U Một tiên đề vai trò trong ngôn ngữ LΣ,Φ
là một tiên đề bao hàm vai trò hoặc một khẳng định vai trò trong LΣ,Φ Định nghĩa 1.7 (Bộ tiên đề vai trò) Bộ tiên đề vai trò (RBox) trong ngôn ngữ LΣ,Φ
1.4.2 Bộ tiên đề thuật ngữ
Định nghĩa 1.8 (Tiên đề thuật ngữ) Một tiên đề bao hàm khái niệm tổng quát trongngôn ngữ LΣ,Φ là một biểu thức có dạng C v D, trong đó C và D là các khái niệmcủa LΣ,Φ Một tiên đề tương đương khái niệm trong ngôn ngữ LΣ,Φ là một biểu thức
có dạng C ≡ D, trong đó C và D là các khái niệm của LΣ,Φ Một tiên đề thuật ngữtrong ngôn ngữ LΣ,Φ là một tiên đề bao hàm khái niệm tổng quát hoặc một tiên đề
Định nghĩa 1.9 (Bộ tiên đề thuật ngữ) Bộ tiên đề thuật ngữ (TBox) trong ngônngữ LΣ,Φ là một tập hữu hạn các tiên đề thuật ngữ trong LΣ,Φ
1.4.3 Bộ khẳng định cá thể
Định nghĩa 1.10 (Khẳng định cá thể) Một khẳng định cá thể trong ngôn ngữ LΣ,Φ
là một biểu thức có dạng C(a), R(a, b), ¬R(a, b), a = b, a 6= b, trong đó C là một
Định nghĩa 1.11 (Bộ khẳng định cá thể) Bộ khẳng định cá thể (ABox) trong ngônngữ LΣ,Φ là một tập hữu hạn các khẳng định cá thể trong LΣ,Φ
1.4.4 Cơ sở tri thức và mô hình của cơ sở tri thức
Định nghĩa 1.12 (Cơ sở tri thức) Một cơ sở tri thức trong ngôn ngữ LΣ,Φ là một
bộ ba KB = hR, T , Ai, trong đó R là một RBox, T là một TBox và A là một ABox
Trang 9Định nghĩa 1.13 (Mô hình) Một diễn dịch I là một mô hình của RBox R (tươngứng, TBox T, ABox A), ký hiệu là I |= R (tương ứng, I |= T , I |= A), nếu I
thỏa mãn tất cả các tiên đề vai trò trong R (tương ứng, tiên đề thuật ngữ trong
T, khẳng định cá thể trong A) Một diễn dịch I là một mô hình của cơ sở tri thức
KB = hR, T , Ai, ký hiệu là I |= KB, nếu nó là mô hình của cả R, T và A
Ví dụ 1.1 Ví dụ sau đây là các cơ sở tri thức đề cập về các ấn phẩm khoa học:
Φ = {I, O, N , Q}, ΣI = {P1, P2, P3, P4, P5, P6},
ΣC = {Pub, Awarded , UsefulPub, Ad}, ΣdA = ΣC, ΣnA = {Year },
ΣoR= {cites, cited_by}, ΣdR = ∅,
R = {cites− v cited_by, cited_by− v cites, Irr(cites)},
T = {> v Pub, UsefulPub ≡ ∃cited_by.>},
A00= {Awarded (P1), ¬Awarded (P2), ¬Awarded (P3), Awarded (P4),
¬Awarded (P5), Awarded (P6), Year (P1) = 2010, Year (P2) = 2009,
Year (P3) = 2008, Year (P4) = 2007, Year (P5) = 2006, Year (P6) = 2006,cites(P1, P2), cites(P1, P3), cites(P1, P4), cites(P1, P6), cites(P2, P3),cites(P2, P4), cites(P2, P5), cites(P3, P4), cites(P3, P5), cites(P3, P6),cites(P4, P5), cites(P4, P6)},
A0= A00∪ {(¬∃cited_by.>)(P1), (∀cited_by.{P2, P3, P4})(P5)}
Lúc đó KB00 = hR, T , A00ivà KB0 = hR, T , A0ilà các cơ sở tri thức trong LΣ,Φ.Tiên đề > v Pub để chỉ ra rằng miền của bất kỳ mô hình nào của KB00 hoặc KB0
đều chỉ gồm các ấn phẩm khoa học
1.5 Suy luận trong logic mô tả
Có nhiều bài toán suy luận được đặt ra trong các hệ thống biểu diễn tri thức dựatrên logic mô tả Để giải quyết các bài toán suy luận, người ta sử dụng hai thuật đólà: thuật toán bao hàm theo cấu trúc và thuật toán tableaux Thuật toán bao hàmtheo tỏ ra hiệu quả đối với các ngôn ngữ logic mô tả đơn giản như F L0, F L⊥, ALN,còn thuật toán tableaux giải quyết các bài toán suy luận với lớp ngôn ngữ logic mô tảrộng hơn như ALC [11], ALCI [12], ALCIQ [12], SHIQ [13],
Tiểu kết Chương 1
Trong chương này, luận án đã giới thiệu khái quát về logic mô tả, khả năng biểudiễn tri thức của các logic mô tả Thông qua cú pháp và ngữ nghĩa của logic mô tả,luận án đã trình bày về cơ sở tri thức, mô hình của cơ sở tri thức trong logic mô tả
và những vấn đề cơ bản về suy luận trong logic mô tả Ngoài việc trình bày ngôn ngữlogic mô tả một cách tổng quát dựa trên logic ALCreg với các đặc trưng mở rộng I
(vai trò nghịch đảo), O (định danh), F (tính chất hàm), N (hạn chế số lượng khôngđịnh tính), Q (hạn chế số lượng định tính), U (vai trò phổ quát), Self (tính phản xạcục bộ của vai trò), luận án còn xem xét các thuộc tính như là các thành phần cơ bảncủa ngôn ngữ, bao gồm thuộc tính rời rạc và thuộc tính số Cách tiếp cận này phùhợp đối với các hệ thống thông tin dựa trên logic mô tả thường có trong thực tế
Trang 10Chương 2.
MÔ PHỎNG HAI CHIỀU TRONG LOGIC MÔ TẢ
VÀ TÍNH BẤT BIẾN
2.1 Giới thiệu
Mô phỏng hai chiều được nghiên cứu trong logic hình thái (modal logic) [2], [17]
Mô phỏng hai chiều là một quan hệ hai ngôi cho phép đặc tả tính tương tự giữa haitrạng thái cũng như tính tương tự giữa các mô hình Kripke Divroodi và Nguyen đãnghiên cứu mô phỏng hai chiều trong một số logic mô tả cụ thể [6]
2.2 Mô phỏng hai chiều
2.2.1 Khái niệm
Định nghĩa 2.1 (Mô phỏng hai chiều) Cho Σ và Σ† là các bộ ký tự logic mô tả saocho Σ† ⊆ Σ, Φ và Φ† là tập các đặc trưng của logic mô tả sao cho Φ† ⊆ Φ, I và I0 làcác diễn dịch trong LΣ,Φ Một LΣ† ,Φ †-mô phỏng hai chiều giữa I và I0 là một quan hệhai ngôi Z ⊆ ∆I× ∆I0 thỏa các điều kiện sau với mọia ∈ Σ†I, A ∈ Σ†C, B ∈ Σ†A\ Σ†C,
r ∈ Σ†oR, σ ∈ Σ†dR, d ∈ range(σ), x, y ∈ ∆I, x0, y0 ∈ ∆I0:
Z(x, x0) ⇒ [BI(x) = BI0(x0) hoặc cả hai đều không xác định] (2.3)
[Z(x, x0) ∧ rI(x, y)] ⇒ ∃y0 ∈ ∆I0 | [Z(y, y0) ∧ rI0(x0, y0)] (2.4)
[Z(x, x0) ∧ rI0(x0, y0)] ⇒ ∃y ∈ ∆I | [Z(y, y0) ∧ rI(x, y)] (2.5)
nếu I ∈ Φ† thì
[Z(x, x0) ∧ rI(y, x)] ⇒ ∃y0 ∈ ∆I0 | [Z(y, y0) ∧ rI0(y0, x0)] (2.7)
[Z(x, x0) ∧ rI0(y0, x0)] ⇒ ∃y ∈ ∆I | [Z(y, y0) ∧ rI(y, x)], (2.8)nếu O ∈ Φ† thì
Z(x, x0) ⇒ [x = aI ⇔ x0 = aI0], (2.9)nếu N ∈ Φ† thì
Z(x, x0) ⇒ #{y ∈ ∆I | rI(x, y)} = #{y0 ∈ ∆I0 | rI0(x0, y0)}, (2.10)nếu {N , I} ⊆ Φ† thì
Z(x, x0) ⇒ #{y ∈ ∆I | rI(y, x)} = #{y0 ∈ ∆I0 | rI0(y0, x0)}, (2.11)nếu F ∈ Φ† thì
Z(x, x0) ⇒ [#{y ∈ ∆I | rI(x, y)} ≤ 1 ⇔ #{y0 ∈ ∆I0 | rI0(x0, y0)} ≤ 1], (2.12)
Trang 11nếu {F , I} ⊆ Φ† thì
Z(x, x0) ⇒ [#{y ∈ ∆I | rI(y, x)} ≤ 1 ⇔ #{y0 ∈ ∆I0 | rI0(y0, x0)} ≤ 1], (2.13)nếu Q ∈ Φ† thì
nếu Z(x, x0) thỏa mãn thì với mọi r ∈ Σ†oR, tồn tại một song ánh
h : {y ∈ ∆I | rI(x, y)} → {y0 ∈ ∆I0 | rI0(x0, y0)} sao cho h ⊆ Z, (2.14)nếu {Q, I} ⊆ Φ† thì
nếu Z(x, x0) thỏa mãn thì với mọi r ∈ Σ†oR, tồn tại một song ánh
h : {y ∈ ∆I | rI(y, x)} → {y0 ∈ ∆I0 | rI0(y0, x0)} sao cho h ⊆ Z, (2.15)nếu U ∈ Φ† thì
∀x ∈ ∆I, ∃x0 ∈ ∆I0, Z(x, x0) (2.16)
∀x0 ∈ ∆I0, ∃x ∈ ∆I, Z(x, x0), (2.17)nếu Self ∈ Φ† thì
Z(x, x0) ⇒ [rI(x, x) ⇔ rI0(x0, x0)], (2.18)
Bổ đề 2.1
1 Quan hệ {hx, xi | x ∈ ∆I} là một LΣ† ,Φ†-mô phỏng hai chiều giữa I và I
2 Nếu Z là một LΣ† ,Φ†-mô phỏng hai chiều giữa I và I0 thì Z−1 cũng là một
LΣ† ,Φ †-mô phỏng hai chiều giữa I0 và I
3 Nếu Z1 là một LΣ† ,Φ †-mô phỏng hai chiều giữa I0 và I1, Z2 là một LΣ† ,Φ †-môphỏng hai chiều giữa I1 và I2 thì Z1◦ Z2 là một LΣ† ,Φ†-mô phỏng hai chiều giữa
I0 và I2
4 Nếu Z là một tập các LΣ† ,Φ †-mô phỏng hai chiều giữa I và I0 thì S
Z là một
2.2.2 Quan hệ tương tự hai chiều và quan hệ tương đương
Định nghĩa 2.2 Cho I và I0 là các diễn dịch trong ngôn ngữ LΣ,Φ Ta nói rằng
I LΣ† ,Φ †-tương tự hai chiều với I0 nếu tồn tại một LΣ† ,Φ †-mô phỏng hai chiều giữa
Định nghĩa 2.3 Cho I và I0 là các diễn dịch trong ngôn ngữ LΣ,Φ, x ∈ ∆I và
x0 ∈ ∆I0 Ta nói rằng x LΣ† ,Φ †-tương tự hai chiều với x0 nếu tồn tại một LΣ† ,Φ †-mô
Định nghĩa 2.4 Cho I và I0 là các diễn dịch trong ngôn ngữ LΣ,Φ, x ∈ ∆I và
x0 ∈ ∆I0 Ta nói rằng x LΣ† ,Φ †-tương đương vớix0 nếu với mọi khái niệm C củaLΣ† ,Φ †,
Trang 122.3 Tính bất biến đối với mô phỏng hai chiều
2.3.1 Quan hệ giữa mô phỏng hai chiều với các khái niệm và vai trò
Bổ đề 2.2 Cho I và I0 là các diễn dịch trong ngôn ngữ LΣ,Φ, Z là một LΣ† ,Φ †-môphỏng hai chiều giữa I và I0 Lúc đó, với mọi khái niệm C của LΣ† ,Φ†, mọi vai tròđối tượng R của LΣ† ,Φ †, mọi đối tượng x, y ∈ ∆I, x0, y0 ∈ ∆I0 và mọi cá thể a ∈ Σ†I,các điều kiện sau sẽ được thỏa mãn:
[Z(x, x0) ∧ RI(x, y)] ⇒ ∃y0 ∈ ∆I0 | [Z(y, y0) ∧ RI0(x0, y0)] (2.20)
[Z(x, x0) ∧ RI0(x0, y0)] ⇒ ∃y ∈ ∆I | [Z(y, y0) ∧ RI(x, y)], (2.21)nếu O ∈ Φ† thì:
Z(x, x0) ⇒ [RI(x, aI) ⇔ RI0(x0, aI0)] (2.22)
2.3.2 Tính bất biến của khái niệm
Định nghĩa 2.5 (Khái niệm bất biến) Một khái niệm C được gọi là bất biến đối với
LΣ† ,Φ†-mô phỏng hai chiều nếu Z(x, x0) thỏa mãn thì x ∈ CI khi và chỉ khi x0 ∈ CI0với mọi diễn dịch I, I0 trong ngôn ngữ LΣ,Φ và với mọi LΣ† ,Φ †-mô phỏng hai chiều Z
2.3.3 Tính bất biến của cơ sở tri thức
Định nghĩa 2.6 Một TBox T (tương ứng, ABox A) trong LΣ† ,Φ † được gọi là bấtbiến đối với LΣ† ,Φ†-mô phỏng hai chiều nếu với mọi diễn dịch I và I0 trong LΣ,Φ tồntại một LΣ† ,Φ †-mô phỏng hai chiều giữa I và I0 sao cho I là mô hình của T (tương
Hệ quả 2.1 Nếu U ∈ Φ† thì tất cả các TBox trong LΣ† ,Φ † đều bất biến đối với
Một diễn dịch I trong LΣ,Φ được gọi là kết nối đối tượng được đối với LΣ† ,Φ† nếuvới mọi đối tượng x ∈ ∆I tồn tại cá thể a ∈ Σ†I, các đối tượng x0, x1, , xk ∈ ∆I
và các vai trò đối tượng cơ bản R1, R2, , Rk của LΣ† ,Φ † với k ≥ 0 sao cho x0 = aI,
xk = x và RIi(xi−1, xi) thỏa mãn với mọi 1 ≤ i ≤ k [6]
Định lý 2.2 Cho T là một TBox trong LΣ† ,Φ†, I và I0 là các diễn dịch trong LΣ,Φ
thỏa điều kiện kết nối đối tượng được đối với LΣ† ,Φ † sao cho tồn tại một LΣ† ,Φ †-môphỏng hai chiều giữa I và I0 Lúc đó I là mô hình của T khi và chỉ khi I0 là mô hình
Trang 13Định lý 2.3 Cho A là một ABox trong LΣ† ,Φ † Nếu O ∈ Φ† hoặc A chỉ chứa cáckhẳng định dạng C(a) thì A bất biến đối với LΣ† ,Φ†-mô phỏng hai chiều
Hệ quả 2.2 Cho cơ sở tri thức KB = hR, T , Aitrong LΣ† ,Φ † sao cho R = ∅ và giảthiết O ∈ Φ† hoặc A chỉ chứa các khẳng định có dạng C(a), I và I0 là các diễn dịchkết nối đối tượng được trong LΣ† ,Φ † sao cho tồn tại một LΣ† ,Φ †-mô phỏng hai chiềugiữa I và I0 Lúc đó I là mô hình của KB khi và chỉ khi I0 là mô hình của KB 2.4 Tính chất Hennessy-Milner đối với mô phỏng hai chiều
Định nghĩa 2.7 Một diễn dịch I trong LΣ,Φ được gọi là phân nhánh hữu hạn (hayhữu hạn ảnh) đối với LΣ† ,Φ † nếu với mọi x ∈ ∆I và với mọi vai trò r ∈ Σ†oR thì:
• tập {y ∈ ∆I | rI(x, y)} là hữu hạn,
• nếu I ∈ Φ† thì tập {y ∈ ∆I | rI(y, x)} là hữu hạn Định lý 2.4 (Tính chất Hennessy-Milner) Cho Σ và Σ† là các bộ ký tự logic mô tảsao cho Σ† ⊆ Σ, Φ và Φ† là tập các đặc trưng của logic mô tả sao cho Φ† ⊆ Φ, I và
I0 là các diễn dịch trong LΣ,Φ thỏa mãn điều kiện phân nhánh hữu hạn đối với LΣ† ,Φ†,sao cho với mọi a ∈ Σ†I, aI LΣ† ,Φ†-tương đương với aI0 Giả thiết rằng U 6∈ Φ† hoặc
Σ†I 6= ∅ Lúc đó, x ∈ ∆I LΣ† ,Φ †-tương đương với x0 ∈ ∆I0 khi và chỉ khi tồn tại một
LΣ† ,Φ†-mô phỏng hai chiều Z giữa I và I0 sao cho Z(x, x0) thỏa mãn
Hệ quả 2.3 Cho Σ và Σ† là các bộ ký tự logic mô tả sao cho Σ† ⊆ Σ, Φ và Φ† làtập các đặc trưng của logic mô tả sao cho Φ† ⊆ Φ, I và I0 là các diễn dịch trong
LΣ,Φ thỏa điều kiện phân nhánh hữu hạn đối với LΣ† ,Φ † Giả thiết rằng Σ†I 6= ∅ và vớimọi a ∈ Σ†I, aI LΣ† ,Φ †-tương đương với aI0 Lúc đó, quan hệ {hx, x0i ∈ ∆I × ∆I0 | x
LΣ† ,Φ †-tương đương với x0} là một LΣ† ,Φ †-mô phỏng hai chiều giữa I và I0 2.5 Tự mô phỏng hai chiều
Định nghĩa 2.8 (Tự mô phỏng hai chiều) Cho I là một diễn dịch trong LΣ,Φ Một
LΣ† ,Φ †-tự mô phỏng hai chiều của I là một LΣ† ,Φ †-mô phỏng hai chiều giữa I và chính
nó Một LΣ† ,Φ †-tự mô phỏng hai chiều Z của I được gọi là lớn nhất nếu với mọi
Cho I là một diễn dịch trongLΣ,Φ, chúng ta ký hiệuLΣ† ,Φ †-tự mô phỏng hai chiềulớn nhất của I là ∼Σ† ,Φ † ,I, và ký hiệu quan hệ hai ngôi ≡Σ† ,Φ † ,I trên ∆I là quan hệthỏa mãn tính chất x ≡Σ† ,Φ†,I x0 khi và chỉ khi x LΣ† ,Φ†-tương đương với x0
Định lý 2.5 Cho Σ và Σ† là các bộ ký tự của logic mô tả sao cho Σ† ⊆ Σ, Φ và Φ†
là tập các đặc trưng của logic mô tả sao cho Φ† ⊆ Φ, I là một diễn dịch trong LΣ,Φ.Lúc đó:
1 LΣ† ,Φ †-tự mô phỏng hai chiều lớn nhất của I tồn tại và nó là một quan hệtương đương,
2 nếu I là một phân nhánh hữu hạn đối với LΣ† ,Φ † thì quan hệ ≡Σ† ,Φ † ,I là một
LΣ† ,Φ†-tự mô phỏng hai chiều lớn nhất của I (nghĩa là, quan hệ ≡Σ† ,Φ†,I và
Trang 14Chúng ta nói rằng tập Y bị phân chia bởi tập X nếu Y \ X 6= ∅ và Y ∩ X 6= ∅.Như vậy, tập Y không bị phân chia bởi tậpX nếu hoặc Y ⊆ X hoặcY ∩X = ∅ Phânhoạch Y = {Y1, Y2, , Yn} được gọi là nhất quán với tập X nếu với mọi 1 ≤ i ≤ n,
Yi không bị phân chia bởi X
Định lý 2.6 Cho Σ và Σ† là các bộ ký tự của logic mô tả sao cho Σ† ⊆ Σ, Φ và Φ† làtập các đặc trưng của logic mô tả sao cho Φ† ⊆ Φ, I là một diễn dịch hữu hạn trong
LΣ,Φ và X ⊆ ∆I Gọi Y là phân hoạch của ∆I thông qua quan hệ ∼Σ† ,Φ†,I Lúc đó:
1 nếu tồn tại khái niệm C của LΣ† ,Φ † sao cho CI = X thì phân hoạch Y nhất quánvới tập X,
2 nếu phân hoạch Y nhất quán với tập X thì tồn tại khái niệm C của LΣ† ,Φ † sao
Trang 15Chương 3.
HỌC KHÁI NIỆM CHO HỆ THỐNG THÔNG TIN
TRONG LOGIC MÔ TẢ
3.1 Hệ thống thông tin
3.1.1 Hệ thống thông tin truyền thống
Một cách hình thức, hệ thống thông tin được định nghĩa như sau [15]:
Định nghĩa 3.1 Hệ thống thông tin là một bộ IS = hU, A, V, ρi, trong đó:
• U là một tập hữu hạn, khác rỗng, được gọi là tập vũ trụ các đối tượng,
• A là một tập hữu hạn, khác rỗng, được gọi là tập thuộc tính,
• V = S
a∈A
Va, trong đó Va là tập khác rỗng các giá trị của thuộc tính a ∈ A và Vađược gọi là miền giá trị của a,
• ρ : U×A → V là một hàm thông tin, sao cho ρ(u, a) ∈ Va với mọi u ∈ U và a ∈ A.
Hạn chế của hệ thống thông tin truyền thống là không thể hiện được mối quan hệgiữa các đối tượng
3.1.2 Hệ thống thông tin dựa trên logic mô tả
Định nghĩa 3.2 (Cơ sở tri thức không vòng) Cơ sở tri thức không vòng trong ngônngữ LΣ,Φ là một bộ KB = hR, T , Ai, trong đó:
• R là một danh sách hữu hạn (ψ1, ψ2, , ψm) Mỗi ψi là một tiên đề vai trò códạng r ≡ R, trong đó R là một vai trò đối tượng của LΣ,Φ và r ∈ ΣoR là mộttên vai trò đối tượng không có mặt trong R, A và ψ1, ψ2, , ψi−1,
• T là một danh sách hữu hạn (ϕ1, ϕ2, , ϕn) Mỗi ϕi là một tiên đề thuật ngữ
có dạng A ≡ C, trong đó C là một khái niệm của LΣ,Φ và A ∈ ΣC là một tênkhái niệm không có mặt trong C, A và ϕ1, ϕ2, , ϕi−1,
Cho cơ sở tri thức không vòng KB = hR, T , Ai Một mô hình I của KB trong
LΣ,Φ được gọi là mô hình chuẩn nếu I thỏa mãn các điều kiện sau:
• ∆I = ΣI (nghĩa là, miền của I chứa tất cả các tên cá thể của Σ),
• nếu A ∈ ΣC là một khái niệm nguyên thủy trong KB thì AI = {a | A(a) ∈ A},
• nếu B ∈ ΣA \ ΣC thì BI : ∆I → range(B) là một hàm từng phần sao cho
BI(aI) = c nếu (B(a) = c) ∈ A,
• nếur ∈ ΣoR là một vai trò đối tượng nguyên thủy trongKBthìrI= {ha, bi| r(a, b) ∈ A},
• nếu σ ∈ ΣdR thì σI = {ha, di | σ(a, d) ∈ A},