Tai liệu Cơ sở dữ liệu suy diễn
Trang 1NGUYEN MAU HAN, PhD
CƠ SỞ DỮ LIỆU SUY DIỄN
Trang 2Định nghĩa 1.1 Bộ ký tự bao gồm các lớp ký hiệu sau:
Hằng, thường ký hiệu là các chữ cái thường a, b, c,
Biến, thường ký hiệu bởi X, Y, Z,
Các ký hiệu hàm, thường ký hiệu bởi f, g, h,
Các ký hiệu vị từ, thường ký hiệu bởi p, q, r,
Trang 3Định nghĩa 1.2
Hạng thức được định nghĩa đệ quy như sau:
(i) Mỗi hằng là một hạng thức,
(ii) Mỗi biến là một hạng thức,
(iii) Nếu f là ký hiệu hàm n-ngôi và t1, ,tn là các hạng
thức thì f(t1, ,tn) là một hạng thức,
(iv) Hạng thức chỉ được sinh ra bởi các quy tắc trên
1.1 Lý thuyết ngôn ngữ bậc nhất
Trang 5Định nghĩa 1.5
Công thức được định nghĩa đệ quy như sau:
Mỗi nguyên tố là một công thức,
Các hằng vị từ true và false là các công thức,
Nếu E và F là các công thức thì: (E F), (E), (EF),
Trang 6Định nghĩa 1.6 Một ngôn ngữ bậc nhất gồm một bộ
ký tự và những công thức xây dựng trên bộ ký tự đó
Định nghĩa 1.7 Nguyên tố hoặc phủ định của một
nguyên tố được gọi là một literal Một literal dương là một nguyên tố, literal âm là phủ định của một nguyên
tố
1.1 Lý thuyết ngôn ngữ bậc nhất
Trang 7Định nghĩa 1.8
Một CSDL suy diễn là một tập hữu hạn các mệnh đề
có dạng:
p1 p m q1 q n (m 0, n 0) (1) trong đó:
p i (i = 0, ,m) là các nguyên tố và q j ,j=0 n là các
literal
Tất cả các đối số của p i và q j là hằng hoặc biến
1.2 Cơ sở dữ liệu suy diễn
Trang 8Một số trường hợp đặc biệt của
p1 pm q 1 qn (1):
Trường hợp m=1, n1
(1) có dạng: p q1 q n và gọi là một quy tắc
Trường hợp m>1, n=0
(1) có dạng: p1 p m và nếu tất cả các đối trong
mọi vị từ p i là hằng thì nó được gọi là sự kiện tuyển
Trang 9Một CSDL suy diễn xác định (còn gọi là chương trình
Datalog) chỉ bao gồm các quy tắc xác định, nghĩa là
Trang 10Định nghĩa 1.9
Cho P là CSDL suy diễn xác định
•Vị từ IDB là vị từ được định nghĩa bởi các quy tắc
trong P
•Vị từ EDB là vị từ không được định nghĩa qua các
quy tắc, nó chỉ xuất hiện trong thân quy tắc
•CSDL EDB của P là tập các sự kiện nền đối với các
vị từ EDB
•CSDL IDB là tập các sự kiện nền được tính đối với các vị từ IDB bằng cách áp dụng việc suy diễn trên
các quy tắc của P với CSDL ban đầu EDB
1.2 Cơ sở dữ liệu suy diễn
Trang 11Định nghĩa 1.10
Với mỗi vị từ k-ngôi q được đặt tương ứng một quan
hệ Q có k thuộc tính Giá trị của quan hệ Q là một tập các bộ, một bộ của quan hệ Q có k thuộc tính được biểu thị bởi bộ (a 1 , ,a k ), trong đó các a i là hằng,
q(a 1 , ,a k) là đúng nếu (a 1 , ,a k ) thuộc Q
Quan hệ đối với vị từ EDB (tương ứng IDB) gọi là
quan hệ EDB (tương ứng IDB)
1.2 Cơ sở dữ liệu suy diễn
Trang 12Định nghĩa 1.11
Cho P là CSDL suy diễn xác định
Trang 13Định nghĩa 1.11 (tt)
(gọi tắt là mô hình) của P nếu I thỏa mãn mọi mệnh đề trong P
5 Mô hình M của P gọi là mô hình cực tiểu nếu
không tồn tại tập con thực sự nào của M là mô hình
của P
Nếu mô hình cực tiểu của P là duy nhất thì nó cũng
được gọi là mô hình nhỏ nhất của P
1.2 Cơ sở dữ liệu suy diễn
Trang 14Ví dụ 1.1 Xét CSDL suy diễn xác định P gồm các quy
B P = { p(a,a), p(a,b), p(a,c), p(b,a), p(b,b), p(b,c),
p(c,a), p(c,b), p(c,c), q(a,a), q(a,b), q(a,c), q(b,a),
q(b,b), q(b,c), q(c,a), q(c,b), q(c,c) }
Để ý rằng vũ trụ Herbrand và cơ sở Herbrand của
1.2 Cơ sở dữ liệu suy diễn
Trang 15trong đó Xi là biến phân biệt, ti là hạng thức và Xi ti
Mỗi cặp Xi/ti được gọi là một phép liên kết và ta nói
rằng mỗi biến Xi được liên kết với hạng thức ti
1.2 Cơ sở dữ liệu suy diễn
Trang 16Định nghĩa 1.14
hội các literal hoặc tuyển các literal
Định nghĩa 1.15
Giả sử E là một biểu thức và = {X1/t1, , X n /t n} là một
phép thế Ta ký hiệu E là việc áp dụng phép thế đối
với biểu thức E bằng cách thay thế đồng thời các biến
X i xuất hiện trong E bởi các ti (i = 1, ,n), ký hiệu E
Nếu mọi ti đều là hằng thì phép thế được gọi là phép thế nền
1.2 Cơ sở dữ liệu suy diễn
Trang 17Định nghĩa 1.14
hội các literal hoặc tuyển các literal
Định nghĩa 1.15
Giả sử E là một biểu thức và = {X1/t1, , X n /t n} là một
phép thế Ta ký hiệu E là việc áp dụng phép thế đối
với biểu thức E bằng cách thay thế đồng thời các biến
X i xuất hiện trong E bởi các ti (i = 1, ,n), ký hiệu E
Nếu mọi ti đều là hằng thì phép thế được gọi là phép thế nền
1.3 Ngữ nghĩa của CSDL suy diễn dạng tuyển
Trang 181.3.1 Ngữ nghĩa của CSDL suy diễn xác định
Trang 19Định nghĩa 1.17
sử P là CSDL suy diễn xác định, B P là cơ sở Herbrand
của P Ký hiệu là tập các tập con của B P Toán tử
hệ quả trực tiếp đối với P là một ánh xạ T p:
được định nghĩa như sau:
Với mỗi I , T p (I) = { AB P : quy tắc p q1 q2
q n của P và phép thay thế nền đối với quy tắc này
Trang 20Ví dụ 1.1
Cho CSDL suy diễn xác định P chỉ gồm một quy tắc:
Giả sử q(b,c), r(c,a) thể hiện Herbrand I và phép thế nền = {X/b, Y/c} Lúc đó ta có ( q(X,Y) r(Y,a)) =
p(a,b) T p (I)
1.3 Ngữ nghĩa của CSDL suy diễn dạng tuyển
Trang 21Định lý sau đây cho ta một tính chất quan trọng của toán tử T p :
Định lý 1.1
Giả sử P là CSDL suy diễn xác định Lúc đó:
(i) Toán tử T P là đơn điệu tăng và có điểm bất động
Trang 2222
Thuật toán 1.1
Vào: CSDL suy diễn xác định P và DB là CSDL EDB
đã cho
Ra: Mô hình nhỏ nhất của P
Phương pháp: Thuật toán được viết theo ngôn ngữ
tựa Pascal như sau:
Trang 231.3.2 Ngữ nghĩa của CSDL suy diễn dạng tuyển
Trong trường hợp CSDL suy diễn dạng tuyển, có thể tồn tại nhiều mô hình cực tiểu và có thể không có
mô hình nhỏ nhất Trong trường hợp này một tiếp cận ngữ nghĩa được đề xuất như sau:
Định nghĩa 1.18
Ngữ nghĩa của CSDL suy diễn dạng tuyển được xác
định bởi tập các mô hình cực tiểu của P
Ví dụ 1.3 Xét CSDL P như sau:
q(a)
p(a) p(b)
thì mô hình cực tiểu của P là {q(a), p(a)} và {q(a),
p(b)} Ngữ nghĩa của P chính là tập {{q(a), p(a)}, {q(a),
1.3 Ngữ nghĩa của CSDL suy diễn dạng tuyển