Chuong 1 - Intro Enhanced Data Models tài liệu, giáo án, bài giảng , luận văn, luận án, đồ án, bài tập lớn về tất cả các...
Trang 1Enhanced Data Models
Chương 1
TS Nguyễn Đình Thuân
Trang 31 CSDL tích cực (Active database)
1.1 Khái niệm, các đặc điểm cơ bản
− CSDL bị động (Passive database): Mọi hành động trên
dữ liệu kết quả chỉ thực hiện với các chương trình ứng dụng được chỉ ra.
− CSDL tích cực/chủ động: Thực hiện các hành động có
thể xảy ra tự động trong trả lời để giám sát các sự kiện, bao gồm cập nhật CSDL, điểm giờ, các sự kiện bên ngoài CSDL.
− Cơ sở dữ liệu tích cực là một CSDL chứa các qui tắc tích cực (hoặc các qui tắc gây nên), chủ yếu là các qui tắc dạng
Trang 41 CSDL tích cực (Active database)
1.2 Các qui tắc ECA (Event-Condition-Action rules)
• Qui tắc sự kiện: là các sự kiện luôn áp dụng cho cập nhật dữ liệu, gắn với CSDL Chúng cũng có thể là sự kiện thời gian hoặc một kiểu sự kiện mở rộng khác.
• Qui tắc điều kiện: Điều kiện là lựa chọn Nếu không có điều kiện nào được xác định thì hành động sẽ được thực hiện khi sự kiện xảy ra Nếu điều kiện được xác định thì hành động chỉ xảy ra khi sự kiện là đúng.
• Qui tắc hành động chiếm giữ: hành động thường là một
Trang 51 CSDL tích cực (Active database)
1.2 Các qui tắc ECA (Event-Condition-Action rules)
• CSDL tích cực nâng cao: nâng cao chức năng CSDL
truyền thống với đầy đủ các quy tắc - khả năng xử lý.
• CSDL tích cực cung cấp một máy có khả năng và
hoạt động tương tự như bất kỳ ứng dụng hệ thống
Trang 6• Nguyên tắc 2: Hành động gây ra sẽ xảy ra trước, sau hoặc đồng thời với lúc bắt đầu sự kiện.
• Nguyên tắc 3: Hành động xảy ra hiện tại được suy xét
Trang 71 CSDL tích cực (Active database)
1.3 Các vấn đề cần xem xét khi thiết kế và cài đặt CSDL tích cực :
Có 3 khả năng chính đối với qui tắc suy xét
1 Suy xét trực tiếp: Điều kiện được ước lượng là một phần của thực hiện tương tự khi bắt đầu sự kiện, và được ước lượng trực tiếp Có
3 lựa chọn:
+ Ước lượng điều kiện trước khi sự kiện bắt đầu
+ Ước lượng điều kiện sau khi sự kiện bắt đầu
+ Ước lượng điều kiện thay thế việc thực hiện khi sự kiện bắt đầu
2 Trì hoãn sự suy xét: Điều kiện được ước lượng vào cuối của sự thực hiện bao gồm sự kiện bắt đầu
3 Suy xét tách rời: Điều kiện được ước lượng như một thực hiện rời
Trang 81 CSDL tích cực (Active database)
1.3 Các vấn đề cần xem xét khi thiết kế và cài đặt CSDL tích cực :
Khả năng các ứng dụng đối với cơ sở dữ liệu tích cực:
+ Thông báo các điều kiện chắc chắn có thể xảy ra:
Trang 91 CSDL tích cực (Active database)
1.4 Qui tắc active mức row-level và statement-level
• Qui tắc active mức row-level:
Ở mỗi dòng (Row) thực hiện phân chia các bộ (tube)
• Qui tắc active mức statement-level
Thực hiện bên ngoài mỗi dòng.
Trang 102 CSDL thời gian (Temporal databases)
2.1 Định nghĩa, các đặc điểm cơ bản
a) Định nghĩa: CSDL thời gian là CSDL được xây dựng dựa trên
khía cạnh thời gian: có mô hình dữ liệu thời gian và ngôn ngữ truy vấn thời gian
Trang 112 CSDL thời gian (Temporal databases)
2.1 Định nghĩa, các đặc điểm cơ bản
b) Đặc điểm: thời gian trong CSDL TG được xem như một chuỗi thứ tự
các thời điểm points (chronon) theo một độ mịn (granularity) được xác định bởi ứng dụng
- Để có thời gian phải tham chiếu đến một hệ thống lịch: Trung Quốc,
Ấn độ…
- Các kiểu dữ liệu thời gian chính:
Thời điểm (point) -> chuỗi thời gian (time series), Khoảng thời gian
(duration), time period
Ví dụ: trong SQL 2 có các kiểu thời gian: DATE, TIME, TIMESTAMP, INTERVAL and PERIOD
Trang 122 CSDL thời gian (Temporal databases)
2.1 Định nghĩa, các đặc điểm cơ bản
c) Valid time, transaction time, bitemporal time trong CSDL thời
• Bitemporal time (BT): bao gồm cả VT và BT
• user-define time: do tùy người sử dụng
Trang 13Temporal Database Concepts
Trang 14Temporal Database Concepts
Trang 15Temporal Database Concepts
2.2) Các kỹ thuật lưu trữ trong CSDL thời gian
• Lưu trữ tất cả các phiên bản trong cùng một bảng
• Tạo hai bảng: một bảng hiện thời (giá trị phiên bản hiện tại) và một bảng lưu lịch sử (phiên bản
cũ hơn)
• Phân hoạch theo chiều dọc: các quan hệ thời gian được phân theo chiều dọc bởi các thuộc tính thành các quan hệ riêng rẽ để có được các giá trị lặp trên các thuộc tính không đổi
Trang 163 CSDL không gian và multimedia
3.1 Định nghĩa, các đặc điểm cơ bản của CSDL không gian
Định nghĩa: Cung cấp các khái niệm cơ bản về CSDL
lưu trữ các đối tượng trong không gian đa chiều.
• CSDL vẽ bản đồ: Lưu trữ các bản đồ trong không gian
2 chiều, mô tả các đối tượng của chúng như: tên nước, tên thành phố, con sông, đường xá, biển…
• CSDL thời tiết: không gian 3 chiều Nhiệt độ và các
Trang 173 CSDL không gian và multimedia
3.1 Định nghĩa, các đặc điểm cơ bản của CSDL
Trang 183 CSDL không gian và multimedia
3.2 Các dạng câu hỏi đặc trưng trong CSDL không gian
Có 3 kiểu truy vấn không gian:
• Truy vấn khoảng: Tìm các đối tượng có kiểu riêng ở bên trong vùng không gian đã cho hoặc bên trong khoảng cách riêng từ
vị trí đã cho.
• Truy vấn lân cận gần nhất: Là truy vấn tìm một đối tượng có kiểu riêng gần nhất một vị trí đã cho.
• Kết nối hoặc che phủ không gian: Kết nối các đối tượng thuộc
2 kiểu dựa vào vài điều kiện không gian như các đối tượng
Trang 193 CSDL không gian và multimedia
3.2 Các dạng câu hỏi đặc trưng trong CSDL không gian Các ví dụ của truy vấn không gian trong quản lý Taxi:
• Ví dụ 1: Tìm tất cả các bến trong thành phố Đà Nẵng hoặc tìm tất cả các thông tin tour du lịch trong vòng 100m từ vị trí Taxi hiện tại.
• Ví dụ 2: Tìm một Taxi gần nhất với vị trí của khách hàng hiện tại.
• Ví dụ 3: Tìm tất cả các khách sạn trong vòng 500m đối với cầu Sông Hàn.
Trang 203 CSDL không gian và multimedia
3.3 Các kĩ thuật đặc biệt về chỉ số trong tuy vấn không gian:
• Kỹ thuật chỉ số R-tree và các biến thể: Tìm các kiểu đối tượng có kiểu riêng bên trong một vùng không gian đã cho hoặc bên trong một khoảng cách đã biết từ một vị trí đã cho
• Nhóm R-Trees tập hợp các đối tượng gần một không gian trạng thái Vật lí cùng nút lá của cấu trúc cây được đánh chỉ số
• Các thuật toán dùng chia không gian thành các hình chữ nhật bên trong chứa các đối tượng là cần thiết
• Các cấu trúc lưu trữ không gian bao gồm Quadtrees, Octrees và các biến thể của chúng
Trang 213 CSDL không gian và multimedia
3.4 CSDL multimedia
Định nghĩa và các đặc điểm của CSDL multimedia:
- CSDL đa phương tiện cung cấp các tính chất cho phép người sử dụng
dự trữ và truy vấn các dạng khác nhau của thông tin đa phương tiện như: hình ảnh, video clip, audio clip,…
- Dạng chính trong truy vấn CSDL đa phương tiện là xác định nguồn đa phương tiện chứa các đối tượng chính xác hoặc tích cực liên quan như:
+ Tìm 3 video clip mới nhất của Britney Spears
+ Tìm tất cả các video clip chứa bàn thắng của Cristiano Ronaldo trong World Cup 2010.
Các dạng trên của truy vấn dẫn đến khái niệm gọi là “sự phục hồi dựa trên nội dung”
Trang 223 CSDL không gian và multimedia
3.5 Vấn đề tìm kiếm nội dung trong CSDL multimedia
Một CSDL đa phương tiện phải sử dụng vài mô hình để thiết lập và đánh chỉ số nguồn đa phương tiện dựa trên nội dung của chúng Định danh các nội dung của nguồn đa phương tiện là một công việc
khó và tốn nhiều thời gian.
Có 2 phương pháp chính đối với định danh nội dung:
1 Tự động phân tích nguồn đa phương tiện để định danh chính xác bản chất toán học của nội dung.
2 Hướng dẫn định danh các đối tượng và các hành động có liên
Trang 234 CƠ SỞ DỮ LIỆU SUY DIỄN
- Xuất phát từ quan điểm lý thuyết, các CSDL suy diễn có thể được coi như các chương trình logic với sự khái quát hoá khái niệm về CSDL quan hệ Đó là cách tiếp cận của Brodie và Manola vào năm 1989, của Codd vào năm 1970, của Date vào năm 1986, của Gardarin và Valdurier vào năm 1989 và của Ullman vào năm 1984
- Một khía cạnh khác nhau nữa giữa CSDL suy diễn và lập trình logic là các hệ thống lập trình logic nhấn mạnh các chức năng, trong khi CSDL suy diễn nhấn mạnh tính hiệu quả Cơ chế suy diễn dùng trong CSDL suy diễn để tính toán trả lời không được tổng quát như trong lập trình logic
Trang 244 CƠ SỞ DỮ LIỆU SUY DIỄN
4.1 Mô hình CSDL suy diễn gồm:
+ Kí pháp toán học để mô tả hình thức dữ liệu và các quan hệ.+ Kỹ thuật để xử lý dữ liệu như trả lời các câu hỏi, kiểm tra
điều kiện toàn vẹn
- Logic bậc một được dùng như kí pháp toán học để mô tả dữ
liệu trong mô hình CSDL suy diễn và dữ liệu được xử lý trong các mô hình như vậy nhờ việc đánh giá công thức logic
- Tuy nhiên để dễ biểu diễn hình thức các khái niệm về CSDL suy diễn, người ta thường dùng phép toán vị từ, tức logic vị từ bậc
Trang 254 CƠ SỞ DỮ LIỆU SUY DIỄN
Các định nghĩa:
Định nghĩa 1: Mỗi một hằng số, một biến số hay một hàm số áp lên
các tên là một hạng thức (term)
Hàm n ngôi f(x1,x2, ,xn); xi | i = 1,2, ,n là một hạng thức thì f(x1,x2,…,xn) là một term.
Định nghĩa 2: Công thức nguyên tố (công thức nhỏ nhất) là kết quả
của việc ứng dụng một vị từ trên các tham số của term dưới dạng P(t1, t2,…, tn)
Nếu P là vị từ có n ngôi và ti | i=1,2, ,n là một hạng thức(term).
Định nghĩa 3: (Literal) Dãy các công thức nguyên tố hay phủ định
của công thức nguyên tố đã được phân tách qua các liên kết logic (, , , , , , ) thì công thức đó được thiết lập đúng đắn.
Trang 264 CƠ SỞ DỮ LIỆU SUY DIỄN
Nhận xét:
i) Một công thức nguyên tố là công thức thiết lập đúng đắn.
ii) F, G là công thức thiết lập đúng đắn => F G, F G, F G, F G,
Trang 274 CƠ SỞ DỮ LIỆU SUY DIỄN
Định nghĩa 4: Câu(Clause)
Công thức có dạng P1P2….Pn Q1Q2….Qn
Trong đó: Pi và Qj (i,j=1,2,…,n) là các Literal dương
Trong hệ thống logic, Literal dương có dạng nguyên tố, nhỏ nhất, trái với Literal
âm là phủ định của nguyên tố.
Định nghĩa 5: Câu Horn (Horn clause)
là câu có dạng P1P2….Pn Q1
Định nghĩa 6: CSDL suy diễn tổng quát (General deductive database)
CSDL suy diễn tổng quát, hay CSDL suy diễn được xác định như cặp (D,L),
trong đó D là tập hữu hạn của các câu CSDL và L là ngôn ngữ bậc một.
Giả sử L có ít nhất hai ký hiệu, một là ký hiệu hằng số và một ký kiệu vị từ
+ Một CSDL xác định (hay CSDL chuẩn) là CSDL suy diễn(D,L) mà D chỉ chứa các câu xác định(câu chuẩn).
+ Một CSDL quan hệ là CSDL suy diễn (D,L) mà D chỉ chứa các sự kiện xác định
Trang 284 CƠ SỞ DỮ LIỆU SUY DIỄN
4.2 Các giao tác trên CSDL suy diễn
Định nghĩa 1: Giao tác (Transaction)
Một giao tác trong CSDL suy diễn là một một xâu hữu hạn của các phép toán, hay các hành động bổ sung, loại bỏ hay cập nhật các câu.
Vì một CSDL suy diễn được xem như tập các câu, tức là theo quan điểm
lý thuyết mô hình, không một phép loại bỏ hay cập nhật nào được phép thực hiện trên sự kiện Các sự kiện là ngầm có trong CSDL.
Trang 294 CƠ SỞ DỮ LIỆU SUY DIỄN
4.3 CSDL dựa trên Logic
DATALOG là một ngôn ngữ phi thủ tục dựa trên logic vị từ bậc nhất.
Người ta sử dụng để mô tả thông tin cần thiết không theo cách lấy thông tin trong các thủ tục bình thường mà dựa trên logic (ngôn ngữ DATALOG).
1 Cú pháp
+ Ký hiệu :
+ vị từ so sánh : <tên thuộc tính> <giá trị>
(Biến) so sánh với (giá trị)
= {<, >, <=, >=, =, <>}
+ Cách biểu diễn các luật(Clause – Rule)
Q P1, P2, ,Pn
Dấu “,” AND () Dấu “;” OR () Dấu “” : Kéo theo
Pi : là các tiên đề, giả thiết, đích con, vị từ
Q : là kết luận hay là sự kiện
+ Nếu n = 0 : Q Các sự kiện của CSDL cài đặt.
+ Nếu P P1, P2,…,Pn thì P là luật đệ quy (hay vị từ ở trong thân và đầu luật)
Trang 304 CƠ SỞ DỮ LIỆU SUY DIỄN
(r3) Ôngbà(x,y) Chamẹ(x,z) , Chamẹ(z,y)
(r4) Bố(x,y) (r7) : TổTiên(x,y) Chamẹ(x,z) ,
TổTiên(z,y)
Trang 314 CƠ SỞ DỮ LIỆU SUY DIỄN
3 Cấu trúc cơ bản
• CSDL DATALOG gồm hai loại quan hệ:
- Các quan hệ cơ sở được lưu trữ trong CSDL, có dạng như người ta thấy Người ta còn gọi cơ sở này là CSDL mở rộng EDB (Extended Database)
- Các quan hệ suy diễn không cần lưu trong CSDL Chúng được dùng như quan hệ tạm thời, chứa các kết quả trung gian khi trả lời câu hỏi Các quan hệ này được gọi là CSDL theo mục đích IDB (Intentional Database)
• Các chương trình DATALOG có một tập hữu hạn các luật tác động đến các quan hệ cơ bản và quan hệ suy diễn
Trang 32Ví dụ
+ Có luật về ngân hàng như sau:
Ca(Y,X) Gửitiền(“TPHCM”, X, Y, Z), Z>1200
Luật này gồm quan hệ cơ sở là “Gửitiền”, quan hệ suy diễn là
“Ca” Luật này rút ra các cặp <Tên khách hàng, Tài khoản> của tất cả các khách hàng có tài khoản tại chi nhánh
“TPHCM” và có số dư lớn hơn 1200
+ Luật trên có thể viết được dưới dạng biểu thức tính toán tương
đương trên miền xác định và kết quả được bổ sung vào quan
hệ suy diễn mới “Ca”
{ <X, Y> | W, Z (W, X, Y, Z) Gửitiền W= “Hà Nội” Z>1200}
Trang 334 CƠ SỞ DỮ LIỆU SUY DIỄN
Định nghĩa 9: Hệ quản trị CSDL suy diễn (Deductive DBMS)
Hệ quản trị CSDL cho phép suy diễn các n_bộ của vị từ
theo mục đích bằng bằng cách sử dụng các luật logic
Các chức năng của hệ quản trị CSDL suy diễn được mô tả như sau:
Trang 355.1 Khái niệm (tt)
Các cơ chế suy diễn:
Modus Ponens: Nếu mệnh đề A đúng và A B
Trang 365.2 Chứng minh mệnh đề
Chứng minh tính đúng đắn của phép suy diễn (a b).
Thao tác biến đối hình thức: khó đối với con người
và cài đặt được trên máy tính.
Lập bảng chân trị: độ phức tạp O(2n)
Hai phương pháp chứng minh mệnh đề có độ phức
tạp là O(n):
▪ Thuật giải Vương Hạo.
▪ Thuật giải Robinson.
Trang 371 Thuật giải Vương Hạo
B1: Phát biểu lại giả thiết và kết luận theo dạng chuẩn:
GT 1 , GT 2 , , GT n KL 1 , KL 2 , ., KL m
B2: Chuyển vế các GT i và KL i có dạng phủ định.
B3: Nếu GT i có phép thì thay thế phép bằng dấu ","
Nếu KLi có phép thì thay thế phép bằng dấu ",“
B4: Nếu GTi có phép thì tách thành hai dòng con.
Nếu ở KL i có phép thì tách thành hai dòng con.
B5: Một dòng được chứng minh nếu tồn tại chung một mệnh đề ở cả hai phía.
B6: a) Nếu một dòng không còn phép và ở cả hai vế và ở 2 vế không có
chung một mệnh đề thì dòng đó không được chứng minh.
b) Một vấn đề được chứng minh nếu tất cả dòng dẫn xuất từ dạng chuẩn ban đầu đều được chứng minh.
Trang 382 Thuật giải Robinson
Hoạt động dựa trên:
Trang 392 Thuật giải Robinson (tt)
B1: Phát biểu lại giả thiết và kết luận dưới dạng chuẩn:
GT1, GT2, , GTn KL 1 , KL2, , KLm
B2: Nếu GTi có phép thì thay bằng dấu ","
Nếu KLi có phép thì thay bằng dấu ",“
B3: Biến đổi dòng chuẩn ở B1 thành danh sách mệnh đề:
{GT1, GT2, , GTn , KL 1 , KL 2 , , KL m }
B4: Nếu danh sách mệnh đề có 2 mệnh đề đối ngẫu nhau thì bài toán
được chứng minh Ngược lại thì chuyển sang B5.
B6: Áp dụng phép hợp giải: i) p (p q) q
ii) (p q) (p r) q r
B7: Nếu không xây dựng được thêm mệnh đề mới và danh sách mệnh
đề không có 2 mệnh đề đối ngẫu thì vấn đề không được chứng minh
Ví dụ : Chứng minh rằng
( p q) ( q r) ( r s) ( u s) p u
Trang 405.3 Logic vị từ
Khái niệm:
Vị từ và lượng từ ( - với mọi, - tồn tại) tăng
cường tính cấu trúc của mệnh đề.
Mệnh đề được biểu diễn dưới dạng :
Vị từ (<đối tượng 1>, <đối tượng 2>, …, <đối
tượng n>)
(Vị từ: mối liên hệ giữa các đối tượng tri thức.)