1. Trang chủ
  2. » Công Nghệ Thông Tin

nghiên cứu các phụ thuộc hàm theo thời gian, thông qua hai quan điểm của wang và wijsen

112 857 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 112
Dung lượng 1,08 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Tại các hệ thống thông tin, dữ liệu luôn tăng nhanh và không ngừng thay đổi theo thời gian, do đó việc lưu trữ không chỉ được thựchiện tại một thời điểm nhất định ở một ngày cụ thể nào đ

Trang 1

MỞ ĐẦU

Ngày nay, chúng ta đang sống và làm việc trong thời đại phát triển củacông nghệ thông tin Nhu cầu sử dụng thông tin ngày càng được mọi người quantâm hơn, thông tin không những phải được truy cập nhanh mà còn phải chínhxác

Với một lượng lớn dữ liệu từ các lĩnh vực khác nhau đang ngày một tăngnhanh, các kho dữ liệu sớm được hình thành Do đó, để sử dụng và khai thác dữliệu một cách có hiệu quả, các nhà khoa học đã tập trung nghiên cứu về cơ sở dữliệu (CSDL) Một khía cạnh quan trọng khi nghiên cứu cơ sở dữ liệu đó chính làyếu tố thời gian

Yếu tố thời gian làm cho CSDL rõ ràng hơn, hữu ích hơn nhưng đồng thờicũng làm cho nó trở nên phức tạp hơn Do đó người ta thường bỏ qua yếu tố thờigian, không quan tâm đến nó khi thiết kế CSDL Song, hầu hết các ứng dụngCSDL hiện nay đều có liên quan đến yếu tố thời gian Vì vậy, vấn đề đặt ra chocác nhà khoa học là: làm thế nào để có thể xây dựng được các ứng dụng CSDL

có yếu tố thời gian một cách thích hợp và có hiệu quả Các nghiên cứu về CSDLtrong những năm gần đây đa số tập trung vào việc giải quyết vấn đề này

Yếu tố thời gian có ở khắp nơi trong các hệ thống thông tin và làm cho các

hệ thống đó trở nên phức tạp Tại các hệ thống thông tin, dữ liệu luôn tăng nhanh

và không ngừng thay đổi theo thời gian, do đó việc lưu trữ không chỉ được thựchiện tại một thời điểm nhất định ở một ngày cụ thể nào đó mà phải thường xuyênđược lưu trữ theo thời gian nhằm đảm bảo việc cung cấp thông tin cho người sửdụng là hoàn toàn chính xác ở mọi thời điểm, cả trong qúa khứ, hiện tại và tươnglai

Trang 2

Yếu tố thời gian trong CSDL bước đầu được nghiên cứu trong ngữ cảnhcủa mô hình quan hệ [12] do mô hình này được xây dựng trên một cơ sở toánhọc chặt chẽ với các phép toán đại số và logic, điều này rất phù hợp với việc mô

tả các khái niệm về thời khoảng cũng như một số các thao tác đối với dữ liệu cóyếu tố thời gian Song, trong những năm gần đây, mô hình hướng đối tượng cũng

đã và đang phát triển theo xu thế của việc đưa khái niệm hướng đối tượng vàotrong một số lĩnh vực của khoa học máy tính Việc áp dụng cách tiếp cận hướngđối tượng vào lĩnh vực CSDL đã tạo khả năng linh hoạt cho mô hình dữ liệu nàytrong việc mô hình hóa thế giới thực vốn ngày càng phức tạp

Một trong những vấn đề đặt ra đối với CSDL có yếu tố thời gian đó là phụthuộc hàm theo thời gian (TFD) Phụ thuộc hàm theo thời gian có vai trò quantrọng đối với việc phân tích và thiết kế CSDL có yếu tố thời gian

Phụ thuộc hàm theo thời gian được nghiên cứu lần đầu tiên bởiWang [12], kết quả nghiên cứu của ông liên quan đến việc thiết kế CSDL có yếu

tố thời gian Sau này đã được các nhà khoa học khác như Jensen, Vianu,Navathe … tiếp tục nghiên cứu và phát triển, đặc biệt đã được Wijsen [15]nghiên cứu trong mô hình hướng đối tượng

Trong luận văn này, mục đích chính của chúng tôi là nhằm nghiên cứu cácphụ thuộc hàm theo thời gian, thông qua hai quan điểm của Wang và Wijsen.Liên quan đến lý thuyết phụ thuộc hàm theo thời gian của Wang, chúng tôi cũng

đã đưa ra một số hệ quả và tính chất về mối liên hệ giữa phụ thuộc hàm theo thờigian (TFD) và phụ thuộc hàm (FD) truyền thống Bên cạnh đó, khi tìm hiểu cáchtiếp cận của Wijsen chúng tôi đã so sánh hai quan điểm về lý thuyết phụ thuộchàm theo thời gian của Wang và Wijsen thông qua việc so sánh hệ 4 tiên đề chocác TFD của Wang và hệ 7 tiên đề cho các TFD của Wijsen

Trang 3

Tổ chức của luận văn

Luận văn bao gồm phần mở đầu, ba chương nội dung, phần kết luận, tàiliệu tham khảo và phần phụ lục

Các khái niệm cơ sở của luận văn được trình bày trong chương 1 Chươngnày nhằm giới thiệu khái quát về CSDL có yếu tố thời gian bao gồm: ngữ nghĩa

dữ liệu theo thời gian, cách biểu diễn yếu tố thời gian trong CSDL, các phép toántrên thời khoảng, cách biểu diễn các bộ dữ liệu theo thời gian, các phép toán giữacác bộ theo thời gian và các phép toán đại số trong CSDL có yếu tố thời gian

Chương 2 trình bày về lý thuyết chuẩn hoá cơ sở dữ liệu quan hệ theo thờigian theo cách tiếp cận của Wang [12] bao gồm: khái niệm kiểu thời gian vàmôđun thời gian, cơ sở lý thuyết của phụ thuộc hàm theo thời gian với khái niệm

về TFD, hệ tiên đề cho các TFD, bao đóng của tập TFD, khoá của lược đồmôđun thời gian, bao đóng của tập thuộc tính, phủ tối thiểu TFD, lý thuyết chuẩnhóa CSDL quan hệ theo thời gian Trên cơ sở đó, chúng tôi đưa ra một số tínhchất và hệ qủa phản ánh mối quan hệ giữa TFD và FD truyền thống

Chương 3 trình bày về việc mở rộng lý thuyết phụ thuộc hàm theo thờigian trên các đối tượng phức theo cách tiếp cận của Wijsen [15] bao gồm: việcđịnh danh đối tượng, vai trò của việc định danh đối tượng, các mô hình dữ liệungữ nghĩa, mô hình thời gian, mô hình dữ liệu hướng đối tượng và sự thể hiệntheo thời gian, lý thuyết phụ thuộc hàm theo thời gian trên các đối tượng phứcvới khái niệm hình thức về TFD và hệ tiên đề cho các TFD Từ đó, chúng tôi sosánh cách tiếp cận của Wang và Wijsen để thấy rằng: khái niệm kiểu thời giantheo cách tiếp cận của Wijsen là một mở rộng so với cách tiếp cận của Wang

Phần phụ lục trình bày một số chứng minh của các định lý, bổ đề và mệnh

đề đã được trình bày trong chương 2 và chương 3

Trang 4

Do thời gian còn hạn chế nên bài luận văn này không thể tránh khỏi nhữngnhầm lẫn và thiếu sót Rất mong nhận được những ý kiến đóng góp chân thànhcủa qúy thầy cô giáo, bạn bè và những người quan tâm.

Trang 5

CHƯƠNG 1 GIỚI THIỆU KHÁI QUÁT VỀ

CƠ SỞ DỮ LIỆU CÓ YẾU TỐ THỜI GIAN

Với một lượng lớn dữ liệu được lưu trữ ngày càng nhiều nên yếu tố thờigian trong vấn đề lưu trữ dữ liệu luôn là vấn đề được quan tâm đến, dữ liệu cungcấp cho người sử dụng phải có giá trị ở mọi thời điểm khác nhau, cả trong quákhứ, hiện tại và tương lai

Cơ sở dữ liệu có yếu tố thời gian sẽ lưu lại các thông tin liên quan khi các

sự kiện thực sự xảy ra hoặc khi các sự kiện được xem là đúng Trong CSDL cóyếu tố thời gian, các sự kiện thường được gắn liền với một thời điểm hoặc vớimột khoảng thời gian cụ thể nào đó Trong quá trình lưu trữ dữ liệu, giá trị của

một số thuộc tính như Họ tên, Ngày sinh, Phái luôn ổn định, thông thường

không thay đổi theo thời gian Trong khi đó, giá trị của một số thuộc tính như

Phòng ban, Chức vụ, Bậc lương thay đổi theo thời gian Những thuộc tính có

giá trị không thay đổi theo thời gian được gọi là thuộc tính phi thời gian, ngượclại được gọi là những thuộc tính có yếu tố thời gian

Trong chương 1 trình bày một cách khái quát về CSDL có yếu tố thờigian, bao gồm các mục như: mục 1.1 là phần giới thiệu, mục 1.2 trình bày các

Trang 6

ngữ nghĩa dữ liệu theo thời gian, vấn đề về cách biểu diễn yếu tố thời gian trong

mô hình dữ liệu quan hệ được trình bày trong mục 1.3, mục 1.4 trình bày cácphép toán trên thời khoảng, từ những mối quan hệ khác nhau giữa hai thờikhoảng trong cùng một quan hệ, chúng có thể dẫn đến các phép toán như phéphợp, phép giao và phép hiệu giữa hai thời khoảng Mục 1.5 trình bày cách biểudiễn các bộ dữ liệu theo thời gian, mục 1.6 trình bày các phép toán trên các bộ

dữ liệu theo thời gian như phép tương đương, phép hợp nhất theo thời gian, phépbao theo thời gian Các phép toán đại số trong CSDL có yếu tố thời gian đượctrình bày trong mục 1.7 và cuối cùng là kết luận chương, phần này được trìnhbày trong mục 1.8

1.2 Ngữ nghĩa dữ liệu theo thời gian

Trong nhiều ứng dụng, yếu tố thời gian được xem là quan trọng đối vớiCSDL Chẳng hạn như hệ thống theo dõi sức khỏe bệnh nhân ở bệnh viện, hệthống đặt vé máy bay tại các phòng bán vé…

Cơ sở dữ liệu có yếu tố thời gian sẽ lưu lại các thông tin liên quan khi các

sự kiện thực sự xảy ra hoặc khi các sự kiện được xem là đúng Trong CSDL cóyếu tố thời gian, các sự kiện thường được gắn liền với một thời điểm hoặc vớimột khoảng thời gian cụ thể nào đó, chẳng hạn giáo viên “Lê Hoàng” dạy chokhóa “TINA28” kể từ ngày 06/03/05

Xét về mặt ngữ nghĩa, ta có thể phân yếu tố thời gian trong CSDL thànhcác dạng thời gian khác nhau tùy từng cách hiểu

Thời gian có thể được gọi là thời gian hợp lệ nếu nó được hiểu như là thời

gian mà sự kiện xảy ra hoặc là quãng thời gian mà sự kiện đúng trong thực tế

Trang 7

Thời gian cũng có thể được gọi là thời gian giao dịch nếu nó được hiểu

như là thời gian mà khi thông tin thực sự được lưu giữ trong CSDL, thời gian ởđây chính là giá trị của đồng hồ hệ thống khi thông tin được lưu giữ

Chẳng hạn, giả sử CSDL của một hệ thống đặt vé máy bay lưu trữ các

thông tin về Họ tên khách hàng, Số CMND, Chuyến bay, Hướng bay, Thời gian xuất phát Giả sử rằng, tại thời điểm 07:30:00 ngày 01/03/2006, một khách hàng

đã cập nhật hệ thống để đặt mua vé máy bay với các thông tin như Họ tên khách hàng: Nguyễn Nam, Số CMND:123456789, Chuyến bay: HS2, Hướng bay: Huế

đi TP Hồ Chí Minh, Thời gian xuất phát: 14:00:00 ngày 05/03/2006 Với CSDL như thế này, xét về mặt ngữ nghĩa thì thời gian hợp lệ chính là thời gian xuất phát của máy bay, tức là vào lúc 14:00:00 ngày 05/03/2006, còn thời gian giao dịch chính là thời gian được tính kể từ lúc khách hàng cập nhật vào hệ thống để

đặt mua vé, tức là vào lúc 07:30:00 ngày 01/03/2006

Thời gian hợp lệ và thời gian giao dịch là hai dạng thời gian thông dụng

nhất trong CSDL có yếu tố thời gian Tùy từng ứng dụng cụ thể, ta có thể chỉ cầnđến một dạng thời gian nào đó Song, có một vài ứng dụng lại đòi hỏi phải sửdụng đến cả hai dạng thời gian kể trên

Bên cạnh thời gian hợp lệ và thời gian giao dịch còn có nhiều dạng thời

gian khác cũng được xét đến như: thời gian dự kiến, thời gian quyết định…

Một dạng thời gian khác thúc đẩy sự nghiên cứu của các nhà khoa họctrong nhiều thế kỷ qua và thật khó để có thể mô tả một cách cụ thể và rõ ràng đó

chính là thời gian hiện tại (ta ký hiệu là “nay” trong CSDL) Thời gian hiện tại là

dạng thời gian không ngừng tăng, toàn bộ các hoạt động thường được đặt ở thời

gian hiện tại, thời gian hiện tại tách rời quá khứ và tương lai Thời gian hiện tại

Trang 8

đã mở ra một thách thức mới cho những ai quan tâm đến việc quản lý dữ liệu,

mà đặc biệt là với các CSDL có yếu tố thời gian

1.3 Biểu diễn yếu tố thời gian trong CSDL

Ta gọi không gian các thời điểm C là không gian một chiều, liên tục vàkhông âm [0, +), trên đó có xác định quan hệ thứ tự “”

Ta quy ước các ký hiệu như sau:

 t  C cho biết t là một thời điểm

  = <t, t’> t, t’>  C cho biết <t, t’> t, t’> là một khoảng thời gian hay còn đượcgọi là một thời khoảng, với t  t’ Thời khoảng này có thể được phânloại dựa trên các khoảng đóng hay mở bên trái hoặc bên phải, bao gồm(t, t’); [t, t’]; (t, t’]; [t, t’)

 Với mô hình quan hệ n ngôi, yếu tố thời gian trong CSDL được biểudiễn bởi một bảng gồm n cột, các cột có tên cột được gọi là thuộc tínhcủa quan hệ

 Các chữ cái in hoa ở đầu dãy Alphabeta như A, B, C, được dùng để

ký hiệu cho tên các thuộc tính

 Các chữ cái in hoa ở cuối dãy Alphabeta như U, V, Z, được dùng để

ký hiệu cho tập các thuộc tính

 R được sử dụng để ký hiệu cho lược đồ quan hệ có yếu tố thời gian

 r được sử dụng để ký hiệu cho quan hệ hiện hành của lược đồ quan hệR

 Phép ghép được sử dụng thay cho phép hợp Như vậy, A1A2 An được

sử dụng để biểu diễn tập {A1, A2, ,An}, và với phép hợp của X và Y,thay vì ta viết X  Y thì ta có thể viết XY

Trang 9

Ví dụ 1.1 Xét quan hệ GIÁOVIÊN như sau:

Bảng 1.1 Quan hệ GIÁOVIÊN có yếu tố thời gian.

Như vậy, từ ví dụ trên, nếu GIÁOVIÊN là một quan hệ có yếu tố thời gian

gồm các thuộc tính như: Mã GV, Họ tên, Khoá dạy, Môn dạy, HS lương và Thời gian thì GIÁOVIÊN = (Mã GV, Họ tên, Khoá dạy, Môn dạy, HS lương, Thời

gian) được gọi là một lược đồ quan hệ có yếu tố thời gian

1.4 Các phép toán trên thời khoảng

Với 1 và 2 là hai thời khoảng trên C (1, 2  C) Mối quan hệ giữa haithời khoảng đó có thể đưa về một trong các trường hợp sau:

i 1 và 2 rời nhau, ký hiệu 1  2

ii 1 và 2 giao nhau, ký hiệu 1  2

iii 1 chứa 2, ký hiệu 1  2

iv 1 chứa trong 2, ký hiệu 1  2

Từ đó, ta có các phép toán trên thời khoảng như sau:

Trang 10

1.5 Biểu diễn các bộ dữ liệu theo thời gian

R = (A1, A2, …, An) là một lược đồ quan hệ có yếu tố thời gian, trong đó{A1, A2, …An} là tập các thuộc tính của quan hệ và An là một thuộc tính chỉ thờigian, ta ký hiệu là thuộc tính T Với mỗi thuộc tính Ai (i = 1 ,n) tương ứng vớimiền giá trị của thuộc tính Ai, ký hiệu là dom(Ai)

Đặt D = dom(A1)  …  dom(An) Khi đó:

Một bộ dữ liệu trên R, ký hiệu , là một ánh xạ được xác định như sau:

: R   D, sao cho [Ai]  dom(Ai), i = 1 ,n Như vậy, ta có thể xem các bộ như là các ánh xạ từ tên các thuộc tính đếncác giá trị trong miền thuộc tính Nếu  là một bộ và X là một tập các thuộc tính,chúng ta có thể dùng [X] để thay cho các thành phần của  trong tập các thuộctính của X

Trong ví dụ 1.1, nếu  là một bộ thì [{Mã GV, Họ tên, Khoá dạy, Môndạy, HS lương, Thời gian}] là bộ (001, Lê Hoàng, KTV36, Excel, 1.82,[01/03/05, 01/05/05])

1.6 Các phép toán giữa các bộ theo thời gian

Định nghĩa 1.1 (Phép tương đương giữa hai bộ theo thời gian)

Cho lược đồ quan hệ R với 1 và 2 là hai bộ trên R Khi đó, 1 và 2 được

gọi là tương đương nhau, ký hiệu 1  2, nếu với X  (R \ {T}) thì(1[X] = 2[X]) trong đó T là thuộc tính chỉ thời gian

Trang 11

Ví dụ 1.2 Xét quan hệ GIÁOVIÊN như sau:

Bảng 1.2 Phép tương đương giữa hai bộ theo thời gian.

Như vậy, với các bộ dữ liệu tương đương nhau, nếu ta không xét đến yếu

tố thời gian thì chúng hoàn toàn trùng nhau trong một mô hình dữ liệu quan hệthông thường Vì quan hệ thực chất là tập các bộ, mà theo lý thuyết tập hợp thìkhông thể tồn tại hai bộ trùng nhau trong cùng một tập, do đó sự trùng nhau củahai bộ trong cùng một quan hệ sẽ dẫn đến điều không hợp lệ Chính vì vậy, việctìm ra một phép toán nhằm đưa toàn bộ các bộ dữ liệu tương đương trong cùngmột quan hệ về dạng hợp lệ được xem là vấn đề cần thiết, và phép toán thực hiệnđược điều này được gọi là phép hợp nhất Khi đó, một quan hệ không chứa các

bộ dữ liệu tương đương nhau được gọi là quan hệ chính tắc.

Nói cách khác, một quan hệ có yếu tố thời gian r trên lược đồ R được gọi

là chính tắc nếu nó không tồn tại hai bộ phân biệt của r tương đương nhau Điều

này có nghĩa là, r là chính tắc nếu với 1, 2  r mà 1 ≉ 2

Như ta đã biết, nguyên nhân dẫn đến sự trùng lặp dữ liệu giữa các bộ trongcùng một quan hệ đó chính là yếu tố thời gian Vì vậy, để đưa một quan hệ có

Trang 12

yếu tố thời gian về dạng chính tắc ta cần phải thực hiện một phép toán gọi là

phép hợp nhất theo chiều thời gian.

Định nghĩa 1.2 (Phép hợp nhất theo thời gian)

Cho lược đồ quan hệ R với 1 và 2 là hai bộ tương đương nhau trên R Khi

đó, phép hợp nhất của 1 và 2, ký hiệu 1  2 là một bộ  được xác định nhưsau:

 = 1  2  (  1)  (  2)  ([T] = 1[T]  2[T])

Ví dụ 1.3 Xét quan hệ GIÁOVIÊN được cho trong bảng 1.2 Áp dụng phép hợp

nhất, ta có thể đưa quan hệ ở bảng 1.2 về dạng chính tắc như sau:

Bảng 1.3 Phép hợp nhất theo thời gian.

Định nghĩa 1.3 (Quan hệ bao theo thời gian)

Cho lược đồ quan hệ R với 1 và 2 là hai bộ tương đương nhau trên R Khi

đó, 1 được gọi là bao theo thời gian 2 trên R, ký hiệu 1 T 2, nếu 1 và 2 là hai

bộ tương đương nhau trong đó thời khoảng của 1 chứa thời khoảng của 2, hay

ta nói cách khác 1[T]  2[T]

Nhận xét: 1 T 2  1 = 1  2

Ví dụ 1.4 Xét quan hệ GIÁOVIÊN được cho trong bảng sau:

Bảng 1.4 Quan hệ bao theo thời gian.

Trang 13

Trong bảng 1.4, với 1[{Mã GV, Họ tên, Khoá dạy, HS lương, Thời gian}]

= (005, Phạm Khoa, KTV63, 2.30, [01/09/06, nay]) và 2[{Mã GV, Họ tên,Khoá dạy, HS lương, Thời gian}] = (005, Phạm Khoa, KTV63, 2.30,[05/09/06, 10/09/06]) Ta có thể nói rằng 1 bao 2 theo thời gian hay 1 T 2

Định nghĩa 1.4 (Phần tử theo thời gian)

Cho lược đồ quan hệ R với  là một bộ trên R Khi đó,  là một phần tửtheo thời gian của quan hệ r trên R, ký hiệu  T r, nếu ’ r sao cho ’ T 

Như vậy, một quan hệ có yếu tố thời gian có thể chứa vô số các phần tử,song quan hệ này luôn được biểu diễn bởi một quan hệ chính tắc chứa một sốhữu hạn các bộ

1.7 Các phép toán đại số trong CSDL có yếu tố thời gian

Định nghĩa 1.5 (Phép hợp nhất trên một quan hệ)

Cho r là một quan hệ trên R Khi đó, phép hợp nhất theo thời gian của mộtquan hệ, ký hiệu r, chính là phép hợp nhất giữa các bộ trong cùng một quan hệ,được xác định như sau:

r = { | 1, 2 T r: 1  2,  = 1  2}

Nhận xét: Quan hệ r có được bằng cách hợp nhất các bộ trên r tương đương

với nhau

Trang 14

Định nghĩa 1.6 (Phép hợp theo thời gian)

Cho r1 và r2 là hai quan hệ chính tắc trên R Khi đó, phép hợp theo thờigian của hai quan hệ r1 và r2 trên R, ký hiệu r1 T r2 là tập các bộ được xác địnhnhư sau:

r1 T r2 = { | ( T r1   T r2)  ( T r1   T r2)  (1 T r1, 2 T r2: 1  2,  = 1  2)}

Định nghĩa 1.7 (Phép hiệu theo thời gian)

Cho r1 và r2 là hai quan hệ chính tắc trên R Khi đó, phép hiệu theo thờigian của hai quan hệ r1 và r2 trên R, ký hiệu r1 \T r2, là tập các bộ được xác địnhnhư sau:

r1 \T r2 = { | ( T r1   T r2)  (1 T r1, 2 T r2: 1  2, [T] = 1[T] \ 2[T] )}

Ví dụ 1.5 Xét hai quan hệ GV1 và GV2 như sau:

Bảng 1.5 Hai quan hệ GV1 và GV2 có yếu tố thời gian.

002 Nguyễn Huy TINA 27 1.82 [05/10/05, 10/10/05]

Thực hiện phép hợp theo thời gian cho hai quan hệ GV1 và GV2, ta có:

Bảng 1.6 Phép hợp theo thời gian của hai quan hệ.

Trang 16

Bảng 1.7 Phép hiệu theo thời gian của hai quan hệ.

Định nghĩa 1.8 (Phép kết nối tự nhiên theo thời gian)

Cho r và s là hai quan hệ lần lượt trên R và S Khi đó, phép kết nối tựnhiên theo thời gian của hai quan hệ r và s, ký hiệu r ⋈T s, và được xác định nhưsau:

r ⋈T s = { | (1 T r : 1 = [R])  (2 T s : 2 = [S])}

Ví dụ 1.6 Xét các quan hệ GV, KD và LUONG như sau:

Bảng 1.8 Các quan hệ GV, KD, LUONG có yếu tố thời gian.

Trang 17

Thực hiện phép kết nối tự nhiên cho hai quan hệ GV và KD, ta có:

Bảng 1.9 Phép kết nối tự nhiên theo thời gian hai quan hệ GV và KD.

Thực hiện phép kết nối tự nhiên các quan hệ GV, KD và LUONG, ta có:

Bảng 1.10 Phép kết nối tự nhiên theo thời gian các quan hệ GV, KD, LUONG.

Trang 18

Định nghĩa 1.9 (Phép chiếu theo thời gian)

Cho r là một quan hệ chính tắc trên R và S  R Khi đó, phép chiếu theothời gian của r trên S, ký hiệu T

S(r) và được xác định như sau:

T S (r) = {[S] |  T r}

Ví dụ 1.7 Xét quan hệ R = (Mã GV, Họ tên, Khoá dạy, HS lương, Thời gian) và

S = (Mã GV, Họ tên, Khoá dạy), với r là một quan hệ chính tắc trên R được chotrong bảng sau:

Bảng 1.11 Quan hệ r có yếu tố thời gian.

Thực hiện phép chiếu theo thời gian cho quan hệ r trên S, ta có:

Bảng 1.12 Phép chiếu theo thời gian.

Định nghĩa 1.10 (Phép chọn theo thời gian)

Cho r là một quan hệ chính tắc trên R và P là biểu thức logic mà mỗi bộcủa quan hệ r có thể thoả hoặc không Khi đó, phép chọn theo thời gian của r đối

Trang 19

với P là tập các bộ  trên r thoả điều kiện P, ký hiệu T

P(r), được xác định nhưsau: T P(r) = { T r |  thoả điều kiện P}

Ví dụ 1.8 Xét quan hệ r được cho trong bảng 1.11, với P: “Mã GV = 002”, ta có

kết quả như sau:

Bảng 1.13 Phép chọn theo thời gian.

T

P(r):

Từ các quan hệ chính tắc, chúng tôi đã giới thiệu các phép toán đại sốtrong CSDL có yếu tố thời gian, bao gồm phép hợp theo thời gian, phép hiệutheo thời gian, phép kết nối tự nhiên theo thời gian, phép chiếu theo thời gian vàphép chọn theo thời gian

Như vậy, từ một CSDL với tập các ràng buộc theo thời gian cho trước.Các ràng buộc ở đây là tập các phụ thuộc hàm theo thời gian (TFD) mà chính nó

đã gây nên các dư thừa dữ liệu và những dị thường trong khi cập nhật và xóa dữ

Trang 20

liệu Vì vậy, một vấn đề được đặt ra là: làm thế nào để ta có thể xây dựng đượccác lược đồ mong muốn, khắc phục được những hạn chế kể trên Vấn đề này sẽđược chúng tôi trình bày trong chương tiếp theo.

Trang 21

CHƯƠNG 2 CHUẨN HÓA CƠ SỞ DỮ LIỆU QUAN HỆ THEO THỜI GIAN

2.1 Giới thiệu

Việc thiết kế CSDL luôn là vấn đề được nhiều người quan tâm nghiêncứu Vấn đề này được đặt ra như sau: từ một CSDL cho trước với tập các ràngbuộc trên đó, làm thế nào để đưa ra được một cấu trúc phù hợp với những dữ liệuđó

Cũng như CSDL truyền thống, việc thiết kế CSDL có yếu tố thời giancũng được thực hiện từ một CSDL có yếu tố thời gian với tập các ràng buộc chotrước

Xét quan hệ KHOÁHỌC = (Mã KH, Số ĐVHT, Họ tên GVGD, HSLương, Số HV, Ngày) được cho ở bảng sau:

Bảng 2.1 Quan hệ KHOÁHỌC.

KHOÁHỌC:

Trong đó: Mã KH là mã của mỗi khóa học, Số ĐVHT là số đơn vị học trình của mỗi khóa học, Họ tên GVGD là họ và tên của giáo viên tham gia giảng dạy vào thời điểm đó, HS Lương là hệ số lương của giáo viên tại thời điểm đó, Số HV là

số học viên tham gia học trong ngày đó Quan hệ này nhằm lưu trữ thông tin về

mỗi khóa học tại các Ngày khác nhau.

Trang 22

Giả sử quan hệ KHOÁHỌC có các ràng buộc sau:

1 Các thuộc tính Mã KH và Ngày tạo thành khóa.

2 Phụ thuộc hàm (FD) Mã KH  Số ĐVHT phải được thoả mãn

3 HS Lương của giáo viên giảng dạy không được thay đổi trong mộttháng

4 Giáo viên giảng dạy cho một khóa học không được thay đổi trongmột tuần

Rõ ràng, các ràng buộc (3) và (4) không thể được biểu diễn như các phụthuộc hàm truyền thống

Vậy, một số câu hỏi có thể được đặt ra cho CSDL có yếu tố thời gian nhưsau:

 Thế nào là một kiểu thời gian? Thế nào là một môđun thời gian?

 Làm thế nào để có thể biểu diễn được các ràng buộc theo thời gianbằng các phụ thuộc hàm theo thời gian (TFD)?

 Từ tập các TFD cho trước, làm thế nào để có thể nhận biết được cácTFD hệ quả?

Với CSDL có yếu tố thời gian, có nhiều TFD được suy ra từ tập hữu hạncác TFD cho trước Để giải quyết vấn đề này, chúng ta phải tìm hiểu khái niệmbao đóng hữu hạn cho các TFD, từ đó phát triển hệ tiên đề đúng đắn và đầy đủ

Trang 23

dẫn đến các mâu thuẫn trong cập nhật và những dị thường trong việc chèn vàxóa.

Trong quá trình cập nhật dữ liệu, nếu ta chỉ cập nhật hệ số lương cho giáoviên giảng dạy trong một bộ mà không cập nhật cho các bộ khác trong cùng mộttháng thì sẽ gây nên mâu thuẫn

Trong quá trình chèn và xóa bộ, nếu chưa có buổi học nào được diễn ra thì

ta không thể ghi nhận giáo viên giảng dạy cho một khóa học, và nếu ta xóa tất cảcác bộ của một khóa học nào đó thì thông tin về họ tên và lương của giáo viêntham gia giảng dạy khóa học đó sẽ bị mất

Việc thiết kế CSDL có yếu tố thời gian phải hướng đến mục đích là tránhđược dư thừa dữ liệu và những dị thường của việc chèn và xóa Vì vậy, để thuđược các lược đồ mong muốn nhằm khắc phục được những hạn chế kể trên,trong lý thuyết chuẩn hóa theo thời gian do Wang [12] đề xuất đã giải quyếtđược vấn đề này

Ngoài việc sử dụng lý thuyết chuẩn hóa, lý thuyết phân tách cũng giúpngười thiết kế tạo ra các lược đồ mong muốn

Chẳng hạn, xét quan hệ KHOÁHỌC với các ràng buộc:

1 Số ĐVHT của mỗi khóa học mãi mãi không thay đổi

2 Số HV trong một khóa học không thay đổi trong 1 ngày

3 Họ tên GVGD cho mỗi khóa học không được thay đổi trong 1 tuần

4 HS Lương của GVGD không được thay đổi trong 1 tháng

Từ các ràng buộc đó, để tránh dư thừa dữ liệu ta có thể tách quan hệKHOÁHỌC thành các quan hệ KH1, KH2, KH3, KH4 như sau:

Bảng 2.2 Một phân tách tự nhiên của quan hệ KHOÁHỌC.

KH2:

Trang 24

TINA27 Lê Hoàng Tuần từ 28/2/05 TINA27 45 8/3/05

TINA27 Nguyễn Huy Tuần từ 2/10/05 TINA27 50 7/10/05TINA27 Nguyễn Huy Tuần từ 16/10/05 TINA27 45 17/10/05Trong đó:

KH1: lưu thông tin về số đơn vị học trình của mỗi khóa học KH2:lưu diễnbiến về lương của các giáo viên giảng dạy theo từng tháng KH3:lưu việc phâncông giảng dạy của các giáo viên cho mỗi khóa học theo từng tuần KH4: lưu sốhọc viên trong một buổi học

Với mục đích kể trên, trong chương này trình bày lý thuyết chuẩn hóaCSDL quan hệ theo thời gian thông qua các mục như sau: mục 2.1 là phần giớithiệu, mục 2.2 trình bày về kiểu thời gian và môđun thời gian, một cơ sở lýthuyết của TFD được trình bày trong mục 3.3 với các khái niệm như TFD, hệtiên đề cho các TFD, bao đóng của tập TFD, bao đóng của tập thuộc tính và vấn

đề về phủ tối thiểu TFD; mục 2.4 trình bày lý thuyết chuẩn hóa CSDL quan hệtheo thời gian, mục 2.5 trình bày một số kết quả được đưa ra phản ánh mối quan

hệ giữa TFD và FD truyền thống, sau cùng là những kết luận của chương, phầnnày được trình bày trong mục 2.6

Trang 25

2.2 Kiểu thời gian và môđun thời gian

2.2.1 Kiểu thời gian

Định nghĩa 2.1 (Kiểu thời gian)

Với là tập các số thực (tập thời gian tuyệt đối) và * là tập các số nguyêndương (các thời điểm) Khi đó, một kiểu thời gian được ký hiệu bởi t là một ánh

xạ được xác định như sau:

t: *  ( )

sao cho với i, j  * và i < j, các điều kiện sau phải được thoả mãn:

1 t(i)   và t(j)   suy ra mỗi số thực trong t(i) phải bé hơn mọi số thực trong t(j).

2 Nếu t(i) =  suy ra t(j) =  Tức là, nếu giá trị của ánh xạ tại một thời

điểm là một tập rỗng thì giá trị của thời điểm tiếp theo cũng là một tậprỗng

Ví dụ 2.1 Chẳng hạn, nếu ta xem mốc thời gian bắt đầu từ ngày 1/1/2005 thì:

t = “Ngày”: là một ánh xạ từ *  sao cho:

t(1) = t(1/1/2005) = [0, 1) t(2) = t(2/1/2005) = [1, 2)

t(7) = t(7/1/2005) = [6, 7)

t(32) = t(1/2/2005) = [31, 32) t’ = “Tháng”: là một ánh xạ từ *  sao cho:

t’(1) = t’(Tháng 1/2005) = [0, 31) t’(2) = t’(Tháng 2/2005) = [31, 59)

Trang 26

Định nghĩa 2.2 (Kiểu con của một kiểu thời gian)

Cho hai kiểu thời gian t và t’ Ta nói rằng t’ là một kiểu con của kiểu thời gian t nếu với i  *, j  * sao cho t’(i) = t(j)

Ví dụ 2.2 Cho hai kiểu thời gian Thứ hai và Ngày Khi đó, Thứ hai là một kiểu

con của kiểu Ngày.

Định nghĩa 2.3 (Một phân hoạch của kiểu thời gian)

Ta nói rằng một tập các kiểu {t 1 , , t n } là một phân hoạch của kiểu t nếu:

1 Mỗi t i,(1  i  n) là một kiểu con của kiểu t, và

2 Với l  * , j  * sao cho t(l) = t k (j), với k nào đó và 1  k  n

3 Với j, r  * và i  k: t k (j)  t i (r)

Ví dụ 2.3 Tập các kiểu {Thứ hai, , Chủ nhật} là một phân hoạch của kiểu

Ngày.

Định nghĩa 2.4 (Hợp của hai kiểu thời gian con)

Cho t 1 và t 2 là hai kiểu thời gian con của kiểu thời gian t Khi đó, hợp của chúng t 1  t 2 là một kiểu sao cho:

+ i, (t 1  t 2 )(i) = t 1 (j 1 ) hoặc (t 1  t 2 )(i) = t 2 (j 2 ), với j 1 , j 2 là hai thời điểm

nào đó của t 1 và t 2

+ j 1 , j 2 : t 1 (j 1 ) = (t 1  t 2 )(i 1 ), và t 2 (j 2 ) = (t 1  t 2 )(i 2 ) với i 1 , i 2 là hai thời điểm

nào đó của (t 1  t 2)

Ví dụ 2.4 Cho hai kiểu thời gian Thứ bảy và Chủ nhật Khi đó Thứ bảy  Chủ

nhật là một kiểu Ngày nghỉ và là một kiểu con của kiểu Ngày.

2.2.2 Mối quan hệ trên các kiểu thời gian

Định nghĩa 2.5 (Quan hệ bé hơn)

Trang 27

Cho t 1 , t 2 là các kiểu thời gian Khi đó, t 1 được gọi là bé hơn t 2, ký hiệu

t 1 ≼ t2 nếu với i *, j * sao cho t 1 (i)  t 2 (j), tức là thời điểm j của t 2 chứa

thời điểm i của t 1

Ví dụ 2.5 Với Ngày và Tuần là hai kiểu thời gian thì Ngày ≼ Tuần.

Định nghĩa 2.6 (Quan hệ bé hơn thực sự)

Cho t 1 , t 2 là các kiểu thời gian Khi đó, t 1 được gọi là bé hơn t 2 thực sự, ký hiệu t 1 ≺ t2 nếu: t 1 ≼ t 2 và t 1  t 2

Ví dụ 2.6 Cho hai kiểu thời gian Ngày và Tháng Khi đó, Ngày ≺ Tháng.

Nhận xét:

+ Nếu t1 ≼ t2 và t2 ≼ t1 thì t 1 = t 2

+ Luôn tồn tại một cận trên bé nhất, ký hiệu t Top và cận dưới lớn nhất, ký

hiệu t Bottom cho tập tất cả các kiểu thời gian Trong đó:

t Top (1) = , t Top (i) = , i>1 và t Bottom (i) = , với i  *.+ Mỗi cặp t1, t2 luôn tồn tại một cận trên bé nhất lub(t 1 , t 2 ) và một cận dưới lớn nhất glb(t 1 , t 2 ) đối với quan hệ ≼.

Ví dụ 2.7 lub(Tháng, Tuần) = tTop, glb(Tháng, Tuần) = Ngày

lub(Tuần, Ngày) = Tuần, glb(Tuần, Ngày) = Ngày

Định nghĩa 2.7 (Quan hệ bé hơn toàn bộ)

Kiểu thời gian t’được gọi là bé hơn toàn bộ tập các kiểu thời gian {t 1 ,t 2 , t n }, ký hiệu t’ ≼ C {t 1 , t 2 , , t n }, nếu:

với i  * , k: 1  k  n và j sao cho t’(i)  t k (j)

Nhận xét: t ≼ t 1 suy ra t ≼C{t 1 , t 2 } với t 2 tùy ý

Trang 28

Ví dụ 2.8 Cho Y1 là kiểu thời gian tương ứng với những năm trước năm 2006,

Y2 là kiểu thời gian tương ứng với những năm sau năm 2006, Year là kiểu thờigian tương ứng với hợp của Y1 và Y2 Khi đó, Year ≼C{Y1, Y2}

2.2.3 Môđun thời gian

Định nghĩa 2.8 (Lược đồ môđun thời gian)

Một lược đồ môđun thời gian là một cặp (R, t) với R là một lược đồ quan

hệ và t là một kiểu thời gian.

Định nghĩa 2.9 (Môđun thời gian)

Một môđun thời gian là một bộ ba (R, t, ) trong đó (R, t) là một lược đồ môđun thời gian và  là một hàm được gọi là hàm cửa sổ thời gian từ N* (các sốnguyên dương biểu diễn các thời điểm) đến 2Tup(R)(biểu diễn tập tất cả các tập

con của tập các bộ dữ liệu trên R) sao cho với mỗi i 1, thì (i) =  nếu t(i) =

 Điều này có nghĩa là: hàm  trong môđun thời gian (R, t, ) là tập các bộ

được lưu giữ tại thời điểm i nào đó trong kiểu thời gian t

Ví dụ 2.9 Xét quan hệ KHOÁHỌC được cho trong bảng 2.1, ta có:

+ Lược đồ môđun thời gian (KHOÁHỌC, Ngày), trong đó:

KHOÁHỌC = (Mã KH, Số ĐVHT, Họ tên GVGD, HS Lương, Số HV)

+ Môđun thời gian là (KHOÁHỌC, Ngày,  ), với:

(3/3/05) = {(TINA27, 3, Lê Hoàng, 1.82, 50)}

(8/3/05) = {(TINA27, 3, Lê Hoàng, 1.82, 45)}

(5/4/05) = {(TINA27, 3, Lê Hoàng, 2.06, 50)}

(3/10/05) = {(TINA27, 3, Nguyễn Huy, 1.82, 50)}

(7/10/05) = {(TINA27, 3, Nguyễn Huy, 1.82, 50)}

(17/10/05) = {(TINA27, 3, Nguyễn Huy, 1.82, 45)}

Trang 29

Quy ước:

+ Các môđun thời gian cũng có thể được ký hiệu bằng M

+ Với mỗi môđun thời gian, ta có thể ký hiệu M là tập tất cả các bộ trênmôđun thời gian M, nghĩa là:

M = {T | i  *: T (i) }

2.2.4 Các phép toán trên môđun thời gian

Định nghĩa 2.10 (Phép nối tự nhiên hai môđun thời gian)

Cho M1 = (R1, t, 1) và M2 = (R2, t, 2) là hai môđun cùng kiểu thời gian t.

Khi đó, phép nối tự nhiên hai môđun M1 và M2, ký hiệu M1 ⋈T M2 là một môđunthời gian M được xác định như sau:

+ 2(3/3/05) = {(TINA27, Lê Hoàng, 1.82)}

2(8/3/05) = {(TINA27, Lê Hoàng, 1.82)}

2(5/4/05) = {(TINA27, Lê Hoàng, 2.06)}

Khi đó:

Trang 30

M1 ⋈T M2 = (KH, Ngày, ), với:

KH = (Mã KH, Số ĐVHT, Số HV, Họ tên GVGD, HS Lương)

(3/3/05) = {(TINA27, 3, 50, Lê Hoàng, 1.82)}

(8/3/05) = {(TINA27, 3, 45, Lê Hoàng, 1.82)}

(5/4/05) = {(TINA27, 3, 50, Lê Hoàng, 2.06)}

Định nghĩa 2.11 (Phép chiếu M lên một lược đồ môđun thời gian)

Cho M = (R, t, ) và R1  R Khi đó, phép chiếu của M trên R1, ký hiệu là

T R1 (M) là một môđun thời gian M’ được xác định như sau:

M’ = (R1, t, 1)

Trong đó: với mỗi i  0, 1(i) = R 1((i)),

và  là phép chiếu truyền thống

Ví dụ 2.11 Cho M = (KHOÁHỌC, Ngày, ), với:

+ KHOÁHỌC = (Mã KH, Số ĐVHT, Họ tên GVGD, HS Lương, Số HV)+ (3/3/05) = {(TINA27, 3, Lê Hoàng, 1.82, 50)}

(8/3/05) = {(TINA27, 3, Lê Hoàng, 1.82, 45)}

(5/4/05) = {(TINA27, 3, Lê Hoàng, 2.06, 50)}

(3/10/05) = {(TINA 27, 3, Nguyễn Huy, 1.82, 50)}

(7/10/05) = {(TINA27, 3, Nguyễn Huy, 1.82, 50)}

(17/10/05) = {(TINA27, 3, Nguyễn Huy, 1.82, 45)}

Cho KH  KHOÁHỌC, với KH = (Mã KH, Họ tên GVGD, HS Lương)Khi đó: T KH (M) = (KH, Ngày, 1), với:

+ KH = (Mã KH, Họ tên GVGD, Lương)

+ (3/3/05) = {(TINA27, Lê Hoàng, 1.82)}

(8/3/05) = {(TINA27, Lê Hoàng, 1.82)}

Trang 31

(5/4/05) = {(TINA27, Lê Hoàng, 2.06)}

(3/10/05) = {(TINA27, Nguyễn Huy, 1.82)}

(7/10/05) = {(TINA27, Nguyễn Huy, 1.82)}

(17/10/05) = {(TINA27, Nguyễn Huy, 1.82)}

Định nghĩa 2.12 (Phép hợp các môđun thời gian)

Cho Mj =(R, t, j) với j = 1 ,n là các môđun thời gian trên lược đồ môđun

thời gian (R, t) Khi đó, hợp của các môđun thời gian M1 T M2 T , , T Mn làmột môđun M được xác định bởi:

M = (R, t, )

Trong đó, với i  1: (i) = 

n j

j i

1 ) (

Ví dụ 2.12 Cho M1 = (KHOÁHỌC, Ngày, 1), với:

+ KHOÁHỌC = (Mã KH, Số ĐVHT, Họ tên GVGD, HS Lương, Số HV)+ 1(3/3/05) = {(TINA27, 3, Lê Hoàng, 1.82, 50)}

1(8/3/05) = {(TINA27, 3, Lê Hoàng, 1.82, 45)}

Cho M2 = (KHOÁHỌC, Ngày, 2), với:

+ 2(5/4/05) = {(TINA27, 3, Lê Hoàng, 2.06, 50)}

Khi dó: M1 T M2 = (KHOÁHỌC, Ngày, )

Với (3/3/05) = {(TINA27, 3, Lê Hoàng, 1.82, 50)}

(8/3/05) = {(TINA27, 3, Lê Hoàng, 1.82, 45)}

(5/4/05) = {(TINA27, 3, Lê Hoàng, 2.06, 50)}

Định nghĩa 2.13 (Phép ánh xạ một kiểu thời gian đến một kiểu thời gian bé hơn

trên một môđun thời gian)

Trang 32

Cho M = (R, t, ) và một kiểu thời gian t’ Khi đó, phép ánh xạ một kiểu thời gian t đến một kiểu thời gian bé hơn t’ trên Msao cho mỗi bộ hợp lệ tại thời

điểm i của t cũng hợp lệ tại thời điểm j của t’ thoả t’(j)  t(i), ký hiệu là

Down(M, t’) và được xác định bởi:

Down(M, t’) = (R, t’, ’)

Trong đó, với i  1:

nếu t’(i) = 

’(i) =  nếu j sao cho t’(i)  t(j)

(j) nếu ngược lại: t’(i)  t(j)

Ví dụ 2.13 Cho M = (KH, Tháng, )

Với KH = (Mã KH, Họ tên GVGD, HS Lương)

(3/05) = {(TINA27, Lê Hoàng, 1.82)}

(4/05) = {(TINA27, Lê Hoàng, 2.06)}

(10/05) = {(TINA27, Nguyễn Huy, 1.82)}

Khi đó, Down(KH, Ngày) = (KH, Ngày, ’)

’(8/3/05) = {(TINA27, Lê Hoàng, 1.82)}

’(5/4/05) = {(TINA27, Lê Hoàng, 2.06)}

’(3/10/05) = {(TINA27, Nguyễn Huy, 1.82)}

’(17/10/05) = {(TINA27, Nguyễn Huy, 1.82)}

Định nghĩa 2.14 (Phép ánh xạ một kiểu thời gian đến một kiểu thời gian lớn

hơn trên một môđun thời gian)

Cho M = (R, t, ) và một kiểu thời gian t’ Khi đó, phép ánh xạ một kiểu thời gian t đến một kiểu thời gian lớn hơn t’trên M sao cho mỗi bộ hợp lệ tại thời

Trang 33

điểm i của t cũng hợp lệ tại thời điểm j của t’ thoả t(i)  t’(j), ký hiệu là Up(M,

t’) và được xác định bởi:

Up(M, t’) = (R, t’, ’)

Trong đó, với i  1: 

) ( ' ) ( :

) (

i t j t

Với KH = (Mã KH, Họ tên GVGD, HS Lương)

(8/3/05) = {(TINA27, Lê Hoàng, 1.82)}

(8/3/05) = {(VB36, Trần Lê, 2.06)}

(5/4/05) = {(TINA27, Lê Hoàng, 2.06)}

(3/10/05) = {(TINA27, Nguyễn Huy, 1.82)}

(17/10/05) = {(TINA27, Nguyễn Huy, 1.82)}

Khi đó, Up(KH, Tháng) = (KH, Tháng, ’)

’(3/05) = {(TINA27, Lê Hoàng, 1.82)}

’(3/05) = {(VB36, Trần Lê, 2.06)}

’(4/05) = {(TINA27, Lê Hoàng, 2.06)}

’(10/05) = {(TINA27, Nguyễn Huy, 1.82)}

2.3 Cơ sở lý thuyết của phụ thuộc hàm theo thời gian

2.3.1 Phụ thuộc hàm theo thời gian (TFD)

Thông thường, CSDL truyền thống sử dụng các thông tin “tĩnh”, thông tinđược cất giữ trong CSDL chỉ mang tính chất “hiện thời” Cho lược đồ quan hệ

’(i) =

Trang 34

R = (A1,…., An), và X, Y là các tập con của {A1,…., An} Cho r là một quan hệtrên R.

Theo lý thuyết phụ thuộc hàm truyền thống, r được gọi là thoả X xác định

Y, ký hiệu X  Y, nếu với  1, 2  r :

1[X] = 2[X]  1[Y] = 2[Y]

Trong CSDL có yếu tố thời gian, các thông tin được cất giữ mang tínhchất “động”, được thay đổi theo thời gian Vì vậy, ta cần có định nghĩa về TFDnhư sau:

Định nghĩa 2.15 (Phụ thuộc hàm theo thời gian)

Cho môđun thời gian M = (R, t, ) và t’ là một kiểu thời gian Cho

X, Y  R Khi đó, môđun thời gian M được gọi là thoả TFD X t’Y nếu với 1,

đó hiển nhiên 1[Y] = 2[Y]

Ví dụ 2.15 Xét môđun thời gian M = (KHOÁHỌC, ngày,  ), với:

KHOÁHỌC = (Mã KH, Số ĐVHT, Họ tên GVGD, HS Lương, Số HV)

Trang 35

(3/3/05) = {(TINA27, 3, Lê Hoàng, 1.82, 50)}

(8/3/05) = {(TINA27, 3, Lê Hoàng, 1.82, 45)}

(5/4/05) = {(TINA27, 3, Lê Hoàng, 2.06, 50)}

(3/10/05) = {(TINA27, 3, Nguyễn Huy, 1.82, 50)}

(7/10/05) = {(TINA27, 3, Nguyễn Huy, 1.82, 50)}

(17/10/05) = {(TINA27, 3, Nguyễn Huy, 1.82, 45)}

Rõ ràng, M thoả TFD:

Mã KH Ngày Số HVTuy nhiên, M cũng có thể thoả TFD được xác định dưới một kiểu thờigian khác Chẳng hạn, M cho trong ví dụ 2.15 cũng thoả TFD:

Mã KH Tuần Họ tên GVGD

Và M cho trong ví dụ 2.15 không thoả TFD:

Mã KH Tháng Số HVVậy, với M và tập các TFD cho trước, làm thế nào để ta có thể nhận biếtđược các TFD hệ quả được suy ra từ tập các TFD cho trước đó mà M cũng thoảcác TFD hệ quả Vấn đề này có thể được giải quyết trong mục sau

2.3.2 Hệ tiên đề cho các TFD

Trong ví dụ 2.15, rõ ràng M thoả TFD:

Mã KH Tuần Họ tên GVGDXét về mặt ngữ nghĩa, điều này có nghĩa là trong một tuần không thể có

hai Họ tên GVGD khác nhau cho một khóa học Do đó, trong một ngày không thể có hai Họ tên GVGD khác nhau cho một khóa học, điều này có nghĩa là:

Mã KH Ngày Họ tên GVGDVậy, M được cho trong ví dụ 2.15 cũng thoả TFD:

Trang 36

Mã KH Ngày Họ tên GVGDĐiều này có được bằng luật suy dẫn sau:

Nếu X t Y và t’ ≼ t thì X  t’Y

2.3.2.1 Hệ bốn tiên đề cho các TFD

Cho mô đun thời gian M = (R, t, ), tập các phụ thuộc hàm theo thời gian

F và X, Y, Z  R Khi đó, hệ 4 tiên đề cho các TFD được phát biểu như sau:

T1 (Luật phản xạ): Nếu Y  X thì X t Y, với t.

T2 (Luật tăng trưởng): Nếu X t Y thì XZ tYZ

T3 (Luật bắc cầu): Nếu X t Y và Y t Z thì X t Z

T4 (Luật thừa kế): Nếu X t1Y, , X t n Y với n 1, thì X t Y

với t ≼C{t1, , tn}.Như vậy, nếu M thoả X t Y và với t’ ≼ t thì M thoả X  t’Y (theo T4)

Định nghĩa 2.16 (TFD suy dẫn từ F)

Cho M = (R, t, ) là một môđun thời gian, F là tập các TFD và X, Y  R.

Khi đó, một TFD X t Y được gọi là suy dẫn từ F, ký hiệu F⊦ X  t Y, nếu tồn

tại dãy hữu hạn các chứng minh f 1 , , f k sao cho:

i f k là X t Y

ii Mỗi f i là một TFD thuộc F hoặc là một TFD thu được bằng cách sử

dụng hệ 4 tiên đề trên đối với các TFD f 1 , , f i-1

Định nghĩa 2.17 (TFD suy dẫn logic từ F)

Trang 37

Cho M = (R, t, ) là một môđun thời gian, F là tập các TFD và X, Y  R.

Khi đó, một TFD X t Y được gọi là suy dẫn logic từ F, ký hiệu F╞ X  tY, nếumọi M thoả mỗi TFD trong F thì M cũng thoả X t Y

Bổ đề 2.1 (Tính đúng đắn của hệ tiên đề cho các TFD)

Hệ 4 tiên đề cho các TFD là đúng đắn

2.3.2.2 Các luật được suy ra từ hệ tiên đề cho các TFD

T5 (Luật bắc cầu mở rộng): Nếu X t1Y và Y  t2 Z thì X glb(t1, t2 ) ZT6 (Luật hợp): Nếu X t1Y và X  t2 Z thì X glb(t1, t2 )YZ

Chứng minh.

+ Vì glb(t 1 , t 2 ) ≼ t 1 và glb(t 1 , t 2 ) ≼ t 2 nên ta có

X glb(t1, t2 )Y và Y glb(t1, t2 )ZTheo luật T3, ta có X glb(t1, t2)Z Vậy T5 được chứng minh

đó, do đó sẽ có vô số TFD được tạo ra dưới dạng các kiểu thời gian bé hơn này

Ví dụ 2.16 Xét TFD:

Trang 38

Mã KH Tuần Họ tên GVGD

Với Tuần i là kiểu thời gian chỉ chứa tuần thứ i Rõ ràng, Tuần i ≼ Tuần, do

đó Tuần i ≼C{Tuần}, i  1 Do đó, với T4 ta có:

Mã KH Tuần i Họ tên GVGD, i  1

Rõ ràng, ta có thể tạo ra vô số các TFD hệ quả từ một TFD cho trước, vấn

đề được đặt ra như sau: Có thể có tập các phụ thuộc hàm theo thời gian F’ mà mọi TFD được suy dẫn logic từ F có thể được suy dẫn từ F’ chỉ bằng cách áp dụng T4 mà thôi hay không? Có thể tìm tập F’ một cách hiệu quả hay không?

Vấn đề này sẽ được giải quyết bởi hệ ba tiên đề hệ quả hữu hạn được trình bàydưới đây

2.3.2.3 Hệ ba tiên đề hệ quả hữu hạn cho các TFD

Cho mô đun thời gian M = (R, t, ), tập các phụ thuộc hàm theo thời gian

F và X, Y, Z  R Khi đó, hệ ba tiên đề cho các TFD được phát biểu như sau:

T7 (Luật phản xạ giới hạn): Nếu Y  X thì X t Top Y

T8 (Luật tăng trưởng): Nếu X tY thì XZ t YZ

T9 (Luật bắc cầu mở rộng): Nếu X t1Y và Y t2 Z thì X glb(t1, t2 )Z

Nhận xét:

- Nếu X tY được suy dẫn từ F bằng cách sử dụng hệ ba tiên đề hệ quảhữu hạn trên thì ta nói rằng F suy dẫn hữu hạn X tY, ký hiệu F├ f X tY

- Nếu F├ f X t Y thì t là cận dưới lớn nhất (glb) của một số các kiểu thời

gian nào đó trong F

2.3.3 Bao đóng của tập phụ thuộc hàm theo thời gian

Định nghĩa 2.18 (Bao đóng hữu hạn của tập các TFD)

Trang 39

Cho F là tập các TFD Khi đó, bao đóng hữu hạn của F, ký hiệu F+, là tậptất cả các TFD có thể suy dẫn được từ F bằng cách sử dụng hệ ba tiên đề hệ quảhữu hạn Nghĩa là:

Định lý 2.1 (Tính chất của hệ ba tiên đề hệ quả hữu hạn cho các TFD)

Hệ ba tiên đề hệ quả hữu hạn cho các TFD là đúng đắn và đầy đủ

thuộc hàm truyền thống có liên quan đến yếu tố thời gian trong tập R, ký

hiệu: R(F) và được xác định như sau:

Trang 40

Bổ đề 2.2 (Mối quan hệ giữa FD và TFD)

Cho tập phụ thuộc hàm theo thời gian F và X tY là một TFD sao choF╞ X t Y Khi đó, với i sao cho t(i)   ta có  t(i)(F)╞ X  Y

Nhận xét:

+ Gọi G là tập các TFD Khi đó, G được gọi là một hỗ trợ cho X  Y nếu

 (G)╞ X Y Hỗ trợ đó là cực tiểu nếu không có tập con nào của G là một hỗtrợ cho X Y

+ Với tập các phụ thuộc hàm theo thời gian G, glb(G) được định nghĩa là kiểu thời gian glb({t | V  tW  G})

Cho tập phụ thuộc hàm theo thời gian F

a) Nếu F1  F là một hỗ trợ cực tiểu cho FD X Y, thì F├f X glb(F1 )Y.b) Nếu Fi là tất cả các hỗ trợ cực tiểu cho X Y, Fi  F, (i = 1 ,m), vàF╞ X tY thì:

Ngày đăng: 21/10/2014, 03:14

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
2. Nguyễn Đình Thuân (2004), Khai thác các luật kết hợp trong cơ sở dữ liệu có yếu tố thời gian, Luận án Tiến sĩ Toán học, Trường Đại học Thủy sản Nha Trang, Nha Trang.Tiếng Anh Sách, tạp chí
Tiêu đề: Khai thác các luật kết hợp trong cơ sở dữ liệu có yếu tố thời gian
Tác giả: Nguyễn Đình Thuân
Năm: 2004
3. Jan Chornicki, David Toman (2004), Time in Database System, Department of Computer Science, University at Buffalo, USA and University of Waterloo, Canada Sách, tạp chí
Tiêu đề: Time in Database System
Tác giả: Jan Chornicki, David Toman
Năm: 2004
4. Carlo Combi, Massimo Franceschet, Adriano Peron (2004), Representing and Reasoning about Temporal Granularities, Italy Sách, tạp chí
Tiêu đề: Representing and Reasoning about Temporal Granularities
Tác giả: Carlo Combi, Massimo Franceschet, Adriano Peron
Năm: 2004
5. Virginie Detienne, Jean Luc-Hainaut (2001), CASE Tool Support for Tempotal Database Design, University of Namurrue Grandgagnage Sách, tạp chí
Tiêu đề: CASE Tool Support for Tempotal Database Design
Tác giả: Virginie Detienne, Jean Luc-Hainaut
Năm: 2001
6. D. Dey, T. M. Baron (1996), Complete Temporal Relational Algebra, The VLDB Journal Sách, tạp chí
Tiêu đề: Complete Temporal Relational Algebra
Tác giả: D. Dey, T. M. Baron
Năm: 1996
7. Ramez Elmasri, Shamkant B. Navathe (2000), Fundamentals of Database System, International Edition Sách, tạp chí
Tiêu đề: Fundamentals of Database System
Tác giả: Ramez Elmasri, Shamkant B. Navathe
Năm: 2000
8. Christian S. Jensen. Richard T. Snodgrass (1994), Extending existing depedency theory to temporal database, Senior Member, IEEE Sách, tạp chí
Tiêu đề: Extending existing depedency theory to temporal database
Tác giả: Christian S. Jensen. Richard T. Snodgrass
Năm: 1994
9. Christian S. Jensen. Richard T. Snodgrass (1996), Semantics of Time Varying Information, Senior Member, IEEE Sách, tạp chí
Tiêu đề: Semantics of Time Varying Information
Tác giả: Christian S. Jensen. Richard T. Snodgrass
Năm: 1996
10.Christian S. Jensen. Richard T. Snodgrass (2001), Temporal Data Management, Senior Member, IEEE Sách, tạp chí
Tiêu đề: Temporal Data Management
Tác giả: Christian S. Jensen. Richard T. Snodgrass
Năm: 2001
11.Christian S. Jensen (2001), Introduction to Temporal Database Research, Senior Member, IEEE Sách, tạp chí
Tiêu đề: Introduction to Temporal Database Research
Tác giả: Christian S. Jensen
Năm: 2001
12. X. Sean Wang, Alexander Brodsky, Sushil Jajodia and Claudio Bettini (1997), Logical Design for Temporal Databases with Multiple Granularities, George Mason University, Fairfax, VA and University of Milan, Milan, Italy Sách, tạp chí
Tiêu đề: Logical Design for Temporal Databases with Multiple Granularities
Tác giả: X. Sean Wang, Alexander Brodsky, Sushil Jajodia and Claudio Bettini
Năm: 1997
13. J. Wijsen, J. Vandenbulcke, H. Olive (1993), Functional Dependencies Generalised for Temporal Databases that Include Object – Identity, Proc. Int’l Conf. Entity – Rlationship Approach Sách, tạp chí
Tiêu đề: Functional Dependencies Generalised for Temporal Databases that Include Object – Identity
Tác giả: J. Wijsen, J. Vandenbulcke, H. Olive
Năm: 1993
14. Jef Wijsen (1995), Design of temporal relation databases based on dynamic and temporal funtion dependencies, In proceedings of the Internatial Workshop on Temporal Databases Sách, tạp chí
Tiêu đề: Design of temporal relation databases based on dynamic and temporal funtion dependencies
Tác giả: Jef Wijsen
Năm: 1995
15. Jef Wijsen (1999), Temporal FDs on Complex Objects, Vrije University Brussel Sách, tạp chí
Tiêu đề: Temporal FDs on Complex Objects
Tác giả: Jef Wijsen
Năm: 1999

HÌNH ẢNH LIÊN QUAN

Bảng 1.5. Hai quan hệ GV1 và GV2 có yếu tố thời gian. - nghiên cứu các phụ thuộc hàm theo thời gian, thông qua hai quan điểm của wang và wijsen
Bảng 1.5. Hai quan hệ GV1 và GV2 có yếu tố thời gian (Trang 14)
Bảng 1.7. Phép hiệu theo thời gian của hai quan hệ. - nghiên cứu các phụ thuộc hàm theo thời gian, thông qua hai quan điểm của wang và wijsen
Bảng 1.7. Phép hiệu theo thời gian của hai quan hệ (Trang 16)
Bảng 1.9. Phép kết nối tự nhiên theo thời gian hai quan hệ GV và KD. - nghiên cứu các phụ thuộc hàm theo thời gian, thông qua hai quan điểm của wang và wijsen
Bảng 1.9. Phép kết nối tự nhiên theo thời gian hai quan hệ GV và KD (Trang 17)
Bảng 1.10. Phép kết nối tự nhiên theo thời gian các quan hệ GV, KD, LUONG. - nghiên cứu các phụ thuộc hàm theo thời gian, thông qua hai quan điểm của wang và wijsen
Bảng 1.10. Phép kết nối tự nhiên theo thời gian các quan hệ GV, KD, LUONG (Trang 17)
Bảng 3.1. Quan hệ GV được nhóm theo thời gian. - nghiên cứu các phụ thuộc hàm theo thời gian, thông qua hai quan điểm của wang và wijsen
Bảng 3.1. Quan hệ GV được nhóm theo thời gian (Trang 77)
Bảng 3.3 Các quan hệ được nhóm theo thời gian với các OID. - nghiên cứu các phụ thuộc hàm theo thời gian, thông qua hai quan điểm của wang và wijsen
Bảng 3.3 Các quan hệ được nhóm theo thời gian với các OID (Trang 79)
Bảng 3.4. Các quan hệ không được nhóm theo thời gian với các OID. - nghiên cứu các phụ thuộc hàm theo thời gian, thông qua hai quan điểm của wang và wijsen
Bảng 3.4. Các quan hệ không được nhóm theo thời gian với các OID (Trang 81)
Hình 3.1. Lược đồ thực thể quan hệ MD. - nghiên cứu các phụ thuộc hàm theo thời gian, thông qua hai quan điểm của wang và wijsen
Hình 3.1. Lược đồ thực thể quan hệ MD (Trang 86)

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w