1. Trang chủ
  2. » Luận Văn - Báo Cáo

Phép dịch chuyển lược đồ khối trong mô hình dữ liệu dạng khối

77 7 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 77
Dung lượng 1,38 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG NGÔ VĂN ĐỊNH PHÉP DỊCH CHUYỂN LƯỢC ĐỒ KHỐI TRONG

Trang 1

Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn

ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG

NGÔ VĂN ĐỊNH

PHÉP DỊCH CHUYỂN LƯỢC ĐỒ KHỐI

TRONG MÔ HÌNH DỮ LIỆU DẠNG KHỐI

LUẬN VĂN THẠC SỸ KHOA HỌC MÁY TÍNH

Thái Nguyên - 2015

Trang 2

Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn

ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG

NGÔ VĂN ĐỊNH

PHÉP DỊCH CHUYỂN LƯỢC ĐỒ KHỐI

TRONG MÔ HÌNH DỮ LIỆU DẠNG KHỐI

CHUYÊN NGÀNH: KHOA HỌC MÁY TÍNH

Trang 3

Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn

LỜI CẢM ƠN

Để hoàn thành luận văn này tôi đã nhận được sự giúp đỡ tận tình của thầy hướng dẫn khoa học, của các thầycô trường Đại học Công nghệ thông tin

và truyền thông - Đại học Thái Nguyên Tôi xin chân thành cảm ơn các thầy

cô trường Đại học Công nghệ thông tin và truyền thông - Đại học Thái Nguyên đã tạo điều kiện học tập, nghiên cứu và giúp đỡ tôi rất nhiều trong

quá trình làm luận văn Đặc biệt tôi xin cảm ơn thầyTS Lê Văn Phùng đã tận

tình hướng dẫn, chỉ bảo tôi trong suốt quá trình học tập, nghiên cứu đề tài và giúp đỡ tôi hoàn thành bản luận văn này

Thái Nguyên, ngày 15 tháng 5 năm 2015

Học viên

Ngô Văn Định

Trang 4

Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn

LỜI CAM ĐOAN

Tôi xin cam đoan đây là kết quả nghiên cứu của tôi dưới sự hướng dẫn khoa học của TS Lê Văn Phùng

Các số liệu, kết quả nêu trong luận văn là trung thực và chưa từng được

ai công bố trong bất kỳ công trình nào khác

Học viên

Ngô Văn Định

Trang 5

Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn

MỤC LỤC

Trang

MỤC LỤC i

DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT iii

DANH MỤC CÁC HÌNH iv

MỞ ĐẦU 1

CHƯƠNG 1 MÔ HÌNH DỮ LIỆU DẠNG KHỐI 4

1.1 Một số mô hình dữ liệu tiêu biểu 4

1.1.1 Mô hình dữ liệu quan hệ 4

1.1.2 Mô hình hướng đối tượng 4

1.1.3 Mô hình dữ liệu dạng khối 5

1.2 Khối, lược đồ khối và các đặc trưng cơ bản 5

1.2.1 Khái niệm khối và lược đồ khối 5

1.2.2 Các phép tính cơ bản trên khối 8

1.2.3 Khái niệm phụ thuộc hàm 15

1.2.4 Bao đóng của tập thuộc tính chỉ số 16

1.2.5 Khóa của lược đồ khối R đối với tập F trên R 19

1.2.6 Các dạng chuẩn, tựa chuẩn và tựa chuẩn hóa trên lược đồ khối 22

1.2.7 Khái niệm về phủ và phủ tối thiểu của tập phụ thuộc hàm 31

Kết luận chương 1 33

CHƯƠNG 2 PHÉP DỊCH CHUYỂN LƯỢC ĐỒ KHỐI 34

2.1 Phép dịch chuyển lược đồ quan hệ 34

2.1.1 Định nghĩa 34

2.1.2 Thuật toán dịch chuyển lược đồ quan hệ 35

2.1.3 Bổ đề về siêu khoá trong phép dịch chuyển lược đồ quan hệ 39

2.1.4 Dịch chuyển lược đồ quan hệ về dạng cân bằng 40

2.2 Phép dịch chuyển lược đồ khối 43

Trang 6

Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn

2.2.1 Định nghĩa 43

2.2.2 Sự khác biệt giữa phép chuyển dịch lược đồ khối so với phép dịch chuyển lược đồ quan hệ 45

2.2.3 Một số thuật toán dịch chuyển lược đồ khối 46

2.2.4 Biểu diễn bao đóng qua phép dịch chuyển 48

2.2.5 Biểu diễn khóa qua phép dịch chuyển 51

2.2.6 Ví dụ 55

Kết luận chương 2 56

CHƯƠNG 3 CHƯƠNG TRÌNH THỬ NGHIỆM 58

3.1 Bài toán thử nghiệm 58

3.2 Phân tích và thiết kế chương trình thử nghiệm 59

3.2.1 Thủ tục dịch chuyển 59

3.2.2 Biểu diễn khóa qua phép dịch chuyển 60

3.2.3 Thiết kế chương trình 60

3.3 Cài đặt và thực hiện chương trình thử nghiệm 60

3.3.1 Yêu cầu hệ thống 60

3.3.2 Hệ thống dữ liệu vào/ra 61

3.3.3 Hệ thống giao diện 61

3.3.4 Kết quả thử nghiệm chương trình và đánh giá 62

Kết luận chương 3 67

KẾT LUẬN 68

TÀI LIỆU THAM KHẢO 69

Trang 7

Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn

DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT

Luận văn này dùng thống nhất các ký hiệu và chữ viết tắt sau:

Ký hiệu Ý nghĩa

x(i) = (x, Ai) các thuộc tính chỉ số của lƣợc đồ khối (x id, i = 1 n)

id(i)= {x(i)|x id} tập các thuộc tính chỉ số của lƣợc đồ khối

Trang 8

Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn

Trang 9

Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn

MỞ ĐẦU

1 Lí do chọn lựa đề tài

Ngày nay, công nghệ thông tin đã trở thành một nhân tố không thể thiếu được trong mọi lĩnh vực của đời sống xã hội Sự bùng nổ nhu cầu xây dựng các hệ thống thông tin, mà trước hết là các hệ thống thông tin quản lý đã trở thành hướng nghiên cứu và quan tâm của rất nhiều nhà khoa học cũng như người sử dụng Các hệ thống cơ sở dữ liệu (CSDL) đã lần lượt xuất hiện Vào những năm 60, thế hệ đầu tiên của cơ sở dữ liệu ra đời dưới dạng các mô hình thực thể - liên kết (có đặc điểm nhận dạng đối tượng), mạng phân cấp Tiếp đến là vào những năm 70 thế hệ thứ hai của CSDL ra đời Đó là mô hình quan

hệ do E F Codd đề xuất Loại mô hình này đã đánh dấu mốc quan trọng về

cơ sở lý thuyết của các hệ thống CSDL Sở dĩ mô hình này được đánh giá cao hơn cả vì nó được xây dựng dựa trên một cơ sở toán học chặt chẽ Tuy nhiên,

do các quan hệ có cấu trúc phẳng (tuyến tính) nên mô hình này chưa đủ đáp ứng đối với các ứng dụng phức tạp, các cơ sở dữ liệu có cấu trúc phi tuyến,…

Trong những năm gần đây, việc nghiên cứu nhằm mở rộng mô hình quan hệ được nhiều nhà khoa học quan tâm Theo hướng nghiên cứu này đã

có một số hướng mở rộng mô hình quan hệ được đề xuất nghiên cứu như: mô hình dữ liệu đa chiều; khối dữ liệu; kho dữ liệu; mô hình dữ liệu dạng khối Trong đó, ở mô hình dữ liệu dạng khối, các khối là khái niệm cơ bản được mở rộng từ các quan hệ trong mô hình quan hệ, các khối này có thể biểu diễn các

dữ liệu có tính chất động (biểu diễn các dữ liệu có thuộc tính thay đổi theo thời gian, không gian…) có khả năng đáp ứng tốt đối với nhiều lớp bài toán phức tạp

Trong mô hình quan hệ, để giảm tính phức tạp của việc xác định bao đóng, khóa trong các cơ sở dữ liệu lớn, phức tạp, người ta đã đề xuất phép dịch chuyển lược đồ quan hệ (LĐQH) Trong mô hình cơ sở dữ liệu dạng

Trang 10

Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn

khối, việc xác định khóa và bao đóng càng khó khăn hơn, chính vì vậy mà phép dịch chuyển lược đồ khối đã được đề xuất với mục đích tương tự

Mục tiêu của đề tài là tìm hiểu kỹ thuật thu gọn lược đồ khối dựa trên phép dịch chuyển lược đồ khối và phương pháp biểu diễn bao đóng và khóa của lược đồ khối thông qua phép dịch chuyển với độ phức tạp thấp hơn so với phương pháp tìm bao đóng và khóa thông thường Đồng thời, nghiên cứu thuật toán và cài đặt chương trình thử nghiệm với thuật toán dịch chuyển lược

đồ khối và biểu diễn khóa của lược đồ khối qua phép dịch chuyển

2 Mục đích nghiên cứu

Mô hình dữ liệu dạng khối là một mở rộng của mô hình quan hệ với các khối cho phép biểu diễn các dữ liệu có tính chất động (biểu diễn các dữ liệu

có thuộc tính thay đổi theo thời gian) Tuy nhiên, các nghiên cứu về mô hình

dữ liệu này còn chưa nhiều

Đối với các cơ sở dữ liệu khối lớn và phức tạp, việc xác định khóa và bao đóng là một việc khó Nhờ việc dịch chuyển lược đồ khối, việc tính bao đóng và khóa có thể trở nên đơn giản hơn

3 Nhiệm vụ nghiên cứu

- Nghiên cứu tổng quan về mô hình dữ liệu dạng khối; một số khái niệm và thuật toán liên quan

- Nghiên cứu phép dịch chuyển lược đồ khối trong mô hình dữ liệu dạng khối và một số thuật toán dịch chuyển lược đồ khối

- Áp dụng thuật toán dịch chuyển trong bài toán thực tế

4 Đối tượng và phạm vi nghiên cứu:

Đối tượng nghiên cứu: Mô hình dữ liệu dạng khối

Phạm vi nghiên cứu: Phép dịch chuyển lược đồ khối nhằm giảm

nhẹ độ phức tạp trong việc tính bao đóng và khóa của khối

5 Phương pháp nghiên cứu

- Phương pháp nghiên cứu lý luận

Trang 11

Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn

- Phương pháp phân tích - tổng hợp

- Phương pháp chuyên gia

6 Những đóng góp mới của đề tài

- Hệ thống hóa các khái niệm cơ bản về mô hình dữ liệu dạng khối; các phép toán và thuật toán liên quan trên mô hình dữ liệu dạng khối

- Tìm hiểu phép dịch chuyển lược đồ khối trong mô hình dữ liệu dạng khối và một số thuật toán dịch chuyển lược đồ khối

- Áp dụng thuật toán đó trên để xây dựng chương trình minh họa khả năng dịch chuyển khối và biểu diễn khóa qua phép dịch chuyển

7 Cấu trúc luận văn

Các nội dung nghiên cứu của đề tài luận văn được cấu trúc thành 3 chương như sau:

Chương 1 Mô hình dữ liệu dạng khối

Giới thiệu tóm tắt về các mô hình dữ liệu Các khái niệm cơ bản về mô hình dữ liệu dạng khối như: Định nghĩa khối, lát cắt, lược đồ khối ; các phép tính trên khối

Một số khái niệm về bao đóng, khóa, phụ thuộc hàm trong mô hình

dữ liệu dạng khối Tìm hiểu một số thuật toán tìm bao đóng và khóa của lược

đồ khối

Chương 2 Phép dịch chuyển lược đồ khối

Giới thiệu sơ lược về phép dịch chuyển LĐQH trong mô hình quan hệ

và một số vấn đề liên quan

Tìm hiểu về phép dịch chuyển và thuật toán dịch chuyển lược đồ khối trong mô hình dữ liệu dạng khối Đưa ra phương pháp biểu diễn bao đóng và khóa của lược đồ khối thông qua phép dịch chuyển

Chương 3 Chương trình thử nghiệm

Tiến hành cài đặt các thuật toán dịch chuyển lược đồ khối trong mô hình dữ liệu dạng khối

Trang 12

Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn

CHƯƠNG 1 MÔ HÌNH DỮ LIỆU DẠNG KHỐI

1.1 Một số mô hình dữ liệu tiêu biểu

1.1.1 Mô hình dữ liệu quan hệ

Khái niệm toán học làm nền tảng cho mô hình quan hệ là các quan hệ theo lý thuyết tập hợp Đó là tập con của tích Đề-Các của một danh sách các miền, mỗi miền đơn giản là một tập các giá trị Ta có thể xem một quan hệ như một bảng, trong đó mỗi hàng là một bộ và mỗi cột là một thuộc tính

Ta cũng có thể biểu diễn một sơ đồ thực thể-liên kết trong mô hình quan hệ Khi đó, các dữ liệu của sơ đồ thực thể-liên kết được biểu diễn bởi hai loại quan hệ:

- Một tập thực thể E có thể được biểu diễn bởi một quan hệ mà LĐQH của nó chứa tất cả các thuộc tính của tập thực thể đó Mỗi bộ của quan hệ biểu diễn một thực thể trong thể hiện của E

- Mối liên hệ giữa các tập E1, E2, , Ek được biểu diễn bởi một quan hệ

lại tên cho các thuộc tính nếu cần, ta đảm bảo rằng không có hai tập thực thể trong danh sách có các thuộc tính cùng tên, ngay cả khi hai tập thực thể này chỉ là một

1.1.2 Mô hình hướng đối tượng

Mô hình dữ liệu hướng đối tượng có một số đặc điểm sau:

Đặc tính nhận dạng đối tượng (Object identity): Các thành phần chúng

xử lý điển hình là những mẩu tin, có địa chỉ duy nhất giống như trong mô hình mạng và mô hình phân cấp

Các đối tượng phức (Complex object): cho phép xây dựng một kiểu mới bằng thao tác tạo lập mẫu tin hoặc tạo lập tập hợp

Trang 13

Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn

Phân cấp theo kiểu (Type hierachy): Cho phép những kiểu có thể có những kiểu con và có thuộc tính riêng

Tất cả các cấu trúc đối tượng (object structure) được định nghĩa trong

mô hình này rất gần với tập các lược đồ cho các mẫu tin cơ sở dữ liệu trong

mô hình phân cấp

Một mô hình hướng đối tượng không bị giới hạn trong khái niệm kiểu đối tượng Khái niệm cơ bản thực sự là lớp (class), đó là một kiểu đối tượng làm cấu trúc dữ liệu nền tảng và một tập hợp các phương pháp (method), đó là các thao tác được thực hiện trên các đối tượng có cấu trúc thuộc về lớp đó

Mô hình hướng đối tượng gắn liền với mô hình phân cấp theo nghĩa là nếu được cho trước một lược đồ phân cấp nào đó, ta có thể mô phỏng nó trong mô hình hướng đối tượng bằng cách xem các con của một nút (gồm tất

cả các con là các kiểu mẫu tin ảo) trong lược đồ phân cấp như là các trường trong một cấu trúc đối tượng ứng với n Các cấu trúc đối tượng cho các con của n lại có các con của chúng là các trường Như vậy, mô hình hướng đối tượng có thể diễn tả mọi cấu trúc của mô hình thực thể-liên kiết, tuy nhiên để đảm bảo yêu cầu truy xuất hiệu quả các thông tin cần thiết trong các cấu trúc đối tượng cũng không phải là một công việc đơn giản

1.1.3 Mô hình dữ liệu dạng khối

Mô hình dữ liệu dạng khối là một mở rộng của mô hình quan hệ, khi

đó, mô hình quan hệ có thể được coi là một trường họp đặc biệt của mô hình

dữ liệu dạng khối Các nội dung cụ thể sẽ được trình bày trong phần tiếp theo của luận văn

1.2 Khối, lược đồ khối và các đặc trưng cơ bản

1.2.1 Khái niệm khối và lược đồ khối

Khái niệm toán học làm nền tảng cho mô hình dữ liệu dạng khối là các khối hiểu theo nghĩa của lý thuyết tập hợp Khối được định nghĩa như sau:

Trang 14

Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn

Định nghĩa 1.1[4], [7]

gồm một số hữu hạn phần tử mà mỗi phần tử là một họ ánh xạ từ tập chỉ số id đến các miền giá trị của các thuộc tính Ai (i=1 n)

Nói một cách khác:

t r(R) t = {ti: id Dom(Ai)} i=1 n

Ta ký kiệu khối đó là r(R) hoặc r(id; A1, A2,…, An), đôi khi nếu không

sợ nhầm lẫn, ta ký hiệu đơn giản là r

Khi đó, khối r(R) đƣợc gọi là có lƣợc đồ khối R Nhƣ vậy, trên cùng một lƣợc đồ khối R, ta có thể xây dựng đƣợc nhiều khối khác nhau

Ví dụ 1.1

Xây dựng khối sản phẩm (ký hiệu SP(R)) để quản lý sản phẩm của một công ty: cho lƣợc đồ khối R = (id; A1, A2, A3, A4) trong đó:

(mã), A2 = ten (tên), A3 = c_luong (chất lƣợng), A4 = gia (giá)

Hình 1.1 Biểu diễn khối SANPHAM

Trang 15

Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn

Với khối SP(R) ở hình trên thì nó gồm 3 phần tử t1, t2, t3

ký hiệu r(Rx) là một khối với Rx = ({x}; A1, A2,…, An) sao cho:

Trang 16

Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn

Nhận xét

Cho R = (id; A1, A2,…, An), r(R) là một khối trên R Với mỗi x id, thì

thì r(R) trở thành một quan hệ

khối, đó chính là khối r(R) với R = ({x}; A1, A2,…, An)

Mệnh đề 1.1[4], [7]

đó tồn tại một họ quan hệ (hiểu theo nghĩa tập hợp) duy nhất biểu diễn họ

họ quan hệ cho trước biểu diễn họ các lát cắt của một khối nào đó thì khối tìm được không duy nhất

1.2.2 Các phép tính cơ bản trên khối

Các phép tính cơ bản thường được áp dụng cho một cơ sở dữ liệu là:

- Phép chèn (insert)

- Phép loại bỏ (delete)

- Phép sửa đổi (change)

Trong mô hình dữ liệu dạng khối, các phép tính này cũng được áp dụng cho từng phần tử của các khối lưu trữ trong máy Cụ thể

0)

- Phép loại bỏ (delete) [4], [7]

Cho lược đồ khối R = (id; A1, A2,…, An), r(R) là một khối trên R

Trang 17

Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn

Phép loại bỏ là phép xóa một phần tử ra khỏi một khối cho trước Chẳng hạn, loại phần tử t0 vào khối r(R), có dạng:

r = r - {t0}, t0 = (t10, t20,…, tn

0) DEL(r, t1 = t10, t2 = t20,…, tn

- Phép sửa đổi (change)[4], [7]

= tn0; t1 = t’1

0, t2 = t’2

0,…, t’n

= tn0) Đối với các phép chèn, loại bỏ và sửa đổi nêu trên, khi khối r suy biến thành một quan hệ, nghĩa là khi tập chỉ số id chỉ gồm một phần tử (id ={x}) thì chúng lại trở thành các phép chèn, loại bỏ và sửa đổi trên một quan hệ trong mô hình dữ liệu quan hệ

* Đại số trên khối [4], [7]

Cho r là một khối trên R = (id; A1, A2,…, An) Tương tự như đại số quan hệ trong mô hình dữ liệu quan hệ, ở đây, các phép toán của đại số quan

hệ được áp dụng cho các khối như: phép hợp, phép giao,phép trừ, phép chiếu, phép chọn, phép kết nối, phép chia Ngoài ra, phép nối dài là phép toán mới được xây dựng

Hai khối r và s được gọi là khả hợp nếu chúng có cùng một lược đồ khối

- Phép hợp

Cho hai khối r và s khả hợp, khi đó hợp của r và s, ký hiệu r s là một khối gồm các phần tử thuộc khối r hoặc thuộc khối s đã cho

Ta có: r s = {t | t r hoặc t s}

Trang 18

Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn

A03 A03

A01

A

A02 A02

A02 A02

Trang 19

Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn

ten

A02 A02

A03 A03

A03

B

B A02

Cho hai khối r và s khả hợp, khi đó hiệu của r và s, ký hiệu r - s là một

khối mà các phần tử của nó thuộc r nhƣng không thuộc s

Khi đó, tích Đề-các của hai khối r(R) và s(S) là một khối, ký hiệu r s,

khối này có khung R S = (id; A1, A2,…, An, B1, B2,…, Bm), mỗi phần tử

thuộc khối này là một bộ gồm n + m ánh xạ, trong đó n ánh xạ đầu có dạng

một phần tử thuộc r, còn m ánh xạ sau có dạng một phần tử thuộc s

), t(S) = (tn+1,…, tn+m

)

Trang 20

Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn

- Tích Đề-các theo tập chỉ số

Cho lược đồ khối R = (id; A1, A2,…, An), S =(id’; A1, A2,…, An) Khi

đó, tích Đề-các của hai khối r(R) và s(S) theo tập chỉ số là một khối, ký hiệu

r id s, khối này có khung R id S=(id ∐ id’; A1, A2,…, An), với id ∐ id’ là

ký hiệu tích rời rạc của hai tập chỉ số id và id’ Mỗi phần tử thuộc khối này

là một bộ gồm n ánh xạ(t1, t2,…, tn

) với ti: id ∐ id’ → Ai, với i = 1 n, mỗi ánh

xạ này được cảm sinh từhai ánh xạ thứ i tương ứng của r và s

Cụ thể hơn, giả sử có 2 phần tử là tr r và ts s:

tr = (t1r, t2r,…, tn

r), ts = (t1s, t2s,…, tn

s), khi đó, ta có ánh xạ cảm sinh của tr và ts, phần tử cảm sinh của tr và ts,

ký hiệu là trs

Gọi j1: id → id ∐ id’; j2: id → id ∐ id’ là các phép nhúng, thì ta được:trsj1 r và trsj2 s và r id s = {t | tj1 r và tj2 s}

- Phép chiếu

Cho lược đồ khối R = (id; A1, A2,…, An), r là một khối trên R Khi đó,

ta gọi P = (id’; Ai1, Ai2,…, Aih) là lược đồ con của lược đồ R nếu:

id' id, Aij {A1, A2,…, An}, j = 1 h

lược đồ P và mỗi phần tử thuộc khối này có dạng:

i1 i2 ih ij 1 2 n 1 2 n P

Trang 21

Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn

Cho một phép chọn, nghĩa là ta xây dựng một tập con các phần tử của khối đã cho thỏa mãn biểu thức F cho trước Biểu thức F được diễn tả bằng một

tổ hợp Boole của các toán hạng, mỗi toán hạng là một phép so sánh đơn giản giữa hai biến là hai giá trị điểm của hai ánh xạ thành phần nào đó hoặc giữa một biến là giá trị điểm của một ánh xạ thành phần và một hằng Các phép so sánh trong F là: <, >, =, , , , còn các phép toán logic trong F là: , ,

Biểu diễn hình thức của phép chọn có dạng:

Nếu hai tập {A1, A2,…, An}và {B1, B2,…, Bm} không giao nhau thì r* s trở thành tích Đề-các của hai khối đã cho

Ta có thể mở rộng khái niệm kết nối như sau:

Trang 22

Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn

Giả sử Aik {A1, A2,…, An}, Bik {B1, B2,…, Bm} và Dom(Aik) = Dom(Bik), 1 k h (ở đây Aik và Bik không nhất thiết phải phân biệt)

Khi đó, phép kết nối của r và s theo Ai1, Ai2,…, Aih và Bi1, Bi2,…, Bih là khối t(T), khối này đƣợc định nghĩa là:

t(T) = {t | tr r và ts s sao cho t(R) =tr, t(S) = ts, tr

ik

= ts ik

, 1 k h}, trong đó tr = (t1r, t2r,…, tn

, 1 k h] s

- Phép chia

Cho hai khối r(id; A1, A2,…, An) và s(id; Ai1, Ai2,…, Aih), trong đó,

Trang 23

Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn

1.2.3 Khái niệm phụ thuộc hàm

Để đơn giản, ta sử dụng các ký hiệu:

x(i) = (x; Ai); id(i) = (x(i)| x id)

Ta gọi x(i) (x id, i = 1 n) là các thuộc tính chỉ số của lƣợc đồ khối R = (id; A1, A2,…, An)

Định nghĩa 1.3[4], [7]

n (i)

i 1id

mọi t1, t2 R sao cho t1(X)= t2(X) thì t1(Y)= t2(Y)

Định nghĩa 1.4[4], [7]

Cho lƣợc đồ khối R = (id; A1, A2,…, An), F là tập cácPTH trên R

Trang 24

Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn

i 1id

trở thành quan hệ r(A1, A2,…, An) vàPTH X Y, (X, Y

n (i)

i 1id

thànhPTH trong mô hình dữ liệu quan hệ

Mệnh đề 1.3[4], [7]

x(m) id(m),x(k) id(k) Khi đó, nếu r thỏaPTHx(m)

x(k) thì đối với mọi y

id, r thỏa y(m) y(k)

Mệnh đề 1.4[4], [7]

x(m),y(m) id(m),x(k),y(k) id(k) Khi đó, nếu r thỏa cácPTHx(m) y(m) và x(m)

i 1id

X+ nhƣ sau:

X+ = {x(i), x id, i = 1 n | X x(i) F}

Cho lƣợc đồ khối R = (id; A1, A2,…, An), ta ký hiệu tập cácPTH trên R:

i Ax

j Bx

Trang 25

Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn

i 1

h x

i 1id

x AM

 , Mx

n (i)

i 1x

Khi đó, dựa vào thuật toán tính bao đóng ở trên, ta có thể tính bao đóng

M+ của M đối với Fh Từ quá trình tính bao đóng của M đối với Fh, ta thấy đó

Trang 26

Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn

Mệnh đề 1.5[4], [7]

Cho lƣợc đồ khối R = (id; A1, A2,…, An), Fh, Fhx là tập cácPTH trên R,

n (i)

i 1id

x AM

 , Mx

n (i)

i 1x

n (i)

i 1x

M+ là bao đóng của Mx =

n (i)

i 1x

i 1id

x AM

 , Mx

n (i)

i 1x

x AM

i 1id

x AM

 , Mx

n (i)

i 1x

i 1x

Trang 27

Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn

Thuật toán 1.2(Tìm bao đóngcủa tập thuộc tính X của lƣợc đồ khối)[4],

Y := X

n (i)

i 1x

n (i)

i 1

h x

Trang 28

Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn

Nếu K là khóa và K K’’ thì K’’ gọi là siêu khóa của lƣợc đồ R đối với F

Từ định nghĩa của khóa, ta có thuật toán tìm khóa của lƣợc đồ khối R đối với tập cácPTH F trên R nhƣ sau:

Thuật toán 1.3(Tìm một khóa của lƣợc đồ khối)[4], [7]

i 1id

x id, Kx =

n (i)

i 1x

i 1id

Trang 29

Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn

n (i)

i 1x

n (i)

i 1x

Nhƣ vậy Kx+

=

n (i)

i 1x

i 1x

i 1x

i 1x

i 1id

 =

n (i)

i 1id

bao đóng ở trên, ta lại có: K+

x idK

n (i)

i 1id

n (i)

i 1id

Khi đó, (K’

n (i)

i 1x

n (i)

i 1x

Trang 30

Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn

Như vậy, x0 id sao cho

0

x

K ' = (K’

n (i) 0

i 1x

n (i) 0

i 1x

i 1x

n (i) 0

i 1x

i 1id

và chỉ khi Kx =

n (i)

i 1x

Hệ quả 1.1

Cho lược đồ khối R = (id; A1, A2,…, An), Fh, Fhx là tập cácPTH trên R,

Rx tương ứng, K

n (i)

i 1id

i Ax

khóa của Rx đối với Fhx thì (i)

i Aid

1.2.6 Các dạng chuẩn, tựa chuẩn và tựa chuẩn hóa trên lược đồ khối

1.2.6.1 Các dạng chuẩn

Định nghĩa 1.7[3], [5]

gọi lược đồ khối R thuộc dạng chuẩn 1 nếu và chỉ nếu toàn bộ các miền giá trị của các thuộc tính x(i), x id, i {1, 2, …,n} đều chỉ chứa các giá trị nguyên tố

Mệnh đề 1.11[3], [5]

thuộc dạng chuẩn 1 Khi đó, nếu id = {x} thì lược đồ khối R suy biến thành LĐQH ở dạng chuẩn 1 trong mô hình dữ liệu quan hệ

Trang 31

Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn

X nhƣng không phụ thuộc hàm vào bất kỳ một tập con thực sự nào của X

Định nghĩa 1.9[3], [5]

gọi lƣợc đồ khối R thuộc dạng chuẩn 2 nếu nó ở dạng chuẩn 1 và mọi thuộc tính không khóa của R đều là PTH đầy đủ vào khóa

Mệnh đề 1.12[3], [5]

thuộc dạng chuẩn 2 Khi đó, nếu id = {x} thì lƣợc đồ khối R suy biến thành LĐQH ở dạng chuẩn 2 trong mô hình dữ liệu quan hệ

Mệnh đề 1.13[3], [5]

Cho lƣợc đồ khối R = (id; A1, A2,…, An), và Fh là tập các PTH trên R

cũng ở dạng chuẩn 2

Định nghĩa 1.10[3], [5]

gọi lƣợc đồ khối R thuộc dạng chuẩn 3 nếu nó ở dạng chuẩn 2 và mọi thuộc tính không khóa của R đều là không PTH bắc cầu vào khóa

Mệnh đề 1.14[3], [5]

thuộc dạng chuẩn 3 Khi đó, nếu id = {x} thì lƣợc đồ khối R suy biến thành LĐQH ở dạng chuẩn 3 trong mô hình dữ liệu quan hệ

Mệnh đề 1.15[3], [5]

Cho lƣợc đồ khối R = (id; A1, A2,…, An), và Fh là tập các PTH trên R

cũng ở dạng chuẩn 3

Trang 32

Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn

Mệnh đề 1.16[3], [5]

thuộc dạng chuẩn Boye-Codd Khi đó, nếu id = {x} thì lƣợc đồ khối R suy biến thành LĐQH ở dạng chuẩn Boye-Codd trong mô hình dữ liệu quan hệ

Mệnh đề 1.17[3], [5]

đó, R thuộc dạng chuẩn Boye-Codd thì R ở dạng chuẩn 3

Mệnh đề 1.18[3], [5]

Boye-Codd

1.2.6.2 Các dạng tựa chuẩn

Định nghĩa 1.12[3], [5]

gọi lƣợc đồ khối R thuộc dạng tựa chuẩn 2 (tựa chuẩn 3) nếu và chỉ nếu x

id, lát cắt Rx thuộc dạng chuẩn 2 (chuẩn 3)

Định nghĩa 1.13[3], [5]

gọi lƣợc đồ khối R thuộc dạng tựa chuẩn Boye-Codd nếu và chỉ nếu x id,

Trang 33

Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn

Mệnh đề 1.19[3], [5]

đó, nếu x id sao cho Rx thuộc dạng chuẩn 2 (dạng chuẩn 3, dạng chuẩn Boye-Codd) thì y id, ta có Ry thuộc dạng chuẩn 2 (dạng chuẩn 3, dạng chuẩn Boye-Codd)

Mệnh đề 1.20[3], [5]

chuẩn 3, dạng tựa chuẩn Boye-Codd)

Mệnh đề 1.21[3], [5]

đó, nếu R thuộc dạng tựa chuẩn 2 thì R thuộc dạng tựa chuẩn 1

Mệnh đề 1.22[3], [5]

đó, nếu R thuộc dạng tựa chuẩn 3 thì R thuộc dạng chuẩn 2

Mệnh đề 1.23[3], [5]

đó, nếu R thuộc dạng tựa chuẩn Boye-Codd thì R thuộc dạng chuẩn 3

Mệnh đề 1.24[3], [5]

thì R thuộc dạng tựa chuẩn 2 (dạng tựa chuẩn 3, dạng tựa chuẩn Boye-Codd)

Mệnh đề 1.25[3], [5]

Cho lƣợc đồ khối R = (id; A1, A2,…, An), Fh là tập các PTH trên R Khi

dạng chuẩn 3

Trang 34

Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn

1.2.6.3 Tựa chuẩn hóa lược đồ khối

Định nghĩa 1.14[3]

Cho lƣợc đồ khối R = (id; A1, A2,…, An), F là tập các PTH trên R Phép tách lƣợc đồ khối R là thay thế nó bởi một tập các lƣợc đồ khối = {R1, R2,…, Rk}, ở đây Ri, i = 1 k là các lƣợc đồ khối con của R có dạng Ri = (id; Ai1, Ai2, …, Aij) với {Ai1, Ai2, …, Aij} {A1, A2,…, An}

a Phép tách không mất mát thông tin

{R1, R2,…, Rk} là một phép tách của R Khi đó, ta nói phép tách này là không mất thông tin đối với F nếu với mọi khối r trên R thỏa F thì:

Cho lƣợc đồ khối R = (id; A1, A2,…, An), Fh là tập các PTH trên R Fh

n ( i )

i 1

h x

F

là nhƣ nhau x id

Trang 35

Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn

Mệnh đề 1.27[3]

Cho lược đồ khối R = (id; A1, A2,…, An), Fh là tập các PTH trên R,

i 1

h x

F

, x id, khi đó:

Nếu Fhx là như nhau x id thì ta chỉ việc chọn F*h = Fh

i Ax

x idF

Thuật toán 1.4(Khẳng định phép tách có mất thông tin hay không)

Để kiểm tra tính bảo toàn thông tin của phép tách trên lược đồ khối, ta chuyển về kiểm tra tính bảo toàn thông tin trên một lát cắt tùy ý

Input: Lược đồ khối R = (id; A1, A2,…, An), tập đầy đủ các PTH Fh trên

R, phép tách = {R1, R2,…, Rk}, Ri = (id; Xi), Xi {A1, A2,…, An}, i = 1 k

Output: Khẳng định phép tách có mất thông tin hay không?

Phương pháp

j tương ứng với thuộc tính Aj Tại vị trí có tọa độ (i, j), nếu Aj thuộc Xj thì ta ghi aj, ngược lại ta ghi bj

Trang 36

Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn

hàng mà tất cả các cột tương ứng với các thuộc tính của X có giá trị như nhau thì ta làm cho các cột ứng với các thuộc tính của Y cũng có giá trị như nhau

bằng một trong các ký hiệu bij Tiếp tục áp dụng các PTH cho bảng (kể cả việc lặp lại các PTH đã áp dụng) cho tới khi không thể thay đổi được giá trị nào trong bảng nữa

Nếu trong bảng có một hàng gồm các ký hiệu a1, a2, , an thì phép tách không bảo toàn thông tin

x = {R1x, R2x, , Rkx}, Rix = (x; Xi), Xi {A1, A2, , An}, i = 1 k

cắt Rx Như vậy, các phép tách x = {R1x, R2x, , Rkx} cũng là như nhau đối với mọi lát cắt Rx

{A11, A12,…, A1i} {A21, A22,…, A2j} {A11, A12,…, A1i} \ {A21, A22,…, A2j} hoặc

{A11, A12,…, A1i} {A21, A22,…, A2j} {A11, A12,…, A1j} \ {A21, A22,…, A2i}

Trang 37

Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn

Chứng minh

Bằng cách chuyển về xét trên lát cắt Rx, thì khi đó Rx là một quan hệ và điều kiện cần và đủ nêu trong mệnh đề này chính là nội dung của định lý Risanen (1977) đã biết trong mô hình quan hệ Từ tổ hợp của các phép tách trên các lát cắt (các phép tách này giống nhau) tạo thành phép tách trên khối

Ta suy ra điều cần chứng minh

Cho lƣợc đồ khối R = (id; A1, A2,…, An), Fh là tập đầy đủ các PTH trên

R, = {R1, R2, ,Rk} là một phép tách của R Fhi là hình chiếu của Fh lên Ri, ký

của Ri Khi đó, ta nói phép tách này bảo toàn tập PTH Fh nếu hợp của tất cả các PTH trong Ri(Fh) với i = 1 k suy diễn logic ra tất cả các PTH trong Fh

Mệnh đề 1.29[3]

Cho lƣợc đồ khối R = (id; A1, A2,…, An), Fh là tập đầy đủ các PTH trên

R, = {R1, R2, , Rk} là một phép tách không mất thông tin của R đối với Fh Với mỗi i = 1, 2, , k, ta gọi Fhi là hình chiếu của Fh lên Ri và đặt = (S1, S2, , Sm) là một phép tách không mất thông tin của Ri đối với Fhi Khi đó, phép tách R thành (R1, R2, , Ri-1, S1, S2, , Sm, Ri+1, , Rk) là không mất thông tin đối với Fh

Giả sử có R, Fh, nhƣ đã nói ở trên, = (R1, R2, , Rk, Rk+1, , Rn) là một phép tách của R chứa các lƣợc đồ của thì là một phép tách không mất thông tin

Trang 38

Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn

Thuật toán 1.5(Tách không mất thông tin về dạng tựa chuẩn

Output: Phép tách = {R1, R2, , Rk} không mất thông tin, Ri với mọi i

= 1, 2, , k đều ở dạng tựa chuẩn Boye-Codd với các PTH là hình chiếu của

Fh lên các Ri

Phương pháp

x sẽ đƣợc tách tiếp với một phép tách không mất mát thông tin đối với Fhx

loại bỏ A

Tiếp tục quá trình cho đến khi mọi lƣợc đồ con đều ở dạng chuẩn Codd Nhƣ vậy, ta xây dựng đƣợc phép tách không mất mát thông tin chuẩn hóa Rx về dạng chuẩn Boye-Codd Với phép tách x = {R1x, R2x, , Rkx}

Boye-Khi đó, phép tách = {R1, R2, , Rk} với Ri = ix

x idR

Thuật toán 1.6(Tách bảo toàn tập PTH và chuyển về dạng tựa chuẩn 3)

Input: Lƣợc đồ khối R = (id; A1, A2,…, An), Fh là tập đầy đủ các PTH trên R, không mất tính tổng quát, ta giả sử Fh là phủ tối thiểu

Ngày đăng: 26/03/2021, 07:02

🧩 Sản phẩm bạn có thể quan tâm

w