2.3. Mô hình dữ liệu thực thể –kết hợp
2.3.2. Phương pháp thiết kế khái niệm cơ sở dữ liệu bằng mô hình thực thể quan hệ
Để thiết kế khái niệm một CSDL bằng mô hình ER, ta tiến hành các bước sau đây:
1) Xác định dữ liệu: Xác định các dữ liệu về đối tượng phải khảo sát trong CSDL.
2) Phân lớp: Dùng phương pháp phân lớp để xác định các thực thể, các quan hệ và các thuộc tính của các thực thể và quan heọ.
3) Xây dựng mô hình ER: Sử dụng ký hiệu đồ họa để xây dựng mô hình ER cho CSDL.
4) Kieồm tra moõ hỡnh ER.
Ví dụ sau đây sẽ minh họa cho quá trình thiết kế khái niệm một CSDL theo mô hình thực thể quan hệ. Giả sử cần xây dựng một CSDL về các công trình nghiên cứu khoa học của một học viện. Mỗi tài liệu khoa học có một nhan đề và được công bố vào một ngày xác định. Nội dung của tài liệu được mô tả bởi các từ khóa.
Ta gọi tên CSDL này là CTKH.
Bước 1: Xác định dữ liệu: Tập hợp các đối tượng biểu diễn trong CSDL bao goàm:
- NHÂN VIÊN: Tập hợp các cán bộ nghiên cứu - PHÂN VIỆN: Tập hợp các phân viện của học viện - HỌ TÊN: Tập hợp họ tên của các cán bộ nghiên cứu
- TÀI LIỆU: Tập hợp các công trình khoa học do học viện xuất bản
- NHAN ĐỀ: Tập hợp các nhan đề của các công trình khoa học
- NGÀY THÁNG: Tập hợp các ngày tháng năm xuất bản tài liệu
- TỪ KHÓA: Tập hợp các từ chuẩn mô tả nội dung tài lieọu
-THUẬT NGỮ: Tập hợp các thuật ngữ biểu diễn các từ chuaồn
LĨNH VỰC: Tập hợp các lĩnh vựa chuyên môn
Các tập hợp đối tượng này có mối liên kết lẫn nhau. Ta cần liệt kê các mối quan hệ này và làm rõ các đặc trưng của chuùng.
Ta thấy mỗi cán bộ nghiên cứu có một tên, nhưng nhiều cán bộ nghiên cứu có thể có cùng một tên. Như vậy quan hệ giữa tập hợp NHÂN VIÊN và tập hợp HỌ TÊN là quan hệ 1-n.
Cũng vậy, một PHÂN VIỆN bao gồm n người, nhưng một người chỉ thuộc một PHÂN VIỆN, nên quan hệ PHÂN VIỆN – NHÂN VIÊN là quan hệ 1-n.
Tương tự:
Quan hệ NHÂN VIÊN – TÀI LIỆU là quan hệ n-n Quan hệ TÀI LIỆU-NHAN ĐỀ là quan hệ 1-1 Quan hệ TÀI LIỆU-TỪ KHÓA là quan hệ n-n Quan hệ TÀI LIỆU-NGÀY THÁNG là quan hệ n-1 Quan hệ TỪ KHÓA-LĨNH VỰC là quan hệ n-1 Quan hệ TỪ KHÓA-THUẬT NGỮ là quan hệ 1-1
Các mối quan hệ trên giữa các đối tượng có thể biểu diễn bằng sơ đồ Hình 15.
Bước 2: Để xác định các thực thể và các thuộc tính của chúng ta chú ý rằng trong các đối tượng trên đây ta có thể phân biệt hai loại:
- Một loại bao gồm các đối tượng có thể biểu diễn bằng một chuỗi các ký tự như:
NHANĐỀ,NGÀYTHÁNG,HỌTÊN,THUẬTNGỮ,PHÂNVIỆN,LĨNHVỰC
- Loại khác bao gồm các đối tượng mà ta phải gán cho một mã số để xác định chúng một cách rõ ràng như:
NHÂN VIÊN, TÀI LIỆU, TỪ KHÓA
Hìn
HỌ TÊN PHÂN VIÊN
NHAÂN VIEÂN
TỪ KHÓA
TÀI LIỆU
THUẬT NGỮ
LĨNH VỰC
NHAN ĐỀ NGÀY THÁNG
h 16. Quan hệ giữa các đối tượng mô tả trong CSDL
Từ lược đồ trên ta thấy rằng tham gia CSDL trên có ba thực thể cùng các thuộc tính sau:
- Thực thể nhân viên, có các thuộc tính: MANV (mã nhân viên), họ tên, phân viện.
- Thực thể tài liệu, có các thuộc tính: MATL (mã tài liệu), nhan đề, ngày tháng.
- Thực thể từ khóa, có các thuộc tính: MATK (mã từ khóa), thuật ngữ, lĩnh vực.
Vì nhân viên là tác giả của tài liệu và tài liệu được mô tả nội dung bằng các từ khóa, nên giữa các thực thể trên có các quan heọ:
- Quan hệ Tác giả, liên kết hai thực thể nhân viên và tài liệu bằng các thuộc tính MANV và MATL. Quan hệ này là quan hệ dạng n-n.
- Quan hệ đánh chỉ số, liên kết hai thực thể tài liệu và từ khoá bằng các thuộc tính MATL và MATK. Quan hệ này cũng là quan hệ dạng n-n.
Hình 17. Moâ hình ER cuûa CSDL CTKH
Bước 3: Xây dựng mô hình ER cho CSDL CTKH. Sử dụng các ký hiệu đồ họa ta có thể trình bày mô hình ER của CSDL như ở hình 16.
NHAÂN VIEÂN
TÁCGIAÛ
MANV
HỌ TÊN
PHAÂN VIEÄN MANV
MATL
TÀI LIỆU
MATL NHAN ẹEÀ NGÀYTHÁN ĐÁNH CHỈSỐ
MATK
MATL
TỪ KHÓA
MATK
THUẬT NGỮ
LĨNH VỰC
Từ mô hình khái niện trên ta thấy rằng có thể xây dựng 3 biểu ghi logic cho các thực thể (nhân viên, tài liệu, từ khóa) và 2 biểu ghi logic cho các quan hệ (TÁC GIẢ, ĐÁNH CHỈ SỐ), với 9 trường dữ liệu (MANV, HỌTÊN, PHÂNVIỆN, MATL, NHANĐỀ, NGÀY THÁNG, MATK, THUẬTNGỮ, LĨNHVỰC). Các biểu ghi này có cấu trúc như sau:
NHAÂN VIEÂN
MANV HỌ TÊN PHÂN VIÊN
TÀI LIỆU
MATL NHAN ĐỀ NGÀY THÁNG
TỪ KHÓA
MATK THUẬT NGỮ LĨNH VỰC
TÁC GIẢ
MANV MATL ĐÁNH CHỈ SỐ
MATK MATL
Tập hợp các biểu ghi trên tạo thành lược đồ khái niệm của cơ sở dữ liệu CTKH. Đó là cái khung của CSDL, nó cho ta cách biểu diễn các giá trị trong CSDL và mối quan hệ giữa chúng.
Ví dụ dưới đây là một thể hiện của CSDL CTKH tại một thời ủieồm.
NHAÂN VIEÂN
MANV HỌ TÊN PHÂN VIỆN
NV12 NV15 NV18
Nguyễn Văn Hải Buứi Vaờn Nam Trần thu Hà
Ngôn ngữ
Coõng ngheọ thoõng tin Thoõng tin – tử lieọu TÀI LIỆU
MATL NHAN ĐỀ NGÀY THÁNG
TL118 TL123
Vấn đề chuẩn hóa tiếng Việt trong tin học
Mô hình hóa quá trình lưu trữ và tìm kiếm thông tin
16-11-1994 25-02-1995
TỪ KHÓA
MATK THUẬTNGỮ LĨNHVỰC
TK112 TK125 TK134 TK138 TK145 TK149
Chuẩn hóa Tin học Tieỏng Vieọt Lưu trữ thông tin Tìm tin
Mô hình hóa
Coõng ngheọ thoõng tin Coõng ngheọ thoõng tin Ngôn ngữ
Thông tin học Thông tin học Thông tin học TÁC GIẢ
MANV MATL NV15
NV18 TL118
TL123 ĐÁNH CHỈ SỐ
MATK MATL TK112 TL118
TK125 TK134 TK138 TK145 TK149
TL118 TL118 TL123 TL123 TL123
Từ các dữ liệu trên ta thấy rằng ở thời điểm đang xét, trong học viện có nghiên cứu viên Trần Thu Hà ở phân viện Thông tin-Tư liệu, là tác giả của tài liệu nhan đề “Mô hình hóa quá trình lưu trữ và tim kiếm thông tin”, công bố ngày 25-02-1995 và nội dung được mô tả bởi các từ khóa: Lưu trữ thông tin, tìm tin, mô hình hóa. Đây là đề tài thuộc lĩnh vực Thông tin học, Ta cũng có những thông tin tương tự với nghiên cứu viên Bùi Văn Nam. Còn nghiên cứu viên Nguyễn Văn Hải chưa có kết quả nghiên cứu nào.
Thông qua ví dụ trên đây, chúng ta đã làm quen với phương pháp thiết kế khái niệm CSDL bằng mô hình thực thể quan hệ. Sản phẩm của thiết kế khái niệm là mô hình khái niệm.
Từ mô hình khái niệm người ta tiếp tục xây dựng mô hình logic cho CSDL. Mô hình logic cung cấp một mô tả dữ liệu sao cho chúng có thể xử lý bằng máy tính điện tử, tức là mô tả cấu trúc của CSDL mà hệ quản trị CSDL quản lý. Từ mô hình logic đã xây dựng ta có thể cài đặt CSDL trên bộ nhớ của máy tính điện tử bằng cách sử dụng một hệ quản trị CSDL thích hợp. Và khi đó một CSDL được hình thành. Có thể nói thiết kế CSDL là quá trình xây dựng cấu trúc cho CSDL. Đó là một khâu quan trọng trong vòng đời của mọi hệ thống thông tin.