Database và DBMS Database DB: là cấu trúc hợp nhất, có thể chia sẽ, lưu trữ trong máy tính _ chứa một tập hợp dữ liệu bao gồm Metadata chứa mô tả về các đặc tính của dữ liệu , và cá
Trang 1Chương 1
Giới thiệu
Trang 2Dữ liệu và Thông tin
Dữ liệu là nền tảng để tạo ra thông tin, và từ đó
là cơ sở để có được tri thức
Trang 3Dữ liệu và Thông tin (tt)
Thông tin chính xác, kịp thời là chìa khóa cho việc đưa ra các quyết định tốt
Có được các quyết định tốt là chìa khóa cho
sự tồn tại của tổ chức
Trang 4Database và DBMS
Database (DB): là cấu trúc hợp nhất, có thể chia sẽ, lưu
trữ trong máy tính _ chứa một tập hợp dữ liệu bao gồm
Metadata chứa mô tả về các đặc tính của dữ liệu , và
các mối liên kết của nó trong Database
Là dữ liệu bổ sung về dữ liệu
DBMS : là một nhóm các chương trình giúp quản lý cấu
trúc database và truy suất dữ liệu trong database
Trang 7Chức năng của DBMS
Ưu điểm của DBMS:
Chia sẽ dữ liệu tốt hơn
Bảo mật dữ liệu tốt hơn
Hợp nhất dữ liệu tốt hơn
Giảm thiểu mâu thuẫn dữ liệu
Truy suất dữ liệu tốt hơn
Trang 8Chức năng của DBMS (tt)
Các chức năng của DBMS:
Lưu trữ, truy xuất và cập nhật dữ liệu
Quản lý giao tác (transaction management)
Điều khiển tương tranh(concurrency control)
Chép lưu và phục hồi dữ liệu (backup & restore)
Bảo mật dữ liệu
Hỗ trợ truyền thông dữ liệu
Duy trì tính toàn vẹn, nhất quán dữ liệu
Cung cấp các tiện ích…
Trang 9Hệ thống xử lý tập tin theo lối cũ
Việc hiểu biết những thiếu sót của hệ thống tập tin sẽ giúp phát triển các database
Các dữ liệu có liên quan được lưu trữ trong tập tin
Mỗi tập tin có
một chương trình ứng dụng để lưu trữ, truy vấn và
chỉnh sửa dữ liệu
các chương trình ứng dụng để xuất ra báo cáo
Mỗi cá nhân hay phòng ban có tập tin riêng
Trang 11Hệ thống xử lý tập tin theo lối cũ
(tt)
Dư thừa dữ liệu (Data redundancy)
Là tình trạng mà cùng một dữ liệu được lưu trữ một cách không cần thiết ở những vị trí khác nhau
Hạn chế việc dùng chung dữ liệu
Thời gian phát triển lâu
Chi phí bảo trì chương trình cao
Trang 13Cách tiếp cận cơ sở dữ liệu
Kho dữ liệu trung tâm chứa các dữ liệu dùng chung.
Dữ liệu được quản lý bởi một đơn vị điều
khiển (controlling agent).
Dữ liệu được lưu trữ theo một dạng thức
chuẩn và thích hợp.
Cần phải có một hệ quản trị CSDL.
Trang 14Cách tiếp cận cơ sở dữ liệu (tt)
Ưu điểm của cách tiếp cận CSDL
Độc lập dữ liệu – chương trình (data - program
independence).
Giảm tối thiểu sự dư thừa dữ liệu (data
redundancy).
Nâng cao tính nhất quán (data consistency) /
toàn vẹn dữ liệu (data integrity).
Nâng cao việc dùng chung dữ liệu (data
sharing).
Trang 15Cách tiếp cận cơ sở dữ liệu (tt)
Ưu điểm của cách tiếp cận CSDL (tt)
Tăng hiệu suất phát triển ứng dụng
Tuân thủ các tiêu chuẩn
Nâng cao chất lượng của dữ liệu
Các ràng buộc (constraint), các qui tắc hợp lệ của dữ liệu (data validation rule).
Nâng cao tính truy xuất và tính đáp ứng của dữ liệu
Sử dụng ngôn ngữ truy vấn dữ liệu chuẩn (SQL_Structured Query Language).
Trang 16Cách tiếp cận cơ sở dữ liệu (tt)
Ưu điểm của cách tiếp cận CSDL (tt)
Giảm chi phí bảo trì chương trình
Bảo mật (security).
Chép lưu (backup) và phục hồi (recovery).
Điều khiển tương tranh (concurrency control).
Trang 17Cách tiếp cận cơ sở dữ liệu (tt)
Nhược điểm:
Chi phí và rủi ro của cách tiếp cận CSDL
Chi phí ban đầu
Chi phí cài đặt và quản lý
Chi phí chuyển đổi
Chi phí vận hành
Cần nhân viên mới có chuyên môn
Cần phải chép lưu và phục hồi
Mâu thuẫn về mặt tổ chức
Trang 18Các loại cơ sở dữ liệu
CSDL cá nhân (personal database)
CSDL nhóm làm việc (workgroup database)
CSDL phòng ban (department database)
CSDL xí nghiệp (enterprise database)
Các điểm khác biệt giưã các loại CSDL:
Số người sử dụng
Kiến trúc CSDL
Kích thước CSDL
Trang 19Sự phát triển các hệ CSDL
Hệ thống tập tin (flat file): 1960 – 1980
Hệ CSDL phân cấp(hierarchical): 1970-1990
Hệ CSDL mạng(network): 1970 – 1990
Hệ CSDL quan hệ ( relational): 1980 – nay
Hệ CSDL hướng đối tượng (object oriented):
1990 – nay
Hệ CSDL đối tượng – quan hệ (object –
Trang 20Mô hình hóa dữ liệu
Tại sao phải mô hình hóa dữ liệu ?
Các nhà thiết kế, nhà lập trình và người dùng có cách nhìn khác nhau về dữ liệu
-> cần có một cái nhìn tổng thể về dữ liệu của tổ chức,
Trang 21Mô hình hóa dữ liệu (tt)
Mô hình – model : là sự trừu tượng về một đối tượng, sự kiện trong thế giới thực
Mô hình dữ liệu – data models:
là cách biểu diễn đơn giản cho các cấu trúc
dữ liệu phức tạp của thế giới thực
thường biểu diễn ở dạng đồ họa
Mô hình dữ liệu được thiết kế cho nhiều
người dùng khác nhau
Như là một công cụ giao tiếp giữa nhà thiết kế, nhà
Trang 22Các thành phần căn bản của
mô hình dữ liệu
Thực thể - entity
là bất kỳ sự vật hay sự việc nào mà từ đó dữ liệu
được thu thập và lưu trữ
Thuộc tính – attribute
đặc tính của một thực thể
Mối quan hệ - relationship
mô tả mối liên hệ giữa các thực thể
Ràng buộc – constraint
là một hạn chế áp đặt cho dữ liệu
Trang 23 Giữa thập kỷ 70 – nay : Mô hình Quan hệ
Giữa thập kỷ 80 – nay : Mô hình hướng đối tượng và Mô hình Quan hệ mở rộng
Trang 24Mô hình thực thể kết hợp
The Entity Relationship Model
Được xem là một chuẩn giúp mô hình hóa dữ liệu
Được giới thiệu vào 1976, bởi Chen
Là sự biểu diễn đồ họa các thực thể và các mối liên
hệ của chúng trong cấu trúc một database
Lược đồ ER (ERD)
Mỗi tập thực thể được biểu diễn bằng hình chữ nhật
được ánh xạ là một table
Mỗi thực thể là một dòng trong table
Mối kết hợp được hiển thị bằng một hình thoi
Các mối kết hợp được gán nhãn để thể hiện loại mối kết hợp