Bài giảng Cơ sở dữ liệu - Chương 1: Các khái niệm cơ bản cung cấp cho người học các kiến thức: Các hệ thống tập tin, các hệ thống cơ sở dữ liệu, định nghĩa cơ sở dữ liệu, định nghĩa hệ quản trị Cơ sở dữ liệu,... Mời các bạn cùng tham khảo nội dung chi tiết.
Trang 1CƠ SỞ DỮ LIỆU
( Databases )
Chương 1: Các khái niệm cơ bản
Trang 2Nội dung
1 Các hệ thống tập tin
2 Các hệ thống cơ sở dữ liệu
3 Định nghĩa cơ sở dữ liệu
4 Định nghĩa hệ quản trị Cơ sở dữ liệu
5 Kiến trúc của một Cơ sở dữ liệu
6 Tính chất độc lập dữ liệu
7 Các mô hình dữ liệu
Trang 31.1 Xử lý trên hệ thống tập tin
Mỗi ứng dụng có 1 hệ thống tập tin riêng
Sales files:
– PropertyForRent– PrivateOwner– Client
Contracts files
– Lease– PropertyForRent– Client
Sales application
Contracts
Trang 4Các hạn chế của hệ thống tập tin
Dữ liệu tách biệt và không chia sẻ
– Mỗi ứng dụng có 1 hệ thống tập tin riêng– Việc chia sẻ dữ liệu giữa các ứng dụng vô cùng khó khăn do khác nhau về cấu trúc
Dữ liệu bị trùng lặp
– Tốn không gian lưu trữ– Có thể dẫn tới tình trạng không nhất quán dữ liệu khi cập nhật trên các hệ thống khác nhau
Phụ thuộc dữ liệu
– Thuật toán xử lý phụ thuộc vào cấu trúc tập tin (đã được định nghĩa) Khi thay đổi cấu trúc dữ liệu, khi
Trang 5Các hạn chế của hệ thống tập tin (tt)
Định dạng không tương thích
– Các tập tin được định nghĩa theo ngôn ngữ lập trình nào đó khó chia sẻ
Câu truy vấn bị cố định trước
– Là hệ quả của việc phụ thuộc dữ liệu
– Mỗi chương trình truy xuất được phát triển cố định cho một cấu trúc dữ liệu bên dưới
Trang 61.2 Cách tiếp cận cơ sở dữ liệu
Dữ liệu độc lập với chương trình
Dữ liệu được quản lý tập trung
Dữ liệu được chia sẻ cho nhiều ứng dụng
Dữ liệu được đảm bảo an toàn
Trang 71.3 Định nghĩa Cơ sở dữ liệu
Cơ sở dữ liệu là tập hợp dữ liệu được tổ chức theo một cấu trúc chặt chẽ nhằm phục vụ (chia sẻ) cho nhiều mục tiêu khác nhau một cách có chọn lọc
Ví dụ:
– Cơ sở dữ liệu nhân viên– Cơ sở dữ liệu hàng hóa– Cơ sở dữ liệu khách hàng– ….v.v
Hệ cơ sở dữ liệu gồm 4 thành phần: CSDL, Người sử dụng, Phần mềm, Phần cứng
Trang 81.4 Hệ quản trị cơ sở dữ liệu
Định nghĩa
– Hệ quản trị cơ sở dữ liệu (DBMS – Database Management System) là hệ thống phần mềm cung cấp công cụ để xây dựng CSDL, thao tác trên CSDL và
kiểm soát việc truy xuất trên CSDL
Ví dụ:
– Microsoft Access– Microsoft SQL-Server– Oracle
– DB2
Trang 91.5 Kiến trúc 3 lớp của CSDL
Trang 101.5 Kiến trúc 3 lớp của CSDL (tt)
Mức vật lý (Physical Level)
– Dữ liệu gì và được lưu trữ như thế nào ? ở đâu (đĩa từ,băng từ, track, sector … nào) ? Cần các chỉ mục gì ?– Việc truy xuất là tuần tự (Sequential Access) hayngẫu nhiên (Random Access) đối với từng loại dữliệu
– Những người hiểu và làm việc với CSDL tại mức này làngười quản trị CSDL (Administrator), những người sửdụng (NSD) chuyên môn
Trang 111.5 Kiến trúc 3 lớp của CSDL (tt)
Mức quan niệm (Conceptual/Logical Level)
– Giải quyết cho câu hỏi CSDL cần phải lưu giữ baonhiêu loại dữ liệu ? Đó là những dữ liệu gì ? Mốiquan hệ giữa các loại dữ liệu này như thế nào ?
– CSDL mức quan niệm là sự biểu diễn trừu tượngCSDL mức vật lý CSDL mức vật lý là sự cài đặt cụ thểcủa CSDL mức quan niệm
Mức ngoài (External Level)
– Là mức dành cho người sử dụng (cương trình ứngdụng) làm việc
– Cung cấp các "khung nhìn" (View) để tùy theo đóngười sử dụng được "nhìn thấy" cái gì của CSDL
Trang 121.5 Kiến trúc 3 lớp của CSDL (tt)
Sno FName LName Age Salary Staff_no LName Bno
Staff_No FName LName DOB Salary Branch_No
Trang 13Các mức nhìn (levels)
Mức khung nhìn/ngoài: là các góc nhìn khác nhau
của các nhóm người sử dụng về CSDL Mỗi nhóm
người dùng có một góc nhìn (view) khác nhau về
Trang 141.6 Độc lập dữ liệu
Độc lập logic:
– Các thay đổi lược đồ quan niệm (thêm/xóa thực thể) thì không làm ảnh hưởng tới lược đồ ngoài hay phải viết lại chương trình ứng dụng
Độc lập vật lý:
– Các thay đổi của lược đồ vật lý (vd: thay đổi cách thức
tổ chức dữ liệu) không làm thay đổi lược đồ quan niệm
Trang 151.6 Độc lập dữ liệu (tt)
External Schemea
External Schemea
External Schemea
Conceptual Schemea
Internal Schemea
External/Conceptual
mapping
Logical data independence
Physical data independence Conceptual/Internal
mapping
Trang 161.7 Mô hình dữ liệu
Định nghĩa mô hình dữ liệu:
– Là mô hình trừu tượng dùng để mô tả dữ liệu vàphương thức (phép toán) truy xuất dữ liệu
– Có nhiều loại mô hình dữ liệu khác nhau (để mô tả dữliệu trong CSDL), mỗi loại đực trưng cho một cách tiếpcận khác nhau của các nhà phân tích
Các loại mô hình dữ liệu
– Mô hình phân cấp (Hierarchical model)– Mô hình mạng (network model)
– Mô hình quan hệ (relation model)
– Mô hình thực thể liên kết (entity–relatiship model)
Trang 19Ví dụ mô hình quan hệ
SVien
MaSV Ten Lop Nganh
Hoc
MaSV MaHP DiemLT DiemTH
HPhan
MaHP SLuong MaMH
MHoc
MaMH TenMH Khoa TinChi
DKien
MaMH MaMHTruoc
Trang 20Ví dụ mô hình hướng đối tượng
SVien
Ten Lop Nganh
LapTKB() InBangDiem()
Diem
DiemTH DiemLT DiemPrj SuaDiem()
HPhan
Ten SLuong 0 *
0 *
Trang 21VD mô hình Entity-Relationship (ER)
MaMH Khoa TenMH
(0,n)
Hocky Gvien Nam
MaHP
Trang 22Mô hình hóa nhiều cấp
Thực tế
Mô hình quan
niệm -- Độc lập với mô hình dữ liệuĐộc lập với DBMS
Mô hình Lôgic - Phụ thuộc mô hình dữ liệu
- Phụ thuộc DBMS Codasyl Relationnel Object XML
- Tổ chức vật lý của dữ liệu
Trang 23Kiến trúc chung DBMS
Application programs
Queries Database
schema
DML preprocessor
Query preprocessor
DDL Compiler
Program Object code
Database manager
Dictionary manager
Access methods File manager
System buffers Database and
system catalog
DBMS
Trang 24Các chức năng của DBMS
Lưu trữ, tìm kiếm, cập nhật
Quản trị siêu cơ sở dữ liệu (Meta Databases/Catalog)
Hỗ trợ giao tác
Xử lý truy xuất đồng thời
Đảm bảo an toàn dữ liệu
Xử lý khôi phục sau sự cố
Quản lý lưu trữ vật lý
Trang 25Các vai trò trong CSDL
Quản trị dữ liệu (DA)
Quản trị Cơ sở dữ liệu (DBA)
Thiết kế CSDL (Database design)
Lập trình viên ứng dụng
Người sử dụng
Trang 26Ưu điểm của DBMS
Kiểm soát sự dư thừa dữ liệu
Dữ liệu nhất quán
Có nhiều thông tin hơn từ cùng 1 khối lượng dữ liệu
Chia sẻ dữ liệu
Cải thiện tính nhất quán của dữ liệu
Cải tiến độ an toàn
Đạt được các yêu cầu về chuẩn hóa
Kinh tế hơn
Trang 27Ưu điểm của DBMS (tt)
Cân bằng các yêu cầu có tranh chấp
Khả năng truy xuất và đáp ứng được cải thiện
Khả năng sản xuất được cải thiện
Cải thiện việc bảo trì dữ liệu (do nó độc lập)
Tăng khả năng truy xuất đồng thời
Cải thiện dịch vụ sao lưu và khôi phục
Trang 28Nhược điểm của DBMS
Phức tạp
Tốn không gian lưu trữ
Tốn chi phí mua DBMS
Tốn chi phí cho phần cứng bổ sung thêm
Tốn chi phí chuyển đổi
Hiệu năng đôi khi bị giảm sút
Khả năng bị sự cố tăng