Phân biệt rõ ràng giữa một hệ thống các file dữ liệu cổ điểnvới một cơ sở dữ liệu được tổ chức một cách có hệ thống, có cấu trúc trong môi trường làm việc nhiều người sử dụng... • Quản t
Trang 1Nhập môn Cơ sở Dữ liệu
Phần 1: Giới thiệu về CSDL
Trang 2Phân biệt rõ ràng giữa một hệ thống các file dữ liệu cổ điển
với một cơ sở dữ liệu được tổ chức một cách có hệ thống, có
cấu trúc trong môi trường làm việc nhiều người sử dụng
Trang 3Dẫn nhập
Người sử dụng
Hệ thống giao diện
Hệ thống
xử lý
Hệ thống lưu trữ
Máy móc, thiết bị
Phần mềm
Trang 4Tại sao cần phải có một CSDL
• Hệ thống tập tin cổ điển:
• triển khai ứng dụng nhanh
• có khả năng đáp ứng nhanh chóng, kịp thời.
Trang 5Ví dụ về hệ thống tập tin cổ điển
Trang 6• Tập tin và thư mục tập tin – File, file folder
Trang 7• Quản trị Dữ liệu của hệ thống tập tin cổ điển
tạp
Nhược điểm hệ thống tập tin cổ điển
Trang 8• Phụ thuộc dữ liệu
• Phụ thuộc cấu trúc
Nhược điểm hệ thống tập tin cổ điển
Trang 9• Định nghĩa trường và cách đặt tên
Nhược điểm hệ thống tập tin cổ điển
Trang 10Nhược điểm hệ thống tập tin cổ điển
• Lãng phí công sức nhập liệu và không gian lưu trữ.
• Những dị thường về dữ liệu - data anomalies
– Khi sửa đổi – Khi thêm – Khi xóa
• Dữ liệu không nhất quán - Data inconsistency
Trang 11Tại sao cần phải có một CSDL
• Chúng ta cần gì
Trang 12• Dữ liệu - Data
• Công ty Robcor có hai chi nhánh và hai chi nhánh này lần lược có 1,380,456 và 1,453,907 hóa đơn.
• Mỗi hóa đơn có mã hóa đơn, ngày hóa đơn, và số lượng
• Giai đoạn xem xét là từ quý 1 năm 1997 tới quý 1 năm
3000124 12-Jan-2002 $121.98
Data
Trang 13• Thông tin - Information
Trang 14• Dữ liệu hợp thành thông tin
• Thông tin có được từ việc xử lý dữ liệu
• Thông tin lột tả ý nghĩa của dữ liệu
• Thông tin đúng đắng, kịp thời và đầy đủ là
mấu chốt để thực hiện những quyết định
• Quyết định đúng đắng là then chốt quyết định
sự sống còn của tổ chức
Trang 15Khái niệm về Cơ sở Dữ liệu
Cơ sở dữ liệu là một hệ thống các thông tin có
cấu trúc được lưu trữ trên các thiết bị lưu trữ
thông tin thứ cấp (như băng từ, đĩa từ ) để có
thể thỏa mãn yêu cầu khai thác thông tin đồng
trình ứng dụng với nhiều mục đích khác nhau
- CSDL phải là một tập hợp các thông tin mang tính hệ thống
chứ không phải là các thông tin rời rạc, không có mối quan hệ
với nhau
- Các thông tin này phải có cấu trúc và tập hợp các thông tin này
phải có khả năng đáp ứng các nhu cầu khai thác của nhiều người
sử dụng một cách đồng thời
Trang 16Sơ đồ tổng quát về một Cơ sở dữ liệu
Chương
trình ứng
dụng 1
Chương trình ứng dụng 2
Trang 17Ưu điểm của CSDL
nhất và do đó bảo đảm được tính nhất quán và
Trang 19Các vấn đề với cách tiếp cận CSDL
• Tính chủ quyền của dữ liệu
• Tính bảo mật và quyền khai thác thông tin của
người sử dụng
• Tranh chấp dữ liệu
• Đảm bảo dữ liệu khi có sự cố
Trang 20Vấn đề quản trị CSDL
• CSDL được chia sẻ, tích hợp giữa các cấu trúc
máy tính giữ các dữ liệu có liên quan:
Trang 21Hệ quản trị Cơ sở Dữ liệu
– Quản lý nội dung dữ liệu – Quản lý cấu trúc CSDL
– Cung cấp các công cụ để định nghĩa, tạo lập, khai thác và
xử lý dữ liệu: môi trường phát triển (đồ họa), ngôn ngữ truy vấn,…
– Kiểm soát truy cập dữ liệu, – …
• Cài đặt dựa trên một mô hình dữ liệu cụ thể.
• Một số hệ quản trị CSDL: Visual FoxPro, MicroSoft
Access, SQL-Server, DB2, Sybase, Paradox, Informix,
Oracle
Trang 22Tầm quan trọng của HQT CSDL
Trang 24Database vs File Systems
Trang 25Ba mức độ biểu diễn CSDL
•Mức vật lý ( Physical): Lưu trữ vật lý CSDL: dữ liệu gì và được
lưu trữ như thế nào? ở đâu (đĩa từ, băng từ, track, sector nào)? Cần các chỉ mục gì?
•Mức quan niệm (Conception hay Logical): CSDL cần phải lưu
giữ bao nhiêu loại dữ liệu? những dữ liệu gì? Mối quan hệ giữa các
loại dữ liệu?
CSDL mức quan niệm là một sự biểu diễn trừu tượng CSDL mức vật lý; và CSDL vật lý là sự cài đặt cụ thể của CSDL mức quan niệm.
CSDL theo một góc độ toàn bộ hay chỉ một phần hoặc chỉ là các
thông tin tổng hợp từ CSDL hiện có, do người quản trị hay chương
trình ứng dụng quy định Người sử dụng hay chương trình ứng dụng
có thể hoàn toàn không được biết về cấu trúc tổ chức lưu trữ thông
Trang 26Cấu trúc ngoài 1
Cấu trúc ngoài 1
Cấu trúc ngoài 2
Cấu trúc ngoài 2
Cấu trúc ngoài n
Cấu trúc ngoài n
Sơ đồ quan niệm (hoặc mức logic)
Môi trường thế giới thực
Được mô hình hoá thành
Sơ đồ vật lý cấu trúc vật lý
Sơ đồ vật lý cấu trúc vật lý
-CSDL
Trang 27Sơ đồ tổng quát của hệ quản trị CSDL
Trang 28Chương trình khai báo (mô tả)
cấu trúc
Chương trình ứng dụng A
Ngôn ngữ mô tả
dữ liệu
Ngôn ngữ thao tác dữ liệu
Các tự điển
Trang 29ứng dụng thông qua các tầng của CSDL
Trang 30Môi trường hệ thống CSDL
Trang 31Các mô hình CSDL
• Định nghĩa: tập hợp logical constructs dùng
để thể hiện cấu trúc của dữ liệu và các mối
Trang 32Các mô hình CSDL
Trang 33• Các loại quan hệ trong mô hình quan niệm
Trang 34xuống
– Mỗi nút cha có thể có nhiều nút con (được nối với nhau bằng đoạn thẳng)
– Mỗi nút con chỉ có một nút cha
– Thể hiện được mối quan hệ 1:M
Books (id, title)
Authors
Trang 35Mô hình dữ liệu phân cấp
Trang 36Mô hình dữ liệu phân cấp
traversal, hay hierarchical sequence
Final assembly->Component A->Assembly A->
-> Part A ->Part B -> Component B ->
Component C –Assembly B -> Part C ->Part D
Trang 37Mô hình dữ liệu phân cấp
mô hình dữ liệu phân cấp này
xuyên
Trang 38Mô hình dữ liệu phân cấp
Trang 39Mô hình dữ liệu phân cấp
Trang 40Mô hình dữ liệu mạng (NDBM)
• Mỗi record có thể có nhiều parents
• Network schema: tổ chức mức quan niệm của toàn CSDL
• Subschema: một phần của CSDL như thông tin cho các chương trình ứng dụng
• Database management language: định nghĩa các đặc tính
và cấu trúc của dữ liệu
– Schema Data definition language (DDL): định nghĩa các thành phần của schema
Trang 41Mô hình dữ liệu mạng
• Mỗi record có thể có nhiều parents
• Giới thiệu khái niệm bộ (set) để mô tả mối
Trang 42Mô hình dữ liệu mạng
Trang 43Mô hình dữ liệu mạng
Authors
Publishers
Trang 44Mô hình dữ liệu mạng
Trang 45Mô hình dữ liệu quan hệ (RDBM)
Trang 46Mô hình dữ liệu quan hệ
Trang 48Mô hình dữ liệu quan hệ
CSDL
Trang 49Mô hình dữ liệu quan hệ
Trang 50Model (ERDBM)
Trang 51• Được thể hiện trong entity relationship
Crow’s Foot ERD
• Dựa trên:
Trang 52Mô hình thực thể kết hợp
entity
relationship
connection
Trang 54relationships) – Không có ngôn ngữ tính toán dữ liệu (không hoàn chỉnh)
Trang 55Model (OODM)
– Attributes mô tả đặc tính – Tập hợp các objects giống nhau là một class, tương tự như entity set nhưng có chứa procedure methods
• Methods thể hiện các hành động của các class trong thế giới thực
• Classes được tổ chức theo một class hierarchy
– Sự kế thừa là khả năng một object có thể kế thừa inherit
Trang 56Mô hình dữ liệu hướng đối tượng
Trang 57Mô hình dữ liệu hướng đối tượng
Trang 58Mô hình dữ liệu hướng đối tượng
– Thêm vào nội dung ngữ nghĩa (semantic content) – Thể hiện trực quan gồm cả semantic content
– Thống nhất CSDL – Độc lập cả cấu trúc và dữ liệu
– Thiếu OODM – Truy cập dữ liệu điều hướng phức tạp – Kiến thức về OO
Trang 60Các mô hình CSDL và Internet
• Đặc tính của CSDL trong thời đại Internet