Các hệ thống dùng phương pháp xử lý tập tin tt • Tính dư thừa dữ liệu: – sự lặp đi lặp lại của những thông tin được lưu trữ lãng phí công sức dị thường dữ liệu.. • Tính dị thường k
Trang 1CƠ SỞ DỮ LIỆU
GV: ThS Lương Thị Ngọc Khánh
Email: ltnkhanh@it.tdt.edu.vn
Web: it.tdt.edu.vn/~ltnkhanh
Trang 3– Tuy nhiên, đối với các bài toán có nhu cầu xử lý
Trang 4Các hệ thống dùng phương pháp xử
lý tập tin (tt)
• Tính dư thừa dữ liệu:
– sự lặp đi lặp lại của những thông tin được lưu trữ lãng phí công sức dị thường dữ liệu
• Tính dị thường (không nhất quán):
– tại một thời điểm thông tin về cùng một đối tượng có thể khác nhau trên các tập tin khác nhau trong cùng một hệ thống thông tin (thường do dư thừa dữ liệu gây ra)
Trang 5Các hệ thống dùng phương pháp xử
lý tập tin (tt)
• Các vấn đề về tính nguyên tố của các giao tác:
– với tệp xử lý truyền thống khó có thể đảm bảo được tính chất “hoặc thực hiện hoàn toàn hoặc không thực hiện gì” và khó đưa được hệ thống trở về trạng thái nhất quán trước khi xảy ra sự cố
– Sự thiếu chia sẻ thông tin giữa các hệ thống và khó
mở rộng hệ thống hay kết nối với các hệ thống khác
• Các vấn đề toàn vẹn:
– khi có thêm những ràng buộc mới, khó thay đổi các
Trang 6Các hệ thống dùng phương pháp xử
lý tập tin (tt)
• Các dị thường của truy cập tương tranh:
– để tăng tính hiệu quả và trả lời nhanh hơn, nhiều hệ thống cho phép nhiều người dùng cập nhật dữ liệu đồng thời dữ liệu không nhất quán
• Tính không toàn vẹn, an toàn dữ liệu:
– Thể hiện sự không đầy đủ của các thông tin cần lưu trữ cho các mục đích yêu cầu của hệ thống thông tin
An toàn dữ liệu như các cơ chế bảo mật, phân cấp đối tượng sử dụng dữ liệu và cả việc sao lưu dữ liệu dự phòng
Để khắc phục và giải quyết được các vấn đề trên, buộc chúng ta phải thay đổi cách tiếp cận hệ thống tiếp cận CSDL
Trang 7Cơ sở dữ liệu - Khái niệm
• Cơ sở dữ liệu:
– Tập hợp có cấu trúc của thông tin, được lưu trữ trên các thiết bị trữ tin để có thể thỏa mãn yêu cầu khai thác thông tin đồng thời cho nhiều người sử dụng hay nhiều chương trình ứng dụng với các mục đích khác nhau
Trang 8Cơ sở dữ liệu - Khái niệm (tt)
• Ưu điểm:
– Về bản thân thông tin lưu trữ:
• Giảm thiểu sự trùng lắp thông tin đến mức thấp nhất,
do đó:
– Bảo đảm tính nhất quán – Tính toán vẹn của dữ liệu
• Đảm bảo DL có thể được truy xuất theo nhiều cách khác nhau
• Khả năng chia sẻ thông tin cho nhiều người sử dụng
và nhiều ứng dụng khác nhau
Trang 9Cơ sở dữ liệu - Khái niệm (tt)
• Ưu điểm: (tt)
– Về hiệu quả sử dụng thông tin:
• Chia sẻ thông tin cho nhiều người dùng khác nhau
• Tiết kiệm tài nguyên
• Tăng hiệu quả khai thác
Trang 10Cơ sở dữ liệu - Khái niệm (tt)
• Những vấn đề nảy sinh:
– Cần xác định rõ trách nhiệm đối với
• Sự an toàn của dữ liệu
• Tính chính xác của dữ liệu
– Ai có trách nhiệm cập nhật, chỉnh sửa – Những thông tin nào được phép sửa
– Cần một cơ chế bảo mật hay phân quyền khai thác thông tin
Trang 11Cơ sở dữ liệu - Khái niệm (tt)
• Những vấn đề nảy sinh: (tt)
– Giải quyết sự tranh chấp trong truy cập dữ liệu khi có nhiều người dùng cùng truy cập đến một nguồn dữ liệu
– CSDL cũng có chu kỳ sống tương tự phần mềm
đòi hỏi người phân tích, thiết kế có chuyên môn, nhiều kinh nghiệm
Trang 12– Mức logic (mức khái niệm):
– dữ liệu nào được lưu trữ trong CSDL và mối quan hệ giữa chúng
– Mức vật lý (mức trong):
– dữ liệu được thực sự lưu trữ như thế nào trong CSDL
Trang 13Kiến trúc ba mức của một hệ CSDL (tt)
Trang 14Lược đồ & thể hiện của CSDL
• Toàn bộ mô tả CSDL được gọi là lược đồ CSDL (database schema) Có 3 loại lược đồ tương ứng với kiến trúc 3 mức của hệ CSDL:
– Lược đồ ngoài (lược đồ con)
– Lược đồ logic
– Lược đồ vật lý
Trang 15Lược đồ & thể hiện của CSDL (tt)
MaNV Hodem Ten Tuoi Luong
Trang 16Lược đồ &thể hiện của CSDL (tt)
• Toàn bộ dữ liệu lưu trữ trong CSDL tại một
thời điểm nhất định được gọi là một thể
hiện của CSDL (database instance)
Nhiều thể hiện của CSDL có thể tương ứng với cùng một lược đồ CSDL
Trang 17Sự độc lập dữ liệu
• Sự độc lập dữ liệu (data independence)
– Các lược đồ ở mức trên không bị ảnh hưởng khi
có sự thay đổi các lược đồ ở mức dưới
• Có 2 loại độc lập dữ liệu:
– Độc lập dữ liệu vật lý
– Độc lập dữ liệu logic
Trang 18Sự độc lập dữ liệu (tt)
Trang 19Các đối tượng sử dụng CSDL
• Người sử dụng không chuyên về lĩnh vực tin học và CSDL:
– Csdl cần có các công cụ để những người này có thể sử dụng và khái thác csdl khi cần
• Chuyên viên tin học biết khai thác csdl:
– Những người này có thể xây dựng các ứng dụng khác nhau phục vụ cho nhiều mục đích khác nhau trên csdl
Trang 20Các đối tượng sử dụng CSDL (tt)
Trang 21• CSDL là một thành phần trong HQTCSDL
Trang 22Hệ quản trị CSDL (tt)
• Các chức năng của HQTCSDL
Một HQTCSDL phải có khả năng giải quyết tốt những vấn đề mà cách tổ chức CSDL đặt
– Quản lý dữ liệu ở mức xử lý tệp như một hệ điều hành
– Truy cập các khối lượng dữ liệu lớn có hiệu quả
Trang 23Hệ quản trị CSDL (tt)
• Các chức năng của HQTCSDL (tt)
– Cung cấp giao diện giữa users và CSDL; giữa CSDL với các hệ thống khác
– Cung cấp một số ngôn ngữ bậc cao
– Quản lý giao tác, phân quyền và an toàn dữ liệu – Điều khiển sự tương hợp, tính toàn vẹn
– Kiểm tra độ tin cậy của dữ liệu