Cơ sở dữ liệu phân tánTS.. Nội dung Dẫn nhập Kiến trúc của Hệ quản trị CSDL phân tán Thiết kế cơ sở dữ liệu phân tán Xử lý truy vấn phân tán Quản lý giao tác phân tán Quản lý
Trang 1Cơ sở dữ liệu phân tán
TS Hồ Bảo Quốc
Trang 2Nội dung
Dẫn nhập
Kiến trúc của Hệ quản trị CSDL phân tán
Thiết kế cơ sở dữ liệu phân tán
Xử lý truy vấn phân tán
Quản lý giao tác phân tán
Quản lý triuy xuất đồng thời
Trang 3Tài liệu tham khảo
Nguyên lý các hệ cơ sở dữ liệu phân tán
M Tamer Özsu, Patrick Valduriez
Biên dịch: Trần Đức Quang
Priciples of Distributed Database Systems
M Tamer ozsu, Patrick Valduriez
Database systems (Design, implementation, and management
Peter Rob, Carlos Coronel
An introduction to Database systems
C J Date
Trang 4Hệ thống phân tán
Một hệ thống phân tán là tập hợp các thành phần xử lý độc lập kết nối với nhau
thông qua mạng máy tính Mỗi thành phần thực hiện một nhiệm vụ xác định
Phân tán cái gì ?
Xử lý (Processing logic)
Chức năng (Function)
Dữ liệu (Data)
Điều khiển (Control)
Trang 5Hệ thống phân tán (tt.)
Phân loại hệ thống phân tán
Mức độ liên kết (coupling)
Cấu trúc kết nối (Interconnect structure)
Point to point
Common channel
Đồng bộ (Synchronization)
Đối xứng (synchronous)
Bất đối xứng (asynchonous)
Trang 6Hệ cơ sở dữ liệu phân tán
Trang 8Thận lợi của CSDL phân tán
Độ tin cậy cao hơn
Một thành phần co thể tồn tại nhiều nơi
Không bị ảnh hưởng khi một điểm bị sự cố
Xử lý giao tác phân tán sẽ bảo đảm tính nhất quán của dữ liệu tren CSDL
Nâng cao hiệu năng
Xử lý song song
Dễ dàng mở rộng hệ thống
Trong suốt về phân tán và nhân bản dữ liệu
Trang 9Tính trong suốt (Transparency)
Trong suốt về mạng
Trong suốt vị trí (location transparency)
Trong suốt việc xác định tên (naming transparency)
Trong suốt nhân bản (Replication)
Trong suốt phân mảnh (Fragmentation)
Trong suốt quản lý giao tác
Trong suốt xử lý đồng thời
Trong suốt xử lý sự cố
Trong suốt hiệu năng
Trang 10Bất lợi của CSDL phân tán
Độ phức tạp
Chi phí
An toàn
Khó điều khiển nhất quán
Thiếu chuẩn
Thiếu kinh nghiệm
Thiết kế CSDL phức tạp hơn
Trang 11Các vấn đề phải được nghiên cứu
Thiết kế cơ sở dữ liệu phân tán
Làm thế nào để phân mảnh dữ liệu ?
Phân ho ch d li u hay nhân b n d li u? ạ ữ ệ ả ữ ệ
Xử lý câu truy vấn phân tán
Thiết kế thuật toán phân tích câu truy vấn và chuyển nó thành chuổi các thao tác dữ liệu
Sự phân tán của dữ liệu, chi phí truyền…phải được xem xét
Tìm k t ho ch th c hi n t i u ế ạ ự ệ ố ư
Quản trị dữ liệu ngữ nghĩa (Distributed directory management)
Quản trị truy xuất đồng thời phân tán
Đồng bộ các truy xất đồng thời để bảo đảm tính nhất quán của CSDL
Tính nhất quán của các nhân bản
Quản lý khóa chết phân tán
Trang 12Các vấn đề phải được nghiên cứu (tt.)
Độ tin cậy
Làm th nào đ h th ng có tính ch u l i cao ế ể ệ ố ị ỗ
Tính nguyên t và b n v ng c a giao tác ố ề ữ ủ
Cơ sở dữ liệu không đồng nhất
Nếu có sự không đồng nhất về mô hình dữ liệu hay phương thức truy xuất giữa các vị trí thì cần có các cơ chể “dịch”