1. Trang chủ
  2. » Công Nghệ Thông Tin

Khái niệm hệ thống phân tán và cơ sở dữ liệu phân tán (CSDL phân tán)

22 653 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 22
Dung lượng 433,44 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Các thiết bị xử lý máy tính, CPU, máy in… Các chức năng chức năng của hệ thống có thể được phân tán và giao cho các phần cứng và phần mềm đảm nhận Dữ liệu được dùng bởi một số ứng dụng c

Trang 1

CHƯƠNG IKHÁI NIỆM HỆ THỐNG XỬ LÝ PHÂN TÁN

VÀ CƠ SỞ DỮ LIỆU PHÂN TÁN

PGS.NCVC.TS LÊ HUY THẬP

Trang 2

Quan hệ EMP

Elect Eng Syst Anal Mech.Eng Programmer Syst.Anal Elect.Eng Mech.Eng Syst Anal

J.Doe

M Smith A.Lee J.Mmith B.Casey L.Chu R.David J.Jones

E1 E2 E3 E4 E5 E6 E7 E8

TITLE ENAME

ENO

Quan hệ PAY

40000 34000 27000 24000

Montreal New York

150000 135000

Instrumentation Dabatase Develop

P1 P2

LOC BUDGET

PNAME PNO

12 24 6 10 48 18 24

Manager Analyst Analyst Consultant Engineer Programmer Manager

P1 P1 P2 P3 P4 P2 P2

PNO ENO

1

1 1

n

Title- Chuyên môn SAL: Salary-Lương Elect Eng Kỹ sư điện tử Syst Anal Nhà phân tích hệ thống Mech.Eng Kỹ sư cơ khí

Programmer Lập trình viên EMP: Employee-Nhân viê PAY: Payment- Trả lương Proj: Project-Dự án

ASG: assignment-Phân nhiệm Resp: responsibility-Trách nhiệm Manager: Người quản lý

Analyst: Nhà phân tích Consultant: Tư vấn Budget: Ngân sách

Trang 3

Quan hệ NhanVien

Kỹ sư điện Phân tích và thiết kế hệ thống

Kỹ sư cơ khí Lập trình viên Phân tích và thiết kế hệ thống

Kỹ sư điện

Kỹ sư cơ khí Phân tích và thiết kế hệ thống

Nguyễn Văn Bổng

Lê Hồng Ngoc Hoàng Trung Mã Trịnh Kim Thanh Ngô Đình Vinh Trần Mỹ Lệ

Lê Hồng Hạnh Nguyễn Trường Tam

NV1 NV2 NV3 NV4 NV5 NV6 NV7 NV8

TrinhDoCM TenNV

MaNV

Quan hệ TraLuong

4000 3400 2700 2400

12 24 6 10 48 18 24 48 36 40

Giám đốc Nhân viên phân tích và thiết kế Nhân viên phân tích và thiết kế Nhân viên tư vấn

Kỹ sư Lập trình viên Giám đốc Giám đốc

Kỹ sư Giám đốc

150000 135000 250000 310000

Thiết bị đo đạc Phát triển CSDL CAD/ CAM Bảo dưỡng

DA1 DA2 DA3 DA4

ViTri NganSac

h

TenDuAn MaD

uAn

n

1 n

1

n

Trang 4

Các thiết bị xử lý (máy tính, CPU, máy in…)

Các chức năng (chức năng của hệ thống có thể được phân tán và giao cho các phần cứng và phần mềm đảm nhận)

Dữ liệu (được dùng bởi một số ứng dụng có thể được phân tán cho một

Trang 5

4 Phân loại các hệ thống xử lý phân tán:

• Mức độ kết nối

• Sự liên đới giữa các thành phần

• Cấu trúc tương giao

• Cách đồng bộ hoá giữa các thành phần.

5 Tại sao phải phân tán

• Thích ứng tốt hơn cho việc phân bố rộng rãi của các công ty, xí

nghiệp, các cơ sở đào tạo,…

• Nhiều ứng dụng của công nghệ thông tin cần được phân tán

• Gải quyết được các bài toán lớn và phức tạp.

• Tận dụng sức mạnh tính toán bằng cách sử dụng nhiều đơn vị xử lý.

• Tận dụng hệ thống xử lý song song.

• Giải quyết bài toán theo từng nhóm hoạt động khá độc lập, nên có thể kiểm soát được chi phí phát triển phần mềm.

Trang 6

1.2 HỆ THỐNG ĐA BỘ XỬ LÝ VÀ HỆ CƠ SỞ DỮ LIỆU PHÂN TÁN 1.2.1 Hệ thống đa xử lý

Trang 7

2 Hệ đa bộ xử lí shared disk

Trang 8

Mạng Truyền DL

CSDL CSDL

CSDL

CSDL

Worstation 1 Worstation

5

Worstation 4

Worstation 3

Worstation 2

CSDL được phân tán trên mạng

Worstatio

n 5

Mạ

ng Tru yền DL

xử của chúng

Định nghĩa Hệ quản trị CSDL phân tán - DDB Management Sytem

(DDBM):

Trang 9

Nhận xét:

• DDBS không phải là tập các tập dữ liệu được lưu trữ riêng rẽ tại

các nút của mạng máy tính mà là các tập dữ liệu vừa liên đới

logic và vừa phải được truy xuất qua một giao diện chung.

• Phân bố vật lý không nhất thiết là các bộ xử lí phải cách xa nhau

về mặt địa lý mà thể ở trong cùng một máy, một phòng Tuy

nhiên việc giao tiếp giữa chúng được thực hiện trên mạng truyền dẫn

• Nếu tất cả CSDL nằm tại một nút mạng thì nó không phải là

DDBS, vì quản trị CSDL không khác với quản trị CSDL trong môi trường tập trung kiểu client/server.

• Nếu cơ sở dữ liệu được phân tán trên nhiều nút mạng, khi đó

CSDL sẽ là cơ sở dữ liệu phân tán.

Trang 10

1.3 CÁC YÊU CẦU VỀ HỆ CSDL PHÂN TÁN

Từ lý do xã hội và kinh tế xã hội phi tập trung, nên để có hiệu quả kinh tế người ta phân mảnh, phân tán và xử lý chúng tại các vị trí khác nhau

Ví dụ 1.3-1

Một công ty Máy tính, có các văn phòng ở Hà Nội , Hải Phòng, Nha Trang

và TP Hồ Chí Minh, có một số dự án được thực hiện tại các địa điểm đó,

và muốn dùng CSDL để quản lý nhân công, quản lý dự án và các dữ liệu liên quan khác Giả sử CSDL là CSDL quan hệ , được cho bởi các quan

hệ sau:

Bảng nhân viên NhanVien(MaNV, TenNV, TrinhDoCM)

Trong đó NhanVien là Nhân viên, MaNV là mã nhân viên, TenNV là tên nhân viên, TrinhDoCM là trình độ chuyên môn

Bảng dự án DuAn(MaDuAn, TenDuAn, NganSach)

Trong đó MaDuAn là mã số dự án; TenDuAn - Tên dự án và NganSach làngân sách dự án

Trang 11

Bảng phân nhiệm PhanNhiem (MaNV, MaDuAn, ThoiGianLV, ChucVu)

Trong đó PhanNhiem: giao nhân viên làm tại dự án, thời gian làm, với nhiệm

vụ, ThoiGianLV thời gian làm việc.ChucVu chức vụ

Nếu dữ liệu được lưu ở hệ CSDL tập trung và nếu muốn có danh sách tên và lương của các nhân viên đã làm dự án nào đó trên 12 tháng thìcâu lệnh truy vấn SQL sẽ là:

SELECT TenNV, Luong

FROM NhanVien, PhanNhiem , TraLuong

WHERE PhanNhiem.ThoiGianLV > 12 AND

NhanVien.MaNV = PhanNhiem.MaNV AND TraLuong.TrinhDoCM = NhanVien.TrinhDoCM

Các yêu cầu về phân mảnh, nhân bản và truy xuất vô hình

Yêu cầu nhân bản (Replication)

Do yêu cầu về hiệu quả và độ tin cậy cho CSDL nên một phần dữ liệu

đã được phân mảnh ở trên cần phải được lưu (bản sao) tại một số vị trí khác Quá trình này được gọi là nhân bản

Trang 12

CSDL được phân tán trên các nút mạng, nhưng người sử dụng vẫn có thể vấn tin như vấn tin trên CSDL tập trung tại điểm nút thực hiện truy vấn.

Vì công ty được phân tán các vị trí khác nhau như Hà Nội, Hải Phòng, Nha Trang và TP.Hồ Chí Minh, nên công ty muốn để dữ liệu về các nhân viên các dự

án của vị trí nào được lưu ở vị trí đó, do đó cần phải phân hoạch các quan hệ

Vô hình là cách cho ẩn đi những cái mà người sử dụng không cần quan tâm đến

Yêu cầu truy xuất vô hình

Trang 13

MỘT SỐ YÊU CẦU CỦA QUẢN TRỊ DỮ LIỆU PHÂN TÁN

1/ Mức độc lập dữ liệu logic Chương trình ứng dụng truy xuất vào một tập con thuộc tính của CSDL sẽ không bị ảnh hưởng nếu thêm hoặc bớt một số thuộc tính vào CSDL đã cho.

2/ Mức độc lập dữ liệu vật lý Người viết ứng dụng không cần quan tâm đến dữ liệu để ở đâu (ổ đĩa, hay băng từ, nút mạng,… nào) và cách truy xuất dữ liệu tuần tự hay ngẫu nhiên.

Yêu cầu độc lập dữ liệu

Độc lập dữ liệu là sự miễn nhiễm các tác động hay che đậy các chi

tiết về cấu trúc lưu trữ dữ liệu Đôc lập dữ liệu là dạng vô hình cơ

bàn đầu tiên của DDBMS.

Có hai mức độc lập dữ liệu:

trên mạng Vô hình liên kết mạng có thể chia thành hai loại:

+ Vô hình vị trí: Việc thực hiện một lệnh nào đó độc lập với vị trí

+ Vô hình đặt tên: Cần cung cấp một tên duy nhất trước cho mỗi đối

Yêu cầu vô hình liên kết mạng

Trang 14

1.Việc nhân bản sẽ làm tăng hiệu quả vì có thể làm giảm xung đột đường truyền khi truy cập vào cơ sở dữ liệu, giảm thời gian truyền

dữ liệu và tăng độ an toàn và bảo mật

2.Nếu một số máy lưu dữ liệu có "hỏng hóc" thì các máy khác có thể truy cập đến các nhân bản tại các máy khác,.…

Yêu cầu vô hình nhân bản

Vô hình nhân bản làm cho người sử dụng không thể biết họ đang làm việc với CSDL gốc hay với các bản sao

Ưu điểm vô hình nhân bản

1.Khi một nhân bản nào đó có sự thay đổi thì tất cả các bản khác phải được cập nhật

2.Nhân bao nhiêu bản

Nhược điểm vô hình nhân bản

Vô hình phân mảnh (Fragmentation transparency)

Trang 15

Người sử dụng chỉ biết dùng ngôn ngữ đã được cung cấp để giao tiếp với máy Mà không cần biết máy tính và chương trình dùng những ngôn ngữ nào khác nữa

Các hệ điều hành cung cấp vô hình cho người sử dụng hệ thống Ví

dụ các trình điều khiển thiết bị

3 Tầng quản trị CSDL

Vô hình ở tầng này là giải quyết sự tương tác giữa hệ điều hành và các DDBMS phân tán.

4 Tầng ngôn ngữ.

Người sử dụng có thể truy xuất đên hai dữ liệu dưới dạng trừu

tượng hóa cao Ví dụ: Nhờ giao diện đồ họa GUI, truy xuất bằng ngôn ngữ tự nhiên.

Trang 16

1 Khi cập nhật tăng lương cho tất cả các nhân viên Nếu có sự cố khi đang thực hiện câu truy vấn trên, DDBMS phải tự xác định nơi chương trình phải dừng lại, để khi trở lại nó phải biết nơi phải tiếp tục thực hiện.

2 Một người đang tính lương trung bình của các nhân viên trong khi mà các hoạt động cập nhật dữ liệu đang được tiến hành trên các mảnh vì thế kết quả tính trung bình trên có thể sai Vậy DDBMS phải có khả

Ví dụ

Trang 17

YÊU CẦU NÂNG CAO HIỆU NĂNG

Tăng hiệu năng của DDBMS cần dựa vào hai điều kiện:

1 DDBMS có khả năng phân mảnh CSDL mức khái niệm.

2 Ưu tiên dữ liệu lưu ở gần nơi sử dụng

Hai ưu điểm khi cục bộ hóa dữ liệu:

1 Mỗi trạm chỉ xử lý một phần CSDL, nên việc tranh chấp về CPU

và các dịch vụ I/O không nghiêm trọng như CSDL tập trung

2 Giảm độ trễ do truy xuất dữ liệu ở ngay nơi sử dụng mà không cần truy cập từ xa trong WAN phải qua: vệ tinh, viba,…

Tính chất song hành của các hệ phân tán có thể được tận dụng để thực hiện song hành liên vấn tin và nội vấn tin:

vấn tin Song hành nội vấn tin là tách một câu vấn tin thành các câu vấn tin con, mỗi câu sẽ được thực hiện tại một vị trí

Trang 18

Phức tạp

Phức tạp vì chúng có cả những vấn đề của môi trường tập trung mà còn

có cả hàng loạt những vấn để mới của phân tán

Chi phí cao

Tăng chi phí vì phải thêm thiết bị mới Phần chi phí đáng kế ở chỗ nó cần phải có các phần mềm và phương pháp truyền thông phức tạp hơn

Phần chi phí quan trọng nhất là chi phí về nhân lực Phải tăng thêm nhân

sự cho các hoạt động xứ lý dữ liệu tại các vị trí và công việc Vì thế cần phải phân tích giữa việc tăng lợi nhuận và chi phí về nhân sự

Khó khăn khi phân tán quyền điều khiển

Sự phân tán gây ra các vấn đề đồng bộ hóa và hiệp đồng Việc điều khiến phân tán có thể trở thành một gánh nặng nếu không có những chiến lược phùhợp để giải quyết chúng

Trang 19

2/ Dựa vào các chức năng

Các chức năng tạo ra một hệ thống phân cấp với các giao diện được xác định giữa các chức năng của các tầng khác nhau

3/ Dựa vào dữ liệu

Các kiểu dữ liệu khác nhau sẽ được định nghĩa và bộ khung kiến trúc được đặc tả để định nghĩa các đơn vị chức năng sẽ tiếp nhận hoặc sửdụng dữ liệu theo những góc độ khác nhau này: bởi vì dữ liệu là tài nguyên chính mà DDBMS cần quản lý, cách tiếp cận này rất được ưa chuộng đối với các hoạt động tiêu chuẩn hóa Ưu điểm của cách tiếp cận này là nội dung chủ chốt được đặt vào tài nguyên dữ liệu

Trang 20

1.5.2 Yêu cầu thiết kế mô hình kiến trúc hệ CSDL phân tán

Tự vận hành nói lên sự hoạt động độc lập của từng DDBMS tham gia vào

Du and Elmagarmid, 1989 mô tả các đặc tính tự vận hành như sau:

1 Tính tự trị thiết kế: Mỗi DDBMS đều tự do sử dụng các mô hình dữ liệu

và các kỹ thuật quản lý giao dịch thích hợp

2 Tính tự trị truyền thông: Mỗi DDBMS đều tự do quyết định xem loại thông

tin nào muốn cung cấp cho những DDBMS khác hoặc cho các phần mềm

Trang 21

4 Tính tích hợp chặt:

Chỉ tồn tại một hình ảnh duy nhất về hệ thống CSDL tuy rằng có nhiều cơ

sở dữ liệu tích hợp lại Trong hệ thống tích hợp chặt, một hệ quản trị dữliệu nắm quyền kiểm soát việc xử lý của các hệ quản trị dữ liệu cùng tham gia xử lý

5 Tính bán tự trị

Các DDBMS hoạt động độc lập nhưng cùng chia sẻ dữ liệu Mỗi DDBMS phải xác định được dữ liệu nào của riêng nó có thể chia sẻ Chúng không phải là hệ thống tự vận hành hoàn toàn vì chúng cần phải được sửa đổi lại để có thể trao đổi thông tin với các hệ thống khác

6 Tính đóng.

Những DDBMS cô lập, không biết có sự hiện diện của các DDBMS khác Trong hệ thống đóng, việc XL truy cập đến nhiều CSDL sẽ rất khó khăn vìkhông có sự kiểm soát toàn cục hoạt động của các DDBMS

7 Tính phân tán

Chúng ta khái quát thành 2 lớp: Client/Server và Peer To Peer

8 Tính đa chủng

Tính đa chủng liên quan đến dữ liệu, ngôn ngữ vấn tin và nghi thức quản

lý giao dịch Tính đa chủng là do dữ liệu được thể hiện bởi các công cụ,

Trang 22

1.5.3 Kiến trúc hệ quản trị CSDL phân tán

Hệ Client/Server

quản lý thiết bị,…

cả mọi việc như tối ưu hóa câu vấn tin, thực hiện truy vấn và trả lại kết quả cho Client

• Mỗi Client chỉ biết Server trực tiếp của mình, khi muốn giao tiếp với các Server khác nó phải thông qua Server trực tiếp của nó

Ngày đăng: 21/01/2016, 17:57

HÌNH ẢNH LIÊN QUAN

Bảng phân nhiệm PhanNhiem (MaNV, MaDuAn, ThoiGianLV, ChucVu) - Khái niệm hệ thống phân tán và cơ sở dữ liệu phân tán (CSDL phân tán)
Bảng ph ân nhiệm PhanNhiem (MaNV, MaDuAn, ThoiGianLV, ChucVu) (Trang 11)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w