1. Trang chủ
  2. » Luận Văn - Báo Cáo

Sự gắn bó thông tin trong các cơ sở dữ liệu phân tán

19 449 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 19
Dung lượng 339 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Hình 1: Xử lý tập tin truyền thông Một trong những động lực thúc đẩy việc sử dụng hệ cơ sở dữ liệu là nhu cầu tích hợp các dữ liệu hoạt tác của một xí nghiệp và cho phép truy xuất tập tr

Trang 1

BỘ GIÁO DỤC & ĐÀO TẠO TRƯỜNG ĐẠI HỌC ĐÀ NẴNG KHOA CÔNG NGHỆ THÔNG TIN

*************

BÁO CÁO TIỂU LUẬN

MÔN:HỆ PHÂN TÁN

Đề 2:

I LÝ THUYẾT:

Sự gắn bó thông tin trong các CSDL phân tán

II BÀI TẬP:

Cho một hệ thống CSDL phân tán bao gồm 5 files thường xuyên phải cập nhật

1 Mô hình hóa môi trường phân tán này bằng sơ đồ hoạt động

2 Xây dựng giải thuật cho phép, khi vận hành hệ, vẫn đảm bảo gắn bó

dữ liệu

GVHD : TS LÊ VĂN SƠN HVTH : TRỊNH SỬ TRƯỜNG THI

Lớp : KHMT K11

Trang 2

LỜI MỞ ĐẦU

Ngày nay, với sự phát triển rất nhanh của các lĩnh vực trong khoa học công nghệ, đặc biệt là Công nghệ thông tin, năng lực các thiết bị tin học được cải tiến và nâng cao từng ngày “vòng đời” các bộ vi xử lý, thiết bị nhớ rút ngắn chỉ còn từ 6 tháng đến 1 năm và chi phí giảm xuống đáng kể Do

đó, thiết bị tin học xuất hiện hầu như mọi nơi - từ văn phòng, nơi vị giám đốc công ty cập nhật thông tin hàng ngày của các thị trường trên thế giới đến vùng quê xa xôi, nơi anh nông dân rao bán nông sản của mình qua WEB, và thông qua nó người ta có thể trao đổi thông tin với khối lượng lớn, khoảng cách xa nhờ hệ thống truyền thông

Trên thực tế, một xu hướng kỹ thuật mới ra đời, xu hướng phân tán các thành phần tạo nên hệ tin học theo hướng tiếp cận nơi sử dụng và sản xuất thông tin Nhưng để sử dụng hệ thống có hiệu quả và tối ưu vấn đề phải quan tâm hàng đầu đó là tài nguyên và chiến lược khai thác

Giả sử trong một Hệ kinh doanh từ xa (HKDTX), Một khác hàng ở tại

A đề nghị mua hàng hoá H tại B và C Anh ta có thể nhận được lời chấp nhận với số lượng hàng hoá và giá cụ thể, nhưng không có hoặc không đủ tại

B và C Bởi vì, trong khi truy cập để báo cho khách thì số lượng này cũng vừa được cập nhật, khách nhận được thông tin mà trên thực tế không còn tồn tại nữa

Như vậy, vấn đề cần quan tâm là độ tin cậy của thông tin Thông tin là đúng tại thời điểm máy phục vụ đọc nó, nhưng có thể sai khi khách hàng nhận được Điều này liên quan đến việc làm tươi thông tin trong cơ sở dữ liệu Nói một cách tổng quát là cần phải có những giải pháp hữu hiệu cho việc truy cập đồng thời vào dữ liệu dùng chung

Trang 3

Trong nội dung tiểu luận này em trình bày về sự gắn bó thông tin trong

cơ sở dữ liệu phân tán, gồm hai phần:

Phần I: Lý thuyết.

- Trình bày các khái quát về cơ sở dữ liệu phân tán Các mô hình thiết kế cơ sở dữ liệu phân tán Ưu nhược điểm của cơ sở

dữ liệu phân tán

- Sự gắn bó thông tin trong cơ sở dữ liệu phân tán

Phần II: Bài tập.

- Mô hình hóa môi trường phân tán bằng sơ đồ hoạt động của 5

cơ sở dữ liệu phân tán thường xuyên phải cập nhật (số lượng cập nhật đủ lơn)

- Xây dựng giải pháp khi vận hành vẫn đảm bảo gắn bó dữ liệu Xin chân thành cảm ơn thầy TS Lê Văn Sơn đã cung cấp kiến thức và tài liệu để em thực hiện tiểu luận này

Rất mong nhận được sự góp ý của thầy và các anh chị, các bạn đồng nghiệp

Trang 4

CHƯƠNG I:

GIỚI THIỆU CƠ SỞ DỮ LIỆU PHÂN TÁN

I GIỚI THIỆU CƠ SỞ DỮ LIỆU PHÂN TÁN

I.1 Giới thiệu

Công nghệ về các hệ cơ sở dữ liệu phân tán (distributed database system, DDBS) là sự hợp nhất của hai hướng tiếp cận đối với quá trình xử lý

dữ liệu: Công nghệ cơ sở dữ liệu và công nghệ mạng máy tính Các hệ cơ sở

dữ liệu chuyển từ mô thức xử lý dữ liệu, trong đó mỗi ứng dụng định nghĩa

và duy trì dữ liệu của riêng chúng sang mô thức quản lý và xử lý dữ liệu tập trung Hướng đi này dẫn đến tính độc lập dữ liệu, nghĩa là các ứng dụng được miễn nhiệm đối với những thay đổi về tổ chức lôgic hoặc vật lý của dữ liệu và ngược lại

Hình 1: Xử lý tập tin truyền thông

Một trong những động lực thúc đẩy việc sử dụng hệ cơ sở dữ liệu là nhu cầu tích hợp các dữ liệu hoạt tác của một xí nghiệp và cho phép truy xuất tập trung, nhờ vậy có thể điều khiển được các truy xuất đến dữ liệu, còn công nghệ mạng đi ngược lại với mọi nổ lực tập trung hóa Nhìn thoáng qua chúng

ta khó hình dung ra làm cách nào tiếp cận hai hướng trái ngược nhau để cho

CHƯƠNG TRÌNH 1

Mô tả dữ liệu

CHƯƠNG TRÌNH 2

Mô tả dữ liệu

CHƯƠNG TRÌNH 3

Mô tả dữ liệu

TẬP TIN 1

TẬP TIN 2 TẬP TIN 3

Trang 5

ra một công nghệ mạnh mẽ và nhiều hứa hẹn hơn so với từng công nghệ riêng lẻ Mấu chốt của vấn đề là cần phải hiểu rằng, mục tiêu quan trọng nhất của công nghệ cơ sở dữ liệu là sự tích hợp không phải sự tập trung hóa, cũng cần phải hiểu rằng hai thuật ngữ có được điều này không dẫn đến điều kia

Và vẫn có thể tích hợp mà không cần tập trung hóa Đây chính là mục tiêu của công nghệ cơ sở dữ liệu phân tán

Hình 2: Xử lý cơ sở dữ liệu

I.2 Định nghĩa cơ sở dữ liệu phân tán

Chúng ta có thể định nghĩa một cơ sở dữ liệu phân tán là một tập nhiều

cơ sở dữ liệu có liên đới lôgic và được phân bố trên một mạng máy tính Vậy

hệ quản trị cơ sở dữ liệu phân tán được định nghĩa là một hệ thống phần mềm cho phép quản trị các hệ cơ sở dữ liệu phân tán và làm cho việc phân tán trở nên “vô hình” đối với người sử dụng Hai thuật ngữ quan trọng trong định nghĩa này là “liên đới lôgic’ và “phân bố trên một mạng máy tính” Một hệ cơ sở dữ liệu phân tán (distributed database system, viết tắt là DDBS) không phải là một “tập các tập tin” lưu riêng lẻ tại mỗi nút của một mạng máy tính Để tạo ra một hệ cơ sở dữ liệu phân tán, các tập tin không những có liên đới lôgic mà chúng còn phải có cấu trúc và được truy xuất qua một giao diện chung

Ngoài ra, một hệ cơ sở dữ liệu phân tán không phải là hệ thống trong đó dù có sự hiện diện của một mạng máy tính,

cơ sở dữ liệu chỉ nằm tại một nút của mạng Trong trường hợp này, vấn đề quản trị cơ sở dữ liệu không khác với việc quản trị cơ sở dữ liệu trong hệ tập trung Cơ sở dữ liệu này

được quản lý tập trung tại một hệ thống máy tính (Hình 3) và

tất cả mọi yêu cầu đều chuyển đến vị trí đó Điều cần xem xét là độ chậm trễ khi truyền dữ liệu Hiển nhiên là sự tồn tại

CHƯƠNG TRÌNH 1

CHƯƠNG TRÌNH 1

CHƯƠNG TRÌNH 1

Mô tả dữ liệu Thao tác dữ liệu

….

CƠ SỞ

DỮ LIỆU

Trang 6

của một mạng máy tính hoặc một tập các tập tin không đủ

để tạo ra một hệ cơ sở dữ liệu phân tán Điều chúng ta quan tâm là một môi trường trong đó dữ liệu được phân tán trên một số vị trí

Hình 3: Kiến trúc CSDL tập trung

Hình 4: Kiến trúc CSDL phân tán

Trạm 1

Trạm 1

Trạm 3

Trạm 3

Trạm 4

Trạm 4

Trạm 5

Trạm

2

Trạm 2

Mạng truyền dữ liệu

Trạm 1

Trạm 1

Trạm 3

Trạm 3

Trạm 4

Trạm 4

Trạm 5

Trạm

5

Trạm 2

Trạm 2

Mạng truyền dữ liệu

Trang 7

Trong hệ thống cơ sở dữ liệu phân tán, cơ sở dữ liệu chứa trong vài máy tính Các máy tính liên lạc với nhau qua nhiều phương tiện truyền thông, như đường truyền tốc độ cao hay đường điện thoại Chúng không chia sẻ bộ nhớ chính, cũng không dùng chung đồng hồ

Các bộ xử lý trong hệ thống phân tán có kích cỡ và chức năng khác nhau Chúng có thể gồm các bộ vi xử lý, trạm làm việc, máy tính mini, hay

các máy tính lớn vạn năng Những bộ xử lý này được gọi tên là các trạm,

nút, máy tính và cả những tên tùy theo ngữ cảnh riêng.

Trong hệ thống cơ sở dữ liệu phân tán gồm nhiều trạm, mỗi trạm có thể khai thác các giao thức truy nhập dữ liệu trên nhiều trạm khác Sự khác nhau chính giữa hệ thống cơ sở dữ liệu phân tán và tập trung là: trong hệ thống tập trung, dữ liệu lưu trữ tại chỗ, còn phân tán thì không

IV THIẾT KẾ CÁC CƠ SỞ DỮ LIỆU PHÂN TÁN

Phần này tập trung vào các thiết kế dùng cho cơ sở dữ liệu phân tán Giả

sử quan hệ R được lưu trữ trong cơ sở dữ liệu Có vài lý do yêu cầu lưu quan

hệ này trong hệ thống phân tán

- Các bản sao Hệ thống bảo trì vài bản sao như nhau của quan hệ Mỗi

quan hệ được lưu tại một trạm

- Các phần nhỏ Quan hệ tách thành các phần nhỏ Mỗi phần được lưu

trên một trạm

- Bản sao và phần nhỏ Đây là hình thức tổ hợp của hai dạng vừa nêu.

Quan hệ tách thành nhiều phần Hệ thống có nhiều bản sao của mỗi phần, trên các trạm khác nhau

Bản sao dữ liệu

Nếu quan hệ R được sao lại, một bản sao của R được lưu trong hai hay nhiều trạm Trong trường hợp cực đoan, tại mỗi trạm đều có một bản sao Một vài ưu điểm và nhược điểm của việc sao này

- Tính sẵn sàng Nếu một trạm chứa quan hệ R bị hư, quan hệ R có thể

được tìm trên trạm khác Do vậy, hệ thống cần tiếp tục câu hỏi về quan hệ R

dù xảy ra hư hỏng trên một trạm

Trang 8

- Tính song song tăng lên Trong trường hợp đa số truy nhập quan hệ R

chỉ là đọc dữ liệu, một vài trạm yêu cầu R có thể xử lý song song Càng nhiều bản sao càng tăng khả năng sẵn sàng của dữ liệu Hơn nữa, việc tăng các bản sao làm giảm số lượng thông tin cần truyền giữa các trạm

- Phức tạp tăng lên khi tiến hành cập nhật Hệ thống cần đảm bảo tất

cả các bản sao của quan hệ R là chặt chẽ, tức thỏa mãn các điều kiện toàn vẹn, trừ khi xảy ra sai sót Điều này có nghĩa khi một bản sao được cập nhật, phép xử lý này cần được thực hiện trên tất cả các trạm có chứa bản sao của

R Chẳng hạn trong hệ thống ngân hàng, khi tài khoản có trên các trạm, số lượng tiền của tài khoản này trên các trạm phải như nhau

Nhìn chung, việc dùng các bản sao làm tăng hiệu quả của phép đọc, tăng tính sẵn sàng trong giao tác đọc dữ liệu Vấn đề điều khiển các phép cập nhật tương tranh của những giao thức trong trường hợp dữ liệu có các bản sao trong hệ thống phân tán là phức tạp hơn việc điều khiển trong hệ thống tập trung Việc quản lý có thể được đơn giản hóa bằng cách chọn ra một bản

sao gọi là bản sao sơ cấp của quan hệ R.

Ví dụ: Trong hệ thống ngân hàng, một tài khoản gắn với trạm mà tài

khoản đó yêu cầu mở Tại trạm này, tài khoản có dữ liệu như bản sao sơ cấp Trong hệ thống đặt chỗ máy bay, dữ liệu gắn với chuyến bay tại trạm mà chuyến bay xuất phát sẽ được xem là bản sao sơ cấp

Trang 9

CHƯƠNG II:

SỰ GẮN BÓ THÔNG TIN TRONG CƠ SỞ DỮ LIỆU PHÂN

TÁN

I CÁC ĐIỀU KIỆN GIẢ ĐỊNH VÀ THỰC TẾ

Ta có một tập thông tin nào đó có thể được truy cập bởi một tập các tiến trình Số lượng các thông tin có thể truy cập được và các tiến trình có nhu cầu thông tin là con số cố định

Hệ này phát triển rời rạc theo thời gian giữa các điểm quan sát, ta có thể nhận biết được trạng thái thực của chúng, có nghĩa là các đối tượng và ngữ cảnh thực hiện các tiến trình,

hệ kiểu như vậy hoạt động với độ ổn định tuyệt vời

Các điều kiện giả định này so với hệ thực tế có những điểm khác nhau

cơ bản sau đây:

1

- Các đối tượng và các tiến trình có thể

- Được tạo lập và huỷ bỏ có tính chất động trong suốt quá trình tồn tại của hệ

2

- Các đối tượng và các tiến trình có thể được phân tán trên các trạm khác nhau liên hệ với nhau qua hệ thống viễn thông Do vậy, ta

không thể xác định trạng thái thời điểm của hệ vì lí do độ trễ đường truyền giữa các trạm và tính không tương thích giữa các điểm quan sát trong trạm đó

3 - Hệ thống viễn thông và các tiến trình là các đối tượng có thể xảy ra

sự cố kỹ thuật

Trang 10

II TÁC ĐỘNG VÀ GIAO DỊCH

Các đối tượng khác nhau của hệ không phải là các đối tượng độc lập nhau, chúng quan hệ với nhau bởi tập hợp các quan hệ gọi là các ràng buộc toàn vẹn Các ràng buộc này thể hiện sâu sắc các đặc tính riêng biệt của hệ Trạng thái của hệ thoả mãn một tập các ràng buộc toàn vẹn gọi là trạng thái gắn bó

Các nhà thiết kế và vận hành hệ mong muốn rằng việc thực hiện các tiến trình phải duy trì cho được hệ trong trạng thái gắn bó Để chính xác hoá đặc tính này, cần phải lưu ý là trạng thái của hệ chỉ được xác định ở mức quan sát cho trước

Ta quan tâm đến hai mức quan sát:

- Tiến trình là một dãy thực hiện các giao dịch Giao dịch đó là chương trình duy nhất được thực hiện từ một trạng thái gắn bó dẫn hệ đến một trạng thái gắn bó khác

2 Hệ thống

- Mỗi giao dịch được cấu tạo từ nột dãy các tác động được thể hiện như sau Nếu 2 tác động A và B thuộc hai giao dịch khác nhau được thực hiện bởi hai tiến trình thì hiệu ứng tổng quát của chúng sẽ là hiệu ứng của dãy (A;B) hoặc là (B;A)

Cho một tập hợp giao dịch M={T1,T2…,Tn} lần lượt được thực hiện bởi các tiến trình độc lập p1,p2…,pn việc thực hiện tuần tự có nghĩa là thực hiện tất cả các giao dịch của M theo kiểu nối đuôi nhau và tuân thủ một trật tự nào đó Sự gắn bó của hệ được bảo toàn

Ở mức hệ thống, ta có thể nói rằng các tác động là phần tử nhỏ nhất

không thể chia cắt được nữa Nếu vì lý do hiệu quả, nhiều giao dịch được

thực hiện song song thì sự gắn bó không còn đảm bảo được nữa Một yêu cầu khác nữa rất quan trọng là trong quá trình thực hiện hệ phải đảm bảo

cho các tác động không bị ngắt quãng.

Trang 11

IV QUẢN LÝ GẮN BÓ CÁC GIAO DỊCH

Bây giờ ta hãy xem xét một hệ, trong đó các đối tượng được phân tán trên nhiều trạm, không có bản sao mỗi đối tượng chỉ tồn tại có một bản duy nhất Một giao dịch Tj có thể tham chiếu đến các đối tượng nằm trên các trạm khác nhau và do vậy gồm nhiều tác động thực hiện trên nhiều trạm Như vậy ta phải xác định trên một trạm Si một tiến trình Pji với nhiệm vụ thực hiện các tác động giao dịch Tj trên Si, các tác động được thực hiện trên các trạm khác nhau có thể tiến hành theo kiểu song song

Các phương pháp để quản lý gắn bó các giao dịch như: Phương pháp dự phòng để chống bế tắc, phương pháp dựa vào việc hạn chế các khả năng diễn

ra bằng cách phát hiện bế tắc có tính chất động, điều đó dẫn đến hủy bỏ các giao dịch

V CÁC THUẬT TOÁN ĐẢM BẢO SỰ GẮN BÓ THÔNG TIN TRONG CƠ SỞ DỮ LIỆU PHÂN TÁN.

- Thuật toán duy trì sự gắn bó tránh bế tắc và thiếu thốn

Nguyên lý:

1 Then cài ngầm định

2 Phát hiện các xung đột

3 Khẳng định

- Thuật toán quản lý nhiều bản sao

+ Thuật toán đảm bảo sự gắn bó yếu nhờ dấu

+ Thuật toán đảm bảo sự gắn bó yếu nhờ bộ tuần tự tuần hoàn + Thuật toán đảm bảo sự gắn bó mạnh

Trang 12

PHẦN BÀI TẬP

Cho một hệ cơ sở dữ liệu phân tán gồm 5 file luôn thường xuyên cập nhật thông tin

- Vẽ sơ đồ hoạt động để hệ hoạt động gắn bó thông tin

- Xây dựng thuật toán đối với hệ thống trên

I SƠ ĐỒ HOẠT ĐỘNG CỦA 5 FILE DỮ LIỆU HOẠT ĐỘNG ĐẢM BẢO GÁN BÓ THÔNG TIN.

Như vậy, ở một thời điểm To nào đó có một thao tác nào xảy ra tại phía người dùng thứ nhất tại vị trí 1 để đọc, ghi dữ liệu tại một trạm bất kỳ nào đó

thì trạm đó sẽ gửi một acknowledge đến một trạm kế tiếp nếu các giao dịch thành công thì trạm này sẽ gửi trả lời một confirm để xác nhận giao dịch này

để đảm bảo gán bó thông tin trong cơ sở dữ liệu phân tán, và các trạm còn lại cũng sẽ có các giao dịch tương tự như vậy trong mạng dưới Nếu có một sự

cố nào đó xảy ra thì tính nhất quán về mặt dữ liệu sẽ không còn và như vậy vấn đề gắn bó dữ liệu trong hệ sẽ không còn

Trang 13

Mạng truyền

dữ liệu (mạng viễn thông)

Trạm 2 Trạm 1

Trạm 4 Trạm 5

To

Confirm

USER

2 T

o

CSDL 4

CSDL 5

CSDL 1

CSDL 2 USER 1

Trang 14

Hình 6: Sơ đồ hoạt động của hệ gồm 5 cơ sở dữ liệu phân

tán.

II THUẬT TOÁN

Giải thuật duy trì sự gắn bó thông tin đối với hệ trên theo phương pháp tránh bế tắc và thiếu thốn dựa trên nguyên lý sau

Bước 1: Then cài ngầm định.

Bộ điều khiển cục bộ trên mỗi trạm Si áp đặt cho các tác động khác nhau trên trạm và diễn biến theo một trật tự hoá hợp thức Để làm được việc đó cần phải ngăn chặn giao dịch

Tj hay nói cách khác là tiến trình Pji mà tiến trình này đang thực hiện trên Si Tất cả diễn ra trên một đối tượng được cài then bởi một giao dịch sử dụng theo kiểu chia sẻ trước khi đọc, theo kiểu loại trừ trước khi ghi Tất cả mở then chỉ diễn

ra sau khi xong một giao dịch

Bước 2: Xác định động các xung đột.

Hành vi xung đột truy cập vào đối tượng khi có hai giao dịch cố gắng thực hiện các tác động không tương thích vào một đối tượng này Một xung đột được xác định khi có ý định truy cập bởi một giao dịch T2 vào một đối tượng đã khoá ngầm định bởi giao dịch T1 theo kiểu không tương thích Không nên để T2 chờ cho đến khi T1 kết thúc mà phải huỷ bỏ một trong hai giao dịch này

Bước 3: Khẳng định.

Như đã trình bày như trên, toàn bộ giao dịch theo hệ số

ưu tiên có thể bị huỷ bỏ, nên cần phải áp dụng có hệ thống một kỹ thuật khẳng định Mỗi khi giao dịch được huỷ bỏ thì tất cả các đối tượng mà nó đã được cài then thì được mở then, và tất cả các giá trị thay đổi phải được khôi phục trở lại như cũ Trong trường hợp này chỉ có các phép ghi được thực hiện trên các bản sao đối tượng Nếu giao dịch bị huỷ thì một thông điệp được gửi đi cho tất cả các trạm chứa các đối tượng thay đổi và các bản sao bị huỷ bỏ Trường hợp ngược lại, giao dịch kết thúc bình thường thì một thông điệp khẳng

Ngày đăng: 23/03/2015, 18:44

HÌNH ẢNH LIÊN QUAN

Hình 1: Xử lý tập tin truyền thông - Sự gắn bó thông tin trong các cơ sở dữ liệu phân tán
Hình 1 Xử lý tập tin truyền thông (Trang 4)
Hình 2: Xử lý cơ sở dữ liệu - Sự gắn bó thông tin trong các cơ sở dữ liệu phân tán
Hình 2 Xử lý cơ sở dữ liệu (Trang 5)
Hình 4: Kiến trúc CSDL phân tán - Sự gắn bó thông tin trong các cơ sở dữ liệu phân tán
Hình 4 Kiến trúc CSDL phân tán (Trang 6)
Hình 3: Kiến trúc CSDL tập trung - Sự gắn bó thông tin trong các cơ sở dữ liệu phân tán
Hình 3 Kiến trúc CSDL tập trung (Trang 6)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w