1. Trang chủ
  2. » Công Nghệ Thông Tin

Giáo trình hệ cơ sở dữ liệu phân tán và suy diễn phần 1 nguyễn văn huân, phạm việt bình

127 364 2

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 127
Dung lượng 4,14 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Ị tíiih độc lặp dừ liệu đưọc thể hiện: • Có rất nhiều cách nhin dữ liệu ỏ‘ mô hìnli ngoài, ngirò'1 sư dụng khác nhau có cách nhìn dữ liệu khác nhau và các hệ ứng dụng khác nhau có nhữii

Trang 1

N G U Y H N V ÃN I I U Â N - P I I ẠM V l ị n ' BÌ NH

GIÁO TRÌNH

HỆ C ơ SỞ DỮ LIỆU PHÂN TÁN VÀ SUY DIỄN

NHÀ X U Ấ T B Ả N K H O A H Ọ C V À K Ỹ T H U Ậ T

Hà Nội - 2Ỏ09

Trang 3

MỤC LỤC

C H Ư Ơ N G I G IỚ I T H IỆ U C H U N G VỀ c ơ s ở DỮ LTỆU 9

1.1.7.4 Kiến trúc hệ thống Server (Server System Architecture) 21

1.2.2.1 Phân biệt giữa các mô hình dữ liệu

Các hệ thống CSDL đối tượng và tri thức

25

1.2.3 Mô hình CSDL phân cấp (Hierarchy Data Model)

Cấu trúc biểu diễn dữ liệu phân cấp

25

1.2.4.2 Ngôn n^ữ dữ liệu thao tác trên CSDL mạng

Cách tiếp cận mô hình CSDL quan hệ

Trang 4

2.3 l.K Quá trinh thiết kế từ trên xuống (top-down) 48

2.5.3 Tính khả tuần tự của các lịch biểu và việc sử dụng chung 115

2.5.4.3 Thuật toán điều khiển tưcmg tranh bằng nhãn thời gian 123

Trang 5

C H Ư Ơ N G IV C ơ SỞ D ữ LIỆU H Ư Ở N G Đ Ó I TƯỢNG 145

5.1.5 Mô tả thiết kế hệ cơ sở dữ liệu phân tán cho hệ thống kế toán 172

5.2 THỰC HÀNH VỚI MỘT s ố THUẬT TOÁN ĐIỀU KHIÊN TƯƠNG 178 TRANH TRONG QUAN LÝ GIAO DỊCH PHÂN TÁN

Trang 7

phải tổ chức dữ liệu dưới dạng cơ sở dữ liệu Tinh độc lặp cúa dữ liệu thể hiện mỏ hinh kiến

trúc 3 mức Vì vậy có thể nói cơ sở dữ liệu phan ảnh tính trune thực, khách quan cúa thế giới dừ liệu Không dư thừa thông tin và cũng khỏng thiếu thông tin Nội dung cúa chương bao gồm các phần;

• C ơ sỡ dữ liệu là gi;

• Sự cần thiết của các hệ cơ sở dữ liệu;

• Mô hình kiến trúc 3 mức cư sờ dữ liệu;

• Mục tiẽi! của các hệ cơ sờ dừ liệu;

• Hệ quản trị CSDL & người quản trị CSDL:

• Tô chức lưu trữ dĩr liệu:

• C á c m ô hì nh t ruy x u ấ t

1.1.1 C ơ s ớ 'd ữ liệu là gi

C ơ sở dữ liệu là một bộ sưu tập rất lớn về các loại dữ liệu tác nghiệp, bao gồm các loại

dữ liệu âm thanh, tiếng nói, chữ viết, văn bán, đồ hoạ, hình anh tĩnh hay hình ánh động được

mã hoá dưới dạng các chuỗi bit và được lưu trữ dưới dạng File dừ liệu trong các bộ nhớ của

m ả y tính, c ấ u t rúc lưu t r ừ d ữ liệu t uân t heo các q u y lấc d ự a trên lý t h uy ếl t o án học C ơ s ớ d ữ

liệu phàn ảnh trung thực thế giới dữ liệu hiện thực khách quan

(V/ sư d ữ liệu Ic) íùi nguyên Ịhỏììịi^ tin dimịĩ^ ch im ^ cho nhịẻiỉ ngirờì: C ơ sở dừ liệu

(CSDL) là tài nguvẻn thông tin chiiim cho nhiều nụirời cùng sư dụng Bất kỳ ngiròi sử dụng nào trẻn mạng máy tính, tại các thiết bị đầu CLioi, vè ngiivên tấc có quyền truy nhập khai thác loàn

bộ hay một phần dừ liệu theo ché độ trực tuyến hay tương tác mà không phụ thuộc vào vị trí địa

lý c ủ a ngườ i s ử d ụ n g với các tài n g u yê n đó

Cơ sơ d ữ ìiệu dược các hệ ứng cỈỊữỉg khai fhúc hòrìg ĩiịĩ^ỏrì n g ữ con d ữ Hệii hoặc bằng cúc chương trình ím g dụng đế xử lý, tìm kiếm, tra cửu sửa đối, bồ sung hay loại bò dữ liệu

Tìm kiếm và tra cứu thông tin là một trong những chức năng quan trọng và phô biến nhất của

DBMS) là phần mềm điều khiến các chiến lược tmy nhập CSDL Khi ngiròi sư dụng đưa ra yêu cầu truy nhập bằng một ngôn ngữ con dữ liệu nào dó, HQTCSDL tiếp nhận và thực hiện các thao tác trẽn CSDL lưu trữ

Trang 8

Đối tiiựng nml'iièn ciVii cua C'SDl là các ílnrc thè và niối quan hệ giìm các thực thê Thực

the và mối quan lìệ uiữa CÍÍC lỉiục tlìc là hai dồi tirọnu kliñc Iihaii \ c căn ban Mối quan hệ giữa

các t hực thể c ù n g là một ỉoại thực tlìê dặc biệt T r o n g c ách ticp cận C'SÍ.)l q u a n hệ, imLiời ta d ụ a

trên cơ sờ lý thuyết íiại sồ quan hệ đè xâ\ dựng các quan hệ clìLiân klii két nối khôns tổn thất

thông tin và khi biểu diền dữ liệu là duy nhất Dữ liệu đưọc lưu trữ Irone bộ nhó' của máy tính không những phải tính đến yếu tố về tối ưu không ụian lưu trữ, mà phải đảm bao tính khách

quan, trung thực của dữ liệu hiện thực Nehĩa là phải đam bào tính nhắt quán ciia dữ liệu và iiiừ

được sụr toàn vẹn ciia dừ liệu

1.1.2 S ự c ầ n thiết ciia các hệ CO' sỏ' dù' iiệu

T ồ c h ứ c lưu t rữ d ữ liệu theo !y thuyết CO' SO' d ữ liệu cỏ n h ữ n g tru đ iểm;

Giám hớt đít' ílìừa ciữ liệu írong ỉini írừ: Trong các ứng dụng lập trinh truyền thống,

p h ư ơ n g p h á p t ố c h ứ c lưu trĩr CÌLÌ liệu vừa tốn kém, làng phí bộ nhcV và c á c t hiế t bị lưu trfi\ vừ a d ư

thừa thông tin lưu trữ Nhiều cluronii trìnli ứng dụnii khác nhau cùnu xứ Iv trẽn các dừ liệu như nhau, dẫn đến sự dư thừa đáng kẻ về dử liệu Ví dụ trong các bài loán nghiệp vụ quan Iv "Cưóc

thuê b a o đi ện t hoại " và "Doanh thu & sán lưọng" tiar nũ ứn g vôi moi Miột c h ư c i m trình ỉà một

hay nhiêu tệp dừ liệu được lưu trữ riẻim biệt, độc lặp vói nhau Trong cá 2 chưong trình cùng

xử lý một số thuộc tínli ciìa một cuộc đàm thoại như “số máy gọi di“", '^số máy gọi đến‘\ "hirớiìg cuộc gọi’\ “thời gian bất dau" và "thòi uian kết thúc" Nhiều thuộc tính đưọc mô tả và lưu trCr nhiều lần độc lập với nhau Neu tổ chức lưu trữ theo lý thuyết CSDL thì cỏ thề họp nhất các tệp lưu trữ cúa các bài toán trên, các chironu trinh ứng dụim có tlìẻ cùim chia sé tài nguyên trẻn cùng một liệ CSDL

Tố chức lim írữ dữ liệu Ịheo lý ihuyẻỊ CSDL sè írủnh (lirợc s ự khòỉĩiĩ nlìầí cỊuáỉì íroìiịị lưu tr ữ d ữ lỉệ ỵ vù bao dam dược íinh Ịoàỉi vẹj7 cua cỉữìiệu: Nếu một thuộc tính đirợc mô tả trong

nhiều tệp dữ liệu khác nhau và lặp lại nhiều lần trong các bán glii, klii thực hiện việc cập nhật, sửa đổi, bổ sung sề không sứa hốt nội dung các mục đó Nếu dCr liệu càng nhiều thì sự sai sót khi cập nhật, bổ sung càng lón Kha năng xuất hiện niâii thuẫn, không nhất quán thông tin càng nhiều, dẫn đến không nhất cỊuán (iữ liệu tronu lưu trữ Tất VCU kéo tiieo sự dị thường thôniỉ tin, thừa, thiếu và mâu thuẫn tliỏng tin

Thông thuửnt», trong một thực thẻ giữa các thuộc tínli có mối quan hệ ràng buộc lẫn nhau, tác động ảnh liưỏng lẫn nhau Cước của một cuộc đàm thoại phụ thuộc vào khoảng cách

và thời gian cuộc gọi, tức ià phụ tliLiôc hàm vào các thuộc tính máy gọi đi, máy gọi đến, thời

gian bắt đầu và thòi gian kết thúc cuộc gọi Các trinh ứng dụng khác nhau cùng xử lý cước đàm

thoại trên các thực thể lưu trữ tirong ứ m khác nhau chưa hãn cho cùng một kết quá về sán

lượng phút và doanh thu Điều này K giai tại sao trong một doanh nghiệp, cùng xử lý trẽn các chi tiêu quản lý mà số liệu báo cáo cua các phòng ban, các công ty con lại cho các kết quả khác nhau, thậm chí còn trái ngược nhau Như vậy, có thế khắng định, nếu d ữ liệu không tố chức

t h eo lý t h u y ế t c ơ s ở d ữ liệu, tất yếu không thể p hả n ảnh thế giới hiện t h ự c d ữ liệu, k h ô n g p hả n ảnh đ ú n g bả n c h ấ t vậ n động c ủa dữ liệu

S ự không nhcíí (Ịiián d ữ liêu Irong lim írữ làm c h o d ừ liệu mất đi tính l oàn vẹn CLiả nó

Tính toàn vẹn dữ liệu đám bao cho sự lưu trừ dừ liệu luôn liiòn đúng Khỏng thẻ có mã vùng

ngoài q u y đ ị n h c ủ a CO' quan quản lý hoặc ngàv sinh c ủa một nhân vi ên k h ô n g the xáy ra sau

n gà y tốt n g h i ệ p ra t rưòìig ciia nhân viên đó

Trang 9

Tỏ chức h m ỉrừ d ữ liệu theo /ý íhiỉyếí CSDL có ílỉê ĩriên khai ckmg ỉhờỉ nhiều tm g dim g irẽn củrìg m ội CSDL\ Điều nảy có nghĩa là các ứng dụní> không chỉ chia sẻ chung tài nguyên dữ

liệu mà còn trên cùng một C SD L có thê triển khai đòng thòi nhiều ứng d ụn g khác nhau tại các thiết bị đầu cuối khác nhau

Tó chức cỉìr Hệ li theo ìý íhiỉvêỉ cơ sa dừ Hệ li sẽ íhòng nhâí các íìẽu chiiârỉ, ihii tục VÍỊ cúc biện phcip hao vệ, an íoàrỉ d ữ ìíệií: Các hệ CSDL sè diro'C quán lý tập triing bỏi một ngirô'i hav

một nhóm người quản trị CSDL, bang các hệ quản trị CSDL Người quản trị C SD L có thể áp dụng thốHii nhất các tiêu chuẩn, quy định, thủ lục chung như quy định thống nhất về mẫu biểu báo cáo, thời gian bổ sung, cập nhật dir lỉệii Điều này làm dễ dàng cho công việc bao trì dCr liệu Người quản trị C S D L có thê bảo đảm việc truy nhập tới C S D U có thẽ kiêm tra, kiêm soát các quyên truy nhập của người sử dụng Ngăn chặn các triiv nhập trái phép, sai quy định từ trong ra hoặc từ ngoài vào

1.1.3 M ô h ìn h k iế n trú c tô n g q u á t CO’ sỏ' d ữ liệu 3 m ứ c

Mô hình kiến trúc 3 mức của hệ CSDL gôm: Mức trong, m ức mỏ hình d ữ liệu (Mức quan niệm) và m ức ĩigoài CúCra các mức tồn tại các ánh xạ quan niệm trong và ánh xạ quan

niệm ngoài Trung tâm của hệ thống là mức quan niệm, tức là mửe mô hỉnh dci‘ liệu Ngoài ra còn cỏ khái niệnì íigười sử dụng, hệ quán trị C'SDL và nmrỏi quản trị CSOL

N gưỏi s ư cÌỊitig: Là n h ữ n g ngiròi tại thiêt bị đáu CLiòi triiv n h ậ p v à o c á c hệ C S D L t heo

ché độ trực tuyến hay tương tác bằng các chương trình ứng dụng hay bằng các ngôn ngữ con dữ liệu Thưòng là các chuyên viên kỹ thuật tin học, có trình độ thành thạo biết lập trình và biết sử dụng ngôn ngữ con thao tác diì liệu (SQL Server, Oracle ) Nguời sứ dụng có thê truy nhập loàn bộ hay một phần C S D L mà họ qưan tâm, phụ thuộc vào qiivên tni> nhập của lìọ C'ách nhìn CSDL của người sử dụng nói cliung là trìu tiạrng Họ nhìn CSDL bằnu mò hinh ngoài; gọi là

mô hình con dừ liệu Chắng hạn ngưòi sử dụng là mộl nhản viẻn ciia phòng kế toán tài chính, chỉ nhin thấy tập các xuất hiện kiểu bản ghi ngoài về doanh thu, san lưọng trong tháng, không thể nlììn thấy các xuất hiện kiểu bán ghi lưu trữ về các chi tiêu kỹ thuật cua đ ườ ng thông, mạng lưói

Mỏ hình ngoài: Mô hình ngoài là nội dung íhỗng tin CLÌỄI CSDL dưới cách nhin của

ngLròi s ử dụng, l.à nội d u n g t h ò n g tin cua một phần d ữ liệu tác nghi ệp đ ư ọ c m ộ t n g ưò i h oặ e một

nhóm níiười sứ dụng quan tâiiì Nói cách khác, mô hình ngoài nìỏ la cách ỉihin dừ liệu cùa người

sử dụng và mỗi người sử dụng có cách nhìn dù' liệu khác nhau Nhiều mô hinh ngoài khác nhau

có thế cùng tồn tại trong một hệ CSDL, nghĩa là có nhiều ngưòi sư dụng chia sé chung cùng một

CO' s ở dĩr liệu H ơ n n ữ a , c ó t hế m ô hình ngoài q u a n hệ, mỏ hình ngoà i p h â n c ấ p hay m ô hình

ngoài kiểu mạng cùng có thế tồn tại trong một cơ sỏ’ dữ liệiL So' đồ ngoài không làm "hiệir' mà được nhúng vào trong logic một đon tác cỏ liên quan

• M ò hì nh n g o à i g ồ m nhi ều xuất hiện kiểu bản ghi ngoài, n gh ĩ a là m ỗ i m ộ t n g ư ò i sử

dụng có một sơ đồ dCr liệu riêng, một khung nhỉn dữ iiệu riêng Bán ghi ngoài cua người sử dụng có thể khác với bán ghi lưu trữ và bản ghi quan niệm

• Mỏ hinh ngoài dtroc xác dịnh bởi một sơ đồ ngoài bao gồm các mô tẳ về kiểu bản ghi ngoài như rên các trirờiig kiểu dQ' liệu các trirờng, độ rộng của trường

• N g ô n n g ữ c o n dữ liệu của ngLrời sử d ụ n g t hao tác trẽn các bản ghi ng oà i

Trang 10

• Người s ử d ụ n g k h ác n h a u c ó k h u n g n hi n do liệu khác nhau.

• Người sử dụng đầu cuối có thề lả các ừng dụng liav thao tác trực tiếp bànu ngôn ngữ thao tác, truy vấn dữ iiệii

Mô hhih d ữ liệu (mỏ hình quan ìiiệm}: Mô hình quan niệm là cách nhìn dữ liệu mộí

cách tổng quát của người sử dụng Nghĩa là có rất nhiều cách nhìn dữ liệu ò’ mô hình ngoài, nhưng chỉ có duy nhất một cách nhiiì dũ' liệu ớ mức quan niệm Biểu diền toàn bộ thông tin trong CSDL là duy nhất

• Mò hinh dữ liệu gồm nhiều xuầl hiện cua nhiều kiểu ban ụhi dử liệu Ví dụ kiểu \uất

hiện bản ghi về nhân sụ\ kiếii xuất hiện bán ghi về doanh thu, san lượng, kiểu XLiấì hiện ban lỉhi

về cưởc đàm thoại

• M ô hi nh d ữ liệu đ ư ợ c xác đ ị n h bỏi m ộ t SO' đồ dũ' liệu m ô tả c ủ a nhi ều kiếu thực thể,

chẳng hạn nlur mô tả thực thể tuyến cáp, các loại cáp, thầy giáo, học sinh Sơ đồ diì liệu bao gồm các định nghĩa về các kiểu bản ghi, đó là các ràng buộc cho quyền và tính toàn vẹn tliích họp Những ràng buộc này chính là các tính chất của dù liệu, lính liên két các thuộc tính củnu một kiểu dữ liệu Các định nghĩa này không bao hàm về cấu trúc lưu trữ, cùng như về chiến lược truy nhập, cíuìng chỉ là các định nghĩa về nội dung thông tin, về tính độc lập của dữ liệu trong mô hinh quan niệm

không ồn định thi các ứng dụng và mỏ hình ngoài củng không ôn định So’ đồ dũ' liệu chi đuọc thay đối k l ứ c ó sự điều chinh trong the giói thực, đòi hói điều chinh lại định nghĩa sao cho nó phản ảnh thế giới hiện thực khách quan hon, chân lý ho‘n

• Thiết kế mô hình dữ liệu là giai đoạn quan trọng và quyết dịnh trong việc thiết kế vàcài đặt các hệ cơ sớ d ữ liệu Quá trình íliiết kế không phụ thuộc quá nhiều vào cấu trúc lưu trừ vật lý và chiến lược truy nhập cũa dữ liệu Như vặv việc thiểt ké SO' đồ dữ liệu phải đưục lien

h à nh đ ộ c lập với việc t hiết kế SO' đồ t r o n g và c ác s ơ dồ ngoài liên kế u vì neu k h ỏ n g việc thicl kc

sẽ k h ô n g ổn đ ị n h và t h ư ờ n g x u y ê n phái \eiTi xét lại lác đ ộ n g t lur ònu x uyê n đ é n nhi ều ihành

phần khác cúa hệ thống

• Với cách thiết kế truyền thống hiện nay, ngưòi thiết kế chi cung cấp một-số sơ đồ trong và một tập các sơ đồ ngoài và họ coi đó là sơ đồ dfr liệu, là mỏ hình dữ liệu Vì vặy tỉnh

k h ô n g ổn đ ịnh hệ t hống, lính k h ô n g phù h ọ p vói c ác ửnii (ÌỊiiig nay sinh sau mộl thòi gian hoại

động Mâu thuần và dị thưòng thòng tin sè \ â y ra Vi phạm tính ít)àn vẹn cua dữ liệu

• Ngoài các định nghĩa về xuất hiện nlìiềii kiêu ban ghỉ quan niệm, sơ đồ dữ liệu còn chứa các định nghĩa về quyền truy nhập cúa ngiiửi sứ dụng, các thư tục kiêm tra tính đúng đan của dữ liệu nhằm bảo đàm tính toàn vẹn của CSDL Các luồng lưu chuyến tliông tin, quy định

Trang 11

End user 1 Application

Prosrammer

Programmer

Hinh 1.1. Ki^n tn ic h? c o s d dG li?u.

Mo hinh trong-. M o hinh trong mo hinh lim trii v$t ly dft lifu Chi c6 duy nhat mpt chi mOt cach bieu dien CSDL dudi d^iig luu trff v$t ly Mo hinh trong 1^ c^ch bilu diln c a sd d(i li§u triu tugmg ¿r mure thdp nhat.

• Mo hinh trong g6m nhilu xuat hifn cua nhieu l(ilu ban ghi luru trQ* du< 7c xdc djnh b^i mpt so do trong Thong tin bieu diln trong m6 hinh trong \h duy nhat.

• S o do trong bao gom cac djnh nghTa mo hinh trong Khong chi xac djnh c^c Icieu khdc nhau cua ban ghi imi trO' ma c6n xac djnh ro svr ton t^i cua cdc chi dan, cdch s4p x^p cac b ^ ghi theo thur t\r nao N o xdc djnh dii lifu luu trii truy nh§p nhu the nao thong qua cdc ducmg din truy nh^p tai d& Ii?u.

Anh xg quart ni$m trong dugc xdc djnh giCta mo hinh trong mo hinh dii li?u nhSm bao dam tinh dpc l?lp ciia dii li|u Neu cau true luru trii cua CSDL thay doi, nghTa la thay doi djnh ngliTa ve cau true liru trtt dii li?u thi dnh x?i nay eung phdi thay d6i tuong umg sao cho so

do quan ni$m (mo hinh d a li^u) khong thay doi.

Anh xg quan ni^m ngoai: La anh dugc xac djnh tuong umg mpt - mOt gitta mo hinh ngoai cua nguoi sur dyng vdri mo hinh dff li^u.

Trang 12

1 1 4 M ụ c tỉê u ciía các hệ co sò dữ liệu

Người sử dụng khi thao lác trên các cơ sỏ- dù’ liệu khòim đirọ'c làm thav đối cấu trúc lưu trữ dữ liệu và chiến lưọc tĩ'uy nhập tói các hộ co sỏ dữ liệu Dữ liệu chi đưọc biểu diễn, mô ta

một cách duy nhất, c ấ i i triic luu trữ dữ liệu và các hệ c hưoim trình írniỉ dụ\m trẽn các hệ CSDL

hoàn toàn độc lập với nhau, khỏnu phụ lluiộc lần nhau Vi vậv bào đám tính độc lập dữ liệu là mục tiêu quan trọng CIUI các hệ CO' SO’ dữ liệu C’ó thê dịnh n g iiĩa tính độc lặp dử liỘLi Jả "Tíỉỉlỉ hầí

hiỏn cu a cá c hộ ih ỉg ch/nyỉ; íló i vói sự ilhiy (lòi /ro ỉig câu ír ủ c hrif Ịr ữ Ví/ chiên luực ím y nhúp dừ

ì ì ệ u \

Khi thay đối cấu trúc lưu trữ và các chiến lược truy nhập dữ liệu khõng kéo theo thav đồi nội dung cùa các c hưonu trình ứng ciụn» và ngưọc lại, khi các c hương trình thay đối cLinụ không làm ảnh hiròng đẻn CÍUI trúc lưu trữ và chiên lưọc truy nhập của dũ' liệu Tính độc lập CLÌa

dữ liệu bảo đảm cho việc biêu diẽn nội dung thòng tin cho các thực thê là duy nhát và bao đam tính toàn vẹn và nhất quán dữ liệu troim lưu trữ

Tr ong các mô hình dữ liệu như mỏ hinli dữ liệu quan hệ, mô hinh dữ liệu phân câp và

mô hình dữ liệu mạng thì mỏ hình dừ liệu quan hệ đưọc sử dụntỉ phổ biến và được nhiều người quan tâm nghiẻii cứu Vì nó có nhiều ưu điếm CO' bản hon so vói các mô hinh dũ' liệu khác Dữ liệu trong mô hỉnh quan hệ đưọc biêu diễn chặt chẽ logic Mô tá thế giới hiện thực một cách chính xác, khách quan, phù họp vói cách nhìn và sư dụng cua người sứ dụng, Vì vặv tính độc lập dừ liệu trong các hệ CO' S0‘ dừ liệu quan hệ cao

Tr ong kiến trúc lìệ cơ so dù' liệu (hình 1 Ị ) tíiih độc lặp dừ liệu đưọc thể hiện:

• Có rất nhiều cách nhin dữ liệu ỏ‘ mô hìnli ngoài, ngirò'1 sư dụng khác nhau có cách

nhìn dữ liệu khác nhau và các hệ ứng dụng khác nhau có nhữiig cách nhìn dữ liệu cùng khác

nhau, n h ư n g chỉ có duy nhất một cách nhin clữ liệu ó' mức quan niệm, biểu diễn toàn bộ nội dung thông tin trong CSDL đó là cách nhin dù' liệu tông quát của Iiiiuời sử dụng Và cùng chí có duy n h ấ t một và chí một cách biêu dien ( ’Sí)l clưỏi dạng lưu trữ vặt lý

• Ảnh x ạ ín m ^ íịịỊỊịì ị\ì\ị\ niô ỉlinll trong và mô hì nh dữ liệu, nhằm bảo đám đưọc

tính độc lập cua dữ liệu, nghía là m u cấu trúc lưu trữ cua C S D L thay đổi, tức là thay đối địnli

nghĩa về cấu trúc liru trữ dữ liệu thì ánh \ ạ này cùng phải thay đổi tưưng ứng sao cho sơ dồ quan niệm (niô hinh dũ' liệu) không dtiực thay đối, Tương tự ánh xạ ngoài xác định tương ứng giừa một mô hinh của người sư dụim nào đó với mò hình d ữ liệu Nó chuyên đỏi dạng biẻii diên dCr liệu lưu trữ sang dạng biêu diễn dù liệu nià các ứng dụng cần đẻn

Cảc hệ ứng dLl^^ kliác Iiliau có nhiều khung nhìn khác nhau vói dữ liệu như nhau Các

hệ ứng dụng độc lập vó‘i cấu trúc lưu trữ và chiến lược truy nhập Giữa chúng không có sự ràng buộc lẫn với nhau Điều này có nghĩa là các hệ ừng dụng hoàn toàn độc lập với bất cử một cấu trúc lưu trữ và chiến lược tniy nhập dừ liệu cụ thể nào Ngược lại cấu trúc lưu trữ và chiến lượctruy nhập dữ liệu không phụ thuộc vào bấl kỳ hệ ừng dụng cụ thể nào

Người quán trị CSF)L phái có kha năng đáp ímg vói mọi sự thay đối về cấu trúc lưu trữ

và các chiến lược truy nháp mà không cằn biết tới có lìlùrng hệ ừng dụng nào trên CSDL

Trang 13

N gư ờ i Lập trình N hà Q uản trị

CỌiao d i ệ l r ^ úmg dụng^ dụnfu^ v ^ c ụ câu hòỊ ^ /^'cíĩữơng trìĩĩĩrN /'""'BQCong N quàn tiỊ_ _ ^ Bộ c ô n g ^ ^

Quản lý bộ nhở

H ình 1.2. S ơ đ ồ k iến trúc hệ tìiống cơ sở dữ liệu

1.1.5 Hệ quản trị CSDL & người quản trị CSDL

Hệ quàn trị CSDL DBMS (DataBase Management System) là hệ thống phần mềm điều

khiển toàn bộ các chiến lược truy nhập và cấu trúc lưu trữ cơ sở dữ liệu Các chức năng chủ yếu

cùa một hệ quản frị cơ sở dữ liệu:

- Mô tả dữ liệu tạo lập và duy trì sự tồn tại của CSDL;

- Cho phép fruy xuất vào CSDL theo thẩm quyền đã được cấp;

Trang 14

- C ậ p nhật, c h è n llỉiéim loại bo hay sưa đỏi dừ liệu m ứ c tệp;

- Đảm bảo an toàn , bao mật dữ liệu và tính toàn vẹn dữ liệu;

- Tạo cấu tríic dữ 1 iệiu ĩư ơ m ửnu vói mò hinh dữ liệu;

- Đ ả m b ả o t í n h đ ộ c ỉlập dữ liệu Tức là câu trúc lưu t r ữ dCr liệu đ ộ c lập vó'i c á c trình ứng

dụng dữ liệu:

- Tạo mối liên kếl giữa các thục íhẽ:

- Cung câp các phưo"nL> tiện sao lưu, phục hỏi (backup, recoverv):

- Đ i ề u khi ển tir ơng tirainli:

Các bước thực hiệiì! cua hệ quan trị CSDL có thẻ tóm tẳl như sau;

- N g ư ờ i s ử d ụ n g diLia ra vêu cầu iriiv nhập bầntí i môn imCr c o n d ữ ỉiệii;

- DBMS sẽ t:iép nhặn và phân lích vẻLi cầu;

- DBMS xein xét S.Ơ đổ ngoái, ánh xạ ngoài, sơ đồ quan niệm, ánh xạ trong, ;

- Thực hiện các thao tảc trên CSDL lưu trCr

Các thành phần cúia một hệ ỌTCSDL: Một hệ Ọ TC S D L thòng thường có các thành

phần c hí nh n h ư sau:

- N g ô n n g ữ đ ị n h nglìiĩaì ciiì liệu (Dala Definition L a n m ia g e) ;

- Ngôn ngữ thao tảc dữ liệu (Data Manipulalion Language);

- Ngôn ngữ truy vấn diữ liệu (Query Language);

- Bộ b á o c á o ( R e p o i t Write);

- Bộ đ ồ h o ạ (iGraplhics (ìenerator):

- Bộ g i a o t i ế p íigôn rìgiì chu ( Ị losi L angua ge liUcrface):

- Ngôn ngữ t-hu tục (Procedure l.anguage):

- T ừ điển dir liệu;

- Bộ p h á t siiiih Íniíỉ d ụnu

Người qiiũìi Iirị (\S'/D£ ỉlà inộl Iigiiời hay một nhóm Uíịườị c ó kha n ă n g c h ư y é n m ô n cao

về c ô n g n g h ệ tin họ)C có xrấch inhiệm quan lý và đi ều khiển t oàn bộ hoạt đ ộ n g c u a các hệ C'SDL

Vì vậy người quản trị CSDL cền phái đặt ra các hình thức, quv định cho người sư dụng nhàm ngăn chặn việc truy !nhập tírải phép vào các hệ CSDL Người quán trị C S D L có thế cho phép

người s ử d ụ n g nhCirng quyể n truy nhập như chỉ đư ợc p h é p đ ọc , đ ọ c m ộ t ph ầ n, c ó thế sưa, bồ

s u ng một phần

NịỊĩrới cỊiỉam I’rị ( 'SDÌL củ ỈÌÌỘỊ sồ nlỉiợỉĩì VỊỈ chinh:

- Xác địnlh Ịthực tỉhc; v à nội dung thõn^i tin cần lưu trử Xá c đ ị nh SO' đ ồ q u a n niệm đá pứng yêiu tcầii truv nỉhập cua Iigirỏi sứ dụng

- Quyết địịnllì cấu tnúc lưu trù và chiến lưọc truy nhập; Người quán trị C S D L phải xácđịnh cáiclii tliửc biiều diễn dữ liệu như niỏ tả cấu trúc lưu trữ trong, mô tà cấu trúc lưu

Trang 15

trữ vật lý X á c đ ị n h m ô h ìn h diì liệiK định n e h ĩ a á n h xạ giìra c ấu trúc lưu trù’ và SO'

đồ ngoài.Thục hiện các chiến lược lưu trừ quan lý hệ thống

- Ngtròi quán trị C SD L phai tạo môi triròim ” iao tiép giữa ngưòi sử dụng vói các hệCSÍ3L, vỉ sơ đồ ngoài cho ngưòi sử dụng là cách nhìn d ữ liệu tương ứng vói ngôn ngCr con d ữ liệu thích hợp, nẻn ngưòi quản trị C SD L phái c ung cấp sơ đồ quan niệm, các ánh xạ, và cấu trúc lưii trữ Kiếm soát thấm quyền truy nhập của người sử

dụng và bảo đảm quvền tm v nhập của họ.

ĩ)uv tri các tiêu chtiân thòng nhàt vẻ các thu tục lưu trữ và cầu trúc lưu trù\ biẻii diễn

thòng tin và các chiến lược truy nhập Kiểm soát và kiểm tra tính đúng đần của cliT

liệu Á p d ụ n g c á c bi ện p h á p an toàn, an ninh d ữ liệu

- Xác định chien lược lưu trừ, sao chép, phục hồi trong các trưòng hợp hư hòng dosai sót, hoặc trục trặc kv thuật

1.1.6 R à n g b u ộ c d ữ liệu

Giừa các thực thê dữ liệu tồn tại các mối quan hệ, ràng buộc lẫn nhau Các ràng buộc

này c hí nh là t ậ p c á c q u y t ấc, q u y đ ị n h y êu c ầu d ữ liệu t r o n g CO' s ở d ữ liệu phải thoá mãn Mục

đích xây dựng các ràng buộc d ữ liệu là nhằm bảo đảm tính độc lập và tính toàn vẹn dừ liệu Dữ liệu lưu trữ trong c ơ sớ d ữ liệu luôn liiỏn hiện thực khách quan, không thừa thiếu thông tin,

k h ô n g máu t hu ẫn t h ô n g tin C á c hệ c ơ s ơ d ữ liệu c ầ n phai c ó c ác CO' c h ế c h o vi ệc m ỏ tá các ràng

buộc và quản lÝ các rànti buộc đâ đưọc mô ta

Có rất nhiều loại ràng buộc Ràng buộc về kiêu, ràng buộc giải tích, ràng buộc logic

đó là các khái n i ệ m v ề p h ụ t h u ộ c h à m , phụ t h uộ c đa trị, p h ụ t h u ộ c kế t nối

Rcwg hiỉộc kĩêir Loại ràng buộc thấp nhắt, mỏ tả tính chất cúa các thuộc tính khi tạo

lặp (' SDL Ngoài tên CLÌa thuộc tính, thuộc tính đó kiẹii gi, chuồi ký tự, kiểu số, kiều ngày, kiểu logic và độ dài là bao nhiêu Ví dụ thuộc tính “ Sổ điện thoại" là kiểu chuỗi ký tự đúng bằng 7

ký tự Irong xâu Hệ thống sẽ không chấp nhận, neu nhập vào C SD L một số điện thoại kiếu so hoặc kiểu xáu nhirng chưa đủ hoặc vượt quá 7 ký tự Phán ừng cúa hệ thống hoặc là đưa ra thông báo ''Dù' liệu không hợp lệ” , hoặc cắt đi những ký tự thừa

Rùng hiíộc g ia i [¡ch: Là những ràng buộc giữa các thuộc tính được biểu diềiì bằng các

biểu thức toán học Ví dụ khi nhập “ số lirợng" và '"đtyn giả" của một mặt hàng, hệ thống sẽ tự

đ ộ n g tính giá trị cLÌa t h u ộ c tính “ t h à n h tiền" t heo c ô n g t h ứ c "‘số l ư ọ n g " nhân với " đ ư n g i á" b àng

"thành tièn" Hoặc đánh giá năng lực học tập cua Iiìộl em học sinh, khi nhập giá trị “điếm trung binh" cua từng em vào hệ thống , hệ thống tự độn g đánh giá em đỏ có năng lực học tập là

"kém", ' I ru n g b i n h ' \ hay "giỏi"

Ràỉiịĩ buộc logic: Mối quan hệ giCra các thuộc tính với nhau không phái là các ràng buộc

giải tích, được gọi là phụ thuộc hàm Thuộc tính Y phụ thuộc hàm vào thuộc tính X, nghĩa là

mồi một giá trị c u a X xá c đ ị n h gi á trị c ua Y Ví d ụ nếu giá trị c ủ a số đi ện t hoại có thế xá c định

các thông tin vê tliuc bao cỏ sỏ điện thoại đó Nhiìng ràng buộc logic cỏ thé là ánh \ ạ một

Trang 16

L 1 7 , C á c m ô h ìn h tr u y x u ấ t d ữ liệu

Truy nhập và khai thác các hệ cơ sỏ' dữ liệu trỏ‘ thành phuo’ng thức phố biến t r o n g các

ứng dụng của hệ thống tin học, đặc biệt trên các mạng Internet/Intranet Chuyên tài t h ô n g tin từ các hệ cơ sỏ' dữ liệu lên mạng dưới dạng ngôn ngCr đánh dấu siêu văn bàn HTML (HvperText Markup Language) hoặc bàng các ngôn ngữ khác nhằm cung cấp cho dịch vụ World Wide Web

đa dạng và phong phú thêm Truy nhập và khai thác các hệ cơ SO' dữ liệu đòi hòi phai nghiên cứu, giải quyết một số vấn đ ề về kỹ thuật lập trình mạ ng , lập trình CO’ sỏ’ dữ liệu đ ộ n g trên các

môi trường Internet và Intranet

L L 7.L M ô h ìn h c ơ s ở d ữ Uệu C lien t S erver

Một trong nhũng mục tiêu khi kết nối các máy tính thành mạng là chia se các tài ngiivẽn thông tin Một máy chủ cung cấp các loại dịch vụ cho nhiều máy khách t h ô n g qua môi t r u ủ n g

mạng Máy chủ và máy khách đều tham gia quá trình xử lý, vì vậy mô hì nh Client - Server 2 lớp trở nên phổ biến Các máy khách (Clients) chia sẻ gánh nặng xlY lý của máy chủ trung tâm Khi máy khách thực hiện các ứng dụng, nó gửi yêu cầu về máy chủ được kết nối với c ơ sờ dữ liệu, máy chủ xử lý và gửi trà lại kết quà về máy khách

• Trên các máy chù, thường được cài đặt các hệ cơ sớ dữ liệu bao gồm các bảng biểu, các thủ tục lưu trũ‘ và điều khiến các tiến trình sau:

V Quản lý dữ liệu

V Bảo mật dữ liệu

V Thực hiện truy vấn, ràng buộc và các thủ tục lưu trCr

V Điều khiển lồi

• Các tiến trình được thực hiện trên m á y khách:

V Tạo giao diện người sử dụng (User Inteface)

• Tương tác c ơ sở dữ liệu ( Database Interaction):

V Cập nhật dữ liệu: thêm, sửa và xoá dữ liệu

V Điều khiển lỗi

V Mô hinh ClienưServer 2 lớp có hiệu quà cao với các ứng dụng nhò và sốlượng người sử dụng hạn chế Khi nhiều máy khách (Clients) kết nối truy

nhập vào cơ sở dữ liệu thi năng lực quản lý và KỬ lý cùa máy chủ (Server)

sẽ bị giảm xuống, tốc độ xử lý chậm

V Nhiều kết nối dữ liệu phải được duy trì

V Mã nguồn không có khả năng dùng sử dụng lại Một ứng dụng tồn tại trongnhiều khối mã nguồn khác nhau được cài đặt trên máy khách, Vì vậy khi có

sự thay đổi mã nguồn người ta cần phải cài đặt lại trên tất cả máy khách, điều này rất khó có thể thực hiện được

V Không có lớp trung gian điều khiển sự bào mật và các giao dịch giữa máy

Trang 17

M ain Fram e Com puter

Client

Hinh 1.3. MÔ hinh C lient - Server 2 lớp.

1 Trinh duyệt Browser gửi yêu cầu cho Web Server

2 Web Server trả kết quà về cho trình duyệt

L L 7.2, M ô h ìn h C ỉien ư S erver n h iều lớp

Trong mô hình ClienưServer 3 lóp (hay nhiều lóp), quá trình xử lý được phân tán trên

3 lóp khác nhau vói các chức năng riêng biệt Vì vậy mô hinh này rất thích hợp cho việc tổ chức

hệ thống thông tin trên mạng Internet và mạng Intranet hay trong các mạng cục bộ Phát triển

mô hinh 3 lớp sẽ khắc phục được một số hạn chế cùa mỏ hình 2 lóp Các hệ cơ sở dữ liệu được cài đặt trẽn các máy chú Web Server và có thế được truy nhập không hạn chế các ứng dụng và

số luợng người dùng

(Presentation Services) Thực hiện việc giao tiếp gÌLia người sử dụng với lóp giao dịch thông qua trình duyệt Browser hay trình ửntí dụng để thao tác và xử lý dữ liệu Thông thường giao diện người sứ dụng được chứa trong các File OCX, Lớp này có thể cài đặt ở dạng ứng dụng Web gồm những trang ASP sử dụng các File OCX I r o n g mỏ hình Internet (Internet model), lóp khách là trình duyệt Internet Explorer hay Netscape

• Lớp giao dịch (Business Tier): Cung cấp các dịch vụ quản trị, tổ chức và khai thác

CSDL Các component trước đây được cài đặt trên lớp khách, nay được cài đặt trên lớp giao dịch Ví dụ, một ngưòi sử dụng trên máy khách đặt mua hàng, lớp giao dịch kiểm tra mã hàng còn nũa hay không mới quyết định tiếp tục bán hay không bán Thành phần cúa lớp giao dịch trong mô hinh Internet là Web Server và COM+/MTS Công nghệ của Microsoft với Web Server là l i s (Internet Information Services) sử dụng ASP để kết nối Client với COM Web Server giao tiếp vói C O M+ /M TS component qua COM C OM+/ MTS component điều khiến tất cả giao tiếp với lớp dữ liệu nguồn thông qua ODBC hoặc O LE - DB

• Lớp nguồn d ữ liệu (Data Source): Lớp nguồn dữ liệu cung cấp các dịch vụ tổ chức và

lưu trũ’ các hệ co- sỏ' dữ liệu quan hệ sẵn sàng cung cắp dữ liệu cho lớp giao dịch Đặc trưng của lớp này là SQL Server quản lý dừ liệu và các thành phần trong cơ sở dữ liệu như bảng, dữ liệu

và các thủ tục lưu trữ Trong mô hình Internet lóp nguồn dữ liệu quản lý các hoạt động của một lưọìig lớn Clients Microsoft phát triển DNA mô hình chung (Framework) xây dựng cho ứng dụng nhiều lớp

Trang 18

Tóm lại, đặc trưng của mô hình tính toán phân tán là các tài nguyên của mạng như thiết

bị phần cửng, chương trình, dữ liệu được phân tán theo địa lý trên mạng Người sử dụng có thể truy nhập khai thác trực tuyến hoặc và khai thác tưomg tác dữ liệu từ xa.

Hình 1.4a và 1.4b, mô tả các loại mô hình Client-Server 3 lớp.

Database Server

Hình 1.4a. M ô hình clien t server 3 lớ p c ó sử dụng M iddlew are server.

Applicaation

Hình 1.4b. M ô hình clien t server 3 lớp c ó sử đụng A p p lication server.

Hình 1.4a cỏ sử dụng Middleware server với mục đích quản lý và điêu khiên các tiền trinh tương tác của hệ thống Nghĩa là sử dụng Middleware server để điều khiển và quan lý nhiều kết nối đồng thời truy xuất CSDL của các frạm đầu cuối Trong cấu trúc loại 3 lớp như hình 1.4b, sử dụng Application server để hỗ trợ cho một số tiến trình ứng dụng cụ thể như truy xuất ghi, cập nhật cơ sở dữ liệu chẳng hạn.

1.1.7.3 Kỹ thuật lập trình cơ sở dữ liệu - Web động

Cơ sở dữ liệu phân tán ngày nay được ứng dụng rộng rãi frên mạng máy tính Dữ liệu Iini trữ trên các máy tính khác nhau tại các vị trí địa lý khác nhau Với cách nhìn của người sử dụng là trong suốt và dễ sử dụng Để đon giàn người ta sao lặp các CSDL thành nhiều bản sao

và được cài đặt frên nhiều vị trí khác nhau Phương pháp này tạo ra độ an toàn cao, đáp ứng

Trang 19

Kỹ thuật kết nối CSDL - Web hỗ ừ ợ cho người sử dụng có thể tạo ra những trang Web động tuỳ biến, kết nối tính toán và truy vấn cơ sở dữ liệu từ các máy khách từ xa nhờ các kỹ thuật HTML (HyperText Markup Language), XML (extensible Markup Language) hoặc XSL (extensible Style Language) Kỹ thuật kết nối CSDL - Web phổ biển như:

Dỉit4ibaỉjC

Database Server

C lient

Application

Hình 1.5. M ô hình clien t server nhiều lớp.

• CGl (Common Gateway Interface) hỗ ừ ợ để tạo ra những ừang Web tuỳ biến theo yêu cầu từ máy khách gửi đến.

• ISAPI (Internet Server Application Progamming Interface) cho phép lập trình ứng dụng trên máy người sử dụng Web duới dạng một thư viện Hên kết động đcm (Dynamic Link Library) được nạp cùng lúc vào bộ nhớ Các ứng dụng của ISAPI thực hiện nhanh hơn các ứng dụng của CGI.

• IDC (Internet Database Connector) là một ứng dụng ISAPI, hỗ trợ của IIS (Internet Information Server) truy nhập CSDL qua ODBC kết nối CSDL trên Internet Với công nghệ ASP (Active Server Pages) cho phép lập trình theo dạng kịch bản tạo những ứng dụng có tính tương tác và hiệu suất cao khi truy xuất cơ sở dữ liệu frên máy chủ.

• JDBC (Java DataBase Connectivity) hỗ trợ lập ữình mạng truy xuất CSDL bằng ngôn ngữ Java Cho phép người sử dụng đầu cuối ừuy nhập vào các hệ CSDL bằng MS SQL Server,

MS Access, Oracle, hay bằng ngôn ngữ truy vấn SQL

1.1.7.4 Kiến trúc hệ thống Server (Server System Architecture)

Hệ thống kiến trúc Server bao gồm Server giao tác (Transaction Server) và Data Server Giao tác Server: Cũng được gọi là Query Server, cung cấp giao diện cho các trạm khách (Clients) có thể gửi câu hỏi và yêu cầu thực hiện và gửi ừả lại kết quả Yêu cầu có thể biểu diễn bằng ngôn ngữ SQL hoặc bằng giao tiếp trong ừình ứng dụng.

Trang 20

• Tiến trình Server (Server process): Tiến trinh nhận các yêu cầu từ các máy trạm clients, thực hiện yêu cầu và trả lại kết quả cho các máy trạm Các yêu cầu của máy trạm được nhận từ giao tiếp người sử đụng hay từ tiến ữinh người sử dụng được nhúng ừong SQL, JDBC hay trong các giao thức tương tự.

• Lock manager process: Đây là tiến trinh khoá cấp quyền truy nhập cơ sở dữ liệu cùa tiến trình quản trị CSDL cho người sử dụng.

3.

Web Server yêu cầu xử lý

CGI

5.

Kết quả truy xuất

4.

Truy xuất

& xử lý

Database

Hình 1.6. Cơ chể làm v iệ c cùa một ứ ng dụ n g CGI.

• Database writer process: Tiến ưinh cho phép đọc dữ liệu vào bộ nhớ phụ và được phép sửa đổi, sau đó được phép cập nhật trở lại CSDL.

• Log writer process: Tiến trình nhật ký theo dõi quá trình đọc, sửa đổi và cập nhật ứờ lại dữ liệu của tiến trình Database writer process.

• Checkpoint process: Tien trình kiểm soát định kỳ khuôn dạng trinh bày

• Process monitor process: Đây íà tiến trình giám sát các tiến ừình khác, nếu phát hiện một tiến trình nào đấy bị lỗi, nó yêu cầu ngắt và thực hiện lại.

Server dữ Hệu (Data Server): Cho phép Clients tương tác với Server bằng các thao tác đọc hay cập nhật dữ liệu Ví dụ như File Server cung cấp giao điện hệ thống file cho các máy ừạm clients có thể thực hiện tạo file, cập nhật dữ liệu, đọc dữ liệu hay xoá dữ liệu.

Trang 21

mô hình cơ sờ dữ liệu mạng, phân cấp, cơ sở dữ liệu quan hệ và mô hình thực thể quan hệ Cơ

sở để so sánh, đánh giá một CSDL tốt đựa vào các mục đích xây dựng hệ thống, cơ sở dữ liệu hướng giá trị hay hướng đối tượng, tính dư thừa và giải quyết tốt mối quan hệ nhiều - nhiều.

Trang 22

• Mô hinh d ữ liệu.

Sự Cần thiết tổ chức lưu trữ dữ liệu theo một cách thiYc xác định và chặt chẽ đã dẫn đến

sự phát triển các mô hinh dCr liệu Từ nhCmg mô hình mạng, mô hình phân cắp và mô hinh dừ

liệu quan hệ là nhCrng m ô hinh C0‘ s ờ d ữ liệu kinh đ iẻ n , truyền t h ố n g c h o đ ế n c á c m ô hì nh c ơ sỏ'

dữ liệu phân tán, c ơ s ở dfr liệu hưóng đối íưọim là những mô hình dữ liệu hiện đại được áp

dụng nhiều trên thị trường hiện nay

Đối tượng nghiên cứu các hệ CSDL là các thực thể và các mối liên kết giữa các thực

thể Một mô hình C S D L phải cỏ khả năng biêu diễn thực thể và liên kết giữa các thực thế Các

liên kết là một dạng đặc biệt của thực thể Các cách tiếp cận C SD L là các cách nhìn và các cách

biểu diễn liên kết cúa ngưòi sứ dụng

Nghiên cứu m ỏ hình CO' sơ dir Hệii dựa (rữỉì cúc vêiỉ càu sau:

1 M ục tiêu độc lập d ừ liệu: Phải xác định rồ ràng các khía cạnh logic và khía cạnh vật

lý c ủa vi ệc q u ả n trị c ơ s ở d ữ liệu, bao g ồ m việc thiết kế c á c hệ c ơ sò’ d ữ liệu, c á c t h a o t ác và tìm

kiếm dữ liệu bàng các công cụ ngôn ngữ con dir liệu

2 Mục tiêu trao đôi: Mô hình dữ liệii đon giản về cấu trik, sao cho người sử dụng có

c á ch nlìin t r o n g s u ố t khi truy n hậ p và o các hệ co S0‘ d ừ liệu và c ó kh ả n ă n g t r a o đỏi với n ha u về

cơ sở dữ liệu

phép toán trên các mà ng thồng tin, kỹ thuật xử iỷ theo lô (batch), mà không phải xư lý tuần tụ-

theo từng bản ghi

4 M ô hình đư ợc xây cũnig írôn a r s ơ lý ihuyéĩ vCmg chac chạỉ chẽ.

1.2.2 M ô h ìn h d ữ liệu (D a ta M ơdel)

Một mô hinh dũ’ liệu là một hệ tliống hình thức toán học, bao gồm:

- Hệ thống các ký hiệu biểu diễn dữ liẻLiỉ

- Tập hợp các phép toán thao tác trẽn co sò' dữ liệu

Đặc trưng cùa một mô hình dữ liệu:

- Tính ổn định khi thiết kế mỏ hình dữ liệu

- Tính đơn giàn có nghĩa là dễ hiếu và dễ ĩhao tác

- Tính dư thừa cần phải kiểm tra kỹ lirõing

- Tính đối x ứn g phải được bảo toàn

Trang 23

L 2 2 L P h ă n b iệ t g iữ a cá c m ô hình d ữ liệu

Tố chức dữ liệu theo mô hình nào là tốt nhắt Thực tế chưa có mỏ hình dữ liệu nào lả tốl nhất Tốt nhất phụ thuộc vào yêu cầu triiv xuất và khai íhác thòng tin cua đơn vị quàn Iv nó Nó đưọx sừ dụng ỏ’ đâu và vào lúc nào là tốt nhất Tuy nhiẻn, thưòng nguời ta dụa vào các tiẻu chí sau đẻ nói răng mô hình d ữ liệu tốt nhât khi:

1 M ục đích: Phần lớn c á c m ỏ hình d ữ liệu sử d ụn g hệ t h ố n g k ý hiệu để biếu diễn dũ' liệu và làm nền t ả n g c h o c á c hệ ứ n g d ụ n g và ngôn ngù' thao tác diì liệu C á c m ô hình t hực thể

q ua n hệ k h ô n g c ó hệ t h o n g ký hi ệu đ ể xây d ự n g các phép toán t hao t á c d ừ iiệu m à s ứ d ụ n g đế thiết kế lirọc đồ khái niệm, cài đặ t t r o n g một m ô hình dừ liệu vói m ột hệ quản trị CO’ sờ dfr liệu

nào đó

2 H ướng g iá trị hay hướng đối tượng: Các mô hình dừ liệu quan hệ và mỏ hình logic là các mô hình dữ liệu h ướng giá trị Trong các mô hình dừ liệu hướng giá trị có tính khai báo (declarativeness) và có tác đ ộ n^ đến các ngôn ngữ đirọc nó hỗ trợ Các mô hinh mạng, phân cấp, mỏ hinh dừ liệu hiróng đối tượng cung cấp đặc tính nhận dạng đối tượng, nên có thể xem chúng là các mô hinh hướng đối tưọng Mỏ hinh thục thê quan hệ cùng có đặc tính nhận dạng hướng đối tượng

3 Tinh d ư thừa: Tất cà các mô hình dữ liệu đều có khả năng hỗ trợ lưu trữ dữ liệu vật

lý và hạn chế sự d ư thừa dữ liệu Tuy nhiên các mô hinh dừ liệu hướng đối tượng giải quyết sự

dư thừa tôt hon bằng cách tạo ra và sử dụng con trỏ trò đên nhiêu vị trí khác nhau

4 G iai cỊiỉvéí m oi tỊiỉun hệ nhièit - nhiều: Phằn lớn trong các niô hinh cơ sờ dữ liệu có

phần lư cua các quan hệ khác và ngưực lại Tuy nhiên trong mô hinh dữ liệu mạng không chấp nhận mối quan lìệ nhiều - nhiều

1.2.2.2 C á c Itệ th ố n g C S D L đ ổ i tư ợ n g và trì íhửc

C ơ sớ dìr liệu hướng đối tượng vả hệ quán trị hướng đối tirợim (Object Oriented Database management Systems - o o DBMS) mô tả các kiểu dữ liệu được xây dụng bằng phưưng pháp tạo bản ghi và tạo tập hợp Các quan hệ đưọc xảy dựng từ các bộ bằng thao tác tạo một tập h ọ p các bản ghi có khuôn dạng thống nhất

Che dấu cìừ liệu (Encapsnlatiorĩ): Nghĩa là khi có yêu cầu truy xuất đến các đối tượng

thuộc kiếu đặc biệt, phải qua các thú tục đà được định nghĩa cho các đối tượng đó Chắng hạn định nghĩa slack như là một kiểu và định nghĩa các thao tác PliSH, POP áp dụng clìO stack

Đặc tính nhận dạng đối tượng (Obịect Indenlitv) là khá năng phản biệt các đối tượng Nghĩa là cấu trúc các kiều cơ ban như nhau Các kiẻu cơ bán là chuồi ký tự, số

1 2 3 M ô h ỉn h C S D L p h â n cấ p (H iera rch y D ata M o d e l)

L 2.3.1, C ấ u trú c b iểu diễn d ữ liệu ph ãỉí cấp

Trong mô hình C S D L phán cấp, dừ liệu được biéu diễn bằng cấu trúc cây Một CSDL phán cấp là tập các cây (rừng cây) Trong mồi một cáy chỉ chứa một và chỉ một xuất hiện của bản ghi gốc, gọi là bản ghi đỉnh, và dirới nó là tập các xiiắí hiện cúa các bán ghi phụ thuộc Các

Trang 24

bản ghi phụ thuộc có thể là tuỳ ý hoặc không tồn tại Một bản ghi gốc có thê co niột sồ bất kv

c á c bản ghi phụ th u ộ c và c á c bản ghi phụ thuộc c ó th ế c ỏ m ộ t s ố c á c ban ghi phụ th u ộc m ứ c

thấp hon Hình 2.1 biểu diễn một mô hinh CSDL phân cấp về tuvến cáp và các loại cáp Dừ liệu được biểu diền bằng 4 cấu trúc cây đon giản, trong đó gốc là xuất hiện kiểu bán ghi loại cáp bao gồm các thông tin mà cáp, tên cáp số lưọn” mã mrớc san xuầt tên niróc sán xiiấl Các ban

ghi phụ thuộc là kiêu các bản ghi các tuyến cáp cỏ láp đặt các loại cáp đỏ bao ” ồm các thỏim

tin về so hiệu tuyến cáp, tên gọi tiiyén cáp độ dài vã ngày lioàn ihành việc \á> dựng tuyến cáp

đó N h ư vậ y các bán ghi UOC là c ác kiẽu ban nhi về c á c l(iại c á p đủ đi rọc lắp đ ặt và c ác ban ulìi

phụ thuộc là các bản uhi về thông tin các tuyén cáp

Theo định nghĩa, không thể cổ các bản ghi phụ thuộc mà không tồn tại bản ghi gốc, nghĩa là không thể tồn tại các loại cáp mà chưa được lắp đặt trên một tuyến nào cả Như vậy có thể tồn tại các loại cây vừa có xuất hiện của bản ghi gốc và các bản ghi phụ thuộc, nghĩa là mồi một loại cáp có thể được lắp đặt trên nhiều tuyến cáp khác nhau và trên một tuyến cáp có thể có nhiều loại cáp khác nhau được lắp đặt Có loại cây chi tồn tại bản ghi gốc thoái hoá, dưới nó không tồn tại bản ghi phụ thuộc, nghĩa là có ít nhất một loại cáp chưa được đưa vào lắp đặt sử dung Theo định nghĩa, không tồn tại loại cây chỉ cổ các bản ghi phụ thuộc mà không có bản gốc, tức là trên mọi tuyến cáp phải có ít nhất một loại cáp Điều gì sẽ xảy ra khi trên một tuyến nào đỏ có duy nhất một loại cáp bị huỷ bỏ.

ỉ 2.3.2, N gôn n g ữ th ư o tác trên CSD L p lĩã n cũp

• Biểu diễn phụ thuộc trong mô hình phân cấp: Các đưò ng nối từ bản uhi gốc tro xiiốnu các bản ghi phụ thuộc, hay từ bản ghi cha trò xuống bản ghi con biểu diễn mối quan hệ ííiừa các

bá n ghi t ro n g m ô hì nh phân cấp Ví dụ t r o n g bán ghi "Pliiếii xiiắt k h o " c ó t hế xác đị nh đirọc mã

và đơn giá của các loại cáp

• Chèn thêm: Trong cấu trúc hình cây, có mộl và chí một xiiấí hiện bàn ghi gổc, tức là bất buộc phái có xuất hiện bản ghi về các loại cáp Nếu muốn lưu trừ thòng tin về niột luyen cáp mới vào C S D U thì điều Iiày không thế thực hiện được, vì không ihể thêm thông tin về các xuất hiện kiểu bàn ghi phụ thuộc (thông tin về các tuyến cáp) vào C S D L phân cấp khi clura có thônu tin về các loại cáp

• Loại bỏ: Trong một số cấu trúc câv dừ liệiu thông tin vê một ván đê Iiào đây đirợc chứa trong một xuất hiện kiểu ban ghi phụ thuộc duy nhất thi khi loại bo sẽ làiiì mất thông tin vẻ vấn đề trên Ví dụ khi loại bỏ loại cáp M04 trén tuyến T03, sẽ kéo theo thông tin về tuyến cáp T03 bị mất và thõng tin về cáp mang mã hiệu M04 cùng bị mất luôn, N h ư vậy có thể xày ra hiện tượng mất thông tin về các tuyến cáp hoặc thông tin về các loại cáp khi thực hiện các thao tác loại bò

1 Bán ghi gốc: Mã cáp, tên cáp số lưọno- mà niróc sán \ u ầ t và íên nước san xuất

2 Bán ghi phụ thuộc: Mà tuyến, độ dài tuyếii và ngày lắp đặt cáp

• Sừa đôi; Neu cằn phái sứa đồi một số thõiig tin trong các xuất hiện kiêu bán ghi phụ

thuộc thì phải duyệt toàn bộ mỏ hình dũ' liệu, bằng cách phái dò tìm trong từng xuất hiện Như

vậy khả năng dò tìm không hết có thế xảy ra, sẽ dẫn đến sự xuất hiện mâu thuẫn thông tin và không nhất quán dừ liệu trong lưu trìr Ví dụ cần thay đối tên gọi của các tuyến cáp hoặc tên gọi

Trang 25

các loại cáp, nếu số các xuất hiện kiểu bản ghi loại này rất lớn, khả năng duyệt sót vẫn có thể xảy r a , nghĩa là mâu thuẫn thông tin, không nhất quán thông tin sẽ xảy r a

Hình 1.9. D ữ liệu biểu diễn dưới dạng phân cấp.

• Các phép tìm kiếm: Các xuất hiện của các bản ghi phụ thuộc chỉ tồn tại khi và chỉ khi tồn tại xuất hiện kiểu bản ghi gốc.

V í dụ Q l: Tìm số hiệu của các tuyến Q2; Tìm số hiệu các loại cáp

có lắp đặt cáp MC#="M02" lắp đặt trên tuyến TC#= "T02".

Bản ghi gốc: MC#="M02" Next: Không còn bản ghi gốc: Thoát

Không tim thấy: Thoát Không tỉm thấy TC#="T2"

Các truy vấn thường đối xứng nhau nhưng kết quả của các phép tìm kiếm không đối xứng Vì vậy trong cấu trúc lưu trữ của mô hinh phần cấp rất hạn chế khi thực hiện việc tìm kiếm thông tin N ếu CSDL phần cấp càng lớn thi tính phức tạp càng cao Gây nhiều phức tạp cho người sử dụng, nhất là đối với lập trình viên phải mất nhiều thời gian công sức để lập ừình

và bảo trì, hiệu chỉnh các chương trinh.

Tóm lại, thông tin tổ chức lưu trữ theo mô hình phân cấp được biểu diễn dữ liệu ữong một tệp duy nhất theo cấu trúc cây Trong mỗi một cây, tồn tại một và chỉ duy nhất một xuất

Trang 26

hiện kiểu bản ghi gốc và cùn;Ị> vói nó có một tập các xuắt hiện kiểu bản ghi phụ thuộc Khi thao

tác trẽn C SD L phân cấp bằng ]^^ỗn ngữ ihao ìác dừ liệu, có nhiều khả năng xẩy ra thừa hoặc

thiếu thông tin, máu thuẫn théim tin dẫn đến sự không nhất quán clũ’ liệu trong liru trữ Tính toàn vẹn cùa dữ liệu không đưọ'c dam bao Các câu hoi - đáp tim kiếm không cỏ tính đối xứng Tính độc lập của dữ liệu đề bị vi pỉhạm Tính ổn định khỏnu cao

1 2 4 M ô h ìn h C S D L m ạn g (N etw ork D ata M o d e l)

1.2.4 L C ấu trú c biểu diễn d ữ Hệ li m ạng

Mô hình dữ liệu mạnu là mỏ hình thirc tlìẻ quan hệ Ironu đó các mối liẻn kết bị hạn chế

các bản ghi liên kết vói nhau bằng các mối nối liẻn kết (link) tạo thành một đồ tliị có hưóng CSDL mạng có cấu trúc tổng quát hơn so vói cấu trúc CSDL phân cấp Mỗi một xuất biện của một bàn ghi có thể có rất nhiều các xuất hiện kiểu bản ghi trên nó và các xuất hiện kiểu bản ghi dưới nỏ Ngoài các kiểu bản ghi biêu diễn dữ liệu còn có kiểu bản s;hi các phần tử kết nối biếu diễn sự kết họp giữa các biéu diễn dừ liệu Cho phép mô hình hoá tương ừng nhiều - nhiều Hình 2.2 bieu diễn một mỏ hình CSDL mạng vẽ các tuyên cáp và các loại cáp được lăp đặt Ngoài các xuất hiện kiêu bản ghi tuyên cáp và các xLiát hiện kiẻLi các bán ạhi các loại cáp còn có các xuất hiện kiểu các bàn ghi về các pliần tiì kết nối đó là các phần tử số ỉưọng Các phần tứ này kết nối tuyến cáp và các loại cáp là thông tin về tình hình lắp đặt So' đồ T l —> 300 —> MOI chỉ ra rằng tuyến TI có 10 cáp MOI, T l - > 1 8 - > M02 có nghĩa là TI có 18 cáp loại có mă số

lả M02

• M ạ n g c h ứ a hai kiểu thực thể: Trong mỗi một tuyến c áp có nhi ều loại c á p k há c nhau vó'i số lu‘ợ n g k há c n ha u Mỏi một loại cáp có tlìê có mặl t ro n g Iihiéii ttiven c á p khác Iihau Kiẻii

bản ghi số liro'ng cỏ chức năng iiêiì kẽt hai kiêu ban uhi luyen cáp và các loại eáp Mỗi một xuất

hiện kiểu b ả n ghi số l ư ợ n u biêu diền mối lién kết giữa các bản nhị t u y ế n c á p vó'i các bản ghi loại cáp Thi ếl lập mối liên kế t g i ữa một luyến cáp và iTìột loại c á p s a o c h o mồi x uấ t hiện t ư ơ n g ứn g của số l ư ợ n g đề u có m ặ t t r o n g xuất hiện các íuyến cá p và loại cáp Ví dụ t u y ế n c á p ' ' T r ' và loại

cá p mã “ M O r ’ c ỏ mối liên kết vói số lượng lá 10 ' T 5 " và “ M 0 7 ' ' k h ô n g có mối liên kết, điều nàv có n gh ĩa là loại c á p “ M 0 7 ‘' chira có mặl írong mộl t uycn n ào cá vả t uyến “ T 5 " c h ư a cỏ một loại c áp n à o đ ư ọ c lãp đặt

• Mạng c h ứ a hơn hai kiêu thực thê: Uẽn kếl n kiêu tlụrc thê biểu diễn bầng một kiểu

bản ghi liên kết n kiểu bản ghi đó vói nhau Mỗi xuất liiện cua bản ghi liên kết sẽ là thành viên

của đúng một xuất hiện của một trong số n kiểu bán ghi N h ư vậy sẽ biểu diễn mối liên kết n thực thể tương ứng Ví dụ thêm một kiểu thực thể iT ió i - đon vị thi công tuyến cáp Có thề một

đơn vị thi công nhiều tuyến cáp và troim một tuyến cáp có nhiều đo'n vị thi công Thẻm kiếii

thực thế ngày nhập kho (NHAP) cua các loại cáp írưeVc klii đưa vào sư dụng hoặc đưa thêm thông tin về hàng sán xuất

• Mạng chỉ chứa một kiẻu thực thế: Tồn tại CO' sò' diì liệu chí chừa một thực thể Ví dụ

CƠ sờ dữ liệu chứa thông tin vê phụ tùng và linh kiện, trong đó một linh kiện tự nó có thẻ là một

phụ tùng và tự nó có thể chứa các phụ tùng khác Nhir vậy mạng c ơ sở dừ liệu chỉ chửa duy nhất

một kiểu bản ghi phụ tùng Và mỗi một phụ tùng lại có thể là tỏ họp của một số chi tiết thành phần, lại vừa có thể là thành phần cua các tồ họp kliác Như vậy CO' sỏ' dữ liệu mạng có hai thực

Trang 27

T5 1 01/05/2002 M05 1 VinaSung 4 LDA Liên doanh

H ình 1.10. C ách tiếp cận C S D L kiểu m ạng.

Trang 28

L 2 ,4 2 , N g ô n n g ữ d ừ liệu thao tcỉc trên CSD L m ạ n g

• Chèn thêm: Khi thêm các các kiêu biin uhi mói cỏ thể con trò (mối nối) tự trỏ vào nỏ

Ví dụ, cỏ chèn tlìêm các thông tin xuất hiç'ii ban uhi VC tuyến cáp hoặc xuất hiện kiều bản ghi về các loại cáp mà chưa có trong CSDL và chưa cỏ các ban ghi kết nối, nghĩa là chưa có thông tin

về các loại cáp được lắp đặt, nhưng mô hinh CSDL mạng vẫn đảm bao đưọc lính nhất quán cúa

dữ liệu và tính toàn vẹn của dir liệu

• Loại bỏ: Có thể loại bò các xuát hiện kiều bản ghi dừ liệu và xuất hiện kiểu bản ghi kết nối trong mô hinh C SD L mạne mà khôns anh hưòng tới tính nhất quán và tính toàn vẹn dừ lỉệu Có thể Koá một loại cáp nào đó khi không còn sử dụng Ví dụ cần xóa bo 8 cáp M04 trong

TI bằng cách xoá bỏ các con trò giữa Tì và 8; giiTa 8 và M04 mà không làm mất thông tin, không xuất hiện dị t hưòng thông tin

• Sửa đối: Có thê sửa đồi nội dung diì liệu mà không cần duyệt qua mô hình và cũng không làm xuất hiện mâu thuẫn dữ liệu

xứng với nhau như trong mô hinh CSDL quan hệ

cáp có lắp đặt cáp MC#="M02" cáp trên tuyến T C #= ’T 0 2 ”

Bản kết nối: M C #-’M02’ Bản kết nối: T C # -T 0 2 ’

Mô hinh C SD L mạng ^à mỏ hình đối xứng, vì vậy các câu hòi và kết quả các câu hỏi tim kiếm thường đối xứng với nhau Khi thực hiện các phép lưu trừ như chèn thêm, loại bò hay sửa đổi dữ liệu trong mô hình CSDL mạng van báo đảm được sự nhất quán của dữ liệu và tính toàn vẹn của dữ liệu Cách tiếp cận CSDL mạng là phưong pháp biểu diễn dữ liệu trong các tệp theo cấu trúc dữ liệu chặt chẽ C'ác xuất hiện kiêu ban ghi được kếl nối với nhau bàng các xuất

hi ện kiểu bàn ghi liên kết Khi t hao tác các phép cặ p nhậ t k h ô n g xuấ t hiện c ác dị t h ư ờ n g t h ông

tin Tuy nhiên cấu trúc dũ* liệu trong mô hinh CSDL mạng quá phức tạp vì quá nhiều liẻn kết

g i ữ a các xuấ t hi ện d ữ liệu với nhau bằng các xiiắt hiện kết nối Vì vậ y vi ệc t hiết kế và cài đặt cơ

s ờ d ữ liệu m ạ n g t h ư ờ n g rất k h ó khăn, nhất là xây d ự n g c á c p h ép toán th a o tác trên nó.

được biểu diễn:

A| X A7 X X A„ í (ai- a a,ĩ) j a, c A„ i I n j

Trang 29

Quan hệ (Relation) là một tập con của tích Đ ề các của một hoặc nhiều miền Sẽ ngầm hiểu quan hệ là hữu hạn Các phần tử cùa quan hệ gọi là bộ (3|, a2, - , 3n), có n giá trị thành phần, hay được gọi n_bộ.

Khái niệm tập n_bộ không phải là khái niệm duy nhất đối với lý thuyết cơ sở dữ liệu kiểu quan hệ Nếu gán tên thuộc tính cho các cột, khi đó thứ tự của các cột là không quan trọng.

Vì vậy có thể xem các bộ như là ánh xạ từ các thuộc tính đến tập các giá ừị của miền xác định các thuộc tính Ánh xạ n được định nghĩa như sau:

ị i : n = { A i , A2, , An} -*■ Q

Khi đó q u a n h ệlà tậ p n _ b ộ : {^ (A ,), ^(A„)} = { (a l, a2, „ a„)}.

Như vậy, "Cơ sở dữ liệu quan hệ" có thể hiểu là dữ liệu được người sử dụng nhìn dưới dạng một quan hệ toán học và các phép toán thao tác dữ liệu được xây dựng ữên các cấu trúc quan hệ toán học M ột quan hệ là một bảng và mỗi bảng là một cấu ữúc quan hệ toán học.

Nói cách khác, cơ sở dữ liệu quan hệ được biểu diễn dưới dạng các bảng, gồm các cột là thuôc tính và các hàng là tập n giá trj của thực thể, đối tượng có cấu trúc, cấu trúc dữ liệu quan

hệ là mối liên kết giữa các bộ được biểu diễn duy nhất bằng các giá trị dữ liệu trong các cột được rút ra tìr miền chung Giữa các thuộc tính có mối quan hệ ràng buộc phụ thuộc lẫn nhau

và các phụ thuộc cũng là các thực thể đặc biệt.

V í dụ: Quan hệ về tuyến cáp - các loại cáp - nhật ký lắp đặt

TC#: Mã tuyến cáp, TC: Tên gọi tuyến cáp, DAI: độ dài tuyến cáp,

NGHT: N gày hoàn thành tuyến, MC#: Mã cáp, MC: Tên gọi cáp, GIA: Giá cáp, N#: Mã nước sản xuất, NSX; Tên nước sản xuất,

a) Thông tin về các loại cáp lắp đặt ừên các tuyến cáp:

Trang 30

b) Thông tin v ề các tuyến cáp:

c) Thông tin về các loại cáp (danh mục các loại cáp):

Trang 31

C H Ư Ơ N G II

C ơ SỞ D ữ LIỆU PHÂN TÁN

Vói việc phân bố ngày càng rộng rãi của các công ty, xí nghiệp, dữ liệu bài toán là rất lón và không tập trung được Các CSDL thuộc thế hệ một và hai không giải quyết được các bài toán trong môi t rường mới không tập trung mà phân tán, song song với các dữ liệu và hệ thống không thuần nhất, thế hệ thứ ba của hệ quản trị CSDL ra đòi vào những năm 80 trong đó có

C SD L phân tán để đáp ứng nhũng nhu cầu mói

2 1 H Ệ C ơ S Ở D ữ L IỆ U P H Â N T Á N

2 1 1 Đ ịn h n g h ĩa C S D L p h â n tán

C ơ sở dũ’ liệu phân tán nói riêng và các hệ phân tán nói chung là một lĩnh vực được nghiên cứu từ lâu nhưng gần đây do sự phát triẻn nhanh chỏng của còng nghệ truyền tin và sự bành trưóng cúa internet C ơ sở dũ' liệu phân tán đã trờ thành một lĩnh vực thu hút nhiều sự quan tâm của các nhà nghiên cứu

về mặt trực quan theo nghĩa đen cũa cụm từ cơ sỏ‘ dCr liệu phân tán chửa hai cụm từ: Co‘

Trang 32

Như vậy, chúng ta có thề nói c ơ sớ dữ liệu phân tán là SỤ' họp nhất cùa hai hưóníì tiếpcận đ ố i với quá trình xử lý dữ l i ệ u là CO' sỏ' d ữ liệ u v à n iạ n ụ niày tính.

Một CSDL ph â n tán ỉ(ì một tập hợp nhiều CSDL fó liên đ ó i lo ỊỊÌc và được phân hồ

rải rác trên nhiều mảy trong m ột mạng máv tính

Tính chất ph â n tán: Toàn bộ dữ liệu cua CSDL phâii tán không được lưu trĩr ở' một noi

mà cư trú trên nhiều máy trạm thuộc mạng máy tính, điều này giúp cluing ta phân biệt CSDL phân tán vói CSDL tập trung đon le

Tương quan logic. Toàn bộ dữ liệu của một CSDL phân táii có một số các ứiuộc tính ràng buộc chúng với ahau, điều này giúp chúng ta có thể phân biệt một CSĐL phân tán với một tập hợp CSDL cục bộ hoặc các tệp cư trú tại các vị trí khác nhau trong một mạng máy tính.

Hình 2.2. M ôi trường hệ C SD L tập trung.

Trong hệ thống cơ sở dữ liệu phân tán gồm nhiều trạm, mỗi irạm có thế thực hiện các giao tác truy nhập dữ liệu trên nhiều trạm khác

nhánh có một máy tính điều khiển một số máy kế toán cuối cùng (Teller terminal) Mỗi máy tính với cơ sở dữ liệu thống kê địa phương của nó tại mỗi chi nhánh được đật ở một vị trí của cơ

sở dữ liệu phân tán Các máy tính được nối với nhau bởi một mạng truyền thông.

Trang 33

Hình 2.3. M ô hình c ơ sở dữ liệu ngân hàng phân tán.

2.1.2 Phân loại cơ sở dữ liệu phân tán

Nhìn chung, cơ sở dữ liệu phân tán được chia thành hai loại sau:

(1) Cff sở dữ liệu phân tán thuần nhầ

Cơ sở dữ liệu phân tán thuần nhất là loại cơ sờ dữ liệu được thiết kế bằng cách chia nhỏ

cơ sở dữ liệu phân tản đó thành nhiều cơ sở dữ liệu địa phương Các cơ sở dữ liệu địa phương được định vị tại một frạm và đều được quản trị bằng một hệ quản frị => thực hiện ừên cùng một

hệ điều hành.

Hình 2.4. T hiết k ế c ơ s ở dữ liệ u phân tán thuần nhất.

Trang 34

(2) C ơ s ở d ữ liệu phãn tán không thuần nhất

Cơ sở dữ liệu phân tán không tluiần nhất là loại CO' sở dừ liệu đưọc thiết kế bàng cách hợp nhất nhiều cơ sở dữ liệu địa phưona hiện đà có và đang hoạt động thành một cơ sỏ‘ dCr liệu phân tán duy nhất Các c ơ só’ dữ liệu địa plurong có thế đuọc quản trị bàng các hệ quản trị ccr sò’

dữ liệu khác nhau và hệ điều hành khác nhau

H ìrìh 2.5 Thiết kế c ơ sở dữ liệu ph â n tá n k h ô n g th uầ n nhất.

2 ,1 3 C á c đ ặ c đ iểm ch ín h của c ơ sỏ’ d ữ liệu p h â n tán

(1) Chia sẻ iàỉ nguyên

Việc chia sẻ tài nguyên cùa hệ phán tán đưọc thực hiện thòng qua mạng truyền thông

Đe chia sẻ tài nguyên một cách có hiệu quả thì mỗi tài nguyên cần đưọc quán lý bởi một chương trình có giao diện truyền thông, các tài nguyên có thể được truy cập, cập nhật một cách tin cậy và nhất quán Quản lý tài nguyên ở đây là lập kế hoạch dự phòng, đặt tên cho các lóp tài

n g u y ê n , c h o p h é p tài n g u y ê n đ ư ợc truy cập lừ nơi này đến n a i k h á c, ánh x ạ lẻn tài n g u y ê n v à o

địa chỉ truyền t h ô n g ,

(2) Tính m ở

Tính mở của hệ thống máy tính là dề dàng mcy rộng phần cứng (thêm các thiết bị ngoại

vi, bộ nhớ, các giao diện truyền thông .) và các phần mềm (các mỏ hình hệ điều hành, các giao thức truyền tin, các dịch vụ chung tài nguyên )

Một hệ phân tán có lính mở là hệ có thề đirọc tạo ra từ nhiều loại phần cứng và phần

mềm CLÌa nhiều nhà cung cắp khác nhau vói điều kiện là các thành phần nàv phải theo một tiêu

Tính mở của hệ phân tán dựa trên việc cung cấp cơ chế truyền thông giữa các tiến trình

và công khai các giao diện dùng đé truy cập các tài nguyên chung

Trang 35

ịĩ) Khả năng song song

Hệ phân tán hoạt đ ộn g trên một mạng truyền thông có nhiều máy tính, mỗi máy có thể

có ỉ hay ỉihiều CPU Trong c ùng m ộ t th ò i điểm nếu có N tiến trinh cùng tồn tại, ta nói chúng thực hiện đồng thời Việc th ự c hiện tiến trình theo C0chế phân chia thời ííian (một CPU) hay song song (nhiều CPU)

Khả năng làm việc song song trong hệ phân tán được thực hiện do hai tình huống sau: Nhiều ngưòi sử dụng đồng thời ra các lệnh hay các tương tác với các chương trinhứng dụng

Nhiều tiến trinh Server chạy đồng thời, mỗi tiến trình đáp ứng các yêu cầu từ các tiến trinh Client khác

(4) Khả năng m ở rộng

Hệ phân tán có khả năng hoạt động tốt và hiệu quả ở nhiều mức khác nhau Một hệ phân tán nhỏ nhất có thề hoạt động chỉ cần hai trạm làm việc và một File Server Các hệ lớn hơn tới hàng nghin máy tính

Khả nàng m ở rộng được đặc trưng bởi tính không thay đồi phần mềm hệ thống và phần, mềm ứng dụng khi hệ được mỏ' rộng Điều này chi đạt được mức độ nào đó với hệ phân tán hiện tại Yêu cầu mờ rộng không chi là sự mở' rộng về phần cứng, về mạng mà nó trải trên các khía cạnh khi thiết kế hệ phân tán

(5) Khả năng th ứ ỉồi

Việc thiết kế khả năng thứ lồi của các hệ thống máy tính dựa trên hai giải pháp cơ bảnsau:

- Dùng khả năng thay thế để đảm bảo sự hoạt động liên tục và hiệu quả

- Dùng các c h ưo ng trinh hồi phục khi xảy ra sự cố

Xây dựng một hệ thống có thể khắc phục sir cố theo cách thứ nhất thi người ta nối hai máy tính với nhau để thực hiện cùng một chương trình, một trong hai máy chạy ờ chế độ Standby (không tải hay chờ) Giải pháp này tốn kém vi phải nhân đôi phần cứng cúa hệ thống Một giải pháp để giảm phí tồn là các Server riêng lé được cung cấp các ứng dụng quan trọng để

có thể thay thế nhau khi có sự cố xuất hiện Khi không có các sự cố các Server hoạt động bình thuờng, khi có sự cố trên một Server nào đó, các ứng dụng Clien tự chuyển hướng sang các Server còn lại

Cách hai thì các phần mềm hồi phục được thiết kế sao cho trạng thái dũ’ liệu hiện thời (trạng thái trước khi xảy ra sự cố) có thể được khôi phục khi lỗi được phát hiện

Các hệ phân tán cung cấp khả nãng sẵn sàng cao để đối phó với các sai hỏng phần cứng

(6) Tính trong suốt

Tính trong suốt cùa một hệ phân tán được hiếu như là việc che khuất đi các thành phần riêng biệt của hệ đối với người sứ dụng và nhĩrng người lập trinh ứng dụng

Tíĩỉh trong suổí về vị tri\ Người sử dụng khôiig cần biết vị trí vật lý của dừ liệu Người

sử dụng có quyền truy cập tới đến cơ sở dữ liệu nằm bất kỳ tại vị trí nào Các thao tác lấy, cập nhật dũ' liệu tại một điểm d ừ liệu ờ xa được tự động thực hiện bỏ’i hệ thống tại điểm đưa ra yêu cầu, người sử dụng không cần biết đến sự phân tán của c ơ sở dữ liệu trẻn mạng

Trang 36

Tính ìn m g s u ổ í trorìg việc sưchm^'. V iệc chuyền đổi CLÌa một phần hay toàn bộ cơ sở dừ

liệu do thay đổi về tổ chức hay quản lý, không ảnh hưỏng tói thao tác ngiròi su dụng

Tính trong suổt cua việc phúĩì chia: Nếu dữ liệu được phản chia do tãng tải, nỏ không

đ ư ợ c ảnh h ư ở n g tới người sử dụng.

Tính trong suốt của s ự trùng ìặp\ Nếu dũ' liệu trùng lặp để giảm chi phí truyền thônụ

với CO' s ở dữ liệu h o ặ c n âng c a o độ tin cậy, n g ư ò i s ử d ụ n g k h ô n g cần biết đến đ iề u đ ó [1 ].

(7) Đảm hảo tin cậv vờ nhẩi lỊỉián

Hệ thống yêu cầu độ tin cậy cao: sự bí mật cua dừ liệu phai đưọc bao vệ, các chức nãnụ khôi phục hư hỏng phải đưọc đảm bảo Ngoài ra yêu cầu của hệ thống về tính nhất quán cũng

rất q ua n t r ọ n g t r o n g t h ể hiện: k h ô n g đ ư ợ c có mâu t hu ẫn t r o n g nội d u n g d ữ liệu K hi c ác t h u ộ c

tính dữ liệu là khác nhau thì các thao tác vẫn phải nhất quán [I]

2 1 4 X ử lý d ữ liệu ph ân tán

- Đ ịnh nghĩa: x ừ lý dCr liệu phân tán là một số các hộ phận xử lý tự vận hành (không nhắt thiết

phải cùng chủng loại) được liên kết bởi một mạng máy tính và hiệp đồng thực hiện các nhiệm

vụ mà chúng được phân công “Các bộ phận xử lý’' muốn nói đến trong định nghĩa này là các thiết bị tính toán có thể chạy được một chương trinh trên chính nó

- N h ữ n g gì đirợc p h â n tán: Trong hệ cơ sỏ‘ du' liệu phân tán có các thành phần sau được phân

tán:

(1) Thiết bị xử lý: Thiél bị \ ử lý phản tán ngầm định thoa màn phân tán vì các bộ phận

c ủ a m ạ n g m á y tính đ ư ợc phân bố tại c á c vị trí địa lý k h á c nhau.

(2) Chức năng: Nhiều chức năng cíia hệ thống có thể chuyển giao cho nhiều bộ phận khác nhau

(3) Dữ liệu: Dữ liệu được dùiig bời một số ứng dụng khác nhau có thể đưọc phân bố tại các vị trí khác nhau

(4) Quyền điều khiển: Một số công việc trong hệ thống được phân cấp chia quyền theo chức năng

- Tại sao chúng ta lại thực hiện phân tán\

• Việc xử lý phân tán nhằm thích ứng tốt hơn với việc phân bố ngày càng rộng rãi cĩia các công ty, xí nghiệp

• Nhiều ứng dụng hiện tại của công nghệ máy tính được phân tán như là một hệ quả tất yếu Thương mại điện tử trên Internet, các ứng dụng đa phưong tiện như việc cung cấp tin tức theo yêu cầu, các kỹ thuật chẩn đoán hình ảnh trong y khoa hoặc các hệ thống điều khiển sản xuất đều minh họa cho những ứng dụng phân tán

• T u y n h iên íừ g ó c đ ộ tổ n g thê hon, c h ú n g la c ó thể k h ẳ n g đ ịn h rằng lý d o CO' bản ciia

việc xử lý phân tán là do nỏ có ihể giái quyết tốt hơn các bài loán lớn và phức tạp mà chúng ta gặp phải hiện nay bàng cách sử dụng một biến thế của quy tắc ‘'chia để trị"

Trang 37

2 1 5 ư u nhu’Ọ‘c đ iể m c ủ a v iệc sử dụ n g cơ sỏ' dữ liệu p h â n tán

dữ liệu đang tồn tại Tiến trình này đòi hỏi cấu trúc lại các cơ sớ dữ liệu cục bộ ờ một mức nhất định Dù sao, những sửa đổi này vẫn là nhỏ hơn rất nhiều so vói việc tạo lập một cở sỏ' dữ liệu tập trung hoàn toàn mới

(3) Làm giảm tổng chi phí tim kiếm; Việc phân tán dữ liệu cho phép các nhóm làm việc cục bộ có thể kiểm soát đưọc toàn bộ dữ liệu cùa họ Tuy vậy, tại cùng thời điểm người sử dụng có thể truy cập đến dữ liệu ở xa nếu cần thiết Tại các vị trí cục bộ, thiết bị phần cứng có thể chọn sao cho phù họp với công việc xử lý dữ liệu cục bộ tại điếm đó

(4) Sir phát triển m ờ rộng: Các tổ chức có thể phát triển mở rộng bằng cách thêm các đơn vị mới, vừa có tính t ự trị, vừa có quan hệ tương đối với các đơn vị tố chức khác Khi đó giải pháp cơ sở dữ liệu phân tán hỗ trợ một sự mô’ rộng uyển chuyển vói một mức độ ảnh hưỏng tối thiểu tói các đơn vị đang tồn tại

(5) Trả lòi truy vấn nhanh; Hầu hết các yêu cầu truv vấn dữ liệu từ người sử dụng tại bất kỳ vị trí cục bộ nào đều thoả mãn dữ liệu ngay tại thời điềm đó

(6) Độ tin cậy và khả năng sử dụng náng cao: Ne u có một thành phần nào đó cùa hệ thống bị hòng, hệ thống vẫn c ó thể duy trì hoạt động

(7) Khả năng phục hồi nhanh chóng: Việc truy nhập dữ liệu không phụ thuộc vào một máy hay một đường nối trên mạng Nếu có bất kỳ một lỗi nàở hệ thống có thể tự động chọn đường lại qua các đ ư ờng nối khác

b) Nhược điểm

(1) Giá thành và sự phírc tạp của phần mềm: Các phần mềm sử dụng trong môi trường

c ơ sờ dữ liệu phân tán rất phức tạp, đặc biệt là phần mềm sử dụng cho việc quản trị môi trường

cơ sở dữ liệu phân tán

(2) Tiến trinh kết nối các vị trí dữ liệu cục bộ khó khăn, phiền phức Các vị trí cục bộ phải trao đổi thông điệp vói nhau và thực hiện thêm các tính toán phức tạp đế đảm bảo sự kết nối đúng đắn giữa những vị trí đó

(3) Sự toàn vẹn d ữ liệu: Một sán pliấm mang nhiều tính phức tạp như vậy dĩ nhiên phải làm gia tăng khả năng xáo trộn trong việc bảo đám tính toàn vẹn cho d ữ liệu

(4) Tốc độ truy cập sẽ trỏ' nên chậm một cách đáng kể, nếu dữ liệu không được phân tán thích hợp theo đún g yêu cầu sử dụng hoặc các bàng truy vấn được thiết lập không đúng đắn thi việc tìm kiếm và xử lý c ũng sẽ xảy ra khá chậm chạp

Trang 38

2 1 6 Co* s ở d ữ liệ u p h â n tán và CO’ sỏ d ữ liệu tập tr u n g

C ơ sờ d ừ liệu tập trung cùng với c ơ sò’ dù' liệu không qua thiết kế hình tlìành trưcVc khi

có co sò' dừ liệu phân tán Hai hình thức này phát trien trèn cư sỏ tự phát và hệ thống tập trung Như vậy hai hình thức này không đáp ứng được yêu cầu tồ chức và CÔIIÔ, việc trên phạm vi lớn

C ơ sờ d ữ liệu phân tán đưọc thiết kế khác CO' sỏ' dữ liệu tập trung Do đó cằn đối sánh

cá c đặc trưng c ủ a c ơ s ờ d ừ liêu phân tán v ớ i c ơ SO' d ữ liệu tập truiiíJ đ ê thắy đirọc lợi ích cua c ơ

s ờ dCr liệu p h ả n tán Đ ặ c f r u n g m ô tá c o d ữ liệu tập Iriing là đi èu khi én íặp truim độ c lập diì

liệu, giám bỏl dư thừa, CO' cấu vật lý phức tạp đối với kha năng tmy cặp, toàn vẹn, hồi phục,

đ iều khiển t ư ơ n g tranh, biệt lập và an toàn d ừ liệu.

Đ iều khiên tập trung: Điều khiến tập trung các nguồn thông tin cua công việc hay tồ

chức Cỏ ngưòi quản trị đảm bảo an toàn dữ liệu

Trong c ơ sỏ' dữ liệu phân tán: không đề cập đến vắn đề điều khiển tập trung Người

quản trị c ơ s ở d ữ liệu c h u n g phân q u y ề n c h o n g ư ờ i quan trị CO' sò ‘ d ữ liệu địa phirong.

Độc ìập d ừ liệu: Là một trong nhiTnii nhân tố tác động đến cấu trúc CO' sở dừ liệu đế tỏ

chức dữ liệu chuyến cho c h ươ ng trình ứng dụng Tiện lợi chính của độc lập dữ liệu là các

•chương trình ứng dụng không bị ảnh hường khi thay đồi cấu trúc vật lý của dữ liệu Trong cơ sở

dừ liệu phân tán, độc lập d ữ liệu có tầm quan trọng cQng nhir trong c ơ sờ dừ liệu truyền thống Khái niệm c ơ s ờ dữ liệu trong suốt mô tả hoạt động chương trình trên cơ sơ dữ liệu phân tán đưọc viết như làm việc trên cơ sớ dữ liệu tập trung Hay nói cách khác tính đúng đắn của

c h ư o n g trinh k h ô n g bị ảnh h ư ò ‘n g b ói v i ệ c di c lu iy é n d ữ liệu từ nơi nàv sanii n oi khác trong

mạng máy tính Tuy nhiên tốc độ làm việc bị ảnh huxVng do có thời gian di chuyển dữ liệu

G iam d ư thừa dir ỉiệu: Trong cơ sở dCr liệu tập trung, tính dư thừa hạn chế được càng

nhiều càng tốt vi;

- D ữ liệu k h ô n g đ ồ n g nhắt khi c ó vài bán s a o cua c ù n g CO' s ờ dũ' liệu lo g ic: đ ẻ tránh

được nhược điếm này giải pháp là chi có một ban sao duy nhầl

- Giẳm không gian lưu trữ Giảm d ư thừa cỏ nghĩa là cho phép nhiều ứng dụng cùng truy cặp đến một c ơ sở d ữ liệu mà không cần đến nhiều bản sao ở nhung nơi chương trình ứng dụng cần

Trong c ơ sở dữ liệu truyền thống tính dư thừa dũ' liệu cfing cần quan tâm vi:

- Tính cục bộ của c h ưo ng trinh ứng dụng sẽ tăim nếu dữ liệu đặt ó‘ IIÌỌÌ noi mà chưong trình ứng dụng cần

- Khả năng sẵn sàng cúa hệ thống cao bỏi vi khi có lỗi ó' một nơi nào đó trong hệ thống thì không cản trờ hoạt đ ộn g của c hương trình ứng dụng

Nói chung, nguyên nhân đối lập với tính dir thừa đưa ra trong môi trưòng truyền thống vẫn còn đúng cho hệ thống phân tán và vì vậy công việc định giá mức độ tốt ciia tính dư thừa đòi hòi định giá lại c ông việc lựa chọn mức độ d ư thừa dừ liệu

Co' sở d ữ liệu phân tán khắc phục được hai nhược điẻm này vi dữ liệu đuọc chia ra thành nhiều phần nhỏ và chi có một bản sao logic tống thế duy nhất đế tiện cho việc truy cập dữ liệu

Trang 39

c ầ u írúc V Ú ! lý vù kha nang ỉruy cụp: Ngiiời sử dụng truv cập đến cư sỏ’ diì liệu tập

truim pliải thôim qua cắu trúc truy cập phức tạp: định vị CO' só' dữ ỉiệiu thiết lập đ ường truyền

Trong cơ sỏ’ du' liệu phân tán, cấu trúc truy cập phức tạp không phải là công cụ chính để truy cập liiệu quá đến cơ sở dữ liệu Hiệu quả có nghĩa là thòi gian tim kiếm và chuyển dữ liệu nho nhất, chi phí truyền thông thấp nhất

Mỗi cách thức truy cặp cơ SCT dừ liệu phân tán viết bỏi ngưòi lập trình hoặc tạo ra bởi một bộ tối ưu Cõng việc viết ra một cách thức truy cập CO' só‘ ciCr liệu phân tán cùng giống như viết c hương trinh duyệt trong cơ sớ dừ liệu tập trung Công việc mà clurong trình duyệt này làm

xác định xem có thể truy cập đến đưọc bao nhiêu CO' sở dừ liệu

Tinh ỉocm vẹn hồi p h ụ c vù điểu khiêỉi íiỉxrìĩg ỉranh: Mặc dù trong cơ sờ dữ liệu, tính

toàn vẹn, hồi phục và điều khiển đồng thòi liẻn quan nhiều vấn đề liên quan lẫn nhau Mờ rộng hơn vấn đề nàv là việc CLiní» cấp các líiao tác Giao tác là đon vị C0‘ bản của việc thực hiện: giao tác cụ thê là bó cỏiig việc được thực hiện toàn bộ hoặc không đưọc thực hiện

Trong cơ sò’ dữ liệu phân tán, vấn đề điều khiển giao tác tự trị cỏ ý nghĩa quan trọng;

hệ thống điều phối phải chuyển đổi các quỹ thời gian cho các giao tác liên tiếp N h ư vậy giao tác tự trị là phương tiện đạt được sự toàn vẹn trong c ơ sở dCr liệu C ó hai mối nguy hiểm của giao tác tự trị là lỗi và tương tranh

quyền điều khiến tập trung, ngưòi sứ dụng có chắc chắn được phân quyền mới truy cập vào

được dữ liệu Điểm quan trọng là trong cách tiếp cận c ơ sở dữ liệu lập trung, không cần thú tục

điều kJiiển chuyên biệt

Trong cơ sở dữ liệu phân tán, những người quản trị địa phương c ũng phải giái quyết

vấn đề tirong tự như ngưòi quản trị CO’ sỏ' dũ’ liệu truyền thống

Tliv nhiên, hai vấn đề đặc biệt sau đây của C0sỏ' d ữ liệu phân tán có ý nghĩa quan trọng khi đề cập đến:

- Thứ nhất trong cơ sỏ' dCr liệu phân tán với cấp độ tự trị cao ớ mồi điếm, người có dQ' liệu địa phương sẽ cảm thấy an toàn hon vì họ có thề tự bảo vệ dCr liệu của mình thay vi phụ thuộc vào người quản trị hệ thống tập trung

- Thứ hai, vấn đề an toàn thực chất vói hệ thống phân tán không giống như các liệ thống thông thường khác mà còn liẻn quan đến mạng truyền thông

Như vậy trong c ơ sỏ' dữ liệu phân tán vấn đề an toàn c ơ sớ d ữ liệu phức tạp hơn và đòi hỏi nhiều kỹ thuật bảo vệ Nguyên nhân gây ra là hệ thống này có tính mở và nhiều người dùng trong cùng hệ thống sử dụng nhiều cơ sờ dữ liệu

2 1 7 K iến tr ú c c ơ b ả n củ a C S D L p h â n tán

Đây không là kiến tmc tường minh cho tất cả các C S D L phân tán, tuy vậy kiến trúc này thể hiện tổ chức của bất kỳ một CSDL phân tán nào

S(/ đồ íông thè\ Định nghĩa tất cả các dữ liệu sè đưọc lưu trữ trong CSDL phân tán

Trong mô hình quan hệ, sơ đồ tồng thể bao gồm định nghĩa cúa các tập quan hệ t ổng thê

Trang 40

S ơ đô p h â n đotm: Mồi quan hệ tống thế có tliè chiíi thành một vài phần không gối lên

nhau được gọi là đoạn (fragments) Có nhiều cách khác nhau để thực hiện việc phân chia này Anh xạ (m ộ t - nhiều) giữa SO' dồ tổng thể và các đoạn đirợc địnli imhĩa trong sơ đồ phân đoạn

Sơ đồ định vị: Các đoạn là các phần logic cua quan hệ tông thẻ đưọc định vị vặt lý trên

một hoặc nhiều vị trí trên mạng Sơ đồ định vị định imhìa đoạn nào định vị tại các vị trí nào Lưũ ý rằng kiểu ánh xạ đưọc định nghĩa trong sơ đồ định vị quyết định C S D L phân tán là dư thừa hay không

Sơ đồ ánh x ạ địa phirơiiịỊ: Ánh xạ các ảnh vật lý và các đối t i i ọ n g đ ư ợ c Ill’ll trữ tại một trạm (tất Gà c á c đ oạ n c ù a một quan liệ tố n g thể trên ciìim niột v ị trí tạo ra m ột ánh vật lý).

H ìn h 2.6 Kiến trúc c ơ bản của CSDL phân tán.

2 1 8 H ệ q u ă n trị C SD L p h ân tán

định nghĩa là một hệ thống phần mềm cho phép quán lý các hệ (?SDL (tạo lập và điều khiển các truy nhập cho các hệ C SD L phản tán) và làm cho việc phân lãn trơ nên trong suốt với người sứ dụng

Đặc tính vô hình muốn nói đến sự tách biệt về ngũ' ngihĩa ỏ' cấp độ cao cũa một hệ thống với các vấn đề cài đặt ở cấp độ thấp Sự phân tán dữ liệu được che dấu với người sừ dụng làm cho người sử dụng truy nhập vào CSDL phân tán như hệ CSDL tập trung Sự tliay đổi việc quản

trị không ảnh hưởng tới người sử dụng.

Hệ quản trị C S D L phân tán gồm I tập các phần mềm ( chương trinh) sau:

Ngày đăng: 03/12/2015, 00:06

HÌNH ẢNH LIÊN QUAN

Hình  1.4a và  1.4b,  mô tả các  loại  mô hình Client-Server 3  lớp. - Giáo trình hệ cơ sở dữ liệu phân tán và suy diễn  phần 1   nguyễn văn huân, phạm việt bình
nh 1.4a và 1.4b, mô tả các loại mô hình Client-Server 3 lớp (Trang 18)
Hình  1.5.   M ô  hình clien t server nhiều  lớp. - Giáo trình hệ cơ sở dữ liệu phân tán và suy diễn  phần 1   nguyễn văn huân, phạm việt bình
nh 1.5. M ô hình clien t server nhiều lớp (Trang 19)
Hình  1.6.   Cơ chể  làm v iệ c  cùa một ứ ng dụ n g CGI. - Giáo trình hệ cơ sở dữ liệu phân tán và suy diễn  phần 1   nguyễn văn huân, phạm việt bình
nh 1.6. Cơ chể làm v iệ c cùa một ứ ng dụ n g CGI (Trang 20)
Hình  1 . 7.  K iến trúc  hệ thống  Server. - Giáo trình hệ cơ sở dữ liệu phân tán và suy diễn  phần 1   nguyễn văn huân, phạm việt bình
nh 1 . 7. K iến trúc hệ thống Server (Trang 21)
Hình  1.9.   D ữ   liệu  biểu diễn dưới  dạng phân cấp. - Giáo trình hệ cơ sở dữ liệu phân tán và suy diễn  phần 1   nguyễn văn huân, phạm việt bình
nh 1.9. D ữ liệu biểu diễn dưới dạng phân cấp (Trang 25)
Hình  2.2.   M ôi  trường  hệ  C SD L  tập  trung. - Giáo trình hệ cơ sở dữ liệu phân tán và suy diễn  phần 1   nguyễn văn huân, phạm việt bình
nh 2.2. M ôi trường hệ C SD L tập trung (Trang 32)
Hình 2.3.   M ô   hình c ơ  sở  dữ  liệu  ngân hàng phân tán. - Giáo trình hệ cơ sở dữ liệu phân tán và suy diễn  phần 1   nguyễn văn huân, phạm việt bình
Hình 2.3. M ô hình c ơ sở dữ liệu ngân hàng phân tán (Trang 33)
Sơ đồ  định  vị:  Các  đoạn  là  các  phần  logic  cua  quan  hệ  tông  thẻ  đưọc  định  vị  vặt  lý  trên - Giáo trình hệ cơ sở dữ liệu phân tán và suy diễn  phần 1   nguyễn văn huân, phạm việt bình
nh vị: Các đoạn là các phần logic cua quan hệ tông thẻ đưọc định vị vặt lý trên (Trang 40)
Hình 2.8. Biểu diễn mối liên hệ giữa các quan hệ nhờ các đường nối. - Giáo trình hệ cơ sở dữ liệu phân tán và suy diễn  phần 1   nguyễn văn huân, phạm việt bình
Hình 2.8. Biểu diễn mối liên hệ giữa các quan hệ nhờ các đường nối (Trang 50)
Hình 2.9a).   C hiến  lược  A. - Giáo trình hệ cơ sở dữ liệu phân tán và suy diễn  phần 1   nguyễn văn huân, phạm việt bình
Hình 2.9a . C hiến lược A (Trang 80)
Hình  2.  Kki).   Vấn tin gốc.  tin  đã rút  gọn. - Giáo trình hệ cơ sở dữ liệu phân tán và suy diễn  phần 1   nguyễn văn huân, phạm việt bình
nh 2. Kki). Vấn tin gốc. tin đã rút gọn (Trang 91)
Hình 2.11b).   Cây  tương  đương. - Giáo trình hệ cơ sở dữ liệu phân tán và suy diễn  phần 1   nguyễn văn huân, phạm việt bình
Hình 2.11b . Cây tương đương (Trang 93)
Hình  2 .12d).   v ấ n   tin  đã  rút gọn. - Giáo trình hệ cơ sở dữ liệu phân tán và suy diễn  phần 1   nguyễn văn huân, phạm việt bình
nh 2 .12d). v ấ n tin đã rút gọn (Trang 97)
Hình  2.15.   M ột  số   lịch  biểu. - Giáo trình hệ cơ sở dữ liệu phân tán và suy diễn  phần 1   nguyễn văn huân, phạm việt bình
nh 2.15. M ột số lịch biểu (Trang 115)
Hình 2. Ị 7.   Đ ồ  thị tuần tự  cho  ba  giao  dịch. - Giáo trình hệ cơ sở dữ liệu phân tán và suy diễn  phần 1   nguyễn văn huân, phạm việt bình
Hình 2. Ị 7. Đ ồ thị tuần tự cho ba giao dịch (Trang 120)

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm