Máy trung tâm s giám sát và qu n lý các ti n trình này... Application Server Application Application Application... Có hai cách phân tán d li u: phân tán ki u Client/Server và phân tán k
Trang 2H C VI N CÔNG NGH B U CHÍNH VI N THÔNG
Biên so n : TS PH M TH QU
Trang 3
Tài li u “C s d li u phân tán” là sách h ng d n h c t p dùng cho sinh viên h đào
t o t xa ngành công ngh thông tin và ngành k thu t đi n t , vi n thông N i dung c a tài
li u bao g m:
- Ch ng I gi i thi u khái ni m c b n v c s d li u phân tán, x lý phân tán vàh
th ng x lý phân tán S c n thi t c a h c s d li u phân tán và các đ c đi m c a c s d
li u phân tán C u trúc logic c a c s d li u phân tán và các l i íchphân tán d li u trên
m ng
- Ch ng II gi i thi u t ng quát v h qu n tr c s d li u phân tán u đi m cách ti p
c n mô hình c s d li u quan h và h qu n tr c s d li u quan h V n đ quy t c toàn
v n d li u Mô hình ki n trúc h qu n tr c s d li u phân tán và ki n trúc t ng quan c a
m t h qu n tr ph c h CSDL phân tán
- Ch ng III trình bày nh ng v n đ thi t k c s d li u phân tán,là các v n đ phân
m nh d li u S c n thi t ph i phân m nh, các ki u phân m nh, m c đ phân m nh, các quy
t c phân m nh và bài toán c p phát d li u N i dung c a ch ng trình bày t ng quát k thu t phân m nh ngang c s và phân m nh ngang d n xu t Thông tin c n thi t c a phân m nh ngang Ph ng pháp phân m nh d c, thông tin c n thi t c a phân m nh d c và các thu t toán
t nhóm và phân m nh Có nhi u bài toán c n thi t ph i s d ng lai ghép phân m nh ngang
và phân m nh d c Bài toán c p phát d li u, thông tin c n thi t cho bài toán c p phát và mô hình c p phát
- Ch ng IV gi i thi u ki m soát d li u ng ngh a, là quá trình ki m soát khung nhìn trong các h qu n tr c s d li u t p trung và khung nhìn trong các h qu n tr c s d li u phân tán N i dung ki m soát d li u ng ngh a c ng bao hàm v n đ an toàn d li u Ki m soát c p quy n t p trung và ki m soát c p quy n phân tán.Ki m soát toàn v n ng ngh a t p trung và ki m soát toàn v n ng ngh a phân tán
- Ch ng V đ c p đ n các v n đ x lý truy v n trong các h c s d li u phân tán Khái ni m x lý truy v n,m c đích c a vi c x lý truy v n và gi i thi u các t ng c a quá trình
Tác gi
Trang 4
2
Trang 5Nguyên lý các h c s d li u phân tán đ c xây d ng d a trên s h p nh t c a hai
h ng ti p c n đ i v i quá trình x lý d li u, đó là lý thuy t các h c s d li u và công ngh m ng máy tính
M t trong nh ng đ ng l c thúc đ y s phát tri n nhanh vi c s d ng các h CSDL là nhu
c u tích h p các lo i d li u, cung c p đa d ng các lo i hình d ch v và các d ch v đa
ph ng ti n cho ng i s d ng M t khác, k t n i máy tính thành m ng v i m c tiêu chia s tài nguyên, khai thác có hi u qu các tài nguyên thông tin, nâng cao kh n ng tích h p và trao
đ i các lo i d li u gi a các thành ph n trên m ng
Nhu c u thu th p, l u tr x lý và trao đ i thông tin bgày càng t ng, các h th ng x lý t p trung đã b c l nh ng nh c đi m sau :
− T ng kh n ng l u tr thông tin là khó kh n, b i b gi i h n t i đa c a thi t b nh
− s n sàng ph c v c a CSDL không cao khi s ng i s d ng t ng
− Kh n ng tính toán c a các máy tính đ n l đang d n t i gi i h n v t lý
− Mô hình t ch c l u tr , x lý d li u t p trung không phù h p cho nh ng t ch c kinh t , xã h i có ho t đ ng r ng l n, đa qu c gia
Nh ng nh c đi m này đã đ c kh c ph c khá nhi u trong h th ng phân tán Nh ng s n
ph m c a các h th ng phân tán đã xu t hi n nhi u trên th tr ng và t ng b c ch ng minh tính u vi t c a nó h n h n các h th ng t p trung truy n th ng Các h th ng phân tán s thay th d n các h th ng t p trung
1.2 X LÝ PHÂN TÁN VÀ H TH NG X LÝ PHÂN TÁN
1.2.1 Khái ni m x lý phân tán
Thu t ng x lý phân tán có th là thu t ng đ c l m d ng nhi u nh t trong khoa h c máy tính trong nh ng n m v a qua Nó th ng đ c dùng đ ch nh ng h th ng g m nhi u
Trang 6
4
lo i thi t b khác nhau ch ng h n nh : h đa b x lý, x lý d li u phân tán, m ng máy tính
Có hai khái ni m x lý phân tán liên quan v i nhau
− Khái ni m liên quan đ n vi c tính toán trên Client/Server Trong đó ng d ng đ c chia ra thành hai ph n, ph n c a Server và ph n c a Client và đ c v n hành hai
n i Trong tính toán phân tán này cho phép truy nh p tr c ti p d li u và x lý d li u trên Server và Client
− Khái ni m th hai là vi c th c hi n các tác v x lý ph c t p trên nhi u h th ng Không gian nh và b x lý c a nhi u máy cùng ho t đ ng chia nhau tác v x lý Máy trung tâm s giám sát và qu n lý các ti n trình này Có tr ng h p thông qua Internet, hàng nghìn máy cùng x lý m t tác v
Có th đ nh ngh a h x lý phân tán nh sau: H x lý phân tán là m t t p h p các ph n t
x lý t tr (không nh t thiêt đ ng nh t) đ c k t n i v i nhau b i m t m ng máy tính và cùng ph i h p th c hi n nh ng công vi c gán cho chúng Ph n t x lý đây đ ch m t thi t
b tính toán có kh n ng th c hi n ch ng trình trên nó
1.2.2 H th ng phân tán
H th ng phân tán là t p h p các máy tính đ c l p k t n i v i nhau thành m t m ng máy tính đ c cài đ t các h c s d li u và các ph n m m h th ng phân tán t o kh n ng cho nhi u ng i s d ng truy nh p chia s ngu n thông tin chung Các máy tính trong h th ng phân tán có k t n i ph n c ng l ng l o, có ngh a là không chia s b nh , ch có m t h đi u hành trong toàn b h th ng phân tán
Các m ng máy tính đ c xây d ng d a trên k thu t Web, ví d nh m ng Internet, m ng Intranet… là các m ng phân tán
1.3 H C S D LI U PHÂN TÁN LÀ GÌ
Công ngh các h c s d li u phát tri n t mô hình x lý d li u, trong đó m i ng d ng
đ nh ngh a m t hay nhi u t p d li u riêng c a nó (hình 1.1), sang mô hình đ nh ngh a và
Trang 7C s d li u phân tán là m t t p các c s d li u có quan h v i nhau v m t logic và
đ c phân b trên m t m ng máy tính H qu n tr c s d li u phân tán là h th ng ph n
m m cho phép qu n tr c s d li u phân tán và làm cho s phân tán đó là trong su t đ i v i
ng i s d ng
Trong mô hình c s d li u phân tán b n thân c s d li u có trên nhi u máy tính khác nhau Nh v y, đ c tr ng c a c s d li u phân tán là các CSDL đ c phân b trên m ng máy tính và có quan h v i nhau v m t logic
H CSDL phân tán không đ n thu n bao g m nhi u file d li u đ c t ch c l u tr riêng
l trên các thi t b nh c a m ng máy tính t o m t h CSDL phân tán, các file không ch
có quan h v i nhau v m t logic mà còn c n có m t c u trúc giao di n chung gi a chúng đ các file có th truy nh p l n nhau
Có r t nhi u ng d ng yêu c u các h qu n tr CSDL thao tác trên d li u bán c u trúc
ho c không c u trúc, nh các file Web trên m ng Internet
1.4 S C N THI T C A H C S D LI U PHÂN TÁN
Trong nh ng n m g n đây, công ngh c s d li u phân tán đã tr thành m t l nh v c quan tr ng c a công ngh thông tin, tính c n thi t c a nó ngày càng đ c nâng cao Có nhi u nguyên nhân thúc đ y s phát tri n c a các h CSDLPT:
…
C S
D LI U
Hình 1.2: X lý c s d li u
Trang 8
6
1.4.2 Gi m chi phí truy n thông
Trong th c t , s d ng m t s ng d ng mang tính đ a ph ng s làm gi m chi phí truy n thông B i v y, vi c t i u hoá tính đ a ph ng c a các ng d ng là m t trong nh ng m c tiêu chính c a vi c thi t k và cài đ t m t CSDLPT
1.4.3 Hi u qu công vi c
S t n t i m t s h th ng x lý đi ph ng đ t đ c thông quan vi c x lý song song
V n đ này có th thích h p v i m i h đa x lý CSDLPT có thu n l i trong phân tích d
li u ph n ánh đi u ki n ph thu c c a các ng d ng, c c đ i hoá tính đ a ph ng c a ng
d ng Theo cách này tác đ ng qua l i gi a các b x lý đ c làm c c ti u Công vi c đ c phân chia gi a các b x lý khác nhau và tránh đ c các t c ngh n thông tin trên m ng truy n thông ho c các d ch v chung c a toàn h th ng S phân tán d li u ph n ánh hi u qu làm
c a toàn h th ng hi m khi x y ra
CSDLPT là s t p h p các d li u thu c cùng m t h th ng v m t logic nh ng phân b trên các site c a m ng máy tính Công ngh CSDLPT là s k t h p gi a hai v n đ phân tán
và h p nh t:
• Phân tán : phân tán d li u trên các site c a m ng
• H p nh t : h p nh t v m t logic các d li u phân tán sao cho chúng xu t hi n v i
ng i s d ng gi ng nh v i CSDL đ n l duy nh t
Công ngh CSDL phân tán m i th c s phát tri n trong nh ng n m g n đây nh s phát tri n c a k thu t tính toán, k thu t truy n thông và m ng máy tính Nh ng ng d ng đ c xây d ng trên CSDL phân tán đã xu t hi n nhi u trên th tr ng và t ng b c ch ng minh tính u vi t c a nó so v i CSDL t p trung
Trang 9nh n m nh Nói chung, trong các c s d li u phân tán , s đi u khi n đ c th c hi n theo
m t c u trúc đi u khi n phân c p bao g m hai lo i ng i qu n tr c s d li u:
• Ng i qu n tr c s d li u toàn c c (Global Database Administrator) là ng i có trách nhi m chính v toàn b c s d li u phân tán
• Ng i qu n tr c s d li u c c b (Local Database Administrator) là ng i có trách nhi m v c s d li u c c b c a h
Tuy nhiên, nh ng ng i qu n tr c s d li u c c b c n ph i có nh ng quy n đ c l p riêng v c s d li u c c b c a mình mà ng i qu n tr c s d li u toàn c c hoàn toàn không có nh ng quy n này và s ph i h p gi a các v trí đ c th c hi n b i chính nh ng
ng i qu n tr c c b c đi m này đ c g i là s đ c l p v trí Các c s d li u phân tán
có th khác nhau r t nhi u v m c đ đ c l p v trí T s đ c l p v trí hoàn toàn (không có
ng i qu n tr c s d li u t p trung) đ n s đi u khi n t p trung hoàn toàn
Trong các h c s d li u phân tán, đ c l p d li u c ng quan tr ng nh trong các c s
d li u t p trung Tuy nhiên, m t đ c đi m m i đ c đ a vào trong khái ni m thông th ng
c a đ c l p d li u là s trong su t phân tán (Distribution Transparency) Nh s trong su t phân tán mà các ch ng trình ng d ng có th đ c vi t gi ng nh trong c s d li u không
đ c phân tán Vì v y, tính đúng đ n c a các ch ng trình ng d ng không b nh h ng b i
s di chuy n d li u t m t v trí này đ n m t v trí khác Tuy nhiên, t c đ th c hi n c a các
ch ng trình ng d ng thì b nh h ng
c l p d li u trong c s d li u t p trung đ c th hi n thông qua m t ki n trúc nhi u
m c, các m c này có nh ng mô t khác nhau v d li u và nh ng ánh x bi n đ i gi a các
m c S trong su t phân tán trong c s d li u phân tán đ c thê hi n b ng cách b sung thêm các m c trong su t vào ki n trúc nhi u m c c a c s d li u t p trung
1.5.3 Gi m d th a d li u
Trong các c s d li u t p trung, s d th a d li u đ c gi m thi u, vì tránh s không
nh t quán gi a nhi u b n sao b ng cách ch có m t b n sao và ti t ki m vùng nh l u tr Các
ng d ng chia s chung, truy xu t đ n các t p tin d li u
Tuy nhiên, trong các c s d li u phân tán, s d th a d li u là m t đ c đi m c n thi t,
vì các lý do sau:
Trang 10
8
• Làm t ng tính c c b c a các ng d ng n u d li u đ c nhân b n t i t t c các v trí mà ng d ng c n d li u này Khi đó, các ng d ng c c b đ c th c hi n nhanh h n vì không c n ph i truy xu t d li u t xa
• Làm t ng tính s n sàng c a h th ng ng d ng, vì m t v trí có s c s không làm
ng ng s th c hi n c a các ng d ng nh ng v trí khác n u d li u t i v trí b
h ng đ c nhân b n t i các v trí khác
Tuy nhiên, s nhân b n d li u c n ph i xem xét k l ng d a vào hai lo i ng d ng c
b n, đó là ng d ng ch đ c và ng d ng c p nh t S nhân b n d li u giúp cho các ng
d ng ch đ c đ c th c hi n nhanh h n, nh ng nó làm cho các ng d ng c p b th c hi n lâu
h n vì ph i c p nh t d li u t i các v trí đ c nhân b n
Nh v y, s nhân b n d li u s là m t u đi m n u h th ng có r t nhi u ng d ng ch
đ c và có r t ít ng d ng c p nh t Trong tr ng h p ng c l i thì s nhân b n d li u l i là
m t nh c đi m
1.5.4 tin c y qua các giao d ch phân tán
H qu n tr CSDL phân tán c i thi n đ tin c y qua các giao d ch phân tán, vì các thành
ph n đ c nhân b n h n ch đ c các v trí l i riêng l L i c a tr m riêng, ho c l i c a truy n thông làm cho m t ho c nhi u tr m m t liên l c, không đ đ phá v toàn b h th ng Trong tr ng h p CSDL phân tán, đi u này ngh a là m t s d li u không th truy nh p đ c,
nh ng n u bi t cách h tr cho các giao d ch phân tán và các giao th c ng d ng, thì ng i s
d ng v n có th truy nh p đ c t i ph n khác trong CSDL phân tán
Giao d ch là m t đ n v tính toán c b n, nh t quán và tin c y, bao g m m t chu i các thao tác CSDL đ c th c hi n chuy n t tr ng thái CSDL nh t quán này sang tr ng thái CSDL
nh t quán khác ngay c khi có m t s giao d ch đ c th c hi n đ ng th i và th m chí c khi
x y ra l i Vì v y, h qu n tr CSDL ph i h tr đ y đ cho giao d ch đ m b o r ng vi c th c thi đ ng th i các giao d ch c a ng i s d ng s không vi ph m tính nh t quán c a CSDL trong khi h th ng có l i, v i đi u ki n là giao d ch đ c th c hi n chính xác, ngh a là tuân theo các qui t c toàn v n c a CSDL
1.5.5 C i ti n hi u n ng
Hi u n ng c a CSDL phân tán đ c c i ti n d a vào hai đi m:
a) H qu n tr CSDL phân tán có kh n ng phân m nh CSDL khái ni m và cho phép c c b hoá d li u Có hai u đi m n i b t:
• Vì m i tr m ch x lý m t ph n CSDL, s tranh ch p v CPU và các d ch v vào/ra không nghiêm tr ng nh trong các h CSDL t p trung
• Tính c c b làm gi m tr truy nh p t xa th ng g p trên các m ng di n r ng
H u h t các h CSDL phân tán đ c c u trúc nh m t n d ng t i đa nh ng u đi m c a tính
c c b d li u L i ích đ y đ c a vi c gi m tranh ch p và gi m chi phí truy n ch có th có
đ c b ng cách phân m nh và phân tán d li u h p lý
Trang 11và x lý c a m ng Rõ ràng là không th có đ c s gia t ng “kh n ng” m t cách tuy n tính,
vì đi u này ph thu c vào chi phí phân tán Tuy nhiên, v n có th có nh ng c i ti n có ý ngh a Kh n ng m r ng h th ng d dàng mang tính kinh t , chi phí gi m
1.6 CÁC MÔ HÌNH C S D LI U CLIENT/SERVER
Nhìn chung m i ng d ng c s d li u bao g m các ph n:
• Thành ph n x lý ng d ng (Application Processing Components)
• Thành ph n ph n m m c s d li u (Database Software Componets)
• B n thân c s d li u (The Database Ifself)
Có 5 mô hình ki n trúc v t lý v truy nh p d li u
• Mô hình c s d li u t p trung (Centralized database model)
• Mô hình c s d li u theo ki u file - server (File - server database model)
• Mô hình x lý t ng ph n c s d li u (Database extract processing model)
• Mô hình c s d li u Client/Server (Client/Server database model)
• Mô hình c s d li u phân tán (Distributed database model)
có th cung c p cho các tr m làm vi c các v trí phân tán truy nh p nhanh chóng t i c s
d li u trung tâm Tuy nhiên trong r t nhi u h th ng, c 3 thành ph n c a ng d ng c s d
li u đ u th c hi n trên cùng m t máy mainframe do v y c u hình này c ng thích h p v i mô hình t p trung
1.6.2 Mô hình c s d li u theo ki u File Server:
Trong mô hình c s d li u theo ki u File Server, các thành ph n ng d ng và ph n m m
c s d li u trên m t h th ng máy tính và các File d li u v t lý c s d li u cài đ t trên
h th ng máy tính khác M t c u hình nh v y th ng đ c dùng trong môi tr ng c c b ,
Trang 12
10
trong đó m t ho c nhi u h th ng máy tính đóng vai trò c a Server l u tr các file d li u
Mô hình File Server gi ng v i mô hình t p trung, c s d li u và các thành ph n ng d ng,
ph n m m c s d li u cài đ t trên các máy tính khác nhau Tuy nhiên các thành ph n ng
d ng và ph n m m c s d li u có th có cùng thi t k đ v n hành m t môi tr ng t p trung H đi u hành m ng có th th c hi n c ch đ ng th i cho phép nhi u ng i s d ng
cu i có th truy nh p vào cùng c s d li u
1.6.3 Mô hình x lý t ng ph n c s d li u
Mô hình trong đó m t c s d li u xa có th đ c truy nh p b i ph n m m c s d
li u, đ c g i là x lý d li u t ng ph n V i mô hình này, ng i s d ng có th t i m t máy tính cá nhân k t n i truy nh p, khai thác c s d li u xa V i cách ti p c n này, ng i s
d ng ph i bi t ch c ch n là d li u n m đâu và làm nh th nào đ truy nh p d li u Ph n
m m ng d ng c n ph i có trên c hai h th ng máy tính đ ki m soát s truy nh p d li u và chuy n d li u gi a hai h th ng Tuy nhiên, ph n m m c s d li u ch y trên hai h th ng không c n bi t r ng vi c x lý c s d li u t xa đang di n ra vì ng i s d ng tác đ ng t i chúng m t cách đ c l p
1.6.4 Mô hình c s d li u Client/Server
Trong mô hình c s d li u Client/Server, c s d li u đ c cài đ t trên Server, các ng
d ng trên các máy Client và ph n m m c s d li u đ c cài đ t trên c Client l n Server Trong mô hình này, các thành ph n x lý ng d ng trên h th ng Client đ a ra yêu c u cho
ph n m m c s d li u trên máy client, ph n m m này s k t n i v i ph n m m c s d li u
ch y trên Server Ph n m m c s d li u trên Server s truy nh p vào c s d li u x lý theo yêu c u và g i tr k t qu cho máy Client
M i nhìn, mô hình c s d li u Client/Server có v gi ng nh mô hình File Server, tuy nhiên mô hình Client/Server có r t nhi u thu n l i h n mô hình File Server V i mô hình File Server, m t giao tác c n truy nh p d li u nhi u l n có th gây ra t c ngh n l u l ng truy n trên m ng Gi s ng i s d ng t o ra m t v n tin đ l y d li u t ng s t 1000 b n ghi, v i cách ti p c n File Server, n i dung c a 1000 b n ghi ph i đ c l u chuy n trên
m ng, vì ph n m m c s d li u ch y trên máy c a ng i s d ng ph i truy nh p t ng b n ghi đ tho mãn yêu c u c a ng i s d ng V i cách ti p c n c s d li u Client/Server, ch
có l i v n tin kh i đ ng ban đ u và k t qu cu i cùng c n đ a lên m ng, ph n m m c s d
li u ch y trên máy l u gi c s d li u s truy nh p các b n ghi c n thi t, x lý chúng và g i các th t c c n thi t đ đ a ra k t qu cu i cùng
Trong mô hình c s d li u Client/Server, th ng nói đ n các ph n m m Front End Software và Back End Software Front End Software đ c ch y trên thi t b truy nh p đ u
cu i ho c trên các Workstation, nh m đáp ng các yêu c u x lý đ n l riêng bi t Nó đóng vai trò c a Client trong ng d ng c s d li u Client/Server và th c hi n các ch c n ng
h ng t i nhu c u c a ng i s d ng Front End Software chia thành các lo i sau:
• End User Database Software: Ph n m m c s d li u này có th đ c ng i s d ng
th c hi n trên thi t b đ u cu i, truy nh p vào các c s d li u c c b , k t n i v i các
c s d li u trên Server
Trang 13• Application Development Tools là ph n m m cung c p các kh n ng phát tri n các
ng d ng c s d li u Bao g m các công c v thông d ch, biên d ch đ n đ n các công c CASE (Computer Aided Software Engineering) Chúng t đ ng t t c các
b c trong quá trình phát tri n ng d ng và sinh ra ch ng trình cho các ng d ng
• Database Administration Tools: Các công c cho phép ng i qu n tr c s d li u
th c hi n vi c qu n tr c s d li u nh đ nh ngh a, l u tr hay ph c h i CSDL
Back End Software đ c cài đ t trên Server c s d li u, bao g m ph n m m c s d
li u Client/Server và ph n m m m ng
1.6.5 Distributed database model (Mô hình c s d li u phân tán)
C hai mô hình File Server và Client/Server đ u gi đ nh là d li u n m trên m t b x lý
và ch ng trình ng d ng truy nh p d li u n m trên m t b x lý khác, còn mô hình c s
d li u phân tán l i gi đ nh b n thân c s d li u có trên nhi u máy khác nhau
1.7 MÔ HÌNH THAM CHI U C S D LI U PHÂN TÁN
Mô hình ki n trúc c s d li u phân tán t i các site g m l c đ t ng th , l c đ phân
m nh và l c đ c p phát
1.7.1 L c đ toàn c c
L c đ toàn c c đ nh ngh a t t c d li u đ c ch a trong c s d li u phân tán nh trong c s d li u t p trung Vì v y, l c đ toàn c c đ c đ nh ngh a chính xác nh đ nh ngh a l c đ c s d li u t p trung Tuy nhiên, mô hình d li u l c đ toàn c c c n ph i
Trang 14m nh đ c ch ra b ng tên c a quan h toàn c c v i m t ch s (ch s phân m nh), ví d , Ri
ch đ n phân m nh th i trong quan h toàn c c R
Các ki u phân m nh d li u bao g m phân m nh ngang và phân m nh d c và m t ki u phân m nh ph c t p h n là s h t h p c a 2 lo i trên Trong t t c các ki u phân m nh, m t phân m nh có th đ c đ nh ngh a b ng m t bi u th c ngôn ng quan h cho các quan h toàn c c nh là các toán h ng và k t qu đ u ra là các phân m nh
1.7.3 L c đ c p phát
Các phân m nh là nh ng ph n logic c a các quan h toàn c c đ c ch a m t hay nhi u site trong m ng L c đ c p phát xác đ nh các phân m nh đ c ch a nh ng site nào T t
c các phân m nh t ng ng v i cùng m t quan h R và đ c l u dùng m t site j t o thành
m t mô hình v t lý c a quan h toàn c c lên site j Do đó, có m t ánh x m t-m t gi a m t
Global Schema
Fragmentation Schema
Allocation Schema
Local mapping Schema 1
Local mapping Schema 1
Trang 15
13
mô hình v t lý và m t c p là m t quan h toàn c c đ c đ nh danh và m t ch s site t ng
ng v i m t mô hình v t lý Ký hi u Rji t ng ng v i mô hình v t lý m nh th i c a quan
h R trên site j
M t ví d c a quan h gi a các ki u đ i t ng đ c đ nh ngh a nh trên đ c bi u di n trong hình sau M t quan h toàn c c R chia thành 4 phân m nh R1, R2, R3, R4 B n phân
m nh này đ c c p phát d t i 3 site c a m ng máy tính, vì th t o nên ba mô hình v t lý R1 site 1, R2 site 2 và R3.site 3
Hình 1.5: Các phân m nh và mô hình v t lý cho m t quan h toàn c c
Có th đ nh ngh a m t b n sao c a m t phân m nh t i m t site cho tr c và kí hi u b ng tên quan h toàn c c R và hai ch s Ví d R32 đ ch b n sao c a phân m nh R2 đ c ch a site 3 Hai mô hình v t lý có th gi ng nhau, ví là b n sao c a nhau
L c đ các site ph thu c: g m l c đ ánh x c c b , DBMS c a các site c c b , c s
d li u site đó
1.7.4 L c đ ánh x c c b
Do ba m c đ u các site đ c l p, do đó chúng không ph thu c vào mô hình d li u c a DBMS c c b m c th p h n, nó c n ph i ánh x mô hình v t lý thành các đ i t ng đ c thao tác b i các DBMS c c b Ánh x này đ c g i là l c đ ánh x c c b và ph thu c vào ki u c a DBMS c c b Trong h th ng không đ ng nh t có các ki u khác nhau c a ánh
x c c b t i các site khác nhau Y u t quan trong nh t đ thi t k ki n trúc này là:
• Phân m nh và phân phát d li u
• Qu n lí d th a d li u
• S đ c l p c a các DBMS c c b
Trang 161.8 C U TRÚC LOGIC C A C S D LI U PHÂN TÁN
Có 3 ki u thi t k c s d li u phân tán trên m ng máy tính
a) Các b n sao: C s d li u đ c sao chép thành nhi u b n và đ c l u tr trên các site phân tán khác nhau c a m ng máy tính
b) Phân m nh: C s d li u đ c phân thành nhi u m nh nh theo k thu t phân m nh
d c ho c phân m nh ngang, các m nh đ c l u tr trên các site khác nhau
c) Mô hình k t h p các b n sao và phân m nh Trên m t s site ch a c c b n sao, m t s site khác ch a các m nh
2 Tính song song trong các h c s d li u phân tán có th nâng cao đ c hi u qu truy
nh p Tính ch t này có th l i d ng đ x lý song song các câu h i Có hai d ng :
• Câu h i đ ng th i phát sinh t i các tr m khác nhau
Application Server
Application
Application
Application
Trang 17
15
• Câu h i có th đ c phân rã thành nh ng câu h i thành ph n đ c th c hi n song song t i các tr m khác nhau
3 Trong t ch c phân tán, t ng tranh d ch v , CPU, vào/ra ít h n so v i t ch c t p trung
tr trong truy nh p t xa có th gi m do vi c th c hi n đ a ph ng hoá d li u m t cách h p lý
4 tin c y và tính s n sàng đ c nâng cao trong t ch c phân tán, là m t trong nh ng m c tiêu c b n c a t ch c d li u phân tán Vi c t ch c l p d li u c ng có th đ m b o cho
vi c truy nh p c s d li u không b nh h ng khi có s c x y ra đ i v i tr m ho c kênh truy n, không th làm s p đ c h th ng
5 T ch c d li u phân tán kinh t h n so v i t ch c t p trung Giá cho m t h máy tính
nh r h n nhi u so v i giá c a m t máy tính l n khi tri n khai cùng m t m c đích ng
d ng Giá chi phí truy n thông c ng ít h n do vi c đ a ph ng hoá d li u
6 Kh n ng m r ng h th ng và phân chia tài nguyên Vi c m r ng kh n ng cho m t h
x lý phân tán là d dàng h n và cho phép th c hi n t t h n
1.10 H QU N TR C S D LI U QUAN H
1.10.1 Ki n trúc t ng quát
H qu n tr c s d li u quan h DBMS là m t h th ng ph n m m h tr mô hình quan
h và ngôn ng quan h DBMS khi th c hi n các giao d ch c n ph i giao ti p v i 2 thành
ph n khác, đó là thành ph n các h th ng con truy n thông (Communication subsystem) và
h đi u hành (Operating system) Các h th ng con truy n thông cho phép DBMS giao ti p
v i các h th ng truy n thông khác thông qua các ng d ng H đi u hành cung c p giao di n
gi a DBMS v i các tài nguyên c a máy Ki n trúc t ng quát c a h qu n tr c s d li u quan h đ c mô t trong hình 2.9 d i đây
Trang 18T ng giao di n (Interface Layer): có ch c n ng qu n lý giao di n v i các các ng d ng
nh giao di n trong SQL và các ng d ng CSDL th c hi n trên các khung nhìn d li u Khung nhìn s mô t cách nhìn d li u c a các ng d ng, là m t quan h o d n xu t t quan
h c s b ng cách áp d ng các phép đ i s quan h Vi c qu n lý khung nhìn bao g m vi c biên d ch câu v n tin c a ng i s d ng thành d li u khái ni m
Trang 19
17
T ng đi u khi n (Control Layer): Có ch c n ng đi u khi n câu v n tin b ng cách thêm
các v t toàn v n d li u và các v t c p quy n truy nh p Toàn v n d li u và c p quy n truy nh p đ c t b ng các phép tính quan h K t qu c a t ng này là câu v n tin đ c bi u
di n b ng phép tính quan h
T ng x lý v n tin (Query Proccessing layer): Có ch c n ng ánh x câu v n tin thành bi u
th c đ i s quan h - các chu i thao tác đ c t i u hoá T ng này có liên quan đ n hi u n ng CSDL Phân rã câu v n tin thành m t cây đ i s , g m các các phép toán đ i s quan h K t
qu s đ c l u trong m t ho ch đ nh truy xu t K t xuúat c a t ng này là câu v n tin đ c
bi u di n b ng đ i s quan h
T ng th c thi (Execution Layer): Ch u trách nhi m h ng d n vi c th c hi n các ho ch
đ nh truy xu t, bao g m các vi c qu n lý giao d ch và đ ng b hoá các phép toán đ i s quan
h Biên d ch các phép toán đ i s quan h b ng cách g i t ng truy xu t d li u qua các yêu
T ng duy trì nh t quán (Consistency Layer): Ch c n ng c a t ng này là đi u khi n các
ho t đ ng đ ng th i và ghi nh t ký các yêu c u c p nh t Cho phép khôi ph c l i các giao
d ch, h th ng và thi t b sau khi b s c
nh ngh a này nh n m nh hai khía c nh quan tr ng c a CSDLPT:
• Tính phân tán: th c t d li u không c trú trên cùng m t site, vì v y có th phân bi t
m t CSDLPT v i c s d li u t p trung (CSDLTT)
• S t ng quan logic: các lo i d li u có m t s tính ch t ràng bu c l n nhau, nh v y
có th phân bi t CSDLPT v i t p các CSDL đ a ph ng ho c v i các t p l u tr trên các site khác nhau
H qu n tr CSDL phân tán là h th ng ph n m m cho phép qu n tr CSDL phân tán và làm cho s phân tán đó là trong su t đ i v i ng i s d ng Nói cách khác CSDL phân tán là CSDL đ c phân tán m t cách v t lý nh ng đ c th ng nh t t ch c nh là m t CSDL duy
nh t
Nh v y s phân tán d li u là trong su t đ i v i ng i s d ng Vi c qu n lý các d li u phân tán đòi h i m i tr m (site) cài đ t các thành ph n h th ng sau:
Trang 20
18
• Thành ph n qu n tr CSDL (Database Management DM)
• Thành ph n truy n d li u (Data Communication DC)
• T đi n d li u (Data Dictionary DD): thông tin v s phân tán d li u trên m ng
• Thành ph n CSDLPT (Distributed Database DDB)
Các d ch v c a h th ng trên bao g m:
• Các ng d ng truy nh p CSDL t xa
• Cung c p các m c trong su t phân tán
• H tr qu n tr và đi u khi n CSDL, bao g m các b công c , thu th p thông tin t các trình ti n ích, cung c p cách nhìn t ng quan v các file d li u trên m ng
• Kh n ng m r ng v i các h th ng khác nhau
• Cung c p kh n ng đi u khi n đ ng th i và ph c h i các giao tác phân tán
Các h QTCSDL phân tán th ng h tr v đi u khi n t ng tranh và khôi ph c các ti n trình phân tán Kh n ng truy c p t xa có th th c hi n đ c b ng 2 cách
Cách th nh t (hình 1.10a) trình ng d ng yêu c u truy c p t xa Yêu c u này đ c đ nh tuy n t đ ng b i DDBMS t i máy ch ch a d li u c th c hi n t i máy ch ch a c s
d li u và g i l i k t qu v tr m yêu c u Cách ti p c n này đ c s d ng cho truy c p t
xa, trong su t phân tán có th th c hi n đ c b ng vi c cung c p các file chung (global) và các truy nh p tr c đó có th đ a ch hoá m t cách t đ ng t i các tr m xa
Hình 1.10 b ch ra m t cách ti p c n khác, ch ng trình ph th c hi n t i các tr m xa (ng i l p trình ph i t l p), các k t qu tr l i cho ch ng trình ng d ng
Hình 1.9 H qu n tr CSDL phân tán Databas
H qu n tr CSDL phân tán
Database
Trang 21
19
H qu n tr CSDL phân tán h tr c hai cách ti p c n trên M i m t cách ti p c n đ u có
nh ng thu n l i và khó kh n riêng Gi i pháp th nh t cung c p kh n ng trong su t phân tán cao h n, trong khi gi i pháp th hai có th hi u qu h n n u nh có r t nhi u ch ng trìn tngs d ng cùng yêu c u truy nhâp, b i vì các ch ng trình ph có th th c hi n các yêu
c u t các tr m xa và tr l i k t qu
1.11.2 H qu n tr CSDL phân tán thu n nh t
CSDLPT có đ c b ng cách chia m t CSDL thành m t t p các CSDL c c b (Local) và
đ c qu n lý b i cùng m t h QTCSDL, trong hình 2.13
CSDLPT có thu n nh t hay không đ c ph thu c b i các yêu t ph n c ng, h đi u hành
và các h qu n tr CSDL c c b Tuy nhiên, h n ch quan tr ng t i h QTCSDL c c b , b i vì
nó ph thu c vào s qu n lý h đi u hành m ng truy n thông
1.11.3 H qu n tr CSDL phân tán không thu n nh t
CSDLPT không thu n nh t đ c tích h p b i m t t p các CSDL c c b đ c qu n lý b i các h QTCSDL khác nhau H QTCSDLPT không thu n nh t thêm vi c chuy n đ i các mô hình d li u c a các h QTCSDL khác nhau đ th ng nh t vi c qu n lý Hình 14
Site 2
Ch ng trình
ng d ng
H qu n tr CSDL 2
Trang 22
20
N u vi c phát tri n CSDL phân tán theo mô hình Top-down, không ph thu c vào h
th ng tr c đó (h th ng các CSDL c c b ), thì vi c phát tri n m t h thu n nh t là t t nh t Tuy nhiên, trong m t s tr ng h p c n xây d ng CSDL phân tán t các CSDL đã có thì đòi
h i ph i phát tri n m t h không thu n nh t Ph ng pháp t t nh t là ti p c n t d i lên (Bottum-up) Trình qu n lý d li u phân tán ph i cung c p các giao di n trao đ i gi a các h QTCSDL V n đ qu n tr CSDL phân tán không thu n nh t r t khó kh n
1.12 MÔ HÌNH KI N TRÚC H QU N TR CSDL PHÂN TÁN
Có ba ki u ki n trúc tham chi u cho h qu n tr CSDL phân tán , đó là h Client Server,
h qu n tr CSDL phân tán ki u ngang hàng (Peer-to-Peer) và h đa CSDL
Hình 1.12 Ki n trúc mô hình h QTCSDLPT không thu n nh t
Trang 23
21
Các l a ch n cài đ t m t h qu n tr CSDLđ c t ch c h th ng theo các đ c tính: (1) tính t tr , (2) tính phân tán, (3) tính h n h p (không thu n nh t) c a h th ng
1.12.1 Tính t v n hành
Tính t v n hành hay còn g i là tính t tr , đ c hi u là s phân tán quy n đi u khi n Là
m c đ ho t đ ng đ c l p c a t ng h qu n tr CSDL riêng l Tính t v n hành đ c bi u
hi n qua ch c n ng c a m t s y u t , nh s trao đ i thông tin gi a các h th ng thành viên
v i nhau, th c hi n giao d ch đ c l p/ không đôck l p và có đ c phép s a đ i chúng hay không Yêu c u c a h th ng t v n hành đ c xác đ nh theo nhi u cách Ví d ,
• Các thao tác c c b c a h qu n tr CSDL riêng l không b nh h ng khi tham gia
ho t đ ng trong h đa CSDL (Multi Database System)
• Các h qu n tr CSDL x lý và t i u truy v n c ng không b nh h ng b i th c thi truy v n toàn c c truy nh p nhi u h CSDL
• Tính nh t quán c a h th ng ho c thao tác không b nh h ng khi các h qu n tr CSDL riêng l k t n i ho c tách r i kh i t p các CSDL
2 T tr truy n thông: M i h qu n tr CSDL riêng l tu ý đ a ra quy t đ nh c a nó v
lo i thông tin mà nó c n cung c p cho các h qu n tr CSDL khác ho c ph n m m đi u khi n th c thi toàn c c c a nó
3 T tr th c thi: M i h qu n tr CSDL có th th c thi các giao d ch đ c g i t i nó theo
b t k cách nào mà nó mu n
Trang 24v trí khác nhau Ng i s d ng nhìn d li u b ng khung nhìn d li u Có hai cách phân tán
d li u: phân tán ki u Client/Server và phân tán ki u ngang hàng K t h p v i các tùy ch n không phân tán, tr c ki n trúc cho ba lo i ki n trúc khác nhau
• Phân tán ki u Client/Server ngày càng ph bi n Qu n tr d li u t i Server, Client cung
c p môi tr ng ng d ng và giao di n ng i s d ng Nhi m v truy n thông đ c chia
s gi a các Client và Server H qu n tr CSDL ki u Client/Server là h phân tán ch c
n ng Có nhi u cách uây d ng, m i cách cung c p m t m c đ phân tán khác nhau
• Trong ki u ngang hàng không có s khác bi t gi a ch c n ng Client và Server M i máy
đ u có đ y đ ch c n ng c a h qu n tr CSDL và có th trao đ i thông tin v i các máy khác đ th c hi n các truy v n và giao d ch Các h th ng này c ng đ c g i là phân tán
th ng ch n các ph ng pháp khác nhau đ di n t các yêu c u gi ng nhau, ví d , DB2 s
d ng SQL, trong khi INGRES s d ng QUEL
• Lo i ki n trúc (A0, D0, H0): c g i là h th ng ph c h p (Composite System) N u không phân tán d li u và h n h p, thì h th ng ch là m t t p g m nhi u h qu n tr CSDL đ c tích h p v m t lôgic Phù h p v i các h th ng đa x lý và tài nguyên đ u dùng chung Ki u này không xu t hi n nhi u trong th c t
Trang 25
23
• Lo i ki n trúc (A0, D0, H1): N u h n h p thì ph i có nhi u b qu n lý d li u h n h p có
th cung c p m t khung nhìn tích h p cho ng i s d ng Tr c đây đ c thi t k truy
nh p tích h p CSDL m ng, phân c p và quan h trên cùng m t máy đ n
• (A0, D1, H0):Tr ng h p CSDL phân tán khi có m t khung nhìn tích h p v d li u cung
c p cho ng i s d ng H th ng lo i này thích h p cho phân tán Client/Server
• (A0, D2, H0): Bi u di n môi tr ng phân tán hoàn toàn trong su t cung c p cho ng i s
d ng Không phân bi t gi a Client và Server, cung c p đ y đ các ch c n ng
• (A1, D0, H0): Là d ng các h th ng bán t tr Các h th ng thành viên có quy n t tr
nh t đ nh trong các ho t đ ng c a chúng Ki n trúc này s d ng thi t l p b khung cho hai
d ng ki n trúc k ti p Trong th c t r t ít s d ng
• (A1, D0, H1): Là h th ng h n h p và t tr , r t ph bi n hi n nay M t ví d h th ng
lo i này bao g m m t h qu n tr CSDL quan h qu n lý d li u có c u trúc, m t h qu n
tr CSDL x lý hình nh t nh và m t Server cung c p video cung c p hình nh tích h p cho ng i s d ng, c n ph i che d u tính t đ ng và tính h n h p c a các h th ng thành viên và thi t l p m t giao di n chung
• (A1, D1, H1): Trong các h th ng lo i này, các h th ng thành viên đ c cài đ t trên các máy khác nhau c g i là các h qu n tr CSDL h n h p phân tán c đi m phân tán ít quan tr ng h n so v i tính t tr và h n h p Các h qu n tr CSDL ki u (A0, D1, H0) và (A0, D2, H0) có th gi i quy t nh ng v n đ khó kh n khi phân tán d li u
• (A2, D0, H0): c đi m c a các h th ng lo i này là các thành viên không có khái ni m
th a hi p và không bi t cách liên l c v i nhau N u không có tính h n h p ho c tính phân tán thì m t ph c h CSDL ch là m t t p các CSDL t tr đ c k t n i v i nhau H qu n
tr ph c h CSDL cho phép qu n lý t p h p các CSDL t tr và cho phép truy nh p trong
su t đ n nó D ng h th ng này ít th c t
• (A2, D0, H1): H th ng lo i này có tính th c t cao, h n c (A1, D0, H1).Có kh n ng xây
d ng các ng d ng truy nh p d li u t nhi u h th ng l u tr khác nhau v i các đ c tính khác nhau Có th là nh ng h th ng l u tr không ph i là h qu n tr CSDL và không
đ c thi t k phát tri n có th t ng tác v i các ph n m m khác C ng nh trong h (A1, D0, H1), gi thi t các h th ng thành viên không tham gia vào toàn b h th ng
• (A2, D1, H1) và (A2, D2, H1): Hai tr ng h p này đ u bi u di n cho tr ng h p các CSDL thành viên t o ra ph c h CSDLđ c phân tán trên m t s v trí – g i là các ph c h CSDL phân tán C hai tr ng h p các gi i pháp phân tán và x lý t ng tác t ng t nhau Trong tr ng h p phân tán Client/Server (A2, D1, H1), các v n đ t ng tác đ c trao cho h th ng trung gian (Middleware System), t o ra ki n trúc ba t ng
T ch c c a m t ph c h CSDL phân tán và vi c qu n lý nó hoàn toàn khác v i các h
qu n tr CSDL phân tán S khác bi t c b n c a chúng là m c đ t tr c a các ch ng trình qu n lý d li u c c b Các ph c h CSDL phân tán ho c t p trung đ u có th thu n nh t
ho c h n h p, không thu n nh t
Trang 26Server th c hi n h u h t các công vi c qu n lý d li u Ngh a là t t c m i x lý và t i u hoá truy v n, qu n lý giao d ch và qu n lý l u tr đ u đ c th c hi n trên Srver Client, ngoài
ng d ng và giao di n ng i s d ng, có m t module h qu n tr CSDL Client trách nhi m
qu n lý d li u và khóa giao d ch đ c g i đ n Client Client và Server trao đ i v i nhau b i các câu l nh SQL C th h n, Client chuy n truy v n SQL đ n Server, Server s th c hi n
và tr l i k t qu cho Client
Lo i ki n trúc Client/Server đ n gi n ch có m t Server đ c truy nh p b i nhi u Client,
g i là đa Client-m t Server Vi c qu n lý d li u không khác so v i CSDL t p trung CSDL
đ c l u ch trên Server và có ph n m m qu n lý nó Tuy nhiên, s khác bi t quan tr ng so
v i các h th ng t p trung là cách th c thi giao d ch và qu n lý b nh Cache
Lo i ki n trúc có nhi u Server trong h th ng, đ c g i là đa Client-đa Server Có hai chi n l c qu n lý: ho c Client qu n lý k t n i c a nó t i Server ho c Client ch bi t Server
ch c a nó và liên l c v i các Server khác qua Server ch khi có yêu c u Chi n l c th nh t làm đ n gi n cho các Server, nh ng l i g n thêm nhi u trách nhi m cho các máy Client i u này d n đ n m t h th ng đ c g i là h máy khách t ph c v M t khác, v i chi n l c th hai, t p trung vào ch c n ng qu n lý d li u t i Server Vì v y, tính trong su t c a truy nh p
d li u đ c cung c p t i giao di n Server
Mô hình CSDLlogic Client/Server là duy nh t Mô hình m c v t lý c a nó có th phân tán Vì v y phân bi t gi a Client/Server và ngang hàng không ph i m c đ trong su t đ c cung c p cho ng i s d ng và cho ng d ng mà mô hình ki n trúc đ c dùng đ nh n ra
m c đ trong su t
Trang 27
25
1.13.2 Các h phân tán ngang hàng( Peer to Peer)
Tr c tiên kh o sát v t ch c d li u v t lý trong các h mgamg hàng T ch c l u tr trên các máy khác nhau có th khác mhau i u này có ngh a là c n ph i có m t đ nh ngh a
n i t i riêng cho m i v trí, đ c g i là l c đ n i t i c c b LIS (Local Internal Schema)
L c đ khái ni m toàn c c mô t c u trúc logic c a d li u m i v trí
D li u trong m t CSDL phân tán th ng đ c phân mành và nhân b n trên các v trí khác nhau Vì v y c n ph i mô t t ch c l u tr d li u v t trên m i v trí C n b sung thêm t ng
th trong ki n trúc c s d li u 3 m c, đó là l c đ khái ni m c c b LCS (Local Conceptual Schema) Vì v y l c đ khái ni m toàn c c GCS (Global Conceptual Schema) là
h p c a các l c đ khái ni m c c b M c trên cùng là khung nhìn d li u c a ng i s
d ng, l c đ ngoài ES (External Schema) Ng i s d ng khác nhau có cách nhìn d li u
c ng khác nhau Nh v y ki n trúc c a h c s d li u phân tán có 3 m c: Có nhi u khung nhìn d li u khác nhau trong m c l c đ ngoài, nh ng ch có duy nh t m t mô hình khái
ni m toàn c c và có nhi u mô hình khái ni m c c b , ng v i l c đ trong c c b trên m i
Trang 28Mô hình trong hình 1.15 đ c m r ng t mô hình ANSI/SPARC Nó ph n nh tính trong
su t và tính đ c l p d li u Trong su t đ nh v và trong su t nhân b n đ c h tr b ng các
l c đ khái ni m c c b và toàn c c và ánh x gi a chúng M t khác, trong su t m ng đ c
h tr b ng l c đ khái ni m toàn c c Ng i s d ng truy v n d li u không c n bi t đ n v trí hay các thành ph n CSDLc c b H qu n tr CSDL phân tán d ch truy v n toàn c c thành các nhóm truy v n c c b và đ c th c hi n b i các thành ph n qu n tr CSDL phân tán t i các tr m khác nhau và gi a các tr m giao ti p v i nhau
Mô hình đang xét là mô hình ANSI/SPARC đ c m r ng b ng cách thêm vào t đi n/th
m c toàn c c GD/D (Glocal Directory/Directionary) cho phép ánh x yêu c u toàn c c Ánh
x c c b đ c th c hi n b i t đi n/th m c c c b LD/D (Local Directory/Directionary)
Vì v y, các thành ph n qu n lý CSDL c c b đ c tích h p thành các ch c n ng c a h qu n
tr CSDL toàn c c
Trong hình 1.16 l c đ khái ni m c c b ánh x đ n l c đ trong t i m i v trí L c
đ khái nhi m toàn c c ánh x vào l c đ khái ni m c c b T t c các đ nh ngh a khung nhìn c a mô hình ngoài đ u có ph m vi toàn c c Các ánh x nó đ m b o cho tính trong su t
c a c s d li u phân tán và tính đ c l p c a c s phân tán
Hình 1.15 Ki n trúc tham chi u CSDL phân tán
Trang 29
27
B x lý
l c đ khái
ni m CSDL1
B qu n lý CSDL toàn c c
Trang 30
28
Người dùng
Bộ xử lý giao diện người dùng
Bộ điều khiển dữ liệu ngữ nghĩa
Bộ tối ưu hóa truy vấn toàn cục
Bộ giám sát thực thi toàn cục
Lược đồ ngoài
Lược đồ khái niệm toàn cục
Bộ quản lý khôi phục cục bộ
Bộ xử lý hỗ trợ thời gian thực thi
Lược đồ khái niệm cục bộ
Lược đồ trong cục bộ
Bộ Xử Lý
dữ liệu
Nhật ký hệ thống
Hỡnh 1.17 Cỏc thành ph n c a m t h qu n tr CSDL phõn tỏn
M t h DBMS phõn tỏn g m 2 ph n nh trong hỡnh 2.19 B x lý phớa ng i s d ng (User Procesor), x ly t t c t ng tỏc v i ng i s d ng và b ph n th 2 c a DBMS phõn tỏn là b ph n x lý d li u (Data Processor) B x lý phớa ng i s d ng bao g m:
1 B x lý giao di n ng i s d ng: Cú trỏch nhi m d ch cỏc l nh c a ng i s d ng khi h g i đ n và đ nh d ng d li u k t qu đ g i nú l i cho ng i s d ng
Trang 31
29
2 B ki m soát d li u ng ngh a: s d ng ràng bu c toàn v n và xác th c, đ c đ nh ngh a nh là m t ph n c a l c đ khái ni m c c b , đ ki m tra xem truy v n c a
ng i s d ng có đ c x lý hay không Thành ph n này c ng có trách nhi m xác
th c và m t s ch c n ng khác
3 B phân rã và b t i u hoá truy v n toàn c c xác đ nh chi n l c th c thi đ gi m thi u ch c n ng chi phí, và d ch các truy v n toàn c c ra thành các truy v n c c b
b ng cách s d ng các l c đ khái ni m c c b , toàn c c và th m c toàn c c B t i
u hoá truy v n có trách nhi m t o ra chi n l c th c thi các ho t đ ng k t n i phân
tán
4 B giám sát th c thi phân tán ph i h p th c thi phân tán yêu c u c a ng i s d ng B giám sát th c thi c ng đ c g i là b qu n lý giao d ch phân tán Vi c th c thi truy v n trong h phân tán, b giám sát th c thi t i m t s tr m có th , và th ng, liên
l c v i m t b giám sát th c thi khác
Ph n th hai c a h qu n tr CSDL phân tán là b x lý d li u g m ba thành ph n:
1 B t i u hoá truy v n c c b ho t đ ng nh là b ch n đ ng d n truy nh p Ch n
đ ng truy nh p t t nh t vào b t k m c d li u nào
2 B qu n lý khôi ph c c c b có trách nhi m đ m b o duy trì tính nh t quán trong CSDL c c b ngay c khi có l i x y ra
3 B h tr th i gian th c thi truy nh p vào CSDL tùy vào các l nh trong l ch bi u đ c
t o ra b i b t i u hóa truy v n B x lý h tr th i gian th c thi là giao di n v i h
đi u hành và ch a b qu n lý vùng đ m CSDL (buffer ho c cache), có trách nhi m
qu n lý vùng đ m c a b nh chính và qu n lý vi c truy nh p d li u
1.14 KI N TRÚC T NG QUAN C A M T H QU N TR PH C H CSDL PHÂN TÁN (Multi Database Management System)
1.14.1 Mô hình ki n truc t ng quan c a m t ph c h
M t ph c h phân tán bao g m nhi u ph c h qu n tr đ c cài đ t t i nhi u v trí (site) khác nhau M i ph c h t i m i v trí bao g m hai thành ph n chính đó là
• H qu n tr d li u DBMS (Database Management System) là các h qu n tr c s d li u
m c th p nh t c a h th ng Nó có ch c n ng t ch c l u tr và th c hi n các thao tác
v n tin đ c chuy n cho nó và tr v k t qu cho h th ng
• Các ph c h qu n tr ( Multi-DataBase Management System) t i m i site, các ph c h này
có ch c n ng qu n lý các DBMS thành ph n trong h th ng và các m i t ng tác qua l i
gi a chúng ng th i nh n và và x lý các câu v n tin tr c khi chuy n giao cho các DBMS thành ph n
Hình 1.18 mô t mô hình ki n trúc c a m t ph c h
Trang 32
30
1.14.2 Phân lo i các ph c h d a vào c u trúc
H qu n tr ph c h CSDL phân tán khác v i h qu n tr CSDL phân tán đ c ph n ánh trong đ nh ngh a l c đ khái ni m toàn c c Trong các h qu n tr CSDL phân tán tích h p logic, l c đ khái ni m toàn c c là h p c a các CSDL c c b , trong khi đó h qu n tr
Database
Management
System
Database Management System
Database Management System
Database Management System
Hình 1.18 Mô hình ki n truc t ng quan c a m t ph c h phân tán
a) Các mô hình s d ng l c đ khái ni m toàn c c: Trong m t h đa CSDL, l c đ khái
d ng khi truy xu t vào các CSDL c c b khác
Vi c thi t k l c đ khái ni m toàn c c GCS trong ph c h CSDL th ng đ c th c
hi n t d i lên (Bottom-Up), ánh x đi t l c đ khái ni m c c b đ n l c đ toàn c c (trong khi qu n tr CSDL phân tán, vi c thi t k l c đ khái ni m toàn c c GCS th ng
đ c thi t k t trên xu ng (Top-Down), ánh x l i theo h ng ng c l i) Khung nhìn c a
ng i s d ng trên l c đ quan h toàn c c đ c đ nh ngh a theo yêu c u truy nh p toàn
c c Các l c đ ngoài toàn c c GES (Global External Schema) và l c đ khái ni n toàn c c
Trang 33trên l c đ khái ni m c c b và l c đ ngoài toàn c c GES trên l c đ khái ni m toàn
c c Khung nhìn ngoài khác nhau c ng có th s d ng các ngôn ng truy nh p khác nhau Hình 2.21 mô t mô hình logic c a h CSDL đ n ng tích h p v i l c đ khái ni m c c
b trong l c đ khái ni m toàn c c
• Ki n trúc đa ng (Multilingual) cho phép ng i s d ng truy nh p t i CSDL toàn c c b ng
l c đ ngoài đ c đ nh ngh a b i ngôn ng c a h qu n tr CSDL c c b nh ngh a GCS trong ki n trúc đ n ng và đa ng gi ng nhau Tuy nhiên đ nh ngh a các l c đ ngoàì trong ki n trúc đa ng đ c mô t b ng ngôn ng c a l c đ ngoài c a CSDL c c
b Truy v n đ c x lý m t cách chính xác nh truy v n trong các h qu n tr CSDL t p trung Truy v n CSDL toàn c c đ c s d ng ngôn ng c a h qu n tr CSDL.Ng i s
d ng truy v n CSDL d dàng h n v i cách ti p c n đa ng
Hình 1.19 ki n trúc ph c h CSDL v i m t l c đ khái ni m toàn c c
1.14.3 Các mô hình không s d ng l c đ khái ni m toàn c c
M t h th ng có nhi u CSDL nh ng không có l c đ toàn c c có nhi u u đi m h n, so
v i h th ng có l c đ khái ni m toàn c c Hình 2.22 mô t ki n trúc c a m t mô hình g m hai t ng: t ng h th ng c c b và t ng ph c h CSDL T ng h th ng c c b g m m t s h
qu n tr CSDL v i ch c n ng là trình bày cho t ng ph c h CSDL các ph n c a CSDL c c b dùng chung b i nhi u ng i s d ng các CSDL khác D li u dùng chung đ c trình bày b i
Trang 34Hình 1.20 Ki n trúc ph c h CSDL không s d ng GCS
Mô hình ki n trúc d a trên các thành ph n c a h đa CSDL khác bi t nhi u so v i m t h
qu n tr CSDL phân tán Khác bi t c b n là s t n t i c a các DBMS hoàn ch nh qu n lý
t ng CSDL khác nhau a CSDL cung c p m t t ng ph n m m ch y trên nh ng DBMS riêng
bi t này và cung c p cho ng i dùng nh ng ti n ích đ truy xu t nhi u CSDL khác nhau Tu thu c vào v n đ có l c đ khái ni m toàn c c ho c là có v n đ đa ch ng hay không, n i dung c a t ng ph n m m s thay đ i hinh 4.10 trình bày m t h qu n tr đa CSDL phi phân tán n u là h phân tán, chúng ta c n ph i sao chép t ng đa CSDL hco m i v trí có h qu n tr CSDL c c b tham gia vào h th ng c ng c n chú ý r ng n u xem xét t ng DBMS riêng bi t,
Trang 35A H p nh t lý thuy t c s d li u và công ngh m ng máy tính
B H p nh t công ngh vi n thông và tin h c
C Tích h p công ngh tin h c và c s d li u
2 Khái ni m h c s d li u phân tán bao g m khái ni m v :
A C s d li u phân tán và công ngh m ng máy tính
B C s d li u t p trung và t i u hoá câu h i
C C s d li u phân tán và h qu n tr c s d li u phân tán
3 C s d li u phân tán là:
Trang 36
34
A M t t p các c s d li u có quan h v i nhau v m t logic và đ c phân tán trên m t m ng máy tính
B M t t p các c s d li u đ c phân tán trên m t m ng máy tính
C M t t p các c s d li u đ c cài đ t l u tr trên các máy ch
5 c tr ng c a c s d li u phân tán là:
A D li u đ c phân tán trên m ng máy tính và có quan h logic v i nhau
B T p các file d li u đ c l u tr trên các thi t b nh c a m ng máy tính
C T p các file d li u có quan h v i nhau v m t logic
A CSDL đ c cài đ t trên Server, các ng d ng trên các máy Client và ph n
m m c s d li u đ c cài đ t trên c Client l n Server
B CSDL đ c cài đ t trên Server, các ng d ng trên các máy Client
C CSDL, các ng d ng và h qu n tr CSDL đ c cài đ t trên Server
10 Mô hình ki n trúc c s d li u phân tán t i các site g m:
Trang 37A Quan h toàn c c có th chia thành nhi u m nh không ch ng l p
B Các quan h đ c cài đ t trên các site khác nhau
C Các quan h đ c sao chép và cài đ t trên các site khác nhau
13 Khái ni m c p phát trong c s d li u phân tán đ c hi u là:
A Ph ng pháp cài đ t các b n sao, phân m nh trên m ng máy tính
B Ph ng pháp phân m nh d li u
C Ph ng pháp cài đ t c s d li u trên m ng máy tính
14 Các ki u thi t k c s d li u phân tán trên m ng máy tính
D B n sao, phân m nh và k t h p b n sao và phân m nh
17 M t trong nh ng u đi m c b n c a t ch c d li u phân tán là:
A tin c y và tính s n sàng đ c nâng cao
B m b o an toàn cho vi c truy nh p c s d li u khi có s c x y, không th làm s p đ c h th ng
Trang 38
36
C Nâng cao hi u qu
18 T ch c d li u phân tán kinh t h n so v i t ch c t p trung, vì:
A Giá cho m t h máy tính nh r h n
B Hi u qu h n khi tri n khai cùng m t m c đích ng d ng
C Giá chi phí truy n thông th p h n
19 u đi m cách ti p c n mô hình c s d li u quan h
B T ng ng d ng, trình bày, giao v n, m ng, liên k t d li u và t ng v t lý
C T ng đi u khi n, x lý v n tin, và t ng truy xu t d li u
Trang 40
38
Trong ch ng này s trình bày nh ng khái ni m c b n v các ph ng pháp phân m nh
d li u và bài toán c p phát d li u trên các v trí c a m ng máy tính N i dung c a ch ng bao g m các ph n:
(Top-đ n v c p phát, vì s làm cho vi c c p phát tr lên ph c t p h n Thi t k phân m nh b ng cách nhóm m t s b trong tr ng h p phân m nh ngang hay nhóm các thu c tính trong
tr ng h p phân m nh d c có cùng đ c tính theo quan đi m c p phát Các m nh hình thành
ng d ng ch yêu c u thao tác trên các t p con c a các quan h , là khung nhìn d li u
c a ng i s d ng Vì v y vi c xem t p con c a quan h là đ n v truy xu t thông tin
đ phân tán d li u là h p lý
• Vi c phân rã m t quan h thành nhi u m nh, m i m nh đ c x lý nh m t đ n v d
li u, s cho phép th c hi n nhi u giao d ch đ ng th i ng th i vi c phân m nh các quan h c ng cho phép th c hi n song song m t câu v n tin b ng cách chia nó thành
m t t p các câu v n tin con ho t tác trên các m nh Vì th vi c phân m nh s làm t ng