Toàn bộ giải pháp kỹ thuật này được thiết kế và xây dựng bằng Java trên JVM và bao gồm các bước thể hiện hoạt động của hệ theo phương thức cung cấp động danh sách các bản sao cần phải cậ
Trang 1Báo cáo t t nghi p ốt nghiệp ệp
NGHIÊN C U PHÁT TRI N GI I THU T QU N ỨU PHÁT TRIỂN GIẢI THUẬT QUẢN ỂN GIẢI THUẬT QUẢN ẢI THUẬT QUẢN ẬT QUẢN ẢI THUẬT QUẢN
LÝ NHI U B N SAO CHO CÁC NG D NG PH C ỀU BẢN SAO CHO CÁC ỨNG DỤNG PHỨC ẢI THUẬT QUẢN ỨU PHÁT TRIỂN GIẢI THUẬT QUẢN ỤNG PHỨC ỨU PHÁT TRIỂN GIẢI THUẬT QUẢN
T P ẠP
Trang 2M C L C ỤNG PHỨC ỤNG PHỨC
I ĐẶT VẤN ĐỀ 3
II CẬP NHẬT THÔNG TIN TRONG MÔI TRƯỜNG PHÂN TÁN 4 III KỸ THUẬT ĐÁNH DẤU BẢN ĐIỀU KHIỂN 6
IV GIẢI THUẬT QUẢN Lí NHIỀU BẢN SAO 8
V KẾT LUẬN 10
Trang 3LÊ VĂN SƠN Trường Đại học Sư phạm - Đại học Đà Nẵng
TÓM TẮT
Bài viết này nêu lên kết quả mô hình hóa và nghiên cứu giải thuật đảm bảo tính gắn bó thông tin trong quản lý nhiều bản sao trên môi trường phân tán hiện đại Trên cơ sở lý thuyết về cập nhật thông tin cho các bản sao của cùng một đối tượng, kỹ thuật đánh dấu bản điều khiển cho phép xác định trạng thái chung của toàn hệ và chọn lựa giải thuật cập nhật phù hợp được nghiên cứu
Việc tham chiếu đến bản điều khiển là cơ sở chủ yếu để các tác tử tự quyết định khi tiến hành cập nhật các bản sao một cách tin cậy
Toàn bộ giải pháp kỹ thuật này được thiết kế và xây dựng bằng Java trên JVM và bao gồm các bước thể hiện hoạt động của hệ theo phương thức cung cấp động danh sách các bản sao cần phải cập nhật
Kết quả này có thể phục vụ cho quá trình nghiên cứu thiết kế và xây dựng các ứng dụng phức tạp với khối lượng lớn các thông tin dùng chung cần xử lý
ABSTRACT
This paper presents the result of modelisation and algorithm research to assure the coherence in managing multicopies of the modern distributive environment On the theory of information update for the copies of the same object, the technique of marking the control panel allows defining the general state of the whole system and choosing the appropriate update researched algorithm
The reference to control panel is the principal basis for an agent to make decision when it carries out updating the copies reliably
All of this technical measure is designed and built by Java on JVM and consists of the steps of the system activities according to the method of dynamic supplication for the list of updated copies
This result can serve the process of research on designing and building complicated applications with the large quantity of treated information
I ĐẶT VẤN ĐỀ
Hiện nay, trong lĩnh vực mạng diện rộng, đặc biệt là mạng Internet, việc quản lý nhiều bản sao của cựng một đối tượng thông tin đang được các nhà chuyên môn tin học quan tâm nghiên cứu ngay trong giai đoạn phân tích, thiết kế
và xây dựng hệ điều hành Ngoài ra, đây cũn là một trong những vấn đề có tính chất cơ sở cho các ứng dụng phức tạp
Quản lý nhiều bản sao (multicopies) là giải phỏp kỹ thuật bao gồm tập hợp cỏc thụng tin được nhân bản từ một đối tượng thông tin và các chương trỡnh quản
lý chỳng trong mụi trường phân tán
Vấn đề truy cập và xử lý thụng tin phõn tỏn núi chung, quản lý nhiều bản sao núi riờng được nghiên cứu trong hàng loạt các công trỡnh, đặc biệt của
Trang 4Herman, Ellis, Wilms và Le Lann [[5], tr 205-206 và 275-291] Các giải thuật này là cơ sở chủ yếu cho giải pháp đảm bảo sự gắn bó yếu nhờ dấu, nhờ bộ tuần
tự tuần hoàn và đảm bảo sự gắn bó mạnh cho các hệ thống đồng nhất
Yờu cầu quan trọng của tất cả cỏc giải phỏp quản lý nhiều bản sao là đảm bảo tính gắn bó thông tin (coherence), toàn vẹn dữ liệu và trỏnh bế tắc diễn ra trong quỏ trỡnh khai thỏc - vận hành hệ
Nội dung quản lý nhiều bản sao là cỏc giải phỏp cho phộp tự động hóa các công việc kiểm tra tính hợp thức của truy cập thông tin, khôi phục thông tin, cập nhật thông tin, an toàn cho các bản sao, sử dụng các bộ nhớ, đĩa, lưu lịch sử, mở/ghi lịch sử, chuyển các bản loại bỏ vào vùng có thể khôi phục, Trong các nội dung nêu trên, vấn đề quan trọng nhất là cập nhật tự động thông tin vào các bản sao
Bài viết này định hướng chủ yếu vào việc xây dựng hệ thống giải pháp kỹ thuật quản lý nhiều bản sao trong mụi trường phân tán phục vụ cho các ứng dụng
có khối lượng xử lý thông tin lớn trong điều kiện kỹ thuật phần cứng, phần mềm không đồng nhất
Mục tiờu nghiờn cứu của đề tài là xây dựng mô hỡnh hoạt động của hệ phân tán và phát triển giải thuật quản lý nhiều bản sao trờn cơ sở công nghệ tác tử
di động trên môi trường JVM
II CẬP NHẬT THÔNG TIN TRONG MÔI TRƯỜNG PHÂN TÁN
Mụ hỡnh và giải thuật nghiờn cứu phải đảm bảo các đặc tính toàn vẹn đó được nêu trong [[6], tr 205-206] và tuân thủ theo các giai đoạn thể hiện trong hỡnh vẽ 1 Mỗi một giai đoạn cập nhật thể hiện những đặc điểm riêng biệt về sự gắn bó dữ liệu giữa các bản sao
1
2
3
Tr íccËpnhËt
SaucËpnhËt TrongcËpnhËt
t
G¾nbã
G¾nbã
Kh«ng g¾nbã H×nh1.Tr¹ngth¸id÷liÖutrong
c¸cgiai®o¹ncËpnhËt.
I II
Trong giai đoạn 1 và 3, thao tác duy nhất là lưu dữ liệu và trạng thái hiện
có là đủ Nếu nằm vào trạng thái 2, thỡ tỏc tử phải cố gắng kết thỳc cụng việc của
mỡnh ở điểm II hoặc là phải phục hồi lại trạng thái ban đầu ở điểm I Hai giai
đoạn gắn bó 1 và 2 cú bản dữ liệu khỏc nhau
Trong môi trường phân tán, sơ đồ vị trí của các bản sao và việc cập nhật chúng có thể mô tả trong hỡnh vẽ 2 sau đây
Trang 5Hìnhư2.ưSơưđồưhệưthốngưnhiềuưbảnưsao.
S1
S2
Sn
b1.2
b1.1
b1.m
b2.2
b2.1 b2.m
bn.2
bn.m
bn.1
Cỏc bản sao cú thể đặt trờn cỏc server S 1 , S 2 , ,S n trờn cỏc tập tin hay vựng
nhớ đặc biệt b ij , i=1 n, j=1 m, trong đú i chỉ server, j chỉ bản sao, n là số lượng server được mắc nối trong mạng, m là số lượng cỏc bản sao cần phải cập nhật.
Mỗi server cú thể quản lý một mạng con Ngoài ra, cỏc bản sao cỳ thể được bố trớ
trờn cỏc trạm thể hiện bằng cỏc t k , k=1 q, k là trạm và q là số trạm được mắc nối.
Nếu ta cỳ n bản sao của đối tượng b nào đú, thỡ ràng buộc toàn vẹn phải
là:
Trờn bản sao của 1 đối tượng
b 1 =b 2 =b 3 = =b n
Trờn cỏc bản sao của toàn bộ cỏc đối tượng
b 11 =b 21 = =b n1
b 12 =b 22 = =b n2
b 1m =b 2m = =b nm
Gọi M là cực đại của cỏc cập nhật cú thể diễn ra đồng thời, thỡ M cỳ thể tớnh theo cụng thức M=n x m.
Căn cứ vào nội dung thụng tin cần phải đảm bảo sự gắn bú mà người ta chia ra hai loại giải thuật:
Giải thuật toỏn gắn bỳ mạnh
Giải thuật toỏn gắn bỳ yếu
Hệ thống viễn thụng là đối tượng cú thể diễn ra cỏc sự cố kỹ thuật và ựn
tắt đường truyền, ta cú số lần truy cập bản sao trờn thực tế sẽ lớn hơn M rất nhiều;
hiệu năng hoạt động của hệ trong trường hợp này sẽ bị giảm
Một trong những giải phỏp khắc phục vấn đề vừa nờu là ỏp dụng kỹ thuật đỏnh dấu bản điều khiển và căn cứ vào hệ thống tớn hiệu này, người ta cú thể chọn cỏc giải thuật cập nhật thớch hợp, rỳt ngắn được tốc độ cập nhật bỡnh quừn
Việc lựa chọn giải thuật cập nhật được tiến hành trờn cơ sở truy cập vào cấu trỳc phõn tầng Cấu trỳc này được mụ tả trong hỡnh vẽ 3
Trang 6GT1
xác định hành vi thay đổi thông tin
xác định nguồn truy cập
xác định vị trí truy cập
xác định phạm vi thay đổi thông tin
xác định cấu trúc l u trữ
xác định hoạt động t ơng ứng
GT2 GTp
GTl - Giải thuật t ơng ứng
Ứng với mỗi một loại truy cập, người ta cú thể hoặc là ỏp dụng cỏc giải thuật đang cú đú được kiểm nghiệm hoặc là phải nghiờn cứu cỏc giải thuật phự hợp hơn nhằm khai thỏc tối đa khả năng của kỹ thuật và cụng nghệ mới
III KỸ THUẬT ĐÁNH DẤU BẢN ĐIỀU KHIỂN
Kỹ thuật đỏnh dấu bản điều khiển gọi tắt là TOMCP (Technique Of
Marking the Control Panel) là một hệ thống bao gồm cỏc chương trỡnh, danh sỏch tài nguyờn cần thiết để thực hiện cỏc lệnh và tổ hợp cỏc tớn hiệu cho phộp nhận biết trạng thỏi của toàn bộ cỏc bản sao đang được sử dụng trong hệ
Thành phần cơ bản của TOMCP cú thể mụ tả trong hỡnh vẽ 4 sau đõy
ch ơng trình quản lý tomcp
tomcp
danh sách các tài nguyên cần thiết
hệ thống các tín hiệu nhận dạng
Hìnhư4.ưThànhưphầnưcơưbảnưcủaưTOMCP.
Chương trỡnh quản lý TOMCP được xõy dựng dưới dạng thủ tục tiện ớch với chức năng chủ yếu là kiểm tra tớnh hợp thức của việc truy cập vào bản, dũ tỡm thụng tin, cập nhật cỏc tớn hiệu và yờu cầu được cung cấp tài nguyờn theo danh sỏch, Thủ tục này là một trong những thành phần cơ bản của tỏc tử
Danh sỏch cỏc tài nguyờn cần thiết là tổ hợp cỏc cỏc thiết bị, chương trỡnh
và dữ liệu phục vụ cho việc quản lý TOMCP Hệ thống cỏc tớn hiệu nhận dạng là tập hợp cỏc chuẩn hỡnh thành trong quỏ trỡnh thiết kế hệ phục vụ cho việc nhận biết tự động trạng thỏi của hệ quản lý nhiều bản sao và xỏc định GTl cần thực hiện
Nội dung cơ bản của kỹ thuật này cú thể mụ tả trong hỡnh vẽ 5 Theo mụ hỡnh điều khiển này, tại mỗi tỏc tử di động, trạng thỏi cỏc bản sao trờn toàn bộ hệ thống được thể hiện một cỏch chớnh xỏc và nhờ đú cỏc tỏc tử biết cần phải hành động như thế nào là tối ưu nhất
Mỗi khi cập nhật, thay vỡ phải kớch hoạt một trỡnh điều khiển như mụ hỡnh Client/Server chứa sẵn trờn Server và gửi toàn bộ cỏc yờu cầu thay đổi, thỡ
kỹ thuật này cho phộp chỉ gửi những chi tiết cần thay đổi là đủ
Việc làm tươi thụng tin trong bản điều khiển sẽ do cỏc tỏc tử thực hiện tự động căn cứ vào dữ liệu mà nú cú được Những thụng tin này cú khối lượng khụng lớn và được cỏc tỏc tử trao đổi với nhau bằng thụng điệp
Trang 7Đặcưtrư ng Serverưhay Trạm 1 2 3 4
n
x x
thông số kỹ thuật
P1
m
x x x
P2 P3 P4 P5 P6
P5.3
P7.4
z
z z
y
y
y
Để trỏnh bế tắc diễn ra trong quỏ trỡnh truy cập bản điều khiển theo kiểu 2
pha, thụng thường giải phỏp gắn bỳ mạnh của Herman được sử dụng.
Hai tỏc tử quan trọng trong tiến trỡnh truy cập bản để đọc và ghi bản là tỏc
tử gửi thụng điệp (tỏc tử yờu cầu) và tỏc tử nhận thụng điệp (tỏc tử đỏp ứng yờu cầu)
Cấu trỳc của cỏc thụng điệp trao đổi giữa cỏc tỏc tử cú thể mụ tả trong hỡnh vẽ 6 dưới đõy
Hìnhư6.ưCấuưtrúcưthôngưđiệpưtraoưđổi.
Cỏc trường của thụng điệp trao đổi là:
1 START Bắt đầu Giỏ trị 8 bớt cho phộp bắt đầu thụng
điệp
nguồn
Địa chỉ tỏc tử gửi thụng điệp với độ dài từ 8 bớt đến 16 bớt đủ để biểu diễn số lượng địa chỉ của cỏc tỏc tử trong cỏc hệ thống lớn
3 TARGET Địa chỉ đớch Địa chỉ của tỏc tử nhận với độ dài
của trường từ 8 bớt đến 16 bớt
Mú sử dụng để nhận biết phộp toỏn trờn bản với độ dài là 8 bớt í nghĩa cỏc bớt được trỡnh bày trong hỡnh 6
5 INFORMATION Thụng tin Thụng tin cần thiết để truy cập vào
cỏc bản sao
Kiểm tra Trường kiểm tra phục vụ cho việc
truyền dữ liệu qua mạng và cỏc giỏ trị được quy ước cho từng loại mạng cụ thể
7 END Kết thỳc Giỏ trị 8 bớt cho phộp kết thỳc thụng
điệp
Giỏ trị cỏc bớt của trường CODE được thể hiện trong hỡnh 7 dưới đõy
Trang 8H×nh7.ýnghÜac¸cbÝtcñatr êng CODE
PhÐpto¸ntruycËp VÞtrÝtrongcÊutrócb¶nsao
YªucÇucôcbéhaytõxa CÊutrócb¶nsao TÝnhchÊtcËpnhËt
Ưu điểm căn bản của kỹ thuật đánh dấu bản điều khiển là:
1 Gắn bú
Đảm bảo tính gắn bó thông tin Nếu kết hợp với kỹ thuật hàng đợi các thông điệp ta có thể tránh được hiện tượng thiếu vô hạn tài nguyên
2 Tin cậy
Hệ thống hoạt động với kỹ thuật này chịu đựng được trạng thái lỗi của mạng nói chung, trong đó có lỗi của hệ thống đường truyền
3 Nhạy Phản ứng được với các tỡnh huống sinh lỗi
4 Liờn tục Cho phộp phõn phối động các tài nguyên cần cập nhật
5 Phỏt hiện sự cố Phỏt hiện cỏc lỗi phỏt sinh trong quỏ trỡnh vận hành
6 Thống kờ Biết được trạng thái cập nhật ở mọi thời điểm
Ngoài ra, để hoàn chỉnh kỹ thuật này, ta cần nghiên cứu Root Server với chức năng giám sát thường xuyên các hoạt động của toàn bộ tác tử cập nhật
IV GIẢI THUẬT QUẢN Lí NHIỀU BẢN SAO
Sơ đồ thể hiện giải thuật tổng quát xử lý cập nhật thụng tin vào cỏc bản sao được mô tả trong hỡnh vẽ 9 Cỏc thụng điệp trao đổi được sử dụng với các mục đích khác nhau căn cứ vào nội dung của trường CODE Tác tử gửi ghi thông tin yêu cầu dưới dạng mó vào trường này, cũn tỏc tử nhận sẽ căn cứ vào mó đó để nhận biết sẽ phải hành động như thế nào trên bản sao
Việc xử lý trạng thái điều khiển do tác tử nhận tiến hành trên cơ sở tham chiếu thông tin trong bản điều khiển và theo yêu cầu thể hiện trong hỡnh 8
H×nh8.Tr×nhtùthùchiÖncËpnhËtb¶n®iÒukhiÓn.
caithen(b) capnhat(b) giaiphong (b)
Khãab¶n®iÒukhiÓnB
ThùchiÖnviÖccËpnhËtth«ngtin
trªnb¶n®iÒukhiÓnB
Mëkhãab¶n®iÒukhiÓnB
Sau khi hoàn thành trọn vẹn công việc, tác tử nhận tiến hành phát thông điệp đến toàn bộ các tác tử của hệ thống để cập nhật vào bản điều khiển, đồng thời
tự động cập nhật vào bản cục bộ của mỡnh
Trang 9Hìnhư9.ưSơưđồưtổngưquátưxửưlý nhiềuưbảnưsao.
xử lý thông điệp
kết thúc
đ
tự động sửa lỗi
Phát thông điệp OK
lặp lại
Đ
Thực hiện giải thuật
GTl
Xử lý và lựa chọn giải thuật thích hợp
xử lý trạng thái
điều khiển
lỗi
đ
Xong
đ
S
S
S
S
Đ
Khi cập nhật, giải thuật GTl, l=1 P được thực hiện bởi tỏc tử nhận trong
cơ chế then cài đối với cỏc phộp làm thay đổi thụng tin trong bản sao, ngược lại, thỡ thực hiện theo kiểu tương tranh
Việc phỏt hiện và xử lý lỗi trong quỏ trỡnh xử lý được tiến hành ngay sau khi tỏc tử nhận được yờu cầu cập nhật Nếu mọi cố gắng sửa lỗi khụng thể thực hiện cú kết quả, thỡ thụng điệp sẽ được phỏt đi để yờu cầu tỏc tử gửi phỏt lại thụng tin Trong trường hợp cụng việc cập nhật kết thỳc tốt đẹp, một thụng điệp khẳng định cũng được phỏt đi bởi tỏc tử nhận Sau khi phỏt đi thụng điệp, tỏc tử gửi chuyển sang trạng thỏi chờ thụng điệp mới, cũn tỏc tử nhận thụng điệp chỉ chuyển sang trạng thỏi chờ khi đú nhận đủ cỏc thụng điệp khẳng định
Cỏc bước thể hiện cụng việc xử lý thụng tin điều khiển được tiến hành tuần tự như trong hỡnh 10 sau đõy
Hìnhư10.ưCácưbư ớcưxửưlýưtrạngưtháiưđiềuưkhiển.
tiếp nhận yêu cầu cập nhật đến từ server hay workstation, kiểm tra, xử lý lỗi và chuẩn bị các tham số kỹ thuật.
1
tính toán xác định thứ tự cập nhật thông tin vào bản sao.
2
tính toán xác định số l ợng bản sao đ ợc uỷ quyền cập nhật 3
tính toán xác định trạng thái của tất cả các trạm và server.
khi khởi sự tát cả phải ở trạng thái nghỉ.
4 phát khẳng định cập nhật và chuyển sang trạng thái hoạt động theo trình tự đ ợc xác định tr ớc
5
cập nhật bản sao 6
Trang 10Thuật toỏn kiểm tra và cập nhật bản sao thể hiện bằng cỏc khối trong hỡnh
vẽ 11, trong đú mỗi khối cú thể xõy dựng một thủ tục hoặc hàm chuyờn biệt
bắt đầu
truy cập
thông tin
về cấu trúc
xác định
độ dài của
information
phát thông
điệp cho agent gửi
tồn tại
bản sao
Đ
S
hợp thức
Đ
S
1
2
Hìnhư11.ưSơưđồưxửưlýưvàưcậpưnhậtưnhiềuưbảnưsao.
thực hiện open vật lý [kt1]
định vị cập nhật
chuyển giá trị vùng nhớ vào bản sao
UNlock record
thao tác kỹ thuật [kt2]
kết thúc
trạng thái
Đ S
ok1
Đ S
LOCK [mức record]
phục hồi bản sao
phép đặc biệt
S
Đ trạng thái chờ
ok2
Đ S
2 1
Sơ đồ trờn được nghiờn cứu cho việc ghi cú kiểm tra thụng tin vào một trường xỏc định của bản sao là cơ sở dữ liệu phõn tỏn
V KẾT LUẬN
Trong quỏ trỡnh xừy dựng cỏc phần mềm cho hệ phừn tỏn hỗ trợ cỏc ứng dụng lớn như thương mại điện tử, chớnh phủ điện tử, vấn đề cập nhật thụng tin dựng chung trong cỏc bản sao của cựng một đối tượng là một trong những vấn đề quan trọng Nú khụng chỉ đảm bảo hệ thống hoạt động với tốc độ bỡnh quừn chấp nhận được, ổn định, tin cậy mà quan trọng hơn cả là phải đảm bảo tớnh gắn bú của
dữ liệu trong cỏc bản sao
Mụ hỡnh hệ thống quản lý nhiều bản sao giống nhau trờn mụi trường phõn tỏn và cỏc giải thuật được nghiờn cứu đú đỏp ứng cỏc yờu cầu của một hệ thống phức tạp với lượng thụng tin lớn cần phải xử lý và thể hiện ở cỏc mặt sau đõy:
Tự động húa cập nhật cỏc bản sao
Phỏt triển giải thuật nhiều bản sao trong mụi trường phõn tỏn hiện đại
Làm phong phỳ khả năng ứng dụng cỏc tỏc tử di động
Triển khai kỹ thuật đỏnh dấu bản điều khiển trong quản lý nhiều bản sao
Bổ sung lý thuyết cập nhật nhiều bản sao
Kết quả nghiờn cứu đú thể hiện cụ đọng bằng những sơ đồ giải thuật và
mụ hỡnh Cỏc giải thuật và mụ hỡnh này đú được thực nghiệm trờn ngụn ngữ Java RMI trong mụi trường Java ảo
TÀI LIỆU THAM KHẢO
[1] Guy Pujolle, Les Rộseaux, Eyrolles, Paris 1995.
[2] S Fdida, G Pujolle, Modốles de systốmes et de rộseaux, Tom I,
Performances, Eyrolles, Paris, 1989.
[3] Lờ Văn Sơn, Trần Nguyễn Hồng Phỳc, Nghiờn cứu cỏc kỹ thuật thụng bỏo
lỗi và kỹ thuật truy vấn hệ thống trong mạng Internet bằng ICMP, Tạp chớ