Nâng cao hiệu quả một số kỹ thuật đảm bảo tính nhất quán dữ liệu trong mạng P2P.Nâng cao hiệu quả một số kỹ thuật đảm bảo tính nhất quán dữ liệu trong mạng P2P.Nâng cao hiệu quả một số kỹ thuật đảm bảo tính nhất quán dữ liệu trong mạng P2P.Nâng cao hiệu quả một số kỹ thuật đảm bảo tính nhất quán dữ liệu trong mạng P2P.Nâng cao hiệu quả một số kỹ thuật đảm bảo tính nhất quán dữ liệu trong mạng P2P.
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO
Trang 2Công trình được hoàn thành tại
ĐẠI HỌC ĐÀ NẴNG
Người hướng dẫn khoa học:
1 PGS.TSKH Nguyễn Xuân Huy
2 PGS.TS Lê Văn Sơn
Phản biện 1:……….Phản biện 2:.……….Phản biện 3:………
Luận án sẽ được bảo vệ trước Hội đồng chấm luận án cấp Đại học Đà Nẵng
Vào hồi … giờ … ngày … tháng … năm 2021
Có thể tìm hiểu luận án tại:
- Thư viện quốc gia Việt Nam
- Trung tâm Thông tin - Học liệu & Truyền thông,
Đại học Đà Nẵng
Trang 3tại nhiều nút trong mạng P2P, thực hiện bằng kỹ thuật nhân bản, gọi
là hệ thống dữ liệu chia sẻ, nhằm đáp ứng yêu cầu và hiệu quả nhấtcho các ứng dụng phân tán như: sự tin cậy cao, khả năng mở rộng,chịu lỗi, khôi phục, sẵn sàng đáp ứng dữ liệu và cân bằng tải
Trong kỹ thuật nhân bản, bên cạnh những ưu điểm, thì việc mỗibản sao được thực thi, xử lý bởi các tiến trình hoàn toàn độc lập, tựtrị và không thuần nhất, sẽ đặt ra những vấn đề khó khăn, phức tạpnhư: an ninh an toàn, chi phí lưu trữ, thao tác ghi dữ liệu chậm, thờigian ngừng hệ thống trong khi tạo bản sao mới, yêu cầu đảm bảo tínhnhất quán dữ liệu Tính nhất quán dữ liệu phụ thuộc vào mô hìnhnhất quán dữ liệu, trong đó quy định cơ chế thực thi của các tiếntrình (các thao tác đọc/ghi) trên dữ liệu chia sẻ Đảm bảo tính nhấtquán dữ liệu để các tiến trình cục bộ (đọc/ghi) trả về kết quả chínhxác, tin cậy, đáp ứng tốt các yêu cầu từ phía người dùng, do đó đây
là yêu cầu vô cùng quan trọng và cần thiết
Ngay từ rất sớm, bài toán đảm bảo tính nhất quán dữ liệu chia
sẻ đã được quan tâm nghiên cứu Tuy nhiên, qua nghiên cứu nhậnthấy rằng, các đề xuất có phạm vi giải quyết hiệu quả hẹp hoặc khóđáp ứng được cho các hệ thống dữ liệu chia sẻ ngày này, do môitrường phân tán và yêu cầu ngày càng trở nên đa dạng, phức tạp.Nhằm góp phần giải quyết các vấn đề trên, nghiên cứu sinh đã
chọn đề tài: “Nâng cao hiệu quả một số kỹ thuật đảm bảo tính nhất quán dữ liệu trong mạng P2P” làm nội dung nghiên cứu cho luận án
tiến sĩ kỹ thuật của mình, với mục tiêu đề xuất các giải pháp nhằmthực hiện tối ưu hơn cho bài toán đảm bảo tính nhất quán dữ liệu
Bố cục của luận án gồm có: phần mở đầu, ba chương và phầnkết luận
Chương 1: Trình bày tổng quan về đảm bảo tính nhất quán dữ
liệu trong mạng P2P Nội dung cụ thể của chương bao gồm: Trình
Trang 4bày về hệ phân tán; khái niệm, phân loại, các đặc trưng cơ bản,chức năng của mạng P2P; nhận xét, so sánh các mạng P2P Tiếp đến,luận án trình bày kỹ thuật nhân bản, phát biểu và phân tích bài toánđảm bảo tính nhất quán dữ liệu trong mạng P2P, mô hình nhất quán
và lược đồ đảm bảo tính nhất quán dữ liệu trong mạng P2P; nhận xét,đánh giá ưu điểm, hạn chế của các nghiên cứu, qua đó luận án xácđịnh những tồn tại cần tiếp tục nghiên cứu, cải tiến
Chương 2: Trình bày nghiên cứu các nội dung cơ bản của hệ
phân tán, như các định nghĩa, chương trình và thuật toán phân tán, Tiếp đến, luận án trình bày và biểu diễn mô hình toán học đối với cáctham số đầu vào ảnh hưởng đến bài toán đảm bảo tính nhất quán; môhình lan truyền nội dung cập nhật để đảm bảo tính nhất quán dữ liệu;biểu diễn mô hình toán học đối với các tham số trong đánh giá hiệuquả các lược đồ Cuối chương, luận án giới thiệu và trình bày cácthiết lập đối với mạng Pastry, là mạng nền để triển khai các thuậttoán và giải pháp được đề xuất; trình bày ngôn ngữ lập trình thuậttoán, các công cụ tiến hành thực nghiệm
Chương 3: Trình bày ba đề xuất về lược đồ cập nhật nội dung
trong đảm bảo tính nhất quán dữ liệu; thực hiện mô phỏng các giải pháp
đề xuất nhằm phân tích và đánh giá kết quả đạt được của giải pháp đềxuất so sánh với các đề xuất của Nakashima và Yi Cuối chương, luận
án trình bày thuật toán phòng tránh bế tắc trong cung cấp tài nguyêncho máy ảo, đây là cơ sở cho các nghiên cứu và ứng dụng nâng caohiệu quả lược đồ đảm bảo tính nhất quán sử dụng máy ảo cập nhật.Phần cuối của luận án tổng kết lại những kết quả chính đạtđược, hướng nghiên cứu tiếp theo, danh mục các công trình nghiêncứu của tác giả, danh mục tài liệu tham khảo
Các kết quả chính của luận án được báo cáo và thảo luận tại cácHội nghị, Hội thảo khoa học; được đánh số và tham chiếu theo quycách [1] -> [6] (trang 98) Trong đó kết quả công bố (3) là trên tạpchí ESCI, các công bố [5][6] đã được đánh chỉ số theo Scopus.Các tài liệu tham khảo của luận án được đánh số và tham chiếutheo quy cách [xyz] được nêu trong các trang 99 – 104
Trang 5Chương 1 TỔNG QUAN VỀ YÊU CẦU ĐẢM BẢO TÍNH NHẤT QUÁN
DỮ LIỆU CHIA SẺ TRONG MẠNG P2P
1.1 Hệ thống dữ liệu chia sẻ phân tán trong mạng P2P
Kỹ thuật nhân bản là giải pháp chìa khóa để giải quyết nhữngvấn đề khó khăn, phức tạp về dữ liệu cho các ứng dụng phân tán quy
mô lớn như phân phối dữ liệu, lưu trữ đám mây, công nghệ chuỗi –
khối Một đối tượng dữ liệu X sẽ được nhân bản ra nhiều bản sao và đặt chúng tại các nút phân tán trong mạng P2P (Hình 1.1).
Hình 1.1 Hệ thống dữ liệu chia sẻ X
Nhiều nút sẽ đồng thời sử dụng chung dữ liệu X, do vậy dữ liệu
X được gọi là dữ liệu chia sẻ (shared data), nút có dữ liệu chia sẻ gọi
là nút sao; thuật ngữ hệ thống dữ liệu chia sẻ trong mạng P2P (sau đây gọi là hệ thống dữ liệu chia sẻ) để chỉ hệ thống các nút và dữ liệu
chia sẻ Hệ thống này là một phần trong các ứng dụng phân tán
1.2 Bài toán đảm bảo tính nhất quán dữ liệu trong mạng P2P
Dữ liệu chia sẻ X được đặt tại các bộ nhớ cục bộ của các tiến trình
thực thi hoàn toàn độc lập (Hình 1.2) Thao tác ghi của tiến
trình trên X trả về giá trị , ký hiệu ( ) , thao tác đọc của tiếntrình trên X trả về giá trị , ký hiệu ( ) Mỗi tiến trình có thể
thực hiện chuỗi các thao tác đọc hoặc ghi trên dữ liệuchia sẻ, trong đó chỉ có thao tác ghi làm thay đổi giá trị của dữ liệu
chia sẻ X Chẳng hạn, giá trị trả về của các thao tác ( ) và( ) lần lượt là 10 và 15
Internet
nút 2 Bản sao X nút 6 Bản sao X
nút 1 Bản sao X
Trang 6Hình 1.2 Tiến trình thực thi độc lập trên dữ liệu chia sẻ X
Tuy nhiên, do hệ phân tán không có đồng hồ toàn cục và dovấn đề về độ trễ truyền thông, cho nên nếu không có những quy ước,ràng buộc đối với việc thực thi của các tiến trình trên dữ liệu chia sẻthì các tiến trình có thể thực thi theo các cách khác nhau, dẫn đếnkhông xác định được giá trị trả về của một thao tác đọc nào đó, cụthể có những trường hợp sau:
1 Giá trị trả về của thao tác đọc dữ liệu chia sẻ X của mỗi tiến trình có thể là một trong số các giá trị ghi trên dữ liệu chia sẻ X mà
các tiến trình thực hiện trước đó
2 Giá trị trả về của thao tác đọc dữ liệu chia sẻ X của các tiến
trình sẽ khác nhau, tức là xẩy ra trường hợp ( ) và ( )
Vì vậy, hệ thống dữ liệu chia sẻ cần có quy ước, quy định chặtchẽ trong việc thực hiện các thao tác đọc/ghi của các tiến trình trên
dữ liệu chia sẻ, nhằm xác định chính xác, tin cậy giá trị trả về củamột tiến trình nào đó Trong đó, quy ước, quy định cần thống nhấttuân theo một mô hình nhất quán dữ liệu nhất định Điều này chính
là đảm bảo tính nhất quán dữ liệu chia sẻ X.
Các hệ thống dữ liệu chia sẻ trong mạng P2P có những khókhăn và yêu cầu phức tạp như: mạng tùy biến, quy mô hệ thống chia
sẻ lớn (số lượng nút tham gia và số lượng đối tượng dữ liệu chia sẽ trong hệ thống); nút hoàn toàn độc lập, tự trị và không thuần nhất; tốc độ nút vào/ra hệ thống và tốc độ nút thực hiện cập nhật không
xác định; yêu cầu đối với mô hình đảm bảo tính nhất quán dữ liệu,hiệu quả mong muốn cần đạt được của mỗi hệ thống là khác nhau.Trong đó, hiện nay các nghiên cứu cũng như triển khai xây dựng hệ
Bản sao (X)
Bản sao (X)
Bản sao (X)
Trang 7thống trên mạng P2P, thì mô hình nhất quán tuyến tính là lựachọn phù hợp, phổ biến.
1.3 Lược đồ đảm bảo tính nhất quán dữ liệu
Có ba phương thức cập nhật, gồm có: gửi các thao tác cậpnhật, gửi thông điệp cập nhật và gửi nội dung cập nhật Trong đó
phương thức gửi nội dung (bản sao mới) cho các nút sao trong hệ
thống, để thực hiện cập nhật nhằm đảm bảo nhất quán dữ liệu (môhình tuyến tính) đã chứng minh tính hiệu quả và phù hợp với các ứngdụng trong mạng P2P Giải pháp tổng quát trong thực hiện như sau:
Bước 1: Với mỗi đối tượng dữ liệu chia sẻ X, lược đồ sẽ xây
dựng cấu trúc cây cập nhật phía trên mạng P2P, ký hiệu là
Bước 2: Các nút có thể thực hiện cập nhật trên bản sao cục bộ
theo nhu cầu sử dụng, đồng thời nút gửi nội dung bản sao mới tới nút gốc Nút gốc lan truyền cập nhật cho các nút phía dưới và thao tác được lặp lại cho tới khi cập nhật được gửi tới nút lá.
Tuy nhiên những giải pháp đã được đề xuất còn tồn tại những hạnchế, chưa tối ưu về phương thức xây dựng cấu trúc cây cập nhật vàphương thức lan truyền nội dung cập nhật Cây cập nhật xây dựng theo
trình tự thời gian vào hệ thống của nút, nên các nút liên kết với nhau có
thể cách rất xa về vật lý hoặc logic, làm tăng độ trễ, số lượng thôngđiệp và băng thông sử dụng khi trao đổi thông điệp hoặc lan truyền cập
nhật Cây cập nhật xây dựng dựa vào tính toán khả năng của nút (độ ổn
định, tốc độ xử lý…) sẽ rất khó thực hiện, tốn nhiều chi phí, đặc biệt
khi tốc độ nút vào/ra hệ thống cao Cây cập nhật “động” chỉ có hiệu quả khi tốc độ nút yêu cầu cập nhật thấp do không tốn chi phí duy trì cấu trúc cây Phương thức lan truyền cập nhật cho tất cả các nút đang online
tốn chi phí, dư thừa và không phù hợp khi người dùng yêu cầu thời gian
sử dụng bản sao khác nhau Phương thức lan truyền cập nhật từ nút gốc cho các nút phía dưới (thậm chí là nút lá) làm tăng độ trễ, số lượng
thông điệp và băng thông do chi phí về truyền thông điệp và xử lý qua
nhiều nút Giải pháp mà mỗi nút sử dụng bộ nhớ đệm để lưu các bản sao được gửi tới nó hoặc chỉ lan truyền cập nhật cho các nút yêu cầu,
cần giải quyết những vấn đề khó khăn, phức tạp như tắc nghẽn, mất cân
bằng tải và tình trạng vượt quá khả năng của nút.
Trang 8Chương 2 GIẢI PHÁP CẬP NHẬT NỘI DUNG ĐẢM BẢO TÍNH NHẤT
QUÁN DỮ LIỆU CHIA SẺ TRONG MẠNG P2P
2.1 Chương trình phân tán, không thuần nhất
2.1.1 Chương trình phân tán
Chương trình phân tán bao gồm tập các tiến trình không
đồng bộ * + và ( ) là trạng thái của tiến
trình Tập tất cả các trạng thái của mỗi tiến trình tại một thời
điểm gọi là một cấu hình của hệ thống, được biểu diễn bởi một
vector có dạng
() Định nghĩa của chương trình phân tán như sau:
Định nghĩa 2.1 Một thực thi trong hệ thống phân tán
( ) là dãy tối đại ( ) với
, và ,
2.1.2 Thuật toán phân tán
Định nghĩa 2.2 Thuật toán cục bộ của một tiến trình là một
bộ ( ), với lần lượt là tập các trạng thái và
trạng thái ban đầu, là quan hệ trên là các quan hệ
trên ( là tập các thông điệp) Mối quan hệ nhị phân
được định nghĩa bởi:
( ) / ( ( ) )
Trong đó các quan hệ và là biểu diễn chuyển đổi
trạng thái trong tiến trình , với là chuyển trạng thái nội bộ,
không nhận hay gửi thông điệp, chuyển trạng thái và gửi thông điệp,
chuyển trạng thái và nhận thông điệp
Định nghĩa 2.3 Một thuật toán phân tán trên
*+ là tập các thuật toán cục bộ của các
Định nghĩa 2.4 Một sự dịch chuyển cấu hình theo phương
thức truyền thông tin không đồng bộ dựa trên một thuật toán phân
tán, là một bộ ( ), trong đó:
1 * ) () và }
2 ( ), với là hàm chuyển đổi trạng thái của tiến
trình ; là tập các cặp:
Trang 9( ) ( )Chúng thỏa mãn một trong ba điều kiện sau:
nhận của
Định nghĩa 2.5 Một sự dịch chuyển cấu hình theo phương
thức truyền thông tin đồng bộ dựa trên một thuật toán phân tán, là
3 *( ) ()+
2.1.3 Biểu diễn các tham số của hệ thống dữ liệu chia sẻ
Mỗi tham số của hệ thống dữ liệu chia sẻ luôn có ảnh hưởngquan trọng tới lược đồ đảm bảo tính nhất quán dữ liệu Các tham số
đó gồm có:
- Nút không thuần nhất về khả năng xử lý được biểu diễn bằng phân phối Pareto; tốc độ nút vào/ra hệ thống và tốc độ nút thực hiện
cập nhật được biểu diễn bởi các hàm phân phối Poisson;
- Quy mô của hệ thống dữ liệu chia sẻ gồm có số lượng nút
Trang 10tham gia và số lượng đối tượng dữ liệu chia sẻ được biểu diễn bằng
phân phối Zipf Lưu ý là các hệ thống này luôn nhằm phục vụ cho
nhiều đối tượng dữ liệu chia sẻ như âm thanh, hình ảnh, video, sách
2.2 Lược đồ cập nhật nội dung
2.2.1 Giải pháp xây dựng và duy trì cấu trúc cập nhật
a) Xây dựng cây cập nhật
Khi nút muốn tham gia hệ thống dữ liệu chia sẻ, trước tiên nó
cần liên kết vào cấu trúc cây cập nhật Một số giải pháp xây dựngcây cập nhật như sau:
- Xây dựng cây cập nhật theo thời gian đến và cân bằng
- Xây dựng cây cập nhật theo xác suất
- Xây dựng cây cập nhật sử dụng nút đại diện.
- Xây dựng cây cập nhật theo khoảng cách mạng
b) Duy trì cấu trúc cây cập nhật
Nút có tốc độ vào/ra hệ thống không xác định, nguyên nhân do nhu cầu tham gia hệ thống khác nhau của các nút và những yếu tố
đặc trưng của mạng P2P Vì thế, các lược đồ đảm bảo tính nhất quán
dữ liệu cần có các giải pháp xử lý vấn đề này nhằm duy trì cấu trúccập nhật Khi tốc độ này càng lớn thì việc duy trì cấu trúc cây cậpnhật càng khó khăn, phức tạp và đòi hỏi chi phí cao Tùy theo mỗiứng dụng cụ thể (các tham số của môi trường phân tán và yêu cầucủa bài toán đặt ra) và giải pháp trong xây dựng cấu trúc cập nhật màcác lược đồ có giải pháp phù hợp, hiệu quả để duy trì cấu trúc Điềunày sẽ ảnh hưởng rất quan trọng tới hiệu quả chung của lược đồ đảmbảo nhất quán dữ liệu
2.2.2 Giải pháp lan truyền cập nhật
Mô hình lan truyền cập nhật từ nút gốc tới các nút lá trong cấu
trúc cây như Hình 2.1 dưới đây:
Hình 2.1 Mô hình lan truyền cập nhật trong cấu trúc cây
: Tốc độ cập nhật mà các nút gửi tới nút gốc
: Kích thước bộ nhớ đệm lưu trữ các bản sao của mỗi nút
Trang 11( ): Độ trễ lan truyền cập nhật lớn nhất từ nút mức
tới nút mức
Giả sử có độ trễ lớn nhất ( ) Như vậy lan truyền cập nhật từ nút gốc tới nút lá có thể biểu diễn bằng mô hình hàng đợi trong toán học là M/M/1, với bộ nhớ đệm có kích
thước , tốc độ đến là , thời gian phục vụ là, như hình sau:
Hình 2.2 Mô hình tính toán rút gọn đối với độ trễ cập nhật
2.2.3 Đánh giá hiệu quả các lược đồ đảm bảo nhất quán
a) Mô hình nhất quán dữ liệu - Mức độ nhất quán
Các lược đồ sử dụng cấu trúc cây lan truyền cập nhật đảm bảotính nhất quán dữ liệu theo mô hình tuyến tính, kích thước bộ nhớđệm (giá trị của ) là độ lệch tối đa giữa các bản sao cho phép theoquy ước, biểu thị mức độ nhất quán trong mô hình nhất quán tuyếntính (sau đây gọi là mức độ nhất quán) Tùy theo yêu cầu của ứngdụng mà các lược đồ có thể xác định giá trị phù hợp
b) Tính sẵn sàng của dữ liệu (tỷ lệ cập nhật thành công)
Tỷ lệ cập nhật thành công biểu diễn bằng công thức sau:
(2.2)
Trang 12Nhận xét, đánh giá:
Từ công thức biểu diễn toán học của các tham số đánh giá hiệuquả lược đồ đảm bảo tính nhất quán dữ liệu trong mạng P2P nhưtrên, chúng ta đưa ra một số nhận xét, đánh giá quan trọng như sau:
- Không thể đạt được tối ưu đồng thời cho ba tham số nêu trênđối với các hệ thống dữ liệu chia sẻ, do chúng loại trừ lẫn nhau vềmặt hiệu quả Chẳng hạn khi kích thước bộ nhớ đệm càng nhỏ, thìmức độ nhất quán càng cao, tuy nhiên tính sẵn sàng của dữ liệu càngnhỏ và ngược lại
- Độ trễ cập nhật và tỷ lệ cập nhật thành công phụ thuộc vàocác tham số của hệ thống dữ liệu chia sẻ và lược đồ đảm bảo tínhnhất quán
+ Các tham số của hệ thống dữ liệu chia sẻ gồm có: (số
lượng nút sao), khả năng của nút, tốc độ nút thực hiện cập nhật, tốc
độ nút vào/ra hệ thống.
+ Hiệu quả của lược đồ đảm bảo tính nhất quán dữ liệu như:
bậc của nút ( ), kích thước bộ nhớ đệm ( ), và độ trễ cập nhật từ nút cha cho nút con ( ) Trong đó, hiệu quả về tỷ lệ cập nhật thành công
sẽ tỷ lệ thuận với , tỷ lệ nghịch với và ; độ trễ cập nhật tỷ lệthuận với Đặc biệt, giá trị phụ thuộc hiệu quả giải pháp
xây dựng cấu trúc cập nhật, truyền thông giữa các nút và phương thức
lan truyền cập nhật; trong đó có những vấn đề khó khăn, phức tạp
như nút quá tải, xảy ra tắc nghẽn, bế tắc và mất cân bằng tải.
Trang 13Chương 3 MỘT SỐ GIẢI PHÁP ĐỀ XUẤT NÂNG CAO HIỆU QUẢ
CẬP NHẬT NỘI DUNG ĐẢM BẢO TÍNH NHẤT QUÁN DỮ
LIỆU 3.1 Giải pháp xây dựng cấu trúc cập nhật hiệu quả đối với các
hệ thống kém ổn định
3.1.1 Bài toán
Các hệ thống dữ liệu chia sẻ trên mạng P2P kém ổn định do tốc
độ nút vào/ra hệ thống lớn và không xác định, làm tăng chi phí xây
dựng và duy trì cấu trúc cập nhật, trong đó phải kể đến thời gian mà
hệ thống phải dừng để xử lý việc nút vào/ra hệ thống nên không thể
thực hiện lan truyền nội dung cập nhật, làm tăng độ trễ cập nhật Hơn
nữa, độ trễ cập nhật phụ thuộc hiệu quả truyền thông giữa các nút.
Tuy nhiên, các giải pháp đã đề xuất còn tồn tại hạn chế trong xây
dựng cấu trúc cây cập nhật và tối ưu truyền thông giữa các nút, dẫn
đến hiệu quả chưa cao về độ trễ cập nhật, đặc biệt khi tốc độ nút vào/
ra hệ thống lớn thường dẫn đến độ trễ cập nhật tăng đột biến (chẳng
hạn như giải pháp do Nakashima đề xuất) Chính vì vậy, luận án đã
đề xuất một giải pháp mới cải tiến cho những hạn chế nêu trên nhằm
đạt được hiệu quả cao về độ trễ cập nhật Nội dung nghiên cứu này
được công bố trong công trình của tác giả số [4]
3.1.2 Thuật toán ID_LINK
Giải pháp đề xuất thực hiện xây dựng cây cập nhật tĩnh d-ary
(mỗi nút có tối đa nút con), chỉ gồm có các nút sao của dữ liệu chia
sẻ X như sau:
Nút M bất kỳ và đối tượng dữ liệu X sẽ được định danh bởi hàm
băm đối với địa chỉ IP của nút và tên của X, kết quả lần lượt là
và Khi đó, nút vào hệ thống đầu tiên sẽ được chọn là nút gốc của
cây cập nhật, ký hiệu là nút R Nút R được coi là chịu trách nhiệm
cho toàn bộ không gian định danh của tất cả các nút, nên với bất kỳ
nút M, ta luôn có , - Không gian định danh của
nút M chịu trách nhiệm được ký hiệu là Ký hiệu
là phần, phân chia liên tiếp bằng nhau trong
không gian định danh Nút con được đánh số thứ tự từ trái qua
phải, chẳng hạn là ký hiệu nút con của nút tại vị trí thứ
Trang 14Giả sử nút M cần liên kết vào trong cấu trúc cây cập nhật, nó sẽ
gửi thông điệp ( ) tới nút gốc R thông qua cấu
trúc mạng phủ Pastry, yêu cầu được liên kết vào cây cập nhật Nút R
kiểm tra , với ̅ ̅̅ ̅ ̅ Nếu nút chưa có nút
con chịu
trách nhiệm cho không gian định danh , thì nút M được chọn là nút con tại vị trí thứ của nút R, ký hiệu nút và
Ngược lại nếu nút R đã có nút con , thì nút R sẽ gửi thông điệp
() tới nút Nút nhận được thông điệp sẽ
thực hiện tương tự Yêu cầu của nút M kết thúc khi tìm được nút thỏa mãn và nút chưa có nút con Như vậy, nút
được chọn là nút con của nút K tại vị trí thứ i, ký hiệu Khi đó, nút chịu tránh nhiệm cho vùng không gian định danh Mã giả của thuật toán ID_LINK được trình bày như dưới đây
Thuật toán 3.1: ID_LINK
Đầu vào: Nút K nhận được thông điệp ()
Đầu ra: Nút cha của nút M
Begin
1 // thuộc không gian định danh thứ i trong
2 If nếu nút K chưa có nút con Then
Bổ đề 1: Chi phí truyền thông giữa nút và nút trong
cây cập nhật tối đa là ⌈
( )⌉ bước
Chi phí gửi cập nhật từ nút gốc tới nút , ký hiệu là
, được biểu diễn bằng công thức như sau: