~Kitin inte Web caching - Dhan tick gidi php Wee Cacking eta ISP é Campuchia THUAT NGU VA CAC TU VIET TAT T2ữ liệu âm thanh Hệ thống cache tai một nút mạng Lả tiến trình truy nhập wcb
Trang 1KIEN TRUC WEB CACHING - PHAN TÍCH GIẢI
PHAP WEB CACHING CUA ISP
TAT CAMPUCHIA
LUẬN VĂN THẠC SI CONG NGHB ‘THONG ‘TIN
Hà nội - 2005
Trang 2
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRUONG DAI HOC BACH KHOA HA NOI
AO
TAN KOSAL
KIEN TRUC WEB CACHING - PHAN
TICH GIAI PHAP WEB CACHING
CUA ISP
TAI CAMPUCHIA
CHUYEN NGANH: CONG NGHE THONG TIN
LUAN VAN THAC SI CONG NGHE THONG TIN
Trang 4~Kitin inte Web caching - (Dhan tick gidi php Wee Cacking eta ISP é Campuchia
THUAT NGU VA CAC TU VIET TAT
T2ữ liệu âm thanh
Hệ thống cache tai một nút mạng
Lả tiến trình truy nhập wcb va lay nội dung web có sẵn
trên cache
La tiến trình truy nhập web và nội dung web không có
sẵn trên cache, phải lay từ F THẤY chủ web lIệ thống cache được đấu nối trên mạng theo cơ chế
proxy
Cache Array Routing protocol - Lhủ tục tim kiểm nội
dung trang web dựa trên cơ chế hàm bảm (Hash function)
là phần cứng hoặc phần mềm xét trong mỗi quan hệ
tương tác với hệ thống máy chủ (Server)
Domain Kame System - Hệ thống tên miễn Eile 'Iransfer Protocol — Ciao thức truyền file
Là cửa ngõ để giao tiếp với các mạng khác
Greedy Dual 8ize - Thuật toản thay thể nội dung cache ¢6
Là thuật toán GDS và GD* với chỉ phí không dỗi
Lá thuật toán GD8 và GD* với chi phi tinh theo gói dữ liệu — 2
Kích thước dữ ệu/536
Một nút trong topology ctia mang thường được sử dụng
với các thủ tục định tuyển RIP
Thiết bị trên mạng nói chung cé dia chi LP vi da PC, Server router
Hyper'lext Markup language — Ngôn ngữ đánh dấu siêu
văn bản
Hyper [ext Iransfer Protocol — (ao thức truyền dẫn siêu văn bản
Internet Cache prolocol - Thủ tục tìm kiểm và lấy nội
dung trang Web
Dữ liệu hinh ảnh Inlemet Service Provider - Nha eung efp dich vụ truy
nhập Internet
Large Scale Active Middleware - B6 dém trung gian quy
mô lớn
Sạn 2Koaat (6ambodie sudeul) — - áp: 6202003 - 2005
Trang 5Least Frequently Used with Dynamic Aging-Thuat toan
thay thế nội dung cache dựa trên tần suất truy nhập Least recently uscd - Thuật toán thay thể nội dụng cache
dựa trên tỉnh tương quan theo thời gian của truy nhập
Loại đữ liệu ví dụ tiổng nói, hình ảnh, văn bản, phim
Mô lá mạng mà mỗi núi mạng đều có đương kết nối đến
ác nút mạng cản lại Most recently used - Vi tri luu cae trang mới được sử
dung nhiều nhất trong ngin xp LRU
Mean time to request - Théi gian trung bình tính tới lần truy nhập tiếp theo
Loại dữ liệu kết hợp hình anh vả âm thanh
Nút mạng
Là tiến trình di lẫy trược nội dung trang web dược dự báo
sẽ được truy nhập trong thời gian tới
Cơ chế dẫu nỗi của một máy chủ trên mạng, máy chú sẽ dại diễn cho toàn bộ thuê bao hay máy tram mà nó làm
proxy dễ thực hiện các giao dịch mạng
Độ định tuyển
Route trip lime - Độ trễ gồi toàn trình
Máy chủ
Segmented least recenlly used - Thudt toan thay thé nội
dung cacho dựa trên tính tương quan thơo thời gian của
truy nhập
Transmission Control Protocol - Giao thức điểu khiến
truyền din
Dự liệu văn bản
Time to request - Thời gian tới lần truy nhập tiếp theo
"Lÿ lệ giữa tổng dung lượng của các trang web được truy
nhập mà nội dung của chúng đã được lưu sẵn trong cache
proxy trên tổng số dung lượng của các trang web dược
truy nhập
Tỷ lệ giữa số truy nhập web mã nội dung dược yêu cầu
dã dược lưu sẵn trong cache proxy trên tổng số truy nhập
User Datagram Protocol — Giao thite truyền gới tin
Trang 6~Kitin inte Web caching - (Dhan tick gidi php Wee Cacking eta ISP é Campuchia
DANH MUC HINH VE
Hink 1.1 : Kiên trúc cơ bản của một bộ đệm cho Web
Hình 1.2: M6 hinh Client/Server
4iình 1.3: Quan hệ giữa Web browser và Internet Server
Hình 1.4: mé hinh proxy
Hinh 1.5: Proxy Server chay trén Firewall
Hình 1.6: Sơ a6 tong quát hé thong Web caching Web
Hình 1.7: Mô hình của cơ chế sử dụng proxy caching
Hình 1.8: Mô tả cơ chế sử dung bộ đệm trang suết
Hình 1.9 : BG dém phin cấp
Hình 1.10 - Mô hình bộ đệm phân tân
Hình 2.1 - Kiên trúc phân ting cia Web Caching
Hình 2.2 : Kiên trúc phan tan cha Web Caching
Hình 2.3: Kiến trúu hỗn hop cia Web Caching
hình 24: Mô hình phân cấp cia ISP ( Network topology)
Hinh 2.5: Kiéu cay cach dat cache (Tree mode, showing cache
lacement.)
Hình 2.6: Thời gian kết nỗi m[fc] với mật độ trang Ã,„.A — 24h, đ— 15sec
TTình 2.7 : Lưu lượng mạng phát sinh bởi kiến trúc phân tầng và kiến
trúc phân tán tại mỗi cấp độ cây Tình 2.8 - Mạng quốc gia không bi nghén ø=0.3
Trang 7Hình 2.11 - Thời gian kết nỗi phụ thuộc vào số lượng cachc công tác
tại mỗi cấp mạng trong kiển trúc hỗn hợp
Hình 2.12 - Thời gian kết nỗi trong kiến trúc hỗn hợp với số cache
cộng tac téi uu ke
Hình 2.13 - Thời gian truyền trung bình phụ thuộc vào số lượng
cachecông tác trong mô hình hỗn hợp với (ø— 0.3) và
điình 3.1 - Quan hệ giữa Pump and filter
Tình 3.2: Troxy lưu trữ ngược
Hình 3.3: Proxy lưu trữ ngược nhiêu - nhiều
Hình 3.4: Một bộ dệm phân cấp dan
Hình 4.1: Lược đỗ thay thé n6i dung cache của thuật toán LRU
Hình 4.2: Lược dỒ thay thể nội dưng cachc của thuật toán SLRU
4iình 4.3: Đoạn mã giả lập cho thuật toán LEU-DA
Hình 4.4: Doan mi gid lap cho thuat toan GD
Hình 4,5 : Mô hình so sánh chứng mình
Hình 4.6 - Hai trường hợp kết thúc khung thời gian
Hình 4.7- Doạn mã giả lập cho thuật toán GD*
Hình 5.1: Miều tả chưng những Cachc Farm lrong mét mang ISP
1iình 5.2: Trình bày chỉ tiết Cache farm trong mang ISP
Trang 8~Kitin inte Web caching - (Dhan tick gidi php Wee Cacking eta ISP é Campuchia
Cơ sở hạ tầng mạng Internet ở Cămpuchia hiện nay
: Sơ đề mạng lưới Web Caching của mạng ISP NiDa
Sơ để dễ xuất piải pháp của mạng ISP Nil2a
: Tổ chức phần mém Squid
Hình 6.2 - Chu hinh trinh duyél Netscape cho Web Caching
TTình 6.3 - Cấu hình trình duyét Netscape tr dng cho Web caching
Hình 6.4: CẤu hình trình duyét Movilla cho Web caching
DANH MUC BANG
Bang 3.1: ICPv2 message format
Bang 3.2: ICP_OP_QUERY payload format
Bang 3.3: Khuôn dạng của ICP OP HIT OBI
Trang 9TAI LIEU THAM KHAO
1 Mạng máy tính vả các hệ thông mở - Nguyễn Thúc Hải
2 Công nghệ mạng máy tỉnh — Nhà xuất bán Bưu Điện,2001
3 Các bài viết về Internet - T8 Hồ Khánh Lâm - Tap chí Bưu chính viễn thông
4 Công nghé Intemet Cache img dụng Vũ Duy Lợi, Trần Trọng Minh
5 Analisis of Web Caching Architecture:Hierarchical and I3istributed
Caching — Pablo Rodriguez, Christian Spanner, and Ernst U Biersack,
Member LKEH-Vap chi IREE/ACM ‘Transactions on Network, Vol 9.No
4,August 2001
6 Algorithms Of The Internet, Organized by Chrislian chindelhaucr
Elaboration on Topic 03 Web Caching by Stefan Luecking (6014415)
sil(aQupb.de University of Paderborn, Dale: August, 4th, 2004
7 Internet Cache Protocol (ICP), version 2, D Wesscls, K Clatfy, National
Laboratory for Applied Network Research/UCSD September 1997
8 Implementation and comparison of distributed caching schemes,
S.Selvakumar, P Prabhakar Department of Computer Science and
Engineering, Regional Lngeneering College, Tirachirappalli, Tamil
Nadu, India Extract in Computer and Communications Magazine,
Received 14 March 2000, Revised 24 July 2000, Accepted 27 July 2000
9 Web Distribution Systems : Caching and Rephcation,
Trang 10Kit trite Webs eaching - Phin lich giải pháp TÙen Caching eiia ISP & Campuchia
BO GIAO DUC VA DAO TAO
TRUONG DAI HOC BACH KHOA HA NOI
——;Kñ——
BẢN NHẬN XÉT LUẬN VĂN CAO HỌC
Họ và tên học viên Tan kosal
Chuyén nganh Công Nghệ Thông Tin
Khoá 2003 — 2005
Người hướng dẫn : TS Hồ Khánh Lâm
Nội dung:” Kiến trúc Web Caching — Phân tích giải pháp Web Caching
cua ISP 6 Campuchia”
Nhận xét của người hướng dẫn
Trang 11MUC LUC
CHƯƠNG 1: GIO] THIEU CHUNG VE WEB CACHING
1.1 VISAO PILAIDUNG WEB CACIING 7
1.1.1 Sự phát triển của Internet
CHUONG 2: 80 SANH PHAN TICH CAC MO HiNH KIÊN TRÚC
HE THONG WEB CACHING
2.1 GIỚI THTƑU CAC KIEN TRUC CACIIE
2.1.1 Kiến trúc cache phân ting — hicrarchical Cachc -25
2.1.2 Kiên tric cache phan tan - Distributed Cache
2.1.3 Kién tric cache hin hợp Ilybi cache
22 ĐÁNH GIÁ HIỆU NĂNG CỦA KIÊN TRUC PHAN TANG VA
Trang 12~Kitin inte Web caching - (Dhan tick gidi php Wee Cacking eta ISP é Campuchia
2.2.6 Thời gian kết nổi
2.3 DANH GIA HIEU NANG CUA KIEN TRÚC HỖN HOP
2.3.1 Thời gian kết nồi
3.2, CAC GIAO THUC CUA WEB CACHING
3.2.1 Giao thée ICP (intemet Cache Protacol)
3.2.2 Giao thức HLCP (Hyper Lext Cache Protocol)
3.2.3 Giao thite CARP
3.2.4 Cache Digest
3.2.5 Các giao thức dựa trên Multicast
3.2.6 Proxy lưu trữ đão ngược
3.2.7 WCCP (Web Cache Central ol Protocol)
3.3 GIAO THỨC ICPv2
2.3.1 Khái nệm
2.3.2 Dinh dang tt tin nhắn ICPv2
2.3.3 ICP_OPCODE
2.3.4 IOP OPTION FLAG ( Cờ lựa chọn IOPv2)
CHUONG 4: THUẬT TOAN CUA WEB CACHING
4.1 TONG QUAT VE CAC THUAT TOAN CACHING
4.2 SỰ CÂN THIẾT CUA WEB CACHING
4.3 MỘT SỐ THƯẬT TOÁN CỦA WEB CACHING
4.3.1 Thuật toán Least Recently Used LRU
4.3.2 Thuật toán Segmented T.vast Recently Used
59 -ÖÒ 6] 63
- 08
4.3.3 Thuật toán Least Frequently Used With Dynamic Aging
4.3.4 Thuật toán Oreedy Dual :
Fan Korul (Cambodia student) — Ldp: C2003 - 2005
Trang 134.3.5 Thuật toán GrccdyDual-Size - 80 4.3.6 THUAT TOAN GREEDY DUAL *(GD*)
AA, REIT LUAN oo cceeesessssescisesssessesineeesseesetisneciee "
CHƯƠNG 5: GIAI PHAP WEB CACHING CỦA MỘT ISP Ở
5.1, CISCO CACHE ENGINE ¬- -Ö- 92
§.1.1 Gidi thigu Cisco Cache Engine -92 5.1.2 Những đặc điểm của Cache Engine - -93
5.1.3 Tìm hiểu phần cửng Cache Engine " Ob
5.144 Ví dụ cấu hình của ISP ¬ - 95
5.2, MANG INTERNET TALCAMPUCHIA
3.2.1 Khảo sát hiện trạng mạng viễn thông Cămpuchia
5.3 KHAO SAT HE THONG WEB CACHING CUA MANG ISP Nila 102
5.3.1 Nhan xét chung ctla NID cee 2,103
$.3.2 Đề xuất giải pháp cho ISP NiDa 105
CHƯƠNG 6: ẤP DỤNG SQUI1D CHO WEB CACHING
6.1, CONG CU PILAN MEM SQUID GIIO WIB CACHIING L08
6.1.2 Vi sao phẩi chọn Squdi ? -.108
6.1.4 Mô hình thử nghiệm da Squid - 110
6.2.1 Cầu hình để chạy được phẩn mém Squid 110
6.2.4 Quan hé gitta browsers va Squid „ 112
Sạn 2Koaat (6ambodie sudeul) — - áp: 6202003 - 2005
Trang 14hương 1: Qiới thiệu chung ob WEB Caching
LOI NOI DAU
Ngày nay internet đã trở thành công nghệ tiêu chuẩn, kết nối mở các
hệ thống tính toán và các mạng máy tính không dồng nhất Việc phát triển
bùng nổ các mạng Internet/Intranet, việc cung cấp các dịch vụ thông tim về
kinh tế, văn hoá, xã hội ngày cảng phong phú trên mạng cũng như xu thể
tích hợp các hệ thống thông tin trong các hoạt đông chính trị, kinh tế, xã hội trên giao điện web nỏi riêng, cũng như việc tối ưu hóa lưu lượng số
liệu, hạn chế đến mức tối da khả năng tắc nghẽn số liệu trao dỗi trên mạng,
trên nên rất cần thiết
Công nghệ lưu trữ và cung cấp nội dung trang wch tại nơi gẦn người
sử dụng gọi là công nghệ Internet Web Caching Day là một trong những
giải pháp công nghệ góp phần giải quyết vấn để nghẽn, nâng cao tốc độ truy
cập Internet, tối ưu được bãng thông Giải pháp web caching dược da số các
nhà cùng cấp dich vu Internet (ISP) st: dung dé nâng cao chat lượng cung
cấp dịch vụ truy cập Intermet và tiết kiệm chỉ phí đầu tư cho cơ sở hạ tầng
mạng, công suất thiết bị Kÿ thuật Web caching luôn mang tỉnh thời sự và cần được liên tục nâng, cấp để đáp ứng như cẩu gia tăng với tốc độ chóng mặt
của số lượng người dùng Tntermet trên toản cầu va chỉ phi cho băng thông, của hạ tầng mang Internet
Đó là lý do vị sao chọn nghiên cửu về web caching của luận văn
Bán luận văn này được trình bảy thành 6 chương trong khoảng
(120)A4
Chương T: Giới thiệu chung vé Web Caching
Chương II: 5o sánh phần tích các mô hinh kiến trúc hệ thống Web
Trang 15Chương TV: Thuật toán của Wcb Caching
Chương V: Giái pháp Web Caching của một ISP ở Cămpuchia
Chương VI: Ap dung Squid cho Web Caching
'Irong quá trình thực hiên đề tài này tôi đã nhận được sự giúp đỡ tận
tỉnh của thây hướng dẫn TS 116 Khánh Lâm đã nhiệt tình giúp đổ và hướng
dẫn tôi hoàn thành đã án tốt nghiệp này:
Tôi xin gửi lời cảm ơn chân thành tới các thầy cô giáo trong khoa
cộng nghệ thông tin của trường đại học Bách khoa Hà Nội
Một lần nữa tôi xin cảm ơn tất cả những ai sẽ đọc và góp ý cho luận
văn này
Trang 16
Ghutong 4: Gidi thifu chung v6 WED Caching
CHUONG 1
GIOI THIEU CHUNG VE WEB CACHING
1.1 VI SAO PHAI DUNG WEB CACHING ?
1.1.1 Sự phát triển của Internet
'Irong những năm pẦn dây, với sự phát triển nhanh chóng, Internet dã
trở thành nguồn cung cấp thông tin khổng lâ và phong phú, đặc biệt lả trên
các web sitcs Số lượng cde Lang web ude Linh đã hơn 3 tý và gần 80% số
lượng người sử dụng Internet là truy cập lấy nội dung các trang web Diều
này làm cho các hệ thống máy chủ dịch vụ web và các kênh truyền thông trở
nên nhanh chóng bị quá tải và nghẽn Chi phí lớn cho đầu tư tăng dung
lượng, công suất cho các máy chủ địch vụ vả truyền dẫn không thể đáp ứng
kịp thời tốc độ phát triển của nhu cầu sử dụng Internet Các nhà cung cấp
địch vụ Internet (ISP) một mặt phải đáp ứng nhu cầu sử dụng Internet của số Tượng lớn những người sử dụng, một mặt phải đấm bảo chất lượng cung cấp
dịch vụ (giảm tắc nghẽn, tăng tốc độ truy cập thông tin) với sự tiết kiệm chi
phí về thuê kênh viễn thông Đó là vấn đề cần phải có giải pháp để thỏa mãn
sự phát triển của Internel
1.1.2 Các giải pháp
Các giải pháp dều phải khắc phục các nhược diểm của Intemet
Services, dé 14: giém nghẽn băng thông ở các cấp mạng: mạng trục quốc gia
(National nctwork), các mạng ving (Regional networks); va cdc mang khu
vuc (Institutional networks),
Trang 17
Giải pháp phổ biển nhất là nâng cấp các nguồn tải nguyễn mạng như:
sử dụng các server mạnh, truyền dẫn băng thông rộng, tối ưu cầu trúc mạng
về dịnh tuyến, phân tãi, v.v Tuy nhiên, cách tiếp cận trên phải chịu chỉ phí lớn về mặt kinh tế, nhưng tốc độ đầu tư và chỉ phí lớn không thể đáp ửng kịp
thời được tốc độ tăng của yêu cầu truy cập Internet
Vì hơn khoảng 70-80% cdc tray cp Intemet la tham chiếu lấy các nội
dung của các Web Sites Do vậy phần lớn lưu lượng chiếm tải của các hệ
thông cung cấp dịch vụ vả các kênh truyền dẫn là các giao dịch gũa WWW
giữa người sử dụng (Clients) và các Web Servers Vậy thì nếu sử dụng giải
pháp bộ nhớ đệm tốc độ cao (cacho) để lưu trữ cde nội dung các trang wcb
phổ biến, thông dụng được nhiều người sử dụng tham chiếu đến thì cũng
chứng tỏ được những ưu điểm của nó:
> Bộ đêm làm giấm bớt nhu cầu chiếm giữ đường truyền (khoảng 359),
giảm thông lượng giữa các máy trạm (clients) và máy chủ thông tin (content
servers)
> Bộ đêm cải thiên chất lượng dich vu (Qo8) thông qua việc phân phối
thông tin với băng thông rộng tốc độ cao hơn, giâm thời gian trễ và chờ đợi ở
phía người ding dau cudi (Client)
Ehi người sử dụng tham chiéu một nội dưng của trang web nào đó lần
đầu băng trình duyệt Web, trình đuyệt Web sẽ hưu đệm trang Web đó tại máy tính của người sử dựng (local web caching) Như vậy, lần tham chiếu trang
'Web đó tiếp theo thì nội dung trang Web đó được lay ngay tại máy tính của
người sử dụng mà không oần phải chuyển yêu cầu của trình duyệt Web lên
trên mạng cấp trên hoặc đến tân máy chủ gốc (Origin server) của trang Web
để tìm kiểm Do đó giảm được lưu lượng sử dụng băng thông ở mạng cắp
trên và sự trễ đối với người đủng lính năng Web caching cuc bộ nảy trên
mỗi máy tính cá nhân của người sử dụng được thực hiện nhờ các loại trinh
Trang 18
Ghutong 4: Gidi thifu chung v6 WED Caching
duyét Web ctia Microsoft, Netscape hay Mozilla của linux Rcdhat với trường
History Gmicrosoft) Tuy nhién trong môi trường rộng lớn hơn, như trong
mang may tinh cuc bé (LAN) co nhidu may tinh két ni thi “local cache” cho web được mở rộng thành một “share cache” chia sé cho tat cả người dùng trong một mạng cục bệ Khí số lượng của người đủng kết nổi vào mật bộ đêm dơn (single cache) nhỏ, còn số lượng thông tin trên Web nhiều, thì các
tính năng của cache bị giảm sút Tỷ lệ truy nhập tring trang Web (hit) tai
cacho gủa mạng sục bộ cúa một cơ quan (các yêu câu cũa những người sử
dụng có thể được phục vụ bởi cache có lưu bản sao trang Web) thường trong
khoảng 30% đến 50%
To vậy Wch Caching là một giải pháp hiệu quả nhất và dỡ tốn kẻm
chỉ phí nhất để nâng cao chất lượng địch vụ đáp ứng được phần lớn các nhu
cầu của người sử dụng truy nhập lẫy nội dung thông tin trên Wch
1.2 GIỚI TIIỆU VỀ WEB CACHING
Bộ nhớ đệm là một vùng lưu trữ tạm các thông tin được sao chép từ
thông tin gấc Có hang triệu trang Web trên mạng internet, điều nay đồng
nghĩa với việc cỏ một khối lượng thông tin khổng lồ, và hàng triệu các đối
tượng cần xử lý khác nhau Trong quá trình khai thác thông tin, rất nhiều yêu
cầu người dùng tới củng một đối lượng Một ví dụ điển hình là logo của
Yahoo trên trang Web của công ty nay Hinh logo này xuất hiện tại tất cả các
trang Web thông tin Mỗi trang lại được truy cập bởi nhiều người dùng và
nhiều lần trong ngày Bộ đệm cho Web là một hệ thống máy tỉnh chuyên
dụng quản lý và lưu trữ các đôi tượng khi nó truy xuất đối tượng từ máy chủ
Với các yêu cầu đến đối tượng, bộ đệm sẽ xử lý và truyền tải đổi tượng từ
vùng nhớ của nó thay vì gửi yêu cầu đến Server lưu trữ đối tượng gốc Mọi
đi tượng Web đều có thể thay đối theo thời gian, vì vậy cơ chế này quy định
Trang 19
một khoảng thời gian cho mỗi đổi tượng Khi qua khoảng thời gian này, bộ
đệm sẽ tự động lấy lại nôi dung của đối tượng được lưu trữ trên máy chủ gốc Điều này đảm bảo luôn phản ánh đúng nội dung của đối tượng đối với người dùng Cảng có nhiều yêu cầu truy xuất chung tới một đối tương,
phương pháp này càng thể hiện được tính hiệu quả của nó
Client Ja bat ky ứng dung nao tao nên sự kết nối sử dụng cho mục đích
gửi yêu cầu
Server
Là một ứng dụng sẽ chập nhận việc kết nối cho mục đích trả lời những
yêu cầu bằng việc gửi trở lại những câu trả lời Bất kỳ chương trình nào cũng
có thể vừa là client vừa là server, phụ thuộc vào vai trỏ mà một kết nối cụ thể thực hiện Thuật ngữ này thường được sử dụng liên quan với mỗi kết nối chứ
không phải dựa vào loại yêu cầu
Fan Kosal 022003 - 2005 6
Trang 20+ Qiấi thiệu cung nề T72 Caching
Về mặt kỹ thuật, Web server gồm có phần mêm và phần cửng để xây
dựng Web server của mình thì phải thiết đặt phầm mềm đặc biệt tới máy tính
đặc biệt hoặc mạng LAN và hệ điều hành (hoặc Network operating system —
NOS) mà đang chay Web server có thể thực hiện một số nhiệm vụ như sau:
> Hoạt đông việc đăng ký
> Xác nhân những người sử dụng
> Ghi đia chỉ Internet, thời gian vả yêu cầu mà làm cho mỗi kết nối
> Bao vé tap tin
> Truyền các yêu cầu đữ liệu mà cả browser lẫn server có thể truy
cập trực tiếp tới các ứng dụng gọi là gateway
Trang 21
> Để giải thích mã HTML trong tải liệu nó nhận từ máy chủ và đưa
ra tài liệu đó tới người sử dụng với nhiều định dạng browser
Khi nhập URL khác, quá trỉnh sẽ bắt đầu lại khắp noi Browser str
dụng URL đề yêu cầu tài liêu rồi cho đợi máy chủ trả lại tài liệu
Hinh 1.3: Quan hé giita Web browser va Internet Server
Firewall
Firewall la mét kỹ thuật được tích hợp vào hệ thống dé chống lại sự
truy cập trái phép nhằm bảo vệ các nguồn thông tin nội bộ cũng như hạn chế
sự xâm nhập vào hệ thống của một số thông tin khác không mong muốn
Proxy
Proxy là một hệ thống trung gian đóng vai trò vừa là server vừa là client với mục đích đưa ra yêu cầu, thay thể các client khác Những proxy
thông thường nằm ở điểm đầu vào mạng Yêu cầu có thể được đáp ứng bên
trong hoặc có thể chuyển tiếp Nếu yêu cầu được chuyển tiếp thì lúc đó
proxy đóng vai trò như client trong khi nhận thông tin từ server và sau đó
đưa thông tin này đến client yêu cầu
Fan Kosal -Đáp: 0202003 - 2005 8
Trang 22Chutiug gu chung vé WEB Caching
Là một hệ thống trung gian đóng vai trò vừa là server vừa là client với
mục đích đưa ra yêu cầu đến Origin Server, thay thể các client xuất phát yêu cầu Những proxy thông thường nằm ở điểm truy cập mạng và có hệ thống caching để lưu trữ những nội dung trang web thường xuyên được truy nhập đến Các client thông quá trình duyệt web gửi yêu cầu nội dung trang web
đến proxy Nếu nội dung trang web đã được cache trong proxy thì proxy có
thể đáp ứng ngay cho client Nếu nội dung trang web yêu cầu không có trong proxy thì proxy sẽ chuyển tiếp yêu cầu của client đến hệ thống web caching
cung cấp hay cấp trên hoặc đến thẳng Origin server Như Vậy, trong trường
hop nay proxy lam nhiêm vụ của một client ủy nhiệm thay cho client nguồn
Fan Kosal -Đáp: 0202003 - 2005 9
Trang 23xuất phát yêu cầu Khi nhận thông tin từ server nguồn, thi proxy sẽ chuyển
tiếp nội đung web đến client, đồng thời lưu trữ nội dung trang web tai cache
của mình
Reverse Proxy
Proxy ngược là một proxy nằm phía Origin server và lưu trữ những
nội dung thường xuyên dược các Client yêu cầu Các proxy ngược thường
được dùng như những cổng phía trước các Origin server sau firewall của
mạng và đóng vai trỏ hỗ trợ giảm tải cho các Origin server
eighbor/sibling Web cache server
Caching Server tham gia trong mang lei caching (caching mesh),
pitiinhan nhiing yéu cau nhting Cache Scrver khac
Cluster
T.ả một tập hợp các thiết bị nối cặp với nhau củng hoạt dông dé chia
sẻ tải
Local caching proxy
Là proxy cục bộ mà người sử dựng kết nỗi trực tiếp
Intermediate caching proxy
Theo các nhà cung cấp nội dụng thì caching proxy trung gian là tẤt cá
các hệ thống cache có trong caching mesh và không phải là các local caching
proxy của người sử dựng
Web Proxy Server
'Web proxy server là một máy chủ IITTP chuyên dung Proxy server
dùng để cho phép các client bên trong (internal clients) truy cap đến internet
từ sau một firewall bất kỳ ai ở đẳng sau firewall có thể có đủ WWeb truy nhập
qua máy chủ lirewall (irewall host) với nội lực nhỏ và không cần đản xếp
bảo mật
Trang 24
ung,
Jiôi thigu chung vé WEB Caching
Proxy server lắng nghe những yêu cầu từ các clients bên trong firewall
và chuyền các yêu cầu đến máy chủ (remote internet servers) bên ngoài
firewall Proxy server đáp ứng đọc từ máy chủ bên ngoải và sau đó gửi chúng cho các Client bên trong Đa số Proxy server được thực hiện trên một
cơ sở phương pháp truy nhập Proxy server có thể cho phép hoặc không cho
phép yêu câu bên trong tuỷ theo giao thức của yêu cau vi du: proxy server
có thể cho phép gọi tới FTP Server khi không cho phép gọi tới HTTP server
Khi nào cần sử dụng Web Proxy Server ?
Có thể dùng Web proxy server như sau:
> Cho phép và han chế Client truy cập đến Internet dựa trên địa chỉ
TP của Client
> Tài liệu chaching cho tài liệu bên trong
> Co su lua chon điều kiện để truy cập tới internet và Subnet dựa trên
Trang 25Cache Server
La nhimg server khéng phue vu nhw ban thin mét proxy ma ching
phục vụ các yêu cầu dược tạo ra từ các local caching proxy va cac caching
proxy ở các cấp mạng trên
Caching mesh
Là một tập hợp các proxy cache hoạt động phối hop (co-operating
proxy caches) hoặc các caching servers hoặc các clusters kết hợp từng cặp
chặt ghỡ và hoạt động độc lập nhưng chia sẽ nội dung giữa chúng với nhau
bằng cách sử dụng các giao thức quan hệ cache bên trong (Inter Cache
Communineatien Protocols)
Transparent Proxy
Một proxv trong suốt là một proxy loại bó những thứ cần thiết cho câu
hình trình đuyệt khi người sử đụng truy nhập một proxy
Local Web Cache Server
Caching Server chạy trên cùng LÀN như một người sử dụng
Một số mô hình hệ thông tiêu biểu
1.2.2.1 Mô hình tổng quát (xem hình 1.6)
Hình 1.6 mô tả về thành phần tạo ra Web Caching và hệ thống tiêu
biểu giữa các thành phần
Tan Kesal -tấp: 0362003 - 2005 12
Trang 26Ghutong 4: Gidi thifu chung v6 WED Caching
Server ~©———** server Server
Top level
Caching pro:
Network
Element Client
Tình 1.6: Sơ đồ tổng quát hệ thống Web caching Web
1.2.2.2 Mô hình sử dụng hệ thống caching uỷ quyền (proxy
caching}
Các máy chủ được uỷ quyển thường được triển khai trên mạng tại các
điểm truy cập vào mạng (enuy poinL) nhằm ngăn chặn các luồng thông tin truy cập vào mạng khêng mong muốn vả kiểm soát các luồng thông tin ra
khỏi mạng Cũng bởi đặc điểm về vị trí như vậy, trên các máy chủ nảy
thường dược cải đặt tỉnh năng làm bộ đêm Và được gọt là bộ đêm uy quyền
(proxy cache) Bộ đệm uỷ quyên đã giúp cho mạng đữ liệu của các doanh
nghiện và cáo nhà cung cấp địch vụ Intermet nhận ra được lợi ích của chia sẽ
tải nguyền thông qua cơ chế này Khi người dùng có yêu cầu truy cập tới
một đổi tượng, yêu cầu này đầu tiên sẽ được gủi tới máy chủ uỷ quyền
13
Trang 27
(proxy server) Néu máy chủ được uỷ quyền nay có lưu trữ đối tượng, nó sẽ
truyền đối tượng tới máy trạm có yêu cầu sử dụng Trong trường hợp máy
chủ được uỷ quyền không có đối tượng, nó sẽ gửi một yêu cầu tới máy chủ gốc (lúc này máy chủ được uỷ quyền đóng vai trỏ như một máy tram gửi yêu
cầu thông thường) Khi nhân được đối tượng từ máy chủ gốc, máy chủ được
uỷ quyền sẽ lưu trữ vào bộ nhớ cục bộ của nó và gửi một phiên bản copy tới
máy trạm có yêu cầu ban đầu Khi có một yêu cầu truy xuất đổi tượng từ một
máy trạm khác, máy chủ được uý quyền có thể nhanh chóng cung cắp thong
tin nhờ sử dụng ngay dữ liệu cục bộ của nó
Ưu điểm của cơ chế này là khi đã có một yêu cầu đến đổi tượng từ một người dủng nảo đó, thì đối tượng này đã được sẵn sảng cho tất cả
caching mesh Nội dung của đối tượng được câp nhật lại theo khoảng thời
Client Client Client
Hinh 1.7: Mé hình của cơ chế sử dụng proxy caching
Trang 28
Ghutong 4: Gidi thifu chung v6 WED Caching
1.2.3.3 Mô hình sử dụng hệ thống caching ủy quyền trong suốt
TPC (Transparent proxy caching)
Thông thường, cách sử đụng máy chủ TPC trong suốt đôi hỏi người sử
dụng phải chủ động thiết lập các tham số của trình duyệt, khai báo dia chi IP
của TPC mới có thể truy cập được thông tin Moi việc sẽ thuận lợi và đơn
giản hơn nếu ta có thể ngăn chặn và kiểm soát các luỗng thông tin truy cập
không mong muốn mà không đòi hỏi phải cấu hình cho từng trình đuyệt
P” (ransparcnU) ở diy ham ý rằng người
riêng biết Tỉnh năng “trong suối
dùng sẽ không cần phải nhận biết TPC, không cần cấu hình trình duyệt của
minh để truy cập vào mạng Một bộ đệm Wcb được gọi lả trong suốt nếu các
máy trạm có thể truy cập váo mạng mà không cần phải thiết lập bất ký cầu
hình nảo cho trình duyệt của mình, kể cả cầu hình tự động hay không tự
động Cơ chế sử dụng TPC rất phủ hợp với ha ting mạng hiện nay Chúng,
hoạt động, giống, như những bức tường lửa trong suốt hơn là một hệ thống
bao gồm nhiều máy chủ uỷ quyền (proxy) được bố trí phân tán Điều này cho phép các doanh nghiệp kết hợp các bộ đệm Ấn vào trong mang,
Tuy nhiên, khi được tích hợp vảo mạng, bộ đệm trong suốt cần phải
đảm bảo tính mềm dẻo và khả năng chịu lỗi như các thành phần khác trong
mang
Một yêu cầu theo giao thức HTTP sẽ được gửi tới cho máy chủ được
uỷ quyền theo nhiều cách khác nhau Cách thông dụng nhất là sử dụng
switch L4 5witch này nhận các gói tin về địa chỉ IP sử dụng cổng 80 và
chuyển tiếp các gới tin này đến bộ đệm uỷ quyền Các yêu cầu thco giao thức
HFLP đời hỏi phải thiết lập một kết nỗi kiểu TCP vả gói tín đầu tiên phải là
gói tn đồng bộ (SYN packeD Swiich sẽ chuyển tiến gói tin này tới bộ đêm
uỷ quyền Bô đệm uỷ quyển hoạt đông như một máy chủ và trả về một gói tin phản hồi (SYN/ACK packet) kèm theo địa chỉ của máy chủ gốc Máy
Trang 29
trạm gửi yêu cầu ban dau sẽ nghĩ rằng các gói tin nhận được là đến từ máy
chủ gốc Bộ đệm uỷ quyên tiếp tục hoạt động như mô hình đã miêu tả ở trên Trong cơ chế sử dụng bộ đêm uỷ quyền ẩn, có một hoặc nhiều máy chủ được
uỷ quyền khác nằm giữa máy chủ gốc và máy chủ đang xử lý hiên tại Do
đó, các yêu cầu từ may chu uy quyén này tới máy chủ gốc có thể bị chăn và
xử lý bởi máy chủ uỷ quyền khác Cuỗi cùng, khi máy tram nhận được đối
tượng đã yêu cầu, nó không thể biết được máy chủ uỷ quyền, máy chủ gốc
hay bat ky một máy chủ uỷ quyền trung gian nảo đó đã xử lý yêu cầu bởi vi
phần thông tin về IP trong gói thông tin phản hồi luôn là địa chỉ IP của máy
chủ gốc
Máy chủ uỷ quyền không nhất thiết phải nằm trực tiếp trên được đi
giữa máy chủ gốc và máy trạm Switch có nhiệm vụ quản lý các bộ đệm và
định hướng lại các tuyến đường nồi tới máy chủ gốc (Origin Server) Switch
cũng có khả năng cân bằng tải, bằng cách phản phối các yêu cầu tới các máy
Trang 30Chuting 1: Giéi thigu chung vé WEB Caching
do đó số lượng đối tượng được lưu trữ cũng hạn chế Một bộ đệm uỷ quyền
đơn lẻ cân bằng tải và giảm nhu cầu chiếm giữ đường truyền cho các máy
trạm đo nó quản lý
Khi các bộ đệm được bồ trí theo phân cấp, một bộ đệm sẽ có mối quan
hệ ngang hàng với các bộ đệm ở các vùng lân cận (nhánh khác trong cây)
Có 2 kiểu quan hệ chính: cha-con và ngang hàng Bộ đệm cha về bản chất là
một bộ đệm thuộc cấp trên trong mô hình phân cấp Bộ đệm ngang hang là
Trang 31hi một bộ dệm không nắm giữ dễi tượng được yêu cầu, nó sẽ hỏi các
bộ đệm lần cận thông qua ICP xem có hay không có đối tượng này Lúc này
bô đệm đóng vai trỏ như một máy trạm gửi yêu cầu tới các bộ đêm lân cận
nó Nếu một trong các bộ đềm lân cận có đổi tượng [thông tin phân hồi “lân cận có”], nó sẽ lấy đối tượng về và lưu trữ cục Trong bệ nhớ cục bệ, và truyền dối tượng về cho máy trạm có yêu cầu ban dầu
Trong trường hợp không bộ đệm lân cận nào lưu trữ đối tượng [thông
tin phần hồi “lân cận không có” |, yêu cầu cúa máy trạm sẽ được chuyển liếp
tới bộ đệm cấp cha của nó hoặc chuyển trực tiếp tới máy chủ gốc Bộ đệm cấp cha của nó sẽ thực hiện tìm kiếm đối lượng theo cơ chế lương tự cho đến khi đối tượng dược trả về chơ nó vá trả về cho máy trạm có yêu cầu
Có sự khác nhau về bản chất giữa các bộ đệm khi tìm kiếm đối tượng Trong
quá trình thăm đỏ các bộ đêm lần cận, tất cả cá bộ dệm gửi yêu cầu đều có
thể nhận được thông tin phản hồi là “lân cận có”, trong khi đó chỉ những bộ
đệm cấp cha mới có thể nhận được thông tin phản hỗi là “lần cận không có”
1.2.2.5 M6 hinh web caching phan tin (Distributed Web caching)
‘M6 hinh bộ dêm phan cap nhu dã trinh bảy trong phần trên có một số
vấn dé sau:
> Mot yéu cầu được gửi đến tử một máy trạm có thé phải đi qua rất
nhiều bộ đệm trong mô hình dễ tìm kiếm được thông tin Thông tin tìm thấy
cũng phải đi qua nhiều chặng (theo chiều ngược lại) để trả về cho máy trạm
gửi yêu cầu
> Cơ chế tìm kiếm toàn bộ cây phân cấp gây nhiễu thời gian trễ thâm
chí không thể chấp nhận được
> Việc chia sẻ tài nguyên giữa các bộ đêm không hiệu qua
Trang 32
Chuting 1:
jidi thigu chung vé WEB Caching
Khắc phục những hạn chế trên, mô hình bộ đệm phân tán cho phép
phân bố các máy chủ uỷ quyền giữ khoảng cách với nhau một cách hợp lý về
mặt địa lý Các bộ đêm được tổ chức theo nhiều phân nhóm (cluster) và không theo mô hình phân cấp cụ thể nào
Hình 1.10 : Mô hình bộ đêm phân tán
Mô hình này được bố trí theo các thuật toán tối ưu hoá và có được
những ưu điểm sau
> Phan tán được vấn đề chịu tải cho server (chuyển về các bộ đệm uỷ
quyền), sử dụng các bộ đêm riêng cho việc tải thông tin lên máy chủ vả cho
phép tải thông tin không trực tuyến (offline)
> Lưu trữ các vết về vị trí, cho phép các máy chủ uỷ quyền định vị thông
tin gần nhất một cách nhanh chóng
> Sử dụng các bộ đêm trực tiếp để lưu trữ dữ liệu đang được trao đổi,
tránh được trễ thời gian trong lưu trữ và chuyển tiếp thông tin
Việc lưu trữ các thông tin gơi ý về vị trí (lưu vết) cho phép một máy chủ xác định được máy chủ gần nhất có lưu trữ thông tin cần thiết Nhờ
các thông tin gợi ý, các bộ đệm trong hệ thống có thể xác định được nhanh
Trang 33
chóng các bộ đêm không hoạt động, và có thể trao đổi trực tiếp với máy
chủ gic
Thương pháp nảy cỏn có ưu điểm là dự đoán các thông tin mả máy trạm có khả năng yêu cầu truy cập trong tương lai, và đẩy các thông tin nảy
về máy chủ uỷ quyển gần máy trạm nhất Điều này cho phép người dùng
khai thác thông tin một cách hiểu quả và nhanh chóng hơn
1.2.2.6 Tạo bản sao sử dụng ky thual da phat (multicast)
‘Lao ban sao sử dụng kỹ thuật Multicast để đây dữ liệu tới các máy chủ
gơ chẽ tạo bản sao
đữ phòng (Ja ban sao của máy chủ gốc) Về bản chất,
(replication) khdc véi cơ chế sử dụng bộ đệm (caching) là trong cơ chế tạo
bản sao, đử liệu được đẩy từ máy chủ gốc tới các máy chủ dự phòng khác
Thư vậy dữ liệu ở các máy chủ chính vả máy chủ dự phỏng lá giống nhau
Ngược lại, trong cơ chế sử dụng bộ đêm, khi có yêu cầu, các máy chủ uỷ
quyền truy cập và lấy dữ liệu từ máy chủ gốc để lưu vào hộ nhớ cục bộ của
mình IDữ liệu ở các máy chủ uỷ quyền là không hoàn toàn giống nhau
Kỹ thuật Multicast có thể (ng dung theo hưởng cần nâng cao tính hiệu
quả hay tính tin cậy Kỹ thuật UDP/IP Mulucast có hiểu quả cao nhất, tuy
nhiên cần phải ứng dụng thêm nhiều giao thức khác để dam bdo tinh tin cay
Các đối tượng chỉ có thể được lưu trữ tại các máy nhận khi nó đấm bảo còn nguyên vẹn Để kiểm tra tỉnh nguyên vẹn, có thể đùng thuật toán “kiểm tra
tổng” Nếu đổi tượng được xác nhận là còn nguyên vẹn thì lưu trữ, ngược lại
thì huỹ đối tượng Kỹ thuật nảy có t lệ lỗi cao, chỉ cần một gói tin bị lãi thì
toàn bộ đối tượng bị coi là lỗi không được chấp nhân
Để nâng cao lính tin cậy, giao thức ACK/NACK được áp dụng để phát hiện các gói tín lỗi và truyền lại gác gói tín này
Trang 34
Ghutong 4: Gidi thifu chung v6 WED Caching
> Chỉ hoạt động và lưu trữ đổi tượng đữ liệu khi có yêu cầu từ máy tram
> Giảm nhu cầu chiếm đường truyền do chỉ lấy và truyền đữ liệu khi
được yêu cầu
* Không đảm bảo dược tỉnh nhất quán về dữ liệu
> Co khả năng xảy ra các vấn để về tính tin cậy do được thiết lập tại các
điểm truy cập vào mạng TIệ thống bộ đệm bị hỏng có thể gây sập toàn bộ hệ
thống mạng
Các hệ thống lao ban sao
> Biết chính xác khi nào nội dung của đối tượng thay dỗi vá chuyển
ngay đổi tượng tới các máy chủ dự phòng 12o vậy, nội dung đối tượng luôn
nhất quan tai các nơi khác nhau
> Khả năng chịu lỗi và khôi phục dữ liệu cao do luôn có nhiều bắn sao
Các yêu cầu có thể dược chuyển tiếp cho may chủ khác nếu máy chủ gắc bị
hồng
> Cho phép cân bằng tải giữa các máy chủ
> Sử đụng nhiều đung lượng nhớ lưu trữ đữ liệu
> Đôi hỏi các thuật toán cần bằng Tải hiệu quả
> Chiếm nhiều đường truyền nếu không có các thuật toán multicast tin
Trang 35
1.3 QUAN HE GIA MAY TRAM VA MAY CHU DU LRU
Phan nay mé té mét sé thanh phan tham gia vào việc trao đối giữa các
máy trạm và máy chủ lưu trữ dữ liệu chỉnh Những thành phần này được sử
dụng vào việc xác định một máy chủ cung cấp đữ liệu tối ưu nhất
13.1 Định hướng jai dia chi URL (Uniform Resource Locator Redirection)
Một cơ chế đơn giản và thông dụng để kết nổi giữa máy chủ và máy
tram la str dung giao thức HTTP, mã phản hồi 307 để tái định hướng dia chi
tạm thời Sau đó kết nỗi này sẽ quyết định giữ nguyên kết nổi và cung cập địch vụ hoặc chuyển kết nối sang một máy chủ khác
Vẫn để bảo một:
Phụ thuộc hoàn toàn vào cơ chế bảo mật của giao thức IITTP
1.3.2 Định hướng lại tên miền (DNS redirection)
1Iệ thẳng DNS cưng cấp các chính sách kết nối giữa máy trạm và máy
chủ phức tạp và tin cậy hơn I2NS sắp xếp các yêu cầu dựa trên chất lượng
các dịch vụ Khi một máy trạm sử dụng tên máy chủ để truy cập, DNS sẽ xác
định địa chỉ ID của máy chú dự phòng hợp lý nhất để xử lý yêu cầu tử máy
trạm DNS cũng cung cắp khả năng cân bằng tải bằng cách phân tán các yêu
cầu tới oác máy chủ một cách hợp lý
Vẫn để bảo mật:
Phụ thuộc hoàn toàn vào cơ chế bảo mật của DNS
Tan Kesal -tấp: 0362003 - 2005 22
Trang 36Ghutong 4: Gidi thifu chung v6 WED Caching
1.3.3.Quan hệ giữa các máy chi (Replica to Replica Relationships)
1.3.3.1 ‘Lao ban sao theo 16 (Batch Drive Mirror Replication)
Trong cơ chế nảy, các máy chủ cần cập nhật đữ liệu sẽ khởi tạo một
kết nối tới máy chú chính Giao tiếp giữa máy chủ chính và các máy chủ dự
phòng được thục hiện theo hàng đợi Ngay khi kết nỗi được thiết lập, lô đữ liệu sẽ được sao chép sang máy chủ dự phòng
đề bảo một:
Thụ thuộc vào các chính sách bảo mật của các giao thức được sử dụng
để tết lập kết nỗi vả trao đổi dữ liệu ETP vả RDIST là các giáo thức
thường được áp dụng hơn
1.3.3.2.Tạo bản sao theo yêu cầu
(Demand Driven Mirror Replication)
Trong cơ chế này, các máy chủ dự phỏng sẽ có được đữ liệu cần thiết
khi có nhu cầu Khi máy trạm có yêu cầu truy xuất đữ liệu, máy chủ dự
phòng sẽ tìm kiếm trong đữ liệu cục bộ của nó Nếu không tìm thấy, nó sẽ thực hiện một kết nối tới máy chủ chính và lẫy đữ liệu về
Vấn đề bão mật:
Thụ thuộc và chính sách báo mật của các giao thức được sử dụng để
trao déi URL, FTP, GOPHER, HTCP, va ICP 1a cdc giao thức thường được
Trang 37có thể được thiết lận cho thực hiện theo khoảng thời gian xác dịnh Từ mức
độ cao như thực hiện đồng bộ theo từng phút, đến mức độ thấp hơn như
déng bé hang piở, hàng ngày,
Vấn đề bảo một:
Các giao thức được sử dụng đều ứng dụng các cơ chế bảo mật
Keberos, RSA
1.4 KẾT LUẬN
Công nghệ lưu giữ và cung câp nội dung Web tại nơi gần người truy
nhập số liệu Web là một trong những giải pháp công nghệ ở mức ứng dụng,
pếp phần lâm giảm thời gian truy nhập số liệu Wcb cho người ding cuỗi cùng, hạn chế và tránh tắc nghẽn lưu lượng số liệu trao đổi trên mạng
Ưu điểm của Wcb caching
* Giảm bớt bảng thông bởi việc giảm lưu lượng từ trỉnh duyệt
(browser) dén nội dung máy chủ
? Giảm bớt tải trên Web server khi có nhiễu yêu cầu gửi đến máy
chủ
3> Truyền Wch Objcct cho người sử dụng cuối củng nhanh hơn
> Giảm bớt băng thông và chỉ phí, nó có lợi ích cho người sử dụng,
người cưng cấp địch vụ và người sở hữu Wcb sitc
® ealability: bộ đệm mạng có hàng nghin I.ocal server đối với nhu cầu nội đung lớn
3 Tăng cường chất lượng dịch vụ khi nội dung đườc chuyển dến
băng thông cao hơn
Tan Kesal -tấp: 0362003 - 2005 24
Trang 38Ghutoug 2: So sdnh phan tich ede md hink kiki trite bệ
CHUONG 2
SANH PHAN TICH CAC MO HINH KIEN TRUC HE
TITONG WEB CACTIING
2.1 GIỚI THIỆU CÁC KIỂN TRÚC CACHE
2.1.1 Kiến trúc cache phân tầng — bierarchical cache
Tiểu năng của các cache proxy phụ thuộc vảo số lượng client kết nối dến nó, cảng có nhiều thuê bao sử dụng cache proxy thì xác suất để một
trang Web đã từng dược truy nhập trước đó, dược lưu trong cache proxy
cảng cao Các hệ thẳng cache proxy dược cộng tác với nhau dễ tăng tỷ lệ hít
Một trong những kiến trúc kết hợp các hệ thống cache với nhau là kiến trúc phần ting Trong kién tric cache phân tầng, các hệ thống cache đặt ở nhiều tầng khác nhau của mạng Hệ thông cache phân tầng làm việc như sau Tại cấp cuối cùng (đáy-bottom) trong kiển trúc phân tầng là các hệ thông cache client/browser (tỉnh năng cache nằm ngảy trong trình duyệt của người
sử dụng ) Nếu một yêu cầu không có trong cache của trình duyêt, yêu cầu nảy sẽ được chuyển đến cấp khu vực (nstitutional cache} Nếu nôi dung nay
vẫn không có trong ting cache khu vue, yêu cầu về nội dung dó sẽ tiếp tục được chuyển tiếp đến hệ thống cache ở cấp ving (regional cache) va dén lượt mình, hệ thống cache ving sẽ tiếp tục gửi các yêu cầu chưa được đáp ứng dến hệ théng cache ở cấp quốc gia (national cache) Kéu ndi dung nay không được tìm thấy trong cachc của hệ thống cache cfp quéc gia, hé thing
Trang 39
này sẽ kết nối trực tiếp với máy chủ chứa nội dung yêu cầu Khi nội dung
yêu uầu được tìm thấy tại một cắp cache nảo đó hoặc
tại máy chủ, nó sẽ dược gửi trá lại cho thuê bao đó tho cấu trúc phân tầng vả một bản sao của
nội dung này số được lưu lại lạ mỗi vấp trung gian mã nó đi qua Các yêu
chu cing một nội dung sé duoc chuyển tiếp lên cáo cắp cache khác nhau cho
đến khi nó được tim thấy Lại một cấp độ cache nào đó Kiến trúc phân tầng
khá phổ biến, phần lớn các nhà cung cấp dịch vụ Internet (SP) vả các doanh nghiệp đã triển khai hệ thống cache theo kiến trúc này để giảm băng thông trên mạng trục và giâm độ trễ hay tăng thời gian đáp ứng cho thuê bao, Trong một cầu trúc như vậy, các trang web thông dụng có thể được lưu trữ phân tán tuỷ theo nhu câu truy cập các trang web đó Tuy nhiên, vẫn còn tin tại một số vấn đề liên quan đến mô hình cache phân tầng:
> Để thiết lập một mô hình phân tầng như vậy, các may chi cache cin
dược dặt tại các điểm truy nhập chỉnh trong mạng Điều này thường đỏi hỏi
có nhiều sự phối hợp giữa các máy chủ cache tham gia vào hệ thẳng cache
> Mỗi cập trong mô hình phân ting sẽ tạo nên thêm một thời gian trễ
> Các hệ thống cache cấp cao có thể trở thành điểm nghẽn cổ chai
Trang 40Hinh 2.1 : Kiên trúc phân tầng của Web Caching
2.1.2 Kiến trúc cache phân tán (Distributed cache)
Gan đây, nhiều nhà nghiên cứu đã đề xuất việc thiết lập một phương thức cache phân tán hoản toàn, trong đó chỉ tôn tại các hệ thông cache ở một
cấp Trong các hệ thông cache phân tán không có các hệ thống cache trung
gian ngoại trừ hệ thống cache ở cấp vùng Trong hệ thống cache này các máy
chủ cache sẽ phục vụ các yêu cầu từ các máy chủ cache khác trong cùng một
hệ thống Để xác định xem cần phải lấy nội dung từ máy chủ cache nào, tất
cả các máy chủ này đều lưu trữ các thông tin meta-data để quy chiều đến các nội dung chứa trong các máy chủ cache khác Để tăng hiệu quả và mở rộng, khả năng phân tán các thông tin meta-data giữa các máy chủ, người ta sử
dụng cơ chế phân tán có tính phân cấp Tuy nhiên mô hình phân cấp chỉ sử
dụng để phân tán các thông tin danh bạ về vị trí của các nội dung chứ không