Chức năng đặc trưng của CDN Dịch vụ định hướng yêu cầu và nội dung Dịch vụ phân phối và thuê ngoài dành cho nội dung Dịch vụ thương lượng nội dung Dịch vụ quản lý Các chức năng đặc t
Trang 1PHÂN LOẠI VÀ KHẢO SÁT VỀ MẠNG PHÂN
PHỐI NỘI DUNG
Giảng viên hướng dẫn: PGS TS Nguyễn Tiến Ban
Trang 3Chương I: Tổng quan
về mạng phân phối nội
dung
Chương II:Cơ chế quản lý và phân phối nội dung
Chương III: Khảo sát các CDN hiện có
Trang 41.1 Khái niệm cơ bản về CDN
1.2 Các thuộc tính đặc trưng
1.3 Các hệ thống tương đồng với CDN
Trang 5Chương I: Tổng quan về mạng phân phối nội dung
1.1 Khái niệm cơ bản về CDN
Khái niệm: CDN là một tập các thành phần mạng được sắp xếp nhằm vận chuyển nội dung
tới người dùng một cách hiệu quả Việc hợp tác giữa các thành phần CDN phân phối có thể diễn ra thông qua các nút mạng trong cả môi trường đồng nhất và không đồng nhất
Chức năng đặc trưng của CDN
Dịch vụ định hướng yêu cầu
và nội dung
Dịch vụ phân phối và thuê ngoài dành cho nội dung
Dịch vụ thương lượng nội dung
Dịch vụ quản lý
Các chức năng đặc trưng:
Trang 61.2 Các thuộc tính đặc trưng
Kiến trúc hạ tầng mạng CDN
1.2.1 Kiến trúc hạ tầng phân phối nội dung/dịch vụ trong CDN
Các dịch vụ và ứng dụng của CDN
Trang 7Chương I: Tổng quan về mạng phân phối nội dung
1.2 Các thuộc tính đặc trưng
Các nhà cung cấp CDN tính phí khách hàng của họ theo nội dung được vận chuyển
tới cho người dùng bởi các máy chủ thay thế
Giá cước trung bình của các dịch vụ CDN khá cao.
Các nhân tố ảnh hưởng nhất tới giá thành của CDN bao gồm:
1.2.1 Kiến trúc hạ tầng phân phối nội dung/dịch vụ trong CDN
Giá băng thông.
Sự thay đổi trong phân phối lưu lượng truy cập.
Kích thước nội dung được sao chép trên các máy chủ thay thế.
Số lượng máy chủ thay thế.
Tính tin cậy và khả năng mở rộng của toàn hệ thống; vấn đề bảo mật trong việc
cung cấp nội dung thuê ngoài
Trang 81.2 Các thuộc tính đặc trưng
CDN về cơ bản là nhằm vào các nhà cung cấp nội dung hoặc khách hàng muốn đảm
bảo QoS cho người dùng cuối khi truy cập nội dung Web của họ
Các mục tiêu kinh doanh hướng tới:
Khả năng mở rộng (scalability)
Bảo mật (security)
Độ tin cậy, Khả năng đáp ứng và Hiệu suất
1.2.2 Các tiêu chí đặc trưng của CDN
Trang 9Chương I: Tổng quan về mạng phân phối nội dung
1.3 Các hệ thống tương đồng với CDN
Data grids (lưới dữ liệu)
KN: là một môi trường tính toán sử dụng nhiều dữ liệu nhằm cung cấp dịch vụ cho
người dùng ở các vị trí khác nhau để khám phá, truyền và thao tác trên các tập dữ liệu lớn được lưu trữ trong các kho lưu trữ phân tán
Chức năng cơ bản: cơ chế truyền dữ liệu hiệu suất cao, đáng tin cậy và cơ chế quản
lý & khám phá bản sao có thể mở rộng
Mục tiêu chung của lưới dữ liệu là tập hợp các tài nguyên phân tán hiện có lại với
nhau để đạt được hiệu suất thông qua phân phối dữ liệu
Lưới dữ liệu được tạo bởi các tổ chức cùng nhau chia sẻ tài nguyên về các mục tiêu
chung bằng cách thành lập Tổ chức ảo (VO)
Peer-to-peer networks (mạng ngang hàng)
KN: là mạng được thiết kế để chia sẻ trực tiếp tài nguyên máy tính thay vì yêu cầu
bất kỳ cơ quan trung gian hoặc cơ quan trung tâm nào
Trong một hệ thống ngang hàng, mỗi peer là tự trị và dựa vào những peer khác về tài
nguyên, thông tin và các yêu cầu chuyển tiếp
Hệ thống ngang hàng có khả năng chịu lỗi và khả năng mở rộng cao hơn hệ thống
tập trung thông thường
Một thực thể trong mạng P2P có thể tham gia hoặc rời khỏi bất cứ lúc nào
Mạng P2P phù hợp hơn với các nhà cung cấp nội dung riêng lẻ, chi phí thấp (VD
như BitTorrent)
Distributed databases (Cơ sở dữ liệu phân tán)
KN: là cơ sở dữ liệu được hình thành bằng cách tách một cơ sở dữ liệu duy nhất
hoặc liên kết nhiều cơ sở dữ liệu hiện có
Cơ sở dữ liệu phân tán (DDB) phát triển để phục vụ:
o Nhu cầu của các tổ chức lớn cần thay thế các hệ thống cơ sở dữ liệu tập trung hiện
có
o Kết nối các cơ sở dữ liệu hiện có.
o Thêm cơ sở dữ liệu mới khi các đơn vị tổ chức mới được thêm vào.
Trang 102.1 Thành phần của CDN
2.2 Phân phối và quản lý nội dung
2.3 Định tuyến theo yêu cầu
2.4 Đo lường hiệu năng
Trang 112.1 Thành phần của CDN
Chương II: Cơ chế quản lý và phân phối nội dung
Thành phần của CDN
Tổ chức CDN Theo lớp phủ Theo mạng Các loại máy chủ Máy chủ gốc Máy chủ thay thế Các mối quan hệ Máy khách-máy chủ thay thế -máy chủ gốc Thành phần trong mạng-proxy lưu đệm
Giữa các proxy Các mảng proxy lưu đệm Các lưới proxy lưu đệm Các giao thức tương tác Giữa các phần tử mạng Giữa các bộ nhớ đệm Các loại nội dung và dịch vụ
Nội dung tĩnh Media trực tuyến Các dịch vụ
Trang 122.1 Thành phần của CDN
2.1.1 Tổ chức CDN
Theo lớp phủ :
Các máy chủ dành riêng cho ứng dụng và lưu đệm ở một số vị trí trong mạng
xử lý việc phân phối các loại nội dung cụ thể (như nội dung Web, đa phương tiện trực tuyến và video thời gian thực)
Theo mạng :
Bộ định tuyến và bộ chuyển mạch được trang bị mã để xác định các loại ứng dụng cụ thể và để chuyển tiếp các yêu cầu dựa trên các chính sách được xác định trước
Trang 13Chương II: Cơ chế quản lý và phân phối nội dung
2.1 Thành phần của CDN
2.1.2 Các loại máy chủ
Máy chủ gốc (Origin server)
Chứa phiên bản cuối cùng của tài nguyên
Được cập nhật bởi nhà cung cấp nội dung.
Máy chủ bản sao (Replica server)
Giữ một bản sao của tài nguyên
Hoạt động như một máy chủ đa phương tiện, máy chủ web hoặc như một
máy chủ bộ đệm
Trang 142.1 Thành phần của CDN
2.1.3 Các mối quan hệ
Các loại máy chủ
Trang 15Chương II: Cơ chế quản lý và phân phối nội dung
2.1 Thành phần của CDN
2.1.4 Các giao thức tương tác
Các giao thức tương tác Tương tác phần tử mạng
NECP (Network Element Control Protocol) WCCP (Web Cache Coordination Protocol)
SOCKS
Tương tác giữa các bộ nhớ đệm
CARP (Cache Array Routing Protocol)
ICP (Internet Cache Protocol)
HTCP (Hypertext Caching Protocol)
Trang 162.1 Thành phần của CDN
2.1.5 Các loại nội dung / dịch vụ
Nội dung tĩnh (static content)
Gồm các trang HTML tĩnh, hình ảnh, tài liệu, bản vá phần mềm, tệp âm thanh hoặc video.
Được lưu vào bộ nhớ đệm dễ dàng.
Duy trì độ mới bằng công nghệ lưu đệm truyền thống.
Phương tiện truyền thông trực tuyến (Streaming media)
sử dụng cho các sự kiện trực tiếp như thể thao, buổi hòa nhạc
Nội dung được phân phối “ngay lập tức” từ bộ mã hóa đến máy chủ media, sau đó được
truyền tới thẳng máy khách có hỗ trợ media
Trường hợp phân phối theo yêu cầu, nội dung được mã hóa rồi được lưu trữ dưới dạng
tệp media trực tuyến bên trong máy chủ
Dịch vụ (Services)
CDN cung cấp tài nguyên của mình để sử dụng như một kênh phân phối dịch vụ (dịch vụ
thư mục, lưu trữ Web, truyền tệp và thương mại điện tử)
Trang 17Chương II: Cơ chế quản lý và phân phối nội dung
2.2 Phân phối và quản lý nội dung
Phân phối và quản lý nội dung
Thuê ngoài nội dung
Push-hợ
p tác
Pull- khôn
g hợ
p tác
Pull- hợ
p tác
Tổ chức bộ nhớ đệmCác
kỹ thuật lưu đệm
Cập nhật
bộ nhớ đệm
Trang 182.2.1 Bố trí máy chủ thay thế (surrogate placement)
2.2 Phân phối và quản lý nội dung
Single-ISP
Có khoảng 40 server thay thế xung quanh vùng mạng biên và các server đại diện có bộ nhớ đệm lớn Do đó, một ISP có thể có phạm vi phủ sóng rộng lớn mà không cần phụ thuộc vào các ISP khác Các server có thể được đặt ở một nơi xa so với các máy khách của nhà cung cấp CDN Phù hợp các trang web có lưu lượng truy cập từ thấp đến trung bình
Multi-ISP
Càng nhiều server của ISP càng tốt, khắc phục hạn chế của single-ISP và máy chủ đại diện được đặt gần người dùng, do đó nội dung được phân phối đáng tin cậy và kịp thời tới người dùng Chênh lệch số lượng yêu cầu nội dung được gửi tới tại các máy chủ đại diện, dẫn đến tài nguyên nhàn rỗi gia tăng và hiệu suất CDN kém Phù hợp các trang web có lưu lượng truy cập cao
Trang 192.2.2 Lựa chọn và phân phối nội dung (Content selection and delivery)
Chương II: Cơ chế quản lý và phân phối nội dung
2.2 Phân phối và quản lý nội dung
Lựa chọn và phân phối nội dungToàn phần
Sao chép toàn bộ nội dung
Từng phầnDựa
trên kinh nghiệm
Dựa trên mức
độ phổ biến
Dựa trên đối tượng
Dựa trên cụm
Dự
a trê
n phiê
n củ
a ngườ
i dùng
Dự
a trê
n đườn
g dẫ
n URL
Trang 20 Push-hợp tác:
Cách tiếp cận này dựa trên việc tìm nạp trước nội dung cho người đại diện Nội dung
được đẩy đến các máy chủ thay thế từ nguồn gốc và các máy chủ thay thế hợp tác để
giảm chi phí sao chép và cập nhật
Hạn chế: vẫn được coi là một cách tiếp cận lý thuyết vì nó chưa được sử dụng bởi bất
kỳ nhà cung cấp CDN nào
Pull-không hợp tác
các yêu cầu của khách hàng được chuyển hướng (sử dụng chuyển hướng DNS hoặc
ghi đè lên URL trước đó) đến các máy chủ đại diện gần nhất của chúng
Hạn chế: một máy chủ tối ưu không phải lúc nào cũng được chọn để phục vụ yêu cầu
nội dung
Pull-hợp tác:
các máy chủ đại diện hợp tác với nhau để lấy nội dung được yêu cầu trong trường hợp
nội dung không được tìm thấy ở một trong tập các máy chủ (cache miss).
2.2.3 Thuê ngoài nội dung (content outsourcing)
2.2 Phân phối và quản lý nội dung
Trang 212.3 Định tuyến yêu cầu
Khái niệm: Cơ chế định tuyến yêu cầu là quá trình định tuyến các yêu cầu của khách hàng
đến một máy chủ đại diện thích hợp để phân phối nội dung Một hệ thống định tuyến yêu cầu chịu trách nhiệm hướng yêu cầu của máy khách tới máy chủ đại diện gần nhất.
→ Do đó, hệ thống định tuyến theo yêu cầu sử dụng một tập hợp các số liệu như:
o Mức độ gần mạng
o Độ trễ nhận thấy của khách hàng
o Khoảng cách và tải của máy chủ bản sao
Chương II: Cơ chế quản lý và phân phối nội dung
Trang 222.3 Định tuyến yêu cầu
2.3.1 Các thuật toán định tuyến theo yêu cầu
Thuật toán định tuyến theo yêu cầu không thích ứng : là thuật toán dựa trên những dự đoán về
tải lượng trên máy chủ bản sao để đưa ra quyết định định tuyến
Các thuật toán định tuyến theo yêu cầu thích ứng: là thuật toán dựa trên các thông số được cập
nhật định kỳ như: khoảng cách, độ trễ của máy chủ - máy khách, tải của máy chủ bản sao hoặc băng thông hiện có sẵn cho một máy chủ bản sao
Trang 232.3 Định tuyến yêu cầu
2.3.2 Cơ chế định tuyến yêu cầu
Các cơ chế định tuyến yêu cầuCân
Chuyển hướng HTTP
Ghi đè URL hoặc siêu liên kết Điều hướng
Anycasti
Chương II: Cơ chế quản lý và phân phối nội dung
Trang 242.3 Định tuyến yêu cầu
2.3.2 Cơ chế định tuyến yêu cầu
a) Cân bằng tải toàn cầu GSLB
Khái niệm: GSLB là một cơ chế sử dụng các nút dịch vụ bao gồm một bộ chuyển mạch và một số
máy chủ đại diện được đặt ở một số điểm vòng quanh thế giới nhằm điều phối, cân bằng tải lượng truy cập ở các máy chủ trên toàn cầu
GSLB hỗ trợ hai khả năng chính: nhận thức toàn cầu và DNS có thẩm quyền thông minh.
Nhận thức toàn cầu DNS có thẩm quyền thông minhMỗi nút dịch vụ biết về tình trạng và
thông tin hiệu suất của các máy chủ
Web được gắn trực tiếp vào nó thông
qua chuyển mạch Web
Khả năng chọn ra máy chủ đại diện tốt nhất cho bất kỳ yêu cầu nào
Ưu điểm:
Các nút dịch vụ nhận thức lẫn nhau, tạo điều kiện tối ưu hóa quá trình tìm kiếm máy chủ yêu cầu.
Quản trị viên mạng có thể thêm khả năng GSLB vào mạng mà không cần thêm bất kỳ thiết bị mạng
bổ sung nào
Nhược điểm: cấu hình thủ công để kích hoạt khả năng này.
Trang 252.3 Định tuyến yêu cầu
2.3.2 Cơ chế định tuyến yêu cầu
b) Định tuyến yêu cầu dựa trên DNS
Khái niệm: Đây là một cơ chế thực hiện ánh xạ giữa tên miền tượng trưng của máy chủ thay thế và
địa chỉ IP số của nó trong một miền DNS
Trong cơ chế này, một tên miền có nhiều địa chỉ IP liên kết với nó, khi có yêu cầu nội dung của
người dùng cuối, máy chủ DNS của nhà cung cấp dịch vụ trả về địa chỉ IP của các máy chủ chứa bản sao của đối tượng được yêu cầu
Để quyết định, trình phân giải của DNS thực hiện:
Gửi các thăm dò tới các máy chủ và chọn dựa trên thời gian phản hồi với mỗi thăm dò này.
Thu thập thông tin lịch sử từ khách hàng dựa trên lần truy cập trước đó vào các máy chủ này.
Ưu điểm:
Tính đơn giản và độc lập với bất kỳ dịch vụ sao chép nào.
Được sử dụng phổ biến như một dịch vụ thư mục, phục vụ cho quá trình định tuyến.
Nhược điểm:
Tăng độ trễ mạng, giảm hiệu suất tìm thấy máy chủ thay thế tốt nhất của hệ thống.
Không thể mở rộng và bị hạn chế về quyền kiểm soát đối với việc nhận dạng máy khách.
Chương II: Cơ chế quản lý và phân phối nội dung
Trang 262.3 Định tuyến yêu cầu
2.3.2 Cơ chế định tuyến yêu cầu
c) Chuyển hướng HTTP
Khái niệm: Đây là cơ chế lan truyền thông tin về các tập máy chủ bản sao được đóng gói trong các
tiêu đề HTTP
Giao thức HTTP cho phép máy chủ Web phản hồi yêu cầu của máy khách bằng một thông báo đặc
biệt yêu cầu máy khách gửi lại yêu cầu của họ đến một máy chủ khác
Cơ chế này sử dụng một máy chủ Web đặc biệt, nó nhận tất cả các yêu cầu của người dùng trong
cụm, lựa chọn máy chủ bản sao thích hợp và chuyển yêu cầu tới các máy chủ này
Nó cần được cập nhật thường xuyên các thay đổi của các máy chủ đại diện và máy khách để xử lý
các tiêu đề bổ sung
Ưu điểm:
Tính linh hoạt, đơn giản
Quản lý tốt việc nhân rộng nội dung
Nhược điểm
Thiếu tính minh bạch
Chi phí tăng cao do các phiên khứ hồi bản tin
Trang 272.3 Định tuyến yêu cầu
2.3.2 Cơ chế định tuyến yêu cầu
d) Ghi đè URL hoặc siêu liên kết Điều hướng (URL rewriting or Navigation hyperlink)
Khái niệm: đây là một cơ chế lựa chọn và phân phối nội dung một phần trang Web và nơi các đối
tượng nhúng được gửi tới như một phản hồi cho các yêu cầu của khách Trong đó, máy chủ gốc chuyển hướng các máy khách tới các máy chủ thay thế khác nhau bằng cách viết lại các liên kết URL của các trang được tạo động
Việc ghi đè URL có thể thực hiện chủ động hoặc theo phản ứng:
Đối với ghi đè chủ động, các URL cho các đối tượng được nhúng của trang HTML chính được xây
dựng trước khi nội dung được tải trong máy chủ gốc
Trong cách tiếp cận phản ứng thì liên quan đến việc ghi đè các URL được nhúng của trang HTML
khi yêu cầu của khách hàng chạm tới máy chủ gốc
Ưu điểm:
Các máy khách không bị ràng buộc với một máy chủ đại diện duy nhất.
Đạt được mức độ chi tiết mạng tốt hơn.
Nhược điểm: độ trễ phân tích cú pháp URL và nút thắt mạng (bottleneck) có thể xảy ra.
Chương II: Cơ chế quản lý và phân phối nội dung
Trang 282.3 Định tuyến yêu cầu
2.3.2 Cơ chế định tuyến yêu cầu
e) Anycasting
Khái niệm: đây là một cơ chế nhân rộng các máy chủ trên toàn mạng thông quá các nền tảng không
đồng nhất Về cơ bản, nó được chia làm 2 loại: IP anycasting và Application-level anycasting:
IP anycasting: các bộ định tuyến IP khác nhau có đường dẫn đến các máy chủ khác nhau nhưng lại
có cùng địa chỉ IP
Application-level anycasting: bao gồm một tập các trình phân giải anycast, thực hiện ánh xạ tên
miền anycast (anycast domain names) thành địa chỉ IP
Loại Anycasting IP anycasting Application-level anycasting
Ưu điểm Phù hợp với định tuyến yêu
cầu và chọn lựa vị trí thiết lậpdịch vụ
Có thể đạt được tính linh hoạt tốt hơn
Nhược điểm Một phần không gian địa chỉ
IP được cấp phát cho địa chỉ anycast
Chi phí gia tăng do cần
có sự thay đổi củamáy chủ và máy khách
Trang 292.3 Định tuyến yêu cầu
2.3.2 Cơ chế định tuyến yêu cầu
f) CDN peering
Khái niệm: đây là cơ chế được hình thành bởi các kết nối đối xứng giữa các máy tính chủ (host
computers) tạo thành các CDN ngang hàng để cung cấp nội dung thay cho nhau
Cách thức hoạt động:
Cách thức hoạt động
Mô hình thư mục tập trung Bảng băm phân tán (DHT) cầu tràn ngập Mô hình yêu Mô hình định
tuyến tài liệu
Chương II: Cơ chế quản lý và phân phối nội dung
Trang 302.4 Đo lường hiệu suất
Khái niệm: Đo lường hiệu suất của một CDN được thực hiện để đo lường khả năng phục vụ khách
hàng với nội dung hoặc dịch vụ mong muốn Đo lường hiệu suất cung cấp khả năng dự đoán, giám sát và đảm bảo hiệu suất đầu cuối của một CDN
Phân loại:
Đo lường hiệu suất
Phép đo nội bộ Thu thập
và phân tích nhật
ký từ các
bộ nhớ đệm và máy chủ truyền thông trực tuyến
Triển khai các đầu dò trên toàn mạng
Sử dụng một số công cụ bên thứ ba
Phép đo ngoài
Được thực hiện bởi bên thứ ba