1. Trang chủ
  2. » Tất cả

Phân loại và khảo sát về mạng phân phối nội dung

39 2 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Phân loại và khảo sát về mạng phân phối nội dung
Người hướng dẫn PGS. TS. Nguyễn Tiến Ban
Thể loại Luận văn
Định dạng
Số trang 39
Dung lượng 11,51 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Chức năng đặc trưng của CDN Dịch vụ định hướng yêu cầu và nội dung Dịch vụ phân phối và thuê ngoài dành cho nội dung Dịch vụ thương lượng nội dung Dịch vụ quản lý  Các chức năng đặc t

Trang 1

PHÂN LOẠI VÀ KHẢO SÁT VỀ MẠNG PHÂN

PHỐI NỘI DUNG

Giảng viên hướng dẫn: PGS TS Nguyễn Tiến Ban

Trang 3

Chương I: Tổng quan

về mạng phân phối nội

dung

Chương II:Cơ chế quản lý và phân phối nội dung

Chương III: Khảo sát các CDN hiện có

Trang 4

1.1 Khái niệm cơ bản về CDN

1.2 Các thuộc tính đặc trưng

1.3 Các hệ thống tương đồng với CDN

Trang 5

Chương I: Tổng quan về mạng phân phối nội dung

1.1 Khái niệm cơ bản về CDN

Khái niệm: CDN là một tập các thành phần mạng được sắp xếp nhằm vận chuyển nội dung

tới người dùng một cách hiệu quả Việc hợp tác giữa các thành phần CDN phân phối có thể diễn ra thông qua các nút mạng trong cả môi trường đồng nhất và không đồng nhất

Chức năng đặc trưng của CDN

Dịch vụ định hướng yêu cầu

và nội dung

Dịch vụ phân phối và thuê ngoài dành cho nội dung

Dịch vụ thương lượng nội dung

Dịch vụ quản lý

 Các chức năng đặc trưng:

Trang 6

1.2 Các thuộc tính đặc trưng

Kiến trúc hạ tầng mạng CDN

1.2.1 Kiến trúc hạ tầng phân phối nội dung/dịch vụ trong CDN

Các dịch vụ và ứng dụng của CDN

Trang 7

Chương I: Tổng quan về mạng phân phối nội dung

1.2 Các thuộc tính đặc trưng

 Các nhà cung cấp CDN tính phí khách hàng của họ theo nội dung được vận chuyển

tới cho người dùng bởi các máy chủ thay thế

 Giá cước trung bình của các dịch vụ CDN khá cao.

 Các nhân tố ảnh hưởng nhất tới giá thành của CDN bao gồm:

1.2.1 Kiến trúc hạ tầng phân phối nội dung/dịch vụ trong CDN

 Giá băng thông.

 Sự thay đổi trong phân phối lưu lượng truy cập.

 Kích thước nội dung được sao chép trên các máy chủ thay thế.

 Số lượng máy chủ thay thế.

 Tính tin cậy và khả năng mở rộng của toàn hệ thống; vấn đề bảo mật trong việc

cung cấp nội dung thuê ngoài

Trang 8

1.2 Các thuộc tính đặc trưng

 CDN về cơ bản là nhằm vào các nhà cung cấp nội dung hoặc khách hàng muốn đảm

bảo QoS cho người dùng cuối khi truy cập nội dung Web của họ

 Các mục tiêu kinh doanh hướng tới:

 Khả năng mở rộng (scalability)

 Bảo mật (security)

 Độ tin cậy, Khả năng đáp ứng và Hiệu suất

1.2.2 Các tiêu chí đặc trưng của CDN

Trang 9

Chương I: Tổng quan về mạng phân phối nội dung

1.3 Các hệ thống tương đồng với CDN

 Data grids (lưới dữ liệu)

 KN: là một môi trường tính toán sử dụng nhiều dữ liệu nhằm cung cấp dịch vụ cho

người dùng ở các vị trí khác nhau để khám phá, truyền và thao tác trên các tập dữ liệu lớn được lưu trữ trong các kho lưu trữ phân tán

 Chức năng cơ bản: cơ chế truyền dữ liệu hiệu suất cao, đáng tin cậy và cơ chế quản

lý & khám phá bản sao có thể mở rộng

 Mục tiêu chung của lưới dữ liệu là tập hợp các tài nguyên phân tán hiện có lại với

nhau để đạt được hiệu suất thông qua phân phối dữ liệu

 Lưới dữ liệu được tạo bởi các tổ chức cùng nhau chia sẻ tài nguyên về các mục tiêu

chung bằng cách thành lập Tổ chức ảo (VO)

 Peer-to-peer networks (mạng ngang hàng)

 KN: là mạng được thiết kế để chia sẻ trực tiếp tài nguyên máy tính thay vì yêu cầu

bất kỳ cơ quan trung gian hoặc cơ quan trung tâm nào

 Trong một hệ thống ngang hàng, mỗi peer là tự trị và dựa vào những peer khác về tài

nguyên, thông tin và các yêu cầu chuyển tiếp

 Hệ thống ngang hàng có khả năng chịu lỗi và khả năng mở rộng cao hơn hệ thống

tập trung thông thường

 Một thực thể trong mạng P2P có thể tham gia hoặc rời khỏi bất cứ lúc nào

 Mạng P2P phù hợp hơn với các nhà cung cấp nội dung riêng lẻ, chi phí thấp (VD

như BitTorrent)

 Distributed databases (Cơ sở dữ liệu phân tán)

 KN: là cơ sở dữ liệu được hình thành bằng cách tách một cơ sở dữ liệu duy nhất

hoặc liên kết nhiều cơ sở dữ liệu hiện có

 Cơ sở dữ liệu phân tán (DDB) phát triển để phục vụ:

o Nhu cầu của các tổ chức lớn cần thay thế các hệ thống cơ sở dữ liệu tập trung hiện

o Kết nối các cơ sở dữ liệu hiện có.

o Thêm cơ sở dữ liệu mới khi các đơn vị tổ chức mới được thêm vào.

Trang 10

2.1 Thành phần của CDN

2.2 Phân phối và quản lý nội dung

2.3 Định tuyến theo yêu cầu

2.4 Đo lường hiệu năng

Trang 11

2.1 Thành phần của CDN

Chương II: Cơ chế quản lý và phân phối nội dung

Thành phần của CDN

Tổ chức CDN Theo lớp phủ Theo mạng Các loại máy chủ Máy chủ gốc Máy chủ thay thế Các mối quan hệ Máy khách-máy chủ thay thế -máy chủ gốc Thành phần trong mạng-proxy lưu đệm

Giữa các proxy Các mảng proxy lưu đệm Các lưới proxy lưu đệm Các giao thức tương tác Giữa các phần tử mạng Giữa các bộ nhớ đệm Các loại nội dung và dịch vụ

Nội dung tĩnh Media trực tuyến Các dịch vụ

Trang 12

2.1 Thành phần của CDN

2.1.1 Tổ chức CDN

 Theo lớp phủ :

Các máy chủ dành riêng cho ứng dụng và lưu đệm ở một số vị trí trong mạng

xử lý việc phân phối các loại nội dung cụ thể (như nội dung Web, đa phương tiện trực tuyến và video thời gian thực)

 Theo mạng :

Bộ định tuyến và bộ chuyển mạch được trang bị mã để xác định các loại ứng dụng cụ thể và để chuyển tiếp các yêu cầu dựa trên các chính sách được xác định trước

Trang 13

Chương II: Cơ chế quản lý và phân phối nội dung

2.1 Thành phần của CDN

2.1.2 Các loại máy chủ

Máy chủ gốc (Origin server)

 Chứa phiên bản cuối cùng của tài nguyên

 Được cập nhật bởi nhà cung cấp nội dung.

Máy chủ bản sao (Replica server)

 Giữ một bản sao của tài nguyên

 Hoạt động như một máy chủ đa phương tiện, máy chủ web hoặc như một

máy chủ bộ đệm

Trang 14

2.1 Thành phần của CDN

2.1.3 Các mối quan hệ

Các loại máy chủ

Trang 15

Chương II: Cơ chế quản lý và phân phối nội dung

2.1 Thành phần của CDN

2.1.4 Các giao thức tương tác

Các giao thức tương tác Tương tác phần tử mạng

NECP (Network Element Control Protocol) WCCP (Web Cache Coordination Protocol)

SOCKS

Tương tác giữa các bộ nhớ đệm

CARP (Cache Array Routing Protocol)

ICP (Internet Cache Protocol)

HTCP (Hypertext Caching Protocol)

Trang 16

2.1 Thành phần của CDN

2.1.5 Các loại nội dung / dịch vụ

Nội dung tĩnh (static content)

 Gồm các trang HTML tĩnh, hình ảnh, tài liệu, bản vá phần mềm, tệp âm thanh hoặc video.

 Được lưu vào bộ nhớ đệm dễ dàng.

 Duy trì độ mới bằng công nghệ lưu đệm truyền thống.

Phương tiện truyền thông trực tuyến (Streaming media)

 sử dụng cho các sự kiện trực tiếp như thể thao, buổi hòa nhạc

 Nội dung được phân phối “ngay lập tức” từ bộ mã hóa đến máy chủ media, sau đó được

truyền tới thẳng máy khách có hỗ trợ media

 Trường hợp phân phối theo yêu cầu, nội dung được mã hóa rồi được lưu trữ dưới dạng

tệp media trực tuyến bên trong máy chủ

Dịch vụ (Services)

 CDN cung cấp tài nguyên của mình để sử dụng như một kênh phân phối dịch vụ (dịch vụ

thư mục, lưu trữ Web, truyền tệp và thương mại điện tử)

Trang 17

Chương II: Cơ chế quản lý và phân phối nội dung

2.2 Phân phối và quản lý nội dung

Phân phối và quản lý nội dung

Thuê ngoài nội dung

Push-hợ

p tác

Pull- khôn

g hợ

p tác

Pull- hợ

p tác

Tổ chức bộ nhớ đệmCác

kỹ thuật lưu đệm

Cập nhật

bộ nhớ đệm

Trang 18

2.2.1 Bố trí máy chủ thay thế (surrogate placement)

2.2 Phân phối và quản lý nội dung

 Single-ISP

Có khoảng 40 server thay thế xung quanh vùng mạng biên và các server đại diện có bộ nhớ đệm lớn Do đó, một ISP có thể có phạm vi phủ sóng rộng lớn mà không cần phụ thuộc vào các ISP khác Các server có thể được đặt ở một nơi xa so với các máy khách của nhà cung cấp CDN Phù hợp các trang web có lưu lượng truy cập từ thấp đến trung bình

 Multi-ISP

Càng nhiều server của ISP càng tốt, khắc phục hạn chế của single-ISP và máy chủ đại diện được đặt gần người dùng, do đó nội dung được phân phối đáng tin cậy và kịp thời tới người dùng Chênh lệch số lượng yêu cầu nội dung được gửi tới tại các máy chủ đại diện, dẫn đến tài nguyên nhàn rỗi gia tăng và hiệu suất CDN kém Phù hợp các trang web có lưu lượng truy cập cao

Trang 19

2.2.2 Lựa chọn và phân phối nội dung (Content selection and delivery)

Chương II: Cơ chế quản lý và phân phối nội dung

2.2 Phân phối và quản lý nội dung

Lựa chọn và phân phối nội dungToàn phần

Sao chép toàn bộ nội dung

Từng phầnDựa

trên kinh nghiệm

Dựa trên mức

độ phổ biến

Dựa trên đối tượng

Dựa trên cụm

Dự

a trê

n phiê

n củ

a ngườ

i dùng

Dự

a trê

n đườn

g dẫ

n URL

Trang 20

Push-hợp tác:

Cách tiếp cận này dựa trên việc tìm nạp trước nội dung cho người đại diện Nội dung

được đẩy đến các máy chủ thay thế từ nguồn gốc và các máy chủ thay thế hợp tác để

giảm chi phí sao chép và cập nhật

Hạn chế: vẫn được coi là một cách tiếp cận lý thuyết vì nó chưa được sử dụng bởi bất

kỳ nhà cung cấp CDN nào

Pull-không hợp tác

các yêu cầu của khách hàng được chuyển hướng (sử dụng chuyển hướng DNS hoặc

ghi đè lên URL trước đó) đến các máy chủ đại diện gần nhất của chúng

Hạn chế: một máy chủ tối ưu không phải lúc nào cũng được chọn để phục vụ yêu cầu

nội dung

Pull-hợp tác:

các máy chủ đại diện hợp tác với nhau để lấy nội dung được yêu cầu trong trường hợp

nội dung không được tìm thấy ở một trong tập các máy chủ (cache miss).

2.2.3 Thuê ngoài nội dung (content outsourcing)

2.2 Phân phối và quản lý nội dung

Trang 21

2.3 Định tuyến yêu cầu

Khái niệm: Cơ chế định tuyến yêu cầu là quá trình định tuyến các yêu cầu của khách hàng

đến một máy chủ đại diện thích hợp để phân phối nội dung Một hệ thống định tuyến yêu cầu chịu trách nhiệm hướng yêu cầu của máy khách tới máy chủ đại diện gần nhất.

→ Do đó, hệ thống định tuyến theo yêu cầu sử dụng một tập hợp các số liệu như:

o Mức độ gần mạng

o Độ trễ nhận thấy của khách hàng

o Khoảng cách và tải của máy chủ bản sao

Chương II: Cơ chế quản lý và phân phối nội dung

Trang 22

2.3 Định tuyến yêu cầu

2.3.1 Các thuật toán định tuyến theo yêu cầu

 Thuật toán định tuyến theo yêu cầu không thích ứng : là thuật toán dựa trên những dự đoán về

tải lượng trên máy chủ bản sao để đưa ra quyết định định tuyến

 Các thuật toán định tuyến theo yêu cầu thích ứng: là thuật toán dựa trên các thông số được cập

nhật định kỳ như: khoảng cách, độ trễ của máy chủ - máy khách, tải của máy chủ bản sao hoặc băng thông hiện có sẵn cho một máy chủ bản sao

Trang 23

2.3 Định tuyến yêu cầu

2.3.2 Cơ chế định tuyến yêu cầu

Các cơ chế định tuyến yêu cầuCân

Chuyển hướng HTTP

Ghi đè URL hoặc siêu liên kết Điều hướng

Anycasti

Chương II: Cơ chế quản lý và phân phối nội dung

Trang 24

2.3 Định tuyến yêu cầu

2.3.2 Cơ chế định tuyến yêu cầu

a) Cân bằng tải toàn cầu GSLB

 Khái niệm: GSLB là một cơ chế sử dụng các nút dịch vụ bao gồm một bộ chuyển mạch và một số

máy chủ đại diện được đặt ở một số điểm vòng quanh thế giới nhằm điều phối, cân bằng tải lượng truy cập ở các máy chủ trên toàn cầu

 GSLB hỗ trợ hai khả năng chính: nhận thức toàn cầu và DNS có thẩm quyền thông minh.

Nhận thức toàn cầu DNS có thẩm quyền thông minhMỗi nút dịch vụ biết về tình trạng và

thông tin hiệu suất của các máy chủ

Web được gắn trực tiếp vào nó thông

qua chuyển mạch Web

Khả năng chọn ra máy chủ đại diện tốt nhất cho bất kỳ yêu cầu nào

 Ưu điểm:

 Các nút dịch vụ nhận thức lẫn nhau, tạo điều kiện tối ưu hóa quá trình tìm kiếm máy chủ yêu cầu.

 Quản trị viên mạng có thể thêm khả năng GSLB vào mạng mà không cần thêm bất kỳ thiết bị mạng

bổ sung nào

 Nhược điểm: cấu hình thủ công để kích hoạt khả năng này.

Trang 25

2.3 Định tuyến yêu cầu

2.3.2 Cơ chế định tuyến yêu cầu

b) Định tuyến yêu cầu dựa trên DNS

Khái niệm: Đây là một cơ chế thực hiện ánh xạ giữa tên miền tượng trưng của máy chủ thay thế và

địa chỉ IP số của nó trong một miền DNS

 Trong cơ chế này, một tên miền có nhiều địa chỉ IP liên kết với nó, khi có yêu cầu nội dung của

người dùng cuối, máy chủ DNS của nhà cung cấp dịch vụ trả về địa chỉ IP của các máy chủ chứa bản sao của đối tượng được yêu cầu

 Để quyết định, trình phân giải của DNS thực hiện:

 Gửi các thăm dò tới các máy chủ và chọn dựa trên thời gian phản hồi với mỗi thăm dò này.

 Thu thập thông tin lịch sử từ khách hàng dựa trên lần truy cập trước đó vào các máy chủ này.

 Ưu điểm:

 Tính đơn giản và độc lập với bất kỳ dịch vụ sao chép nào.

 Được sử dụng phổ biến như một dịch vụ thư mục, phục vụ cho quá trình định tuyến.

 Nhược điểm:

 Tăng độ trễ mạng, giảm hiệu suất tìm thấy máy chủ thay thế tốt nhất của hệ thống.

 Không thể mở rộng và bị hạn chế về quyền kiểm soát đối với việc nhận dạng máy khách.

Chương II: Cơ chế quản lý và phân phối nội dung

Trang 26

2.3 Định tuyến yêu cầu

2.3.2 Cơ chế định tuyến yêu cầu

c) Chuyển hướng HTTP

Khái niệm: Đây là cơ chế lan truyền thông tin về các tập máy chủ bản sao được đóng gói trong các

tiêu đề HTTP

 Giao thức HTTP cho phép máy chủ Web phản hồi yêu cầu của máy khách bằng một thông báo đặc

biệt yêu cầu máy khách gửi lại yêu cầu của họ đến một máy chủ khác

 Cơ chế này sử dụng một máy chủ Web đặc biệt, nó nhận tất cả các yêu cầu của người dùng trong

cụm, lựa chọn máy chủ bản sao thích hợp và chuyển yêu cầu tới các máy chủ này

 Nó cần được cập nhật thường xuyên các thay đổi của các máy chủ đại diện và máy khách để xử lý

các tiêu đề bổ sung

 Ưu điểm:

 Tính linh hoạt, đơn giản

 Quản lý tốt việc nhân rộng nội dung

 Nhược điểm

 Thiếu tính minh bạch

 Chi phí tăng cao do các phiên khứ hồi bản tin

Trang 27

2.3 Định tuyến yêu cầu

2.3.2 Cơ chế định tuyến yêu cầu

d) Ghi đè URL hoặc siêu liên kết Điều hướng (URL rewriting or Navigation hyperlink)

Khái niệm: đây là một cơ chế lựa chọn và phân phối nội dung một phần trang Web và nơi các đối

tượng nhúng được gửi tới như một phản hồi cho các yêu cầu của khách Trong đó, máy chủ gốc chuyển hướng các máy khách tới các máy chủ thay thế khác nhau bằng cách viết lại các liên kết URL của các trang được tạo động

Việc ghi đè URL có thể thực hiện chủ động hoặc theo phản ứng:

 Đối với ghi đè chủ động, các URL cho các đối tượng được nhúng của trang HTML chính được xây

dựng trước khi nội dung được tải trong máy chủ gốc

 Trong cách tiếp cận phản ứng thì liên quan đến việc ghi đè các URL được nhúng của trang HTML

khi yêu cầu của khách hàng chạm tới máy chủ gốc

 Ưu điểm:

 Các máy khách không bị ràng buộc với một máy chủ đại diện duy nhất.

 Đạt được mức độ chi tiết mạng tốt hơn.

 Nhược điểm: độ trễ phân tích cú pháp URL và nút thắt mạng (bottleneck) có thể xảy ra.

Chương II: Cơ chế quản lý và phân phối nội dung

Trang 28

2.3 Định tuyến yêu cầu

2.3.2 Cơ chế định tuyến yêu cầu

e) Anycasting

Khái niệm: đây là một cơ chế nhân rộng các máy chủ trên toàn mạng thông quá các nền tảng không

đồng nhất Về cơ bản, nó được chia làm 2 loại: IP anycasting và Application-level anycasting:

 IP anycasting: các bộ định tuyến IP khác nhau có đường dẫn đến các máy chủ khác nhau nhưng lại

có cùng địa chỉ IP

 Application-level anycasting: bao gồm một tập các trình phân giải anycast, thực hiện ánh xạ tên

miền anycast (anycast domain names) thành địa chỉ IP

Loại Anycasting IP anycasting Application-level anycasting

Ưu điểm Phù hợp với định tuyến yêu

cầu và chọn lựa vị trí thiết lậpdịch vụ

Có thể đạt được tính linh hoạt tốt hơn

Nhược điểm Một phần không gian địa chỉ

IP được cấp phát cho địa chỉ anycast

Chi phí gia tăng do cần

có sự thay đổi củamáy chủ và máy khách

Trang 29

2.3 Định tuyến yêu cầu

2.3.2 Cơ chế định tuyến yêu cầu

f) CDN peering

Khái niệm: đây là cơ chế được hình thành bởi các kết nối đối xứng giữa các máy tính chủ (host

computers) tạo thành các CDN ngang hàng để cung cấp nội dung thay cho nhau

 Cách thức hoạt động:

Cách thức hoạt động

Mô hình thư mục tập trung Bảng băm phân tán (DHT) cầu tràn ngập Mô hình yêu Mô hình định

tuyến tài liệu

Chương II: Cơ chế quản lý và phân phối nội dung

Trang 30

2.4 Đo lường hiệu suất

Khái niệm: Đo lường hiệu suất của một CDN được thực hiện để đo lường khả năng phục vụ khách

hàng với nội dung hoặc dịch vụ mong muốn Đo lường hiệu suất cung cấp khả năng dự đoán, giám sát và đảm bảo hiệu suất đầu cuối của một CDN

 Phân loại:

Đo lường hiệu suất

Phép đo nội bộ Thu thập

và phân tích nhật

ký từ các

bộ nhớ đệm và máy chủ truyền thông trực tuyến

Triển khai các đầu dò trên toàn mạng

Sử dụng một số công cụ bên thứ ba

Phép đo ngoài

Được thực hiện bởi bên thứ ba

Ngày đăng: 26/02/2023, 17:03

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w