1. Trang chủ
  2. » Luận Văn - Báo Cáo

báo cáo tiểu luận nguyên lý và mô thức các hệ phân tán các hệ phân tán dựa trên web

17 584 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 17
Dung lượng 145 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

ĐỀ CƯƠNG CHI TIẾT TIỂU LUẬNĐề tài: Các hệ phân tán dựa trên Web MỤC LỤC 1.Giới thiệu hệ phân tán trên Web Hệ phân tán đóng vai trò quan trọng trong lĩnh vực phát tri ển của công nghệ máy

Trang 1

Viện Công Nghệ Thông Tin & Truyền Thông

-o0o -BÁO CÁO TIỂU LUẬN NGUYÊN LÝ VÀ MÔ THỨC CÁC HỆ PHÂN TÁN

Đề bài: 01 Các hệ phân tán dựa trên Web

Giảng viên: TS.Vũ Thị Hương Giang

Nhóm sinh viên thực hiện: Tôn Văn Trưởng- CB120119

Nguyễn Văn Phương- CB120106

Nguyễn Thị Nụ- CB120102

Lớp: 12BCNTT2

Hà nội 12 - 2012

Trang 2

ĐỀ CƯƠNG CHI TIẾT TIỂU LUẬN

Đề tài: Các hệ phân tán dựa trên Web

MỤC LỤC

1.Giới thiệu hệ phân tán trên Web

Hệ phân tán đóng vai trò quan trọng trong lĩnh vực phát tri ển của công nghệ máy tính, đăc bi ệt là trong điề u kiện phát triển bùng nổ

củ a các mạng máy tính S ự phát triển của các mạ ng LAN, WAN cho phép hàng trăm, hàng nghìn hay thậm chí hàng triệu mát

tính có thể k ết nối với nhau Kết quả c ủa sự phát triển công nghệ hiện nay không chỉ đáng tin cậy mà còn tạo nên các hệ thống máy tính rất lớn, đượ c kết nố i bằng các đườ ng kết nối tốc độ cao Chúng tạo nên các mạng máy tính lớn hoặ c các hệ phân tán, ngược với hệ thống t ập trung trước đây, bao gồm các máy tính đơn và có thể cả thiế t bị điều khiển đầu cuố i (remote teminal) Có nhiều định nghĩa được đưa ra, nhưng n ếu coi hệ phân tán là hệ thống phục vụ người dùng thì : hệ phân tán là tập các máy tính độc lập giao tiếp với người dùng như một hệ thống thống nhất và tr ọn vẹn

Hệ phân tán được xây dựng cần đảm bảo một số đặc trưng :

 Chia sẻ tài nguyên

 Tính trong suốt

 Tính mở

 Tính co giãn

Trang 3

Tính trong suốt đảm bảo khả năng che giấu tiến trình và tài nguyên phân tán trong mạng máy tính H ệ phân tán có kh ả năng biểu diễn bản thân nó vớ i người dùng và ứng dụng giống như mộ máy tính đơn lẻ Bài tiểu luận này sẽ trình bày về các đặc trưng về mặt lý thuyết để đảm bảo tính trong suốt trong hệ phân tán và triển khai nó trong hệ thống WEB

2.Các vấn đề lý thuyết cơ bản của hệ phân tán

2.1 Tính trong suốt đối với người sử dụng

 Truy nhập (Access transparency): che giấu sự khác biệt trong cách biểu hiện dữ liệu và cách thức truy nhập tài nguyên Ở mức cơ bản, ta che giấu sự khác biệt về kiến trúc máy, nhưng quan trọng hơn chính là ta phải đạt được sự thống nhất trong biểu diễn dữ liệu bởi các máy tính khác nhau và các hệ điều hành khác nhau Ví dụ , quy ước về cách đặ t tên c ủa các máy tính khác nhau chạy trên các hệ đ iều hành khác nhau là khác nhau, tuy nhiên cách thứ c này cùng với các thao tác với file hoàn toàn trong su ốt vớ i cả ứng dụng và người dùng

 Vị trí (Location transparency): che giấu vị trí tài nguyên → người dùng hoàn toàn không biết về vị trí vật lý của tài nguyên trong hệ thống Đểđạt được , ta cần tiến hành định danh bằng tên gọi logic Tên gọi có thểđơn giản, không cần mã hóa VD : cardchua.vn, là tên của trang web, ta không hề biết vị trí vật lý của nó trên Web server nào, nhưng vẫn có thể truy cập được

 Di trú (Migration transparency): che giấu việc tài nguyên di chuyển sang máy khác

Trang 4

 Di chuyển (Relocation transparency): che giấu việc tài nguyên

có thể bị di chuyển sang nơi khác

 Nhân bản (Repilcation transparency): che giấu việc sao chép tài nguyên dẫn đến việc sao chép tài nguyên giúp đơn giản hóa và tăng tốc độ truy cập dữ liệu

 Tương tranh (Concurrency transparency): che giấu sự chia sẻ tài nguyên bởi một số người sử dụng, nhiều người dùng có thể cùng truy cập dữ liệu tại cùng một thời điểm, đặc biệt sử dụng nhiều trong mạng truyền thông

 Lỗi (Failure transparency): che giấu lỗi và khắc phục lỗi →đảm bảo người dùng hoàn toàn không biết về các lỗi xảy ra trong hệ thống và sự khắc phục các lỗi này

2.2 Kiến trúc

Hệ phân tán thường bao gồm tập phức tạp của các phần mềm nằm rải rác trên các máy khác nhau, do đó cần tổ chức tốt Có nhiều cách khác nhau để xem xét tổ chức của hệ phân tán , và một trong sốđó là tách riêng tổ chức logic của các thành phần phần mềm và các phần cứng hệ thống

Một trong các mục đích quan trọng của hệ phân tán là phân tách các ứng dụng từ nền bên dưới thông qua lớp trung gian Đó chính là bước thiết kế quan trọng với mục đích chính là đảm bảo tính trong suốt phân tán Tuy nhiên, việc đó phải đánh đổi bằng nhiều biện pháp thiết kế phức tạp để làm lớp trung gian có khả năng tương tác tốt

Các loại kiến trúc hệ thống:

Trang 5

- kiến trúc lớp

- kiến trúc hướng đối tượng

- kiến trúc dữ liệu trung tâm

- kiến trúc hướng sự kiện

Kiến trúc lớp : các thành phần được tổ chức theo kiểu lớp, thành phần lớp Li

sẽ gọi thành phần ở lớp dưới Li-1 , mô hình được sử dụng rộng rãi trong truyền thông mạng Kiến trúc hướng đối tượng có các đối tượng được định nghĩa dưới dạng các thành phần và được kết nối với nhau thông qua cơ chế gọi thủ tục (remote) Dạng kiến trúc phần mềm này tương tự như kiến trúc client-server Hai dạng kiến trúc lớp và hướng đối tượng vẫn đóng vai trò quan trọng trong các hệ thống phần mềm lớn Kiến trúc dữ liệu tập trung suy

ra từ ý tưởng các tiến trình giao tiếp thông qua phần tử (chủ động hay thụ động) chung Kiến trúc này cũng quan trọng không kém 2 kiến trúc trên, ví

dụ như hệ thống chia sẻ file chung nhằm che giấu tất cả các kết nối trong hệ thống thông qua các liên kết ảo tới file như trong hệ thống phân tán kiểu Web Trong kiến trúc hướng sự kiện, tiến trình về cơ bản sẽ giao tiếp thông qua sự lan truyền của sự kiện, có thể mang cả dữ liệu Với hệ phân tán, sự lan truyền sự kiện nói chung liên quan tới các hệ thống công cộng (publish/subscribe) Ý tưởng cơ bản là các tiến trình gửi sự kiện sau khi lớp trung gian đảm bảo chỉ các tiến trình chấp nhận sự kiện này mới có thể nhận chúng Lợi ích lớn của hệ thống hướng sự kiện là các tiến trình có mỗi quan hệ linh động, chúng không cần liên quan chặ chẽ với các tiến trình khác

Do đó chúng có thể liên kết hoặc tự do Kiến trúc hướng sự kiện có thể kết hợp với kiến trúc dữ liệu tập trung, tạo thành không gian dữ liệu chia sẻ Bản chất của không gian dữ liệu tập trung là các tiến trình có thể không liên kết với nhau, chúng không cần sẵn sàng khi sự truyền đạt được thiết lập Xa hơn,

Trang 6

nhiều không gian dữ liệu chia sẻ sử dụng giao diện SQL để chia sẻ kho dữ liệu với ý nghĩa dữ liệu có thể truy nhập thông qua mô tả hơn là tham chiếu rõ ràng, như trong trường hợp với file Sự cần thiết của các kiến trúc phần mềm đểđảm bảo tính trong suốt đối với các hệ phân tán là không có gì phải bàn cãi, tuy nhiên yêu cầu về tính trong suốt phải đánh đổi với hiệu năng hệ thống, khả năng chịu lỗi, khả thi khi lập trình và còn một số các yêu cầu khác Không có lời giải tách biệt nào đảm bảo tất cả yêu cầu của

hệ phân tán, do đó ta cần áp dụng tổng hợp các giải pháp để đạt hiệu quả

2.3 Tiến trình

Khái niệm của tiến trình bắt nguồn từ các lĩnh vực của hệđiều hành , trong đó

nó được định nghĩa như là chương trình đang thực thi Trong đó thì việc quản lý và lập kế hoạch của các tiến trình có lẽ là vấn đề quan trọng nhất cần phải quan tâm Ví dụ , để tổ chức hiệu quả 1 hệ thống client-server, người ta thường sử dụng các kỹ thuật đa luồng Như chúng ta đã thảo luận trong phần trước, đặc điểm quan trọng nhất của luồng trong hệ phân tán là chúng cho phép các máy trạm và máy chủ có thểđược xây dựng để các kết nối và xử lý nội bộ có thể chồng lên nhau , điều này dẫn đến hiệu suất cao , Trong những năm gần đây , khái niệm vềảo hóa đã trở nên phổ biến Ảo hóa cho phép một ứng dụng và có thể có môi trường hoàn chỉnh bao gồm hệđiều hành , để chạy đồng thời với các ứng dụng khác nhưng hoàn toàn độc lập về phần cứng và nền tảng nằm dưới Hơn nữa , ảo hóa giúp tách được các sự cố gây ra do lỗi hay các vấn đề về bảo mật Đây là một khái niệm quan trọng trong hệ phân tán Một vấn đề quan trọng , đặc biệt là ở khu vực phân tán rộng, là việc di chuyển tiến tình giữa các máy tính khác nhau Quá trình di chuyển hay cụ thể hơn là di trú mã

Trang 7

2.4 Truyền thông

 Truyền thông đa tiến trình là trái tim của hệ phân tán Hệ phân tán hiện đại chứa hàng nghìn, thậm chí hàng triệu tiến trình đồng thời hoạt động trong mạng, tiêu biểu như Internet Trong phần này, ta sẽ xét tới vai trò của các mô hình truyền thông hiện đại trong

việc đảm bảo tính trong suốt của hệ phân tán:

Gọi thủ tục từ xa RPC (Remote Procedure Call)

Triệu gọi đối tượng từ xa ROI(Remote Object Invocation)

Truyền thông điệp MOM (Message Oriented Middleware)

Truyền thông hướng dạng (Stream Oriented Middleware)

2.5 Định danh

Tên giữ một vai trò rất quan trọng trong tất cả các hệ thống máy tính Chúng thường được sử dụng để chia sẻ tài nguyên, nhận biết các thực thể duy nhất, tương ứng với các vị trị và hơn nữa Một vấn đề quan trọng của việc định danh đó là tên có thểđược phân giải tới thực thể tương ứng Ngoài ra, việc định danh cũng có vai trò quan trọng trong việc đảm bảo tính trong suốt về vị trí ytong hệ phân tán Giải pháp định danh cho phép một tiến trình truy cập tới thực thểđã được đặt tên Để phân giải tên, cần phải bổ sung hệ thống định danh Sự khác nhau giữa việc đặt tên trong hệ phân tán và hệ không phân tán nằm ở cách hệ thống đặt tên được thực hiện

2.6 Đồng bộ hoá

Trong hệ phân tán, vai trò của vấn để đảm bảo tính ổn định và thống nhất hoạt động.chúng ta sẽ tìm hiểu bằng cách nào các tiến trình đồng bộ hóa được với nhau

Trang 8

2.7 Tính nhất quán và sử dụng bản sao

Dữ liệu nói chung trong hệ phân tán được nhân lên thành nhiều bản để tăng thêm tính tin cậy và tăng hiệu năng Vấn đề chính của các bản sao là

sự nhất quán giữa các bản sao khi một hoặc 1 số bản sao bị thay đổi Ta cần quan tâm tới 2 vấn đề : quản lý bản sao và giữ các bản sao được nhất quán khi xây dựng hệ phân tán

2.8.Tính chịu lỗi (Fault Tolerance)

Một đặc tính của hệ phân tán khác biệt với các hệ thống máy đơn lẻ là khái niệm lỗi bộ phận, xảy ra khi một thành phần của hệ thống gặp sự cố Lỗi này có thể ảnh hưởng đến hoạt động của các thành phần khác, trong khi một số thành phần không chịu bất cứ ảnh hưởng nào Ngược lại, sự cố trong các hệ không phân tán thường làm cả hệ thống phải ngừng hoạt động

3 Hệ thống phân tán dựa trên Web

World Wide Web (www) có thểđược xem là hệ phân tán khổng

lồ nhất và cũng là tiêu biểu nhất với hàng triệu server và client cho truy cập dữ liệu Server chứa dữ liệu trong khi client cung cấp cho người sử dụng giao diện thân thiện cho việc biểu diễn dữ liệu và truy nhập dữ liệu Tính trong suốt là một đặc trưng tiêu biểu của hệ phân tán, cũng được thể hiện rõ rệt thông qua WEB Đối với người dùng , một tài liệu được lấy từ phía server , truyền tới client, và được biểu diễn trên màn hình Không có sự khác nhau giữa tài liệu được lưu trữ bên trong client và tài liệu được lưu trữ trên máy chủ, có thể là ở tận bên kia thế giới Theo nghĩa này, tính phân tán là trong suốt Trong phần này, ta sẽ chỉđưa ra một số nội dung thể hiện tính trong suốt tiêu biểu của web, đại diện tiêu biểu của hệ phân tán hiện đại

Trang 9

3.1Kiến trúc

 Hệ thống dựa trên web truyền thống

Nhiều hệ thống dựa trên nền web được tổ chức đơn giản dưới dạng client-server Nhân của web được định dưới dạng tiến trình có thể truy cập tới một hệ thống file cục bộ lưu trữ dữ liệu Cách thức đơn giản nhất là thông qua Uniform Resource Locator (URL) Qua đó, ta xác định vị trí của tài liệu, thường là qua tên DNS để xác định vị trí của server chứa dữ liệu vật lý của tài liệ được yêu cầu

 Các tài liệu web

Tài liệu của web mang ý nghĩa rộng lớn : nó không đơn thuần là dạng kí tự (plain text),mà một tài liệu có thể chứa cả âm thanh, hình ảnh, hoạt hình … Trong nhiều trường hợp,các ứng dụng trợ giúp đặc biệt là cần thiết để thể hiện tài liệu một cách gần gũi với cuộc sống

 Một số dạng tài liệu web

Text, Image, Audio, Video, Application, Multicast

3.2 Định danh

Vấn đề định danh, đặc biệt là với web, là một đặc tính cơ bản thể hiên tính trong suốt về vị trí, có nghĩa là ta không cần biết vị trí thực của một trang web về mặt vật lý nhưng vẫn có thể đảm bảo khả năng truy cập dữ liệu khi

Trang 10

cần đến Web sử dụng hệ thống định danh đơn để tham chiếu tới tài liệu gọi là Uniform Resource Identifiers (URI)

 Uniform Resource Locator (URL) : định danh tài liệu bằng cách đưa thêm thông tin về vị trí và cách thức truy cập tài liệu

• Uniform Resource Name (URN) : đóng vai trò của đối tượng định danh đích thực, được sử dụng nhưđối tượng tổng thể duy nhất, độc lập về

vị trí và liên kết vững chắc với tài liệu

Ta sẽ xét tới cấu trúc của URL :

• Cách thức truy cập : thông qua cơ chế nhưhttp,ftp hay telnet

• Vị trí của tài liệu : ý nghĩa của tên DNS của server hay có thể là địa chỉ IP của server

• Số hiệu cổng mà server lắng nghe

• Tên của tài liệu muốn truy cập tới

3.3Sự nhân bản

 Sự nhân bản cho các hệ thống lưu trữ web Vai trò quan trọng của web ngày càng tăng về mặt tổ chức đểđảm bảo khả năng biểu diễn và kết nối trực tiếp với người dùng, ta cần đảm bảo nội dung đồng thời cả khả năng tiện dụng trong truy cập Sự phân biệt này mởđường cho các mạng phân phối nội dung (content delivery networks CDNs) Ý tưởng chính là đặt các CDN này ở bên dưới, để chúng đóng vai trò là các dịch

vụ web, cung cấp cơ sở hạ tầng cho phân tán và sao chép các tài liệu web cho nhiều trang khác nhau trên Internet Đánh giá độ đo Một vấn

đề đáng chú ý của CON là cần phải đánh giá vai trò của mặt khi có liên quan đến vấn đề lưu trữ các bản sao.Ví dụ, thời gian truy cập đến một tài liệu có thể tối ưu nếu nó được sao chép với số lượng lớn, nhưng nó

Trang 11

lai đòi hỏi chi phí lớn về tài chính cũng như băng thông cho hệ thống

Do đó tuỳ trương hợp mà có các tiêu chí đánh giá khác nhau

Độ trễ : khoảng thời gian để thực hiện hành động, ví dụ tìm kiếm một tài liệu Ví dụ đánh giá độ trễ giữa một client và vài remote server Thay vì đánh giá độ trễ, ta có thể xác định băng thông thích hợp giữa 2 nút trong mạng, đặc biệt quan trọng đối với việc truyền các tài liệu có kích cỡ lớn

Độ đo không gian : bao gồm khoảng cách giữa các nút thông qua số hop trong lớp mạng, hoặc số hop giữa các hệ thống tự trị Tuy nhiên việc này rất khó thực hiện

Độ đo về mức độ sử dụng mạng : thường liên quan đến băng thông, việc tính toán băng thông bằng số byte được truyền qua mạng là đơn giản Tuy nhiên để chính xác, ta nên đánh giá mức độ thường xuyên mà tài liệu được đọc, ghi, và nhân bản

Độ đo về tính nhất quán : xác định mức độ sai lệch của một bản sao so với bản gốc

Độ đo về tài chính : xác định mức độ hoạt động tốt của CDN Tuy không mang tính kĩ thuật, nhưng trong trương hợp hoạt động trong hệ thống tài chính, đây lại là yếu tố quyết định Ví dụ, hầu hết CDN tài chính đều đặt server tại trạm đỉnh của mạng Internet, nghĩa là họ thuê trực tiếp từ các ISP để phục vụ người dùng cuối Điều này làm gắn chặt mo hình kinh doanh với mô hình kĩ thuật, và trong thực tế rất tài liệu được đưa ra về mối liên hệ này

Ngày đăng: 28/01/2015, 20:26

TỪ KHÓA LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w