Sự phát triển không ngừng của cơ sở hạ tầng, phần cứng máy tính, mạng đãgiúp các hệ thống Grid ngày nay thực hiện được nhiều điều hơn những ý tưởng trướcđây.1.2 Khái niệm Grid Một định n
Trang 1ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN LỚP CAO HỌC CÔNG NGHỆ THÔNG TIN KHÓA 8
TIỂU LUẬN MÔN HỌC
ĐIỆN TOÁN LƯỚI VÀ ĐÁM MÂY
ĐỀ TÀI:
GVHD: PGS.TS Nguyễn Phi Khứ
HVTH: Trầm Hoàng Nam MSHV: CH1301100
Trà Vinh, 06/2014
TÌM HIỂU VỀ CÔNG NGHỆ GRID COMPUTING
Trang 2NHẬN XÉT CỦA GVHD
LỜI NÓI ĐẦU
Hiện nay, đất nước ta đang thực hiện công cuộc công nghiệp hoá, hiện đại hóa, trong
đó việc rút ngắn sự tụt hậu, phát triển về khoa học công nghệ là yếu tố then chốt quyết định đến thành công của công cuộc đổi mới Song song với quá trình phát triển, ngày càng có nhiều bài toán đòi hỏi năng lực xử lý lớn xuất hiện trong khoa học, thương mại và quản lý đất nước Các công nghệ tính toán hiện hành cũng được áp dụng nhưng không thể triển khai rộng rãi để có thể giải quyết hết các nhu cầu do chi phí đầu tư quá lớn Việc nghiên cứu, áp dụng công nghệ Grid Computing là một giải pháp tốt để giải quyết các tình huống này Hơn nữa, công nghệ Grid Computing hiện nay còn khá mới mẻ, đang trong giai đoạn hoàn thiện, việc cùng tham gia nghiên cứu với cộng đồng thế giới sẽ giúp chúng ta học hỏi kinh nghiệm, tiến tới làm chủ công nghệ, từ đó có thể phát triển theo hướng đi của riêng mình, đáp ứng nhu cầu tính toán hiệu năng cao ngày càng tăng của đất nước
Công nghệ Grid Computing ra đời đánh dấu một bước phát triển mới trong lĩnh vực điện toán hiệu năng cao Nó cho phép tận dụng năng lực xử lý, lưu trữ cùng các tài nguyên
Trang 3nhàn rỗi khác để cung cấp một môi trường tính toán có năng lực xử lý lớn, khả năng lưu trữdồi dào để giải quyết các bài toán phức tạp - khó có thể giải quyết được với các công nghệhiện hành hoặc giải quyết được nhưng với chi phí rất cao - trong khoa học, thương mại GridComputing giúp tận dụng tối đa tài nguyên, tăng cường hợp tác, giảm chi phí đầu tư trongkhi vẫn cung cấp năng lực tính toán như mong muốn Trong những năm vừa qua, nhiều tổchức, tập đoàn côngnghệ thông tin lớn đã chọn công nghệ Grid Computing làm chiến lượcphát triển của mình, đã đầu tư nghiên cứu nhằm sớm đưa công nghệ Grid Computing vàothực tế Công nghệ này đang ngày càng thu hút được sự quan tâm chú ý từ khắp nơi trên thếgiới Có thể nói công nghệ Grid Computing là một xu hướng phát triển mới trong ngành côngnghệ thông tin.
Tiểu luận này là kết quả lĩnh hội được sau khi học môn Điện toán lưới và đám mây,trong đó nội dung chủ yếu của tiểu luận là tìm hiểu về công nghệ Grid Computing Em xinchân thành cám ơn PGS TS Nguyễn Phi Khứ, giảng viên môn Điện toán lưới và đám mây,
đã truyền đạt cho chúng em những kiến thứ quý báu về Grid Computing và CloudComputing, đồng thời đã khơi dậy trong mỗi học viên chúng em niềm niềm đam mê nghiêncứu khoa học, khao khát được cống hiến và góp phần xây dựng đất nước ngày càng hiện đại,văn minh hơn
Do kiến thức còn hạn hẹp, nên tiểu luận không tránh khỏi những sai sót nhất định.Kính mong Thầy và các bạn góp ý giúp em hoàn thiện tiểu luận cũng như cũng cố vốn kiếnthức kinh nghiệm của bản thân Em xin chân thành cảm ơn!
Trang 4CHƯƠNG 1 TÌM HIỂU CÔNG NGHỆ GRID COMPUTING
1 Khái niệm Grid
1.1 Lịch sử ra đời
Mặc dù công nghệ Grid Computing được nhắc đến rất nhiều trong thời giangần đây, nhưng thực ra nhiều ý tưởng cơ bản về Grid đã xuất hiện dưới dạng này haydạng khác trong lịch sử tính toán Ví dụ như ý tưởng “chia sẻ năng lực tính toán” đãxuất hiện từ những năm 60-70 của thế kỷ XX, lúc đó toàn bộ năng lực tính toán đượcchia sẻ từ các máy mainframe
Năm 1965, những người phát triển hệ điều hành Multics (tiền thân của hệ điềuhành Unix) đã đề cập đến việc sử dụng năng lực tính toán như là một tiện ích,mộtquan điểm rất gần với quan điểm về Grid hiện nay Đó là một hệ thống cung cấpnăng lực tính toán tương tự như hệ thống cung cấp điện, nước hiện đang được sử dụngtrong cuộc sống hàng ngày Người dùng khi muốn sử dụng tài nguyên tính toán để xử
lý công việc, chỉ cần cắm thiết bị vào hệ thống cung cấp, sử dụng và trả tiền giống nhưkhi cắm thiết bị điện vào lưới điện
Tuy trước đó đã có nhiều ý tưởng về Grid nhưng nguồn gốc của Grid chínhthức được xác định vào năm 1990, khi thuật ngữ “siêu tính toán” (metacomputing) rađời, dùng để mô tả các dự án kết nối các trung tâm siêu máy tính của Mỹ nhằm kếthợp sức mạnh xử lý của nhiều siêu máy tính lại với nhau
Đến năm 1995, 2 dự án siêu tính toán quan trọng, ảnh hưởng lớn đến các côngnghệ nền tảng trong các dự án Grid ngày nay là FAFNER (Factoring via Network-Enabled Recursion) và I-WAY(Information Wide Area Year) ra đời
Khái niệm Grid ra đời ở phòng thí nghiệm Argonne National Laboratory vàotháng 7/1997, sau đó được đưa vào quyển sách "The Grid: Blueprint for a NewComputing Infrastructure" viết bởi tiến sỹ Ian Foster (Argonne National Laboratory)
và Carl Kesselman (University of Southern California) năm 1998 Ian Foster đã từngtham gia dự án I-WAY, Carl Kesselman là người tham gia dự án Globus Toolkit, một
dự án nền tảng của công nghệ Grid và Metacomputing
Từ đó đến nay, việc phát triển công nghệ Grid trở nên rất sôi động với sự thamgia nghiên cứu, đầu tư của nhiều tổ chức, tập đoàn công nghệ thông tin, nhiều quốcgia, và đã thu được những thành tựu bước đầu Có thể nói, việc phát triển và xây dựng
Trang 5hệ thống Grid là sự kế thừa và phát triển các ý tưởng, các công nghệ hiện hành ở mứccao hơn Sự phát triển không ngừng của cơ sở hạ tầng, phần cứng máy tính, mạng đãgiúp các hệ thống Grid ngày nay thực hiện được nhiều điều hơn những ý tưởng trướcđây.
1.2 Khái niệm Grid
Một định nghĩa về Grid khá hoàn chỉnh được đưa ra bởi tiến sỹ Ian Foster như sau:
“Grid là một loại hệ thống song song, phân tán cho phép chia sẻ, lựa chọn, kết hợpcác tài nguyên phân tán theo địa lý, thuộc nhiều tổ chức khác nhau dựa trên tính sẵnsàng, khả năng, chi phí của chúng và yêu cầu về chất lượng dịch vụ (QoS) của ngườidùng để giải quyết các bài toán, ứng dụng có quy mô lớn trong khoa học, kỹ thuật vàthương mại Từ đó hình thành nên các “tổ chức ảo” (Virtual Organization (VO)), cácliên minh tạm thời giữa các tổ chức và tập đoàn, liên kết với nhau để chia sẻ tàinguyên và/hoặc kỹ năng nhằm đáp ứng tốt hơn các cơ hội kinh doanh hoặc các dự án
có nhu cầu lớn về tính toán và dữ liệu, toàn bộ việc liên minh này dựa trên các mạngmáy tính”
Một hệ thống Grid có những đặc trưng sau:
- Có sự kết hợp, chia sẻ các tài nguyên không được quản lý tập trung: Grid tích hợp
và phối hợp tài nguyên, người dùng thuộc nhiều vùng quản lý khác nhau, nhiềuđơn vị khác nhau trong một tổ chức, hay nhiều tổ chức khác nhau Công nghệ Gridtập trung giải quyết các vấn đề về bảo mật, chính sách quản trị, chi phí, thành viên,
… nảy sinh trong quá trình chia sẻ và sử dụng tài nguyên
- Sử dụng các giao diện và giao thức chuẩn, mang tính mở, đa dụng:Grid được xâydựng trên các giao thức và giao diện tổng quát, đa dụng để giải quyết các vấn đề
cơ bản như chứng thực người dùng, phân quyền, tìm kiếm và truy xuất tài nguyên
- Đáp ứng yêu cầu cao về chất lượng dịch vụ: Grid cho phép sử dụng phối hợp cáctài nguyên để cung cấp nhiều loại dịch vụ với các mức chất lượng khác nhau, liênquan đến ví dụ như thời gian đáp ứng, hiệu suất, tính sẵn sàng, bảo mật, cho phépkết hợp nhiều kiểu tài nguyên để đáp ứng nhu cầu phức tạp của người dùng Mụctiêu là phải phối hợp làm sao để khả năng của hệ thống sau khi kết hợp phải lớnhơn hẳn tổng khả năng của từng đơn vị cấu thành nên Grid
1.3 Tài nguyên của Grid
Trang 61.3.1 Tài nguyên tính toán
Đây là tài nguyên phổ biến nhất, là các chu kỳ tính toán (computing cycles)được cung cấp bởi bộ vi xử lý của các thiết bị trong Grid Các bộ vi xử lý khôngcần phải cùng loại mà có thể có tốc độ, kiến trúc, chạy phần mềm khác nhau
Có 3 cách để khai thác tài nguyên tính toán của Grid:
+ Cách đơn giản nhất là chạy các ứng dụng hiện có trên một node của Gridthay vì chạy trên máy tính cục bộ
+ Thiết kế ứng dụng, tách các công việc thành các phần riêng rẽ để có thể thựcthi song song trên nhiều bộ xử lý khác nhau
+ Chạy ứng dụng thực thi nhiều lần trên nhiều node khác nhau trong Grid.1.3.2 Tài nguyên lưu trữ
Tài nguyên phổ biến thứ nhì trong Grid là tài nguyên lưu trữ Mỗi thiết bịtrong Grid thường cung cấp một số dung lượng lưu trữ phục vụ cho việc thực thiứng dụng trên Grid Tài nguyên lưu trữ có thể là bộ nhớ trong, ổ đĩa cứng hoặc cácthiết bị lưu trữ khác
1.3.3 Phương tiện liên lạc
Khả năng liên lạc giữa các máy tính phát triển nhanh chóng đã giúp chocông nghệ Grid trở nên hiện thực, do đó đây cũng là một tài nguyên quan trọng Ởđây bao gồm việc liên lạc, trao đổi dữ liệu giữa các thành phần trong Grid và giaotiếp giữa Grid với bên ngoài Một số công việc đòi hỏi một lượng dữ liệu lớnnhưng các dữ liệu này thường không nằm trên máy đang thực thi công việc Khảnăng về băng thông trong những trường hợp như vậy là một tài nguyên then chốt,ảnh hưởng đến khả năng của Grid Việc giao tiếp với bên ngoài được thực hiệnthông qua mạng Internet Grid có thể sử dụng các kết nối Internet để liên lạc giữa
Trang 7các node Vì các kết nối này không chia sẻ một đường truyền nên làm tăng băngthông truy cập Internet Các đường truyền dự phòng đôi khi cần thiết để giải quyếttốt hơn các vấn đề về hư hỏng mạng và truyền dữ liệu lớn.
1.3.4 Phần mềm, ứng dụng
Grid có thể được cài đặt các phần mềm mà có thể quá mắc để cài trên tất cảmọi máy tính trong Grid Các phần mềm này chỉ cần được cài trên một số node.Thông qua Grid, khi một công việc cần đến chúng, nó sẽ gửi dữ liệu đến node đãđược cài đặt phần mềm và cho thực thi Đây có thể là một giải pháp tốt để tiếtkiệm chi phí về bản quyền phần mềm
1.3.5 Các thiết bị đặc biệt
Là các thiết bị dùng trong khoa học, kỹ thuật như kính viễn vọng, các bộcảm biến (sensor),… Các thiết bị này chủ yếu thu thập các dữ liệu khoa học, phục
vụ cho các bước phân tích, xử lý sau này
2 Phân loại Grid và Grid Topology
và tăng khả năng tận dụng hệ thống Thông thường một hệ thống chính sẽ chiakhối dữ liệu cần xử lý thành các phần nhỏ, sau đó phân phối đến các node trênGrid Mỗi node sẽ thực hiện xử lý dữ liệu và trả kết quả về hệ thống chính để hệnày tổng hợp và trình diễn kết quả toàn cục cho người dùng
Trang 82.1.2 Grid dữ liệu (Data Grid)
Ở đây, không gian lưu trữ là tài nguyên Một Grid Dữ liệu chịu trách nhiệmlưu trữ và cung cấp khả năng truy cập dữ liệu cho nhiều tổ chức khác nhau Ngườidùng không cần biết chính xác vị trí dữ liệu khi thao tác với dữ liệu Các cơ sở dữliệu, đặc biệt các cơ sở dữ liệu liên hợp, đóng vai trò quan trọng trong các Grid Dữliệu, nhất là khi có nhiều nguồn dữ liệu và xuất hiện nhu cầu kết hợp các thông tin
từ các nguồn dữ liệu này
2.1.3 Scavenging Grid
Một Scavenging Grid thường được dùng với một lượng lớn các máy tính đểbàn Các máy tính thường được kiểm tra định kỳ để xem khi nào bộ xử lý và cáctài nguyên khác rảnh rỗi để thực hiện các tác vụ Grid Chủ nhân của máy để bànthường có quyền xác định khi nào thì chia sẻ chiếc máy của mình
2.2 Đồ hình Grid (Grid Topology)
Grid có thể được xây dựng theo nhiều kích cỡ khác nhau, từ một nhóm vài máytính đặt trong một phòng ban đến hàng trăm nhóm máy tính tổ chức theo kiểu phâncấp trải rộng khắp thế giới Đồ hình Grid đơn giản nhất là SimpleGrid, chỉ bao gồmmột số máy tính đồng nhất ở cùng một vị trí Độ phức tạp của đồ hình Grid tương ứngvới số lượng tổ chức tham gia Grid và các ràng buộc về địa lý
Trang 9lý cũng như bảo mật Các máy tính chạy cùng hệ điều hành, cùng kiến trúc phầncứng nên việc chọn các phần mềm ứng dụng khá đơn giản, dễ dàng Đồ hình nàykhiến người ta liên tưởng đến các cluster hơn là Grid
2.2.2 IntraGrid
Trang 10Mở rộng hơn một chút so với SimpleGrid là IntraGrid Lúc này xuất hiệncác hệ thống không đồng nhất, nhiều loại tài nguyên mới trong Grid Sử dụng cùngmột chính sách bảo mật, sử dụng mạng nội bộ để kết nối các hệ thống trong Grid
là các đặc tính quan trọng của đồ hình này Hệ thống Grid cần có các module lậplịch Việc chia sẻ file có thể sử dụng các hệ thống file mạng (network filesytem).Các máy tính tham gia Grid có thể thuộc nhiều phòng ban khác nhau nhưng vẫntrong cùng một tổ chức Khi Grid mở rộng ra nhiều phòng ban, các chính sách mới
về cách sử dụng Grid cần phải được xác lập và áp dụng Ví dụ: cần phải có chínhsách quy định những công việc nào được thực hiện trên Grid, vào thời điểm nào;
độ ưu tiên của các phòng ban,… Bên cạnh đó vấn đề bảo mật cũng cần được quantâm, các dữ liệu nhạy cảm của một phòng ban cần được bảo vệ khỏi sự truy cập từcác công việc của các phòng ban khác Các máy tính dành riêng cho Grid bắt đầuđược đưa vào để làm tăng chất lượng dịch vụ của Grid, thay vì phải trông chờ vàocác tài nguyên rảnh rỗi
2.2.3 ExtraGrid
Vẫn trong cùng một tổ chức, ExtraGrid là sự kết hợp 2 hay nhiều IntraGrid.ExtraGrid liên quan đến nhiều vùng quản lý khác nhau, phân tán theo địa lý, sửdụng các kết nối truy cập từ xa hay WAN, do đó độ phức tạp trong quản lý tănglên rất nhiều Đối với ExtraGrid, các tài nguyên mang tính động hơn, Grid cầnphải linh động trong việc quản lý các tài nguyên, cần có cơ chế kiểm soát và phụchồi lỗi Cần có các dịch vụ cung cấp thông tin (information service) để tìm kiếmtài nguyên
Trang 112.2.4 InterGrid
Theo thời gian, các Grid mở rộng ra khỏi một tổ chức và bắt đầu liên kếtnhiều tổ chức với nhau, được dùng để phối hợp giữa các tổ chức trong các dự ánlớn Một InterGrid đòi hỏi việc liên kết động các ứng dụng, tài nguyên và dịch vụ.Khách hàng hay bất kỳ tổ chức hợp lệ nào khác đều có thể truy cập Grid thông quacác kết nối Internet và WAN
Trong dạng Grid này, cấp độ bảo mật cao nhất cần được áp dụng để ngănngừa các khả năng bị tấn công và gián điệp InterGrid cung cấp khả năng trao đổi,mua bán, tìm kiếm tài nguyên ở mức toàn cầu Các tài nguyên có thể được mua từcác nhà cung cấp tin cậy
3 Các thách thức, yêu cầu của công nghệ Grid
3.1 Quản lý tài nguyên (Resource Management)
Trang 12Mục tiêu của công nghệ Grid Computing là chia sẻ, phối hợp, sử dụng hiệu quảnhiều loại tài nguyên đến từ nhiều nguồn khác nhau Để thực hiện được điều đó, cầnphải giải quyết các thách thức và yêu cầu chính sau đây:
+ Tài nguyên thuộc nhiều vùng quản trị khác nhau: Các tài nguyên Grid phân tán theođịa lý qua nhiều vùng quản trị và được sở hữu và quản lý bởi nhiều tổ chức khác nhau.Không thể chờ đợi một sự thống nhất chung về các chính sách sử dụng, chia sẻ, bảomật giữa các tổ chức Grid cần phải tôn trọng, tương thích với các chính sách quản trị
và sử dụng tài nguyên cục bộ Cần có một cơ chế chia sẻ có tính mềm dẻo cao, từ môhình client-server đến peer-to-peer để kiểm soát chi tiết, chính xác cách sử dụng cáctài nguyên chia sẻ, bao gồm kiểm soát truy cập, ủy quyền, áp dụng các chính sách cục
bộ và toàn cục; để chia sẻ nhiều loại tài nguyên khác nhau từ các chương trình, file, dữliệu đến các máy tính, sensor,…; và cho nhiều phương thức sử dụng khác nhau từ đơnngười dùng đến đa người dùng, từ hướng hiệu suất đến hướng chi phí, từ đó đưa ra môhình chất lượng dịch vụ, lập lịch, phối hợp cấp phát tài nguyên và thanh toán chi phí.net Cần có cơ chế dàn xếp việc chia sẻ tài nguyên giữa các bên tham gia (bên cungcấp và bên sử dụng) hợp lý Việc chia sẻ này phải được quản lý chặt chẽ và đặc tả rõràng giữa các bên cung cấp và sử dụng về những gì được chia sẻ, ai được phép chia
sẻ, ở điều kiện nào thì việc chia sẻ được thực hiện
+ Tài nguyên đa dạng, hỗn tạp: Grid phải quản lý nhiều tài nguyên không đồngnhất về bản chất, sử dụng nhiều công nghệ, các hệ thống quản lý tài nguyên cục bộkhác nhau Ngay cả khi có 2 site cùng sử dụng một công nghệ, một hệ quản lý tàinguyên cục bộ nhưng có cấu hình khác nhau cũng dẫn đến có các chức năng khácnhau
+ Việc tồn tại của tài nguyên trong Grid thay đổi theo thời gian: Trong Grid, cáctài nguyên có thể xuất hiện hoặc biến mất mà không hề báo trước do nhiều nguyên dokhác nhau như lỗi hệ thống, lỗi mạng, các chính sách chia sẻ của nhà cung cấp,…Đâycũng là một thách thức lớn để đảm bảo tính tin cậy củahệ thống Cần có các cơ chếtìm kiếm, xác định tài nguyên, phát hiện và phục hồi lỗi
+ Vấn đề phối hợp cấp phát tài nguyên: Các ứng dụng có nhiều đòi hỏi về tàinguyên mà chỉ có thể đáp ứng bằng cách sử dụng song song các tài nguyên trên nhiềusite khác nhau Các chính sách quản trị cục bộ của các site cùng với khả năng bị lỗi
Trang 13trong quá trình cấp phát tài nguyên đòi hỏi phải có các cơ chế đặc biệt để phối hợp cấpphát nhiều tài nguyên, khởi tạo các quá trình tính toán, theo dõi, và quản lý chúng trêncác tài nguyên
+ Vấn đề điều khiển trực tuyến, theo thời gian thực (online): Cần có cơ chế chophép thoả thuận sử dụng tài nguyên trong thời gian thực thi để đáp ứng nhu cầu củaứng dụng, nhất là trong trường hợp các yêu cầu và tính chất các tài nguyên thay đổitrong quá trình thực thi
3.2 Bảo mật (Security)
Các hệ thống Grid cần phải cung cấp đầy đủ các chức năng bảo mật truyền thốngnhư chứng thực, phân quyền, bảo vệ thông điệp, toàn vẹn dữ liệu, … ngoài ra cần đápứng các yêu cầu sau:
3.2.1 Đăng nhập một lần (Single sign-on)
Một tính toán đơn giản cũng cần phải sử dụng nhiều tài nguyên khác nhau,
vì thế nếu cứ mỗi lần truy xuất tài nguyên lại cần phải chứng thực người dùng làđiều không thực tế và không thể chấp nhận được Thay vào đó, hệ thống Grid cần
có cơ chế cho phép người dùng chỉ cần chứng thực một lần mà có thể sử dụngnhiều tài nguyên khác nhau
3.2.2 Cho phép ủy quyền
Đây là một yêu cầu quan trọng, để thực hiện được yêu cầu “đăng nhập mộtlần” thì cần phải có sự uỷ quyền Người dùng cần có khả năng uỷ quyền cho cácchương trình sử dụng các quyền của mình, để chương trình có thể truy cập đến cáctài nguyên được phép khác của người dùng Và chương trình, đến lượt nó cũng cần
có khả năng ủy quyền cho các chương trình khác
3.2.3 Có khả năng tích hợp được với các chính sách bảo mật cục bộ
Mỗi site hoặc nhà cung cấp tài nguyên đều có chính sách bảo mật riêng củamình Do đó, các giải pháp bảo mật trên Grid cần phải liên kết được với các giảipháp cục bộ, không được thay thế toàn bộ các giải pháp này mà cho phép kế thừa,
sử dụng lại
3.2.4 Sử dụng các quan hệ tin cậy lẫn nhau dựa theo người dùng
Để cho phép người dùng sử dụng kết hợp tài nguyên từ nhiều nhà cung cấpkhác nhau, hệ thống bảo mật không được yêu cầu các nhà cung cấp phải hợp tác,
Trang 14liên lạc với nhau để thiết lập môi trường bảo mật Ví dụ, nếu người dùng có quyền
sử dụng 2 site A và B, thì người dùng cũng có thể sử dụng kết hợp 2 site A, B cùnglúc mà không cần các chuyên gia bảo mật của site A, B liên lạc với nhau
3.2.5 Hỗ trợ bảo mật liên lạc nhóm
Một quá trình tính toán được cấu thành từ nhiều tiến trình khác nhau, nhữngtiến trình này cần phải liên lạc với nhau theo từng nhóm Các nhóm có thể thay đổitrong suốt quá trình tính toán Grid cần có giải pháp để thực hiện bảo mật cho cácnhóm này
3.2.6 Đảm bảo tính riêng tư
Một trong những khả năng của Grid là cho phép xử lý dữ liệu trên máy tính
ở xa Từ đây cũng nảy sinh vấn đề cần bảo vệ tính riêng tư của dữ liệu, sao cho cácngười dùng hay nhà quản trị trên máy tính ở xa không thể xâm nhập, sử dụng các
dữ liệu đang được xử lý trên máy tính của mình
3.2.7 Cho phép có nhiều cài đặt khác nhau
Các giải pháp bảo mật không nên chỉ tập trung vào một cài đặt cụ thể mànên cài đặt theo nhiều công nghệ khác nhau dựa trên một nền tảng chung Điều nàyđảm bảo tính tương thích với nhiều hệ thống khác nhau
3.3 Quản lý thông tin
- Hệ thống thông tin Grid cần có các cơ chế hỗ trợ việc truy cập, tìm kiếm thôngtin các loại về hệ thống Grid một cách nhanh chóng, chính xác Cần có cácchức năng để xác định đặc tính phần cứng, phần mềm cũng như các thông tintrạng thái như tải hiện tại và trạng thái hàng đợi trong trường hợp tài nguyênđược lập lịch sử dụng và có các cơ chế cung cấp các thông tin này gần nhưtheo thời gian thực
- Hệ thống thông tin cần hỗ trợ theo dõi thông tin của một lượng rất lớn cácthành phần, cho phép nhiều loại thực thể truy cập, tìm kiếm thông tin trong khigiảm thiểu các chi phí về công sức và tài nguyên cần thiết để tạo lập, cập nhậtcác thông tin cả ở từng site lẫn toàn bộ Grid
- Một trong những mục tiêu của hệ thống thông tin là đơn giản hoá việc tìmkiếm thông tin để ra các quyết định sử dụng tài nguyên thích hợp, do đó hệthống thông tin cần phải được xây dựng theo mô hình dữ liệu đơn nhất
Trang 15(uniform), cung cấp một giao diện chung để truy xuất nhiều thông tin khácnhau
- Mô hình quản lý thông tin cần đủ bao quát để biểu diễn các cấu trúc thông tintrong môi trường tính toán phân tán Một trong những thách thức là biểu diễnđược các thuộc tính liên quan đến nhiều site cùng lúc (ví dụ như : băng thôngliên lạc giữa các site)
- Do tài nguyên của Grid rất đa dạng, có thể được thêm bớt theo thời gian, do đókhả năng tích hợp thêm các thông tin mới vào hệ thống là rất quan trọng Các
hệ thống thông tin Grid cần phải có khả năng này
- Các hệ thống thông tin Grid cần có khả năng phát sinh thông tin từ nhiềunguồn khác nhau để cung cấp các thông tin tổng hợp về hệ thống
- Đưa ra các cách thức truy xuất mềm dẻo đến hệ thống thông tin, người dùngcần có khả năng đọc, cập nhật cùng với khả năng tìm kiếm, định vị thông tin
- Hệ thống thông tin chỉ có thể hữu dụng khi nó được triển khai rộng rãi, do đócần có những kỹ thuật cho phép cài đặt, triển khai, bảo trì dễ dàng trên các sitekhác nhau
- Cần có mô hình quản lý thông tin phân tán, nên cho phép uỷ quyền tạo lập vàquản lý thông tin tài nguyên cho các site
3.4 Quản lý dữ liệu
- Cần có mô hình quản lý dữ liệu phân tán, cho phép kết hợp dữ liệu từ nhiều nơikhác nhau, hệ thống quản lý dữ liệu cần có các cơ chế quản lý sao cho có thểche đi sự phức tạp của dữ liệu, cung cấp cho người dùng cách thức truy cậpđơn giản, hiệu quả thông qua một giao diện chung mà không cần biết đến vị trícủa dữ liệu
- Cho phép sắp xếp các vị trí dữ liệu và có cơ chế lập lịch truy xuất dữ liệu tối
ưu nhằm nâng cao hiệu suất của Grid
- Cần có cơ chế di chuyển dữ liệu đến nơi xử lý mà không tạo ra hiệu ứng cổchai trong hệ thống mạng hoặc các vấn đề về truy xuất dữ liệu khác
- Cần có các cơ chế truyền file hiệu suất cao, đọc ghi một loạt các file hoặc cácchức năng chọn lựa, tinh giảm dữ liệu từ xa, các cơ chế điều khiển việc cấpphát tài nguyên phục vụ truyền dữ liệu (không gian, băng thông, CPU)
Trang 163.5 Phát triển ứng dụng
- Việc xây dựng Grid gặp khó khăn hơn nhiều so với các ứng dụng bình thườnghiện nay, cần phải đưa ra các mô hình, phương pháp giải quyết các vấn đề nhưchia sẻ, chia nhỏ, phân tích, di chuyển , bảo mật, quản lý, dữ liệu, đồng bộ hoácác tiến trình, công việc,… nhằm tận dụng tối đa khả năng của hệ thống
- Cần xây dựng các mô hình, các môi trường lập trình, các bộ công cụ phát triểnứng dụng cho Grid nhằm đơn giản hóa việc phát triển ứng dụng, tạo điều kiệnđưa công nghệ Grid Computing vào thực tế
3.6 Các vấn đề khác
- Khi kích cỡ Grid tăng lên, chi phí quản lý cũng tăng theo, hiệu suất của Gridcũng giảm xuống, do đó khi xây dựng các công nghệ Grid cần tính toán khảnăng mở rộng của hệ thống
- Cần có các cơ chế quản lý tiến trình để đặt chỗ trước trên tài nguyên, khởiđộng, kiểm soát, điều khiển việc thực thi của các tiến trình.Về mã thực thi ứngdụng, dạng đặc biệt của tài nguyên lưu trữ này đòi hỏi các cơ chế để quản lýphiên bản mã nguồn và mã thực thi của các đối tượng để đảm bảo tính tươngthích
- Nguời dùng mong muốn có thể dùng môi trường ảo của Grid với chất lượnggần giống như trên hệ thống cục bộ Do đó, Grid cần phải cung cấp các công
cụ đơn giản để hỗ trợ người dùng để xác định các dịch vụ, số lượng và chấtlượng (QoS) của chúng, chất lượng trong trường hợp này liên quan đến khảnăng truy cập dịch vụ một cách nhanh chóng thông qua các giao diện hoàn hảo,các hệ thống chứng thực thông minh và các đường truyền tốc độ cao
- Cần có một hệ thống quản lý phân phối hợp lý giữa các nhu cầu của ngườidùng với khả năng của tài nguyên, theo dõi việc sử dụng các dịch vụ, và cungcấp các dịch vụ cộng thêm khác như quản lý tài nguyên cục bộ, quản lý hiệusuất, trạng thái tài nguyên, quản lý đăng nhập và bảo mật
- Cần có một giao diện chuẩn để chuyển các yêu cầu của người dùng và khảnăng của tài nguyên thành một ngôn ngữ duy nhất bất kể nền tảng phần cứng,phần mềm của mỗi tài nguyên phân tán nhằm mục đích phối hợp hoạt động
3.7 Các việc cần làm để chuẩn hóa Grid
Trang 17Các bước chung trong quá trình hiện thực hoá Grid:
- Tích hợp các thành phần phần cứng và phần mềm đơn lẻ thành tài nguyên kết hợpthông qua hệ thống mạng
- Xây dựng và triển khai
+ Middleware cấp thấp để cung cấp môi trường truy cập bảo mật và trong suốt đếncác tài nguyên
+ Middleware cấp cao và các công cụ phục vụ kết hợp các tài nguyên phân tán vàphát triển ứng dụng
- Phát triển và tối ưu hoá các ứng dụng phân tán để tận dụng khả năng tài nguyên và
cơ sở hạ thầng
4 Lợi ích và ứng dụng của Grid
4.1 Khai thác, tận dụng các tài nguyên nhàn rỗi
Hầu hết các tổ chức đều có một lượng lớn các tài nguyên tính toán nhàn rỗi, cácmáy tính cá nhân thường chỉ sử dụng hết 5% thời gian xử lý CPU, ngay cả các servercũng thường “rảnh rỗi” Grid có thể tối ưu sử dụng các tài nguyên nhàn rỗi này theonhiều cách khác nhau, ví dụ, gửi một công việc trên một máy tính đang bận rộn đếnmột máy khác rảnh rỗi hơn để xử lý, hoặc phân nhỏ một công việc rồi gửi các côngviệc con đến các máy tính nhàn rỗi khác cho xử lý song song,…
Grid cho phép kết hợp nhiều không gian lưu trữ nhàn rỗi để tạo thành một khônggian lưu trữ lớn hơn, được cấu hình để tăng hiệu suất, độ tin cậy hơn so với các máyđơn lẻ thông qua các cơ chế quản lý dữ liệu
Một chức năng của Grid nữa là cân bằng sử dụng tài nguyên tốt hơn Một tổ chứcthường gặp các vấn đề không mong đợi khi các hoạt động đòi hỏi thêm nhiều tàinguyên hơn Với Grid, có thể chuyển hoạt động đến các tài nguyên nhàn rỗi khác,hoặc có thể thêm các tài nguyên mới một cách dễ dàng, từ đó làm tăng khả năng chịuđựng của hệ thống Grid có thể quản lý nhiều loại tài nguyên, do đó có thể cho phéptheo dõi tổng quan về các hoạt động sử dụng tài nguyên trong các tổ chức lớn, hỗ trợhoạch định các chiến lược sử dụng tài nguyên
4.2 Sử dụng CPU song song
Khả năng sử dụng các CPU song song là một đặc tính tuyệt vời của Grid, ngoàiviệc hỗ trợ các nhu cầu tính toán của các nhà khoa học, sức mạnh tính toán do Grid
Trang 18cung cấp có thể giúp giải quyết các bài toán đòi hỏi năng lực xử lý lớn trong cácngành khác như y dược, tính toán tài chính, kinh tế, khai thác dầu hoả, dự báo thờitiết, công nghiệp vũ trụ, thiết kế sản phẩm, … và rất nhiều lĩnh vực khác.
4.3 Cho phép hợp tác trên toàn thế giới
Một trong những đóng góp quan trọng của công nghệ Grid Computing là cho phép
và đơn giản hoá hợp tác chia sẻ, làm việc giữa một cộng đồng rộng lớn trên toàn thếgiới Các công nghệ tính toán phân tán trước đây cũng cho phép hợp tác nhưng chỉtrong một phạm vi nhỏ, còn Grid cho phép mở rộng trên phạm vi toàncầu khi đưa ranhững chuẩn quan trọng cho phép các hệ thống không đồng dạng làm việc chung vớinhau để tạo nên một hệ thống tính toán ảo cung cấp rất nhiều dạng tài nguyên khácnhau
4.4 Cho phép chia sẻ, sử dụng tất cả các loại tài nguyên
Không chỉ cho phép chia sẻ các chu kỳ tính toán, dữ liệu, Grid có thể cho phépchia sẻ tất cả các loại tài nguyên mà trước đây chưa được chia sẻ, như băng thôngmạng, các thiết bị đặc biệt, phần mềm, bản quyền, các dịch vụ,… Ví dụ, nếu mộtngười dùng muốn tăng băng thông kết nối Intenet của mình lên để thực hiện một ứngdụng khai thác dữ liệu, ứng dụng đó có thể được gửi đến nhiều máy tính trong Grid cócác kết nối Internet riêng, từ đó băng thông truy cập Internet của anh ta tăng lên rấtnhiều lần,…
4.5 Tăng tính tin cậy cho các hệ thống máy tính
Hiện nay, các hệ thống tính toán sử dụng các phần cứng chuyên dụng, đắt đỏ đểtăng độ tin cậy Ví dụ, có thể sử dụng các “chip” có các mạch dự phòng để có thểphục hồi lỗi khi có sự cố về phần cứng Một máy tính có thể sử dụng các bộ vi xử lýđôi, cho phép “cắm nóng”, để khi có một vi xử lý bị hỏng, có thể thay thế cái khác màkhông làm ngưng hoạt động của hệ thống Các giải pháp này làm tăng độ tin cậy của
hệ thống, tuy nhiên với chi quá đắt khi phụ kiện đi kèm cũng phải nhân lên
Trong tương lai, các hướng tiếp cận mới để giải quyết vấn đề độ tin cậy dựa nhiềuhơn vào các công nghệ phần mềm hơn là các phần cứng đắt tiền Grid là sự khởi đầucho các công nghệ đó Các hệ thống trong Grid thường rẻ và phân tán theo địa lý, do
đó, nếu có sự cố về nguồn điện hay các lỗi hệ thống khác tại một vị trí, toàn bộ phầncòn lại không bị ảnh hưởng Các phần mềm quản trị Grid có khả năng thực thi lại