Ngử lý, lưu trữ và các tài nguyên nhàn rỗi để cung cấp ột môi trường tính ốc Gia TP.HCM ường Đại Học Công Nghệ Thông Tini dùng khi mu n sốc Gia TP.HCM ử lý, lưu trữ và các tài nguyên nhà
Trang 1Đ i H c Qu c Gia TP.HCMại Học Quốc Gia TP.HCM ọc Quốc Gia TP.HCM ốc Gia TP.HCM
Trường Đại Học Công Nghệ Thông Tinng Đ i H c Công Ngh Thông Tinại Học Quốc Gia TP.HCM ọc Quốc Gia TP.HCM ệ Thông Tin
Đ TÀI: Ề:
GRID COMPUTING SECURITY - B O M T TÍNH TOÁN L ẢO MẬT TÍNH TOÁN LƯỚI ẬT TÍNH TOÁN LƯỚI ƯỚI I
HV th c hi n: ực hiện: ện: Nguy n Siêu Đ ng ễn Siêu Đẳng ẳng
TP.HCM – 2013
Trang 2M C L C ỤC LỤC ỤC LỤC
***
L I NÓI Đ U ỜI NÓI ĐẦU ẦU 3
PH N I: T NG QUAN V TÍNH TOÁN L ẦU ỔNG QUAN VỀ TÍNH TOÁN LƯỚI Ề: ƯỚI 4 I I.1- Khái ni m v tính toán l ện: ề tính toán lưới ướp: .4 i I.2- Tài nguyên c a tính toán l ủa tính toán lưới ướp: .8 i I.3- Phân lo i ại l ướp: i và công ngh l ện: ướp: .10 i I.4- Các yêu c u c a tính toán l ầu của tính toán lưới ủa tính toán lưới ướp: .14 i I.5- L i ích c a công ngh tính toán l ợi ích của công nghệ tính toán lưới ủa tính toán lưới ện: ướp: .20 i I.6- C s h t ng tính toán l ơ sở hạ tầng tính toán lưới ở hạ tầng tính toán lưới ại ầu của tính toán lưới ướp: .22 i I.7- Ki n trúc tính toán l ến trúc tính toán lưới ướp: .23 i I.8- Các chu n v tính toán l ẩn về tính toán lưới ề tính toán lưới ướp: .30 i
PH N II: B O M T TÍNH TOÁN L ẦU ẢO MẬT TÍNH TOÁN LƯỚI ẬT TÍNH TOÁN LƯỚI ƯỚI 33 I II.1 Gi i thi u v b o m t tính toán l ớp: ện: ề tính toán lưới ảo mật tính toán lưới ật tính toán lưới ướp: .33 i II.2 Nh ng yêu c u an ninh cho h th ng tính toán l ững yêu cầu an ninh cho hệ thống tính toán lưới ầu của tính toán lưới ện: ống tính toán lưới ướp: .35 i II.3 Đ c đi m c a b o m t h th ng tính toán l ặc điểm của bảo mật hệ thống tính toán lưới ểm của bảo mật hệ thống tính toán lưới ủa tính toán lưới ảo mật tính toán lưới ật tính toán lưới ện: ống tính toán lưới ướp: .36 i II.4 Mô hình b o m t trong l ảo mật tính toán lưới ật tính toán lưới ướp: .38 i II.5 C s h t ng b o m t l ơ sở hạ tầng tính toán lưới ở hạ tầng tính toán lưới ại ầu của tính toán lưới ảo mật tính toán lưới ật tính toán lưới ướp: i (GSI) 40 II.6 Mô hình b o m t l ảo mật tính toán lưới ật tính toán lưới ướp: i trong Globus Tookit 46 II.7 B o m t trong ki n trúc l ảo mật tính toán lưới ật tính toán lưới ến trúc tính toán lưới ướp: .50 i
K T LU N ẾT LUẬN ẬT TÍNH TOÁN LƯỚI 52 TÀI LI U THAM KH O ỆU THAM KHẢO ẢO MẬT TÍNH TOÁN LƯỚI 53
Trang 3L I NÓI Đ U ỜI NÓI ĐẦU ẦU
Tính toán lưới đã phát triển rất mạnh trên thế giới, nhằm liên kếti đã phát tri n r t m nh trên th gi i, nh m liên k tển rất mạnh trên thế giới, nhằm liên kết ất mạnh trên thế giới, nhằm liên kết ại Học Quốc Gia TP.HCM ế giới, nhằm liên kết ới đã phát triển rất mạnh trên thế giới, nhằm liên kết ằm liên kết ế giới, nhằm liên kết
nh ng h th ng tính toán v i nhau đ gi i nh ng bài toán c c l n Nó choệ Thông Tin ốc Gia TP.HCM ới đã phát triển rất mạnh trên thế giới, nhằm liên kết ển rất mạnh trên thế giới, nhằm liên kết ải những bài toán cực lớn Nó cho ực lớn Nó cho ới đã phát triển rất mạnh trên thế giới, nhằm liên kếtphép t n d ng năng l c x lý, l u tr và các tài nguyên nhàn r i đ cung c pực lớn Nó cho ử lý, lưu trữ và các tài nguyên nhàn rỗi để cung cấp ư ỗi để cung cấp ển rất mạnh trên thế giới, nhằm liên kết ất mạnh trên thế giới, nhằm liên kếtmôi trường Đại Học Công Nghệ Thông Tinng x lý tính toán, kh năng l u tr l n đ gi i quy t các bài toánử lý, lưu trữ và các tài nguyên nhàn rỗi để cung cấp ải những bài toán cực lớn Nó cho ư ới đã phát triển rất mạnh trên thế giới, nhằm liên kết ển rất mạnh trên thế giới, nhằm liên kết ải những bài toán cực lớn Nó cho ế giới, nhằm liên kết
ph c t p H th ng bao g m ph n c ng, ph n m m, đại Học Quốc Gia TP.HCM ệ Thông Tin ốc Gia TP.HCM ồm phần cứng, phần mềm, đường truyền và nhiều ần cứng, phần mềm, đường truyền và nhiều ần cứng, phần mềm, đường truyền và nhiều ềm, đường truyền và nhiều ường Đại Học Công Nghệ Thông Tinng truy n và nhi uềm, đường truyền và nhiều ềm, đường truyền và nhiềuthi t b khác… trong nh ng không gian thích h p t o m t môi trế giới, nhằm liên kết ợp tạo một môi trường tính ại Học Quốc Gia TP.HCM ột môi trường tính ường Đại Học Công Nghệ Thông Tinng tínhtoán g i là môi trọc Quốc Gia TP.HCM ường Đại Học Công Nghệ Thông Tinng lưới đã phát triển rất mạnh trên thế giới, nhằm liên kếti M t yêu c u quan tr ng cho tính toán lột môi trường tính ần cứng, phần mềm, đường truyền và nhiều ọc Quốc Gia TP.HCM ưới đã phát triển rất mạnh trên thế giới, nhằm liên kếti là v nất mạnh trên thế giới, nhằm liên kết
đ b o m t C b n b t kỳ môi trềm, đường truyền và nhiều ải những bài toán cực lớn Nó cho ơ bản ở bất kỳ môi trường lưới, phải có cơ chế để cung cấp ải những bài toán cực lớn Nó cho ở bất kỳ môi trường lưới, phải có cơ chế để cung cấp ất mạnh trên thế giới, nhằm liên kết ường Đại Học Công Nghệ Thông Tinng lưới đã phát triển rất mạnh trên thế giới, nhằm liên kếti, ph i có c ch đ cung c pải những bài toán cực lớn Nó cho ơ bản ở bất kỳ môi trường lưới, phải có cơ chế để cung cấp ế giới, nhằm liên kết ển rất mạnh trên thế giới, nhằm liên kết ất mạnh trên thế giới, nhằm liên kếtcho b o m t tính toán lải những bài toán cực lớn Nó cho ưới đã phát triển rất mạnh trên thế giới, nhằm liên kếti, bao g m xác th c, cho phép mã hóa d li u,… ồm phần cứng, phần mềm, đường truyền và nhiều ực lớn Nó cho ệ Thông TinTrong khuôn kh bài thu ho ch này, ngoài nh ng ki n thúc t ng quát vổ bài thu hoạch này, ngoài những kiến thúc tổng quát về ại Học Quốc Gia TP.HCM ế giới, nhằm liên kết ổ bài thu hoạch này, ngoài những kiến thúc tổng quát về ềm, đường truyền và nhiềutính toán lưới đã phát triển rất mạnh trên thế giới, nhằm liên kếti, tr ng tâm đ tài là tìm hi u v b o m t tính toán lọc Quốc Gia TP.HCM ềm, đường truyền và nhiều ển rất mạnh trên thế giới, nhằm liên kết ềm, đường truyền và nhiều ải những bài toán cực lớn Nó cho ưới đã phát triển rất mạnh trên thế giới, nhằm liên kếti nh :ưyêu c u và chính sách b o m t lần cứng, phần mềm, đường truyền và nhiều ải những bài toán cực lớn Nó cho ưới đã phát triển rất mạnh trên thế giới, nhằm liên kếti; b o m t thông tin; phân tích các thànhải những bài toán cực lớn Nó cho
ph n trong mô hình b o m t trong h th ng lần cứng, phần mềm, đường truyền và nhiều ải những bài toán cực lớn Nó cho ệ Thông Tin ốc Gia TP.HCM ưới đã phát triển rất mạnh trên thế giới, nhằm liên kếti; c s h t ng b o m tơ bản ở bất kỳ môi trường lưới, phải có cơ chế để cung cấp ở bất kỳ môi trường lưới, phải có cơ chế để cung cấp ại Học Quốc Gia TP.HCM ần cứng, phần mềm, đường truyền và nhiều ải những bài toán cực lớn Nó cho
lưới đã phát triển rất mạnh trên thế giới, nhằm liên kếti GSI; mô hình b o m t lải những bài toán cực lớn Nó cho ưới đã phát triển rất mạnh trên thế giới, nhằm liên kếti đượp tạo một môi trường tínhc phát tri n trong các phiên b n c aển rất mạnh trên thế giới, nhằm liên kết ải những bài toán cực lớn Nó cho ủaGlobus Tookit
V i th i lới đã phát triển rất mạnh trên thế giới, nhằm liên kết ờng Đại Học Công Nghệ Thông Tin ượp tạo một môi trường tínhng lên l p h n ch nh ng th y Nguy n Phi Kh đã t n tìnhới đã phát triển rất mạnh trên thế giới, nhằm liên kết ại Học Quốc Gia TP.HCM ế giới, nhằm liên kết ư ần cứng, phần mềm, đường truyền và nhiều ễn Phi Khứ đã tận tìnhtruy n t i m t kh i lềm, đường truyền và nhiều ải những bài toán cực lớn Nó cho ột môi trường tính ốc Gia TP.HCM ượp tạo một môi trường tínhng l n ki n th c Đ c bi t, v i kỹ năng s ph m,ới đã phát triển rất mạnh trên thế giới, nhằm liên kết ế giới, nhằm liên kết ặc biệt, với kỹ năng sư phạm, ệ Thông Tin ới đã phát triển rất mạnh trên thế giới, nhằm liên kết ư ại Học Quốc Gia TP.HCMphong thái di n gi i thi t ph c cùng h th ng ki n th c sâu r ng, th y đãễn Phi Khứ đã tận tình ải những bài toán cực lớn Nó cho ế giới, nhằm liên kết ệ Thông Tin ốc Gia TP.HCM ế giới, nhằm liên kết ột môi trường tính ần cứng, phần mềm, đường truyền và nhiều
đ a ra nh ng ng d ng th c t , tr c quan giúp h c viên thu n thi n cho vi cư ực lớn Nó cho ế giới, nhằm liên kết ực lớn Nó cho ọc Quốc Gia TP.HCM ệ Thông Tin ệ Thông Tin
đ nh hưới đã phát triển rất mạnh trên thế giới, nhằm liên kếtng nghiên c u c a mình C m n th y đã t n tình gi ng d y vàủa ải những bài toán cực lớn Nó cho ơ bản ở bất kỳ môi trường lưới, phải có cơ chế để cung cấp ần cứng, phần mềm, đường truyền và nhiều ải những bài toán cực lớn Nó cho ại Học Quốc Gia TP.HCM
hưới đã phát triển rất mạnh trên thế giới, nhằm liên kếtng d n hoàn t t bài thu ho ch này ẫn hoàn tất bài thu hoạch này ất mạnh trên thế giới, nhằm liên kết ại Học Quốc Gia TP.HCM
Chúc th y đần cứng, phần mềm, đường truyền và nhiều ượp tạo một môi trường tínhc nhi u s c kho ềm, đường truyền và nhiều ẻ
Trân tr ng.ọc Quốc Gia TP.HCM
H c viên th c hi nọc Quốc Gia TP.HCM ực lớn Nó cho ệ Thông TinNguy n Siêu Đ ng.ễn Phi Khứ đã tận tình ẳng
Trang 4PH N I: ẦU T NG QUAN V TÍNH TOÁN L ỔNG QUAN VỀ TÍNH TOÁN LƯỚI Ề: ƯỚI I
I.1- Khái ni m v tính toán l ện: ề tính toán lưới ướp: i
L ch s phát tri n ịch sử phát triển ử phát triển ển
M c dù công ngh Grid đặc biệt, với kỹ năng sư phạm, ệ Thông Tin ượp tạo một môi trường tínhc nh c nhi u trong th i gian g n đây, nh ngắc nhiều trong thời gian gần đây, nhưng ềm, đường truyền và nhiều ờng Đại Học Công Nghệ Thông Tin ần cứng, phần mềm, đường truyền và nhiều ư
th c ra nhi u ý tực lớn Nó cho ềm, đường truyền và nhiều ưở bất kỳ môi trường lưới, phải có cơ chế để cung cấpng c b n v Grid đã xu t hi n dơ bản ở bất kỳ môi trường lưới, phải có cơ chế để cung cấp ải những bài toán cực lớn Nó cho ềm, đường truyền và nhiều ất mạnh trên thế giới, nhằm liên kết ệ Thông Tin ưới đã phát triển rất mạnh trên thế giới, nhằm liên kết ại Học Quốc Gia TP.HCMi d ng này hay d ngại Học Quốc Gia TP.HCMkhác trong l ch s tính toán Ví d “chia s năng l c tính toán” đã xu t hi n tử lý, lưu trữ và các tài nguyên nhàn rỗi để cung cấp ẻ ực lớn Nó cho ất mạnh trên thế giới, nhằm liên kết ệ Thông Tin ừ
nh ng năm 60-70 c a th k XX, lúc đó năng l c tính toán đủa ế giới, nhằm liên kết ỷ XX, lúc đó năng lực tính toán được chia sẻ từ các ực lớn Nó cho ượp tạo một môi trường tínhc chia s t cácẻ ừmáy mainframe
Năm 1965, nh ng ngường Đại Học Công Nghệ Thông Tini phát tri n h đi u hành Multics (ti n thân c aển rất mạnh trên thế giới, nhằm liên kết ệ Thông Tin ềm, đường truyền và nhiều ềm, đường truyền và nhiều ủa
h đi u hành Unix) đã đ c p đ n năng l c tính toán nh m t ti n ích, m tệ Thông Tin ềm, đường truyền và nhiều ềm, đường truyền và nhiều ế giới, nhằm liên kết ực lớn Nó cho ư ột môi trường tính ệ Thông Tin ột môi trường tínhquan đi m r t g n v i quan đi m Grid hi n nay Đó là m t h th ng cungển rất mạnh trên thế giới, nhằm liên kết ất mạnh trên thế giới, nhằm liên kết ần cứng, phần mềm, đường truyền và nhiều ới đã phát triển rất mạnh trên thế giới, nhằm liên kết ển rất mạnh trên thế giới, nhằm liên kết ệ Thông Tin ột môi trường tính ệ Thông Tin ốc Gia TP.HCM
c p năng l c tính toán tất mạnh trên thế giới, nhằm liên kết ực lớn Nó cho ươ bản ở bất kỳ môi trường lưới, phải có cơ chế để cung cấpng t nh h th ng cung c p đi n, nực lớn Nó cho ư ệ Thông Tin ốc Gia TP.HCM ất mạnh trên thế giới, nhằm liên kết ệ Thông Tin ưới đã phát triển rất mạnh trên thế giới, nhằm liên kếtc hi nệ Thông Tin
đượp tạo một môi trường tínhc đang s d ng trong cu c s ng hàng ngày Ngử lý, lưu trữ và các tài nguyên nhàn rỗi để cung cấp ột môi trường tính ốc Gia TP.HCM ường Đại Học Công Nghệ Thông Tini dùng khi mu n sốc Gia TP.HCM ử lý, lưu trữ và các tài nguyên nhàn rỗi để cung cấp
d ng tài nguyên tính toán đ s lý công vi c, ch c n c m thi t b vào hển rất mạnh trên thế giới, nhằm liên kết ử lý, lưu trữ và các tài nguyên nhàn rỗi để cung cấp ệ Thông Tin ỉ cần cắm thiết bị vào hệ ần cứng, phần mềm, đường truyền và nhiều ắc nhiều trong thời gian gần đây, nhưng ế giới, nhằm liên kết ệ Thông Tin
th ng cung c p, s d ng và tr ti n gi ng nh c m thi t b đi n vào lốc Gia TP.HCM ất mạnh trên thế giới, nhằm liên kết ử lý, lưu trữ và các tài nguyên nhàn rỗi để cung cấp ải những bài toán cực lớn Nó cho ềm, đường truyền và nhiều ốc Gia TP.HCM ư ắc nhiều trong thời gian gần đây, nhưng ế giới, nhằm liên kết ệ Thông Tin ưới đã phát triển rất mạnh trên thế giới, nhằm liên kếti
đi n.ệ Thông Tin
Tuy trưới đã phát triển rất mạnh trên thế giới, nhằm liên kếtc đó có nhi u ý tềm, đường truyền và nhiều ưở bất kỳ môi trường lưới, phải có cơ chế để cung cấpng v Grid nh ng ngu n g c c a Grid chínhềm, đường truyền và nhiều ư ồm phần cứng, phần mềm, đường truyền và nhiều ốc Gia TP.HCM ủa
th c đượp tạo một môi trường tínhc xác đ nh vào năm 1990, khi thu t ng “siêu tính toán”(metacomputing) ra đ i, dùng đ mô t các d án k t n i cá trung tâm siêuờng Đại Học Công Nghệ Thông Tin ển rất mạnh trên thế giới, nhằm liên kết ải những bài toán cực lớn Nó cho ực lớn Nó cho ế giới, nhằm liên kết ốc Gia TP.HCMmáy tính c a Mỹ nh m k t h p s c m nh x lý c a nhi u máy tính l i v iủa ằm liên kết ế giới, nhằm liên kết ợp tạo một môi trường tính ại Học Quốc Gia TP.HCM ử lý, lưu trữ và các tài nguyên nhàn rỗi để cung cấp ủa ềm, đường truyền và nhiều ại Học Quốc Gia TP.HCM ới đã phát triển rất mạnh trên thế giới, nhằm liên kếtnhau
Đ n năm 1995, 2 d án siêu tính toán quan tr ng, nh hế giới, nhằm liên kết ực lớn Nó cho ọc Quốc Gia TP.HCM ải những bài toán cực lớn Nó cho ưở bất kỳ môi trường lưới, phải có cơ chế để cung cấpng l n đ n cácới đã phát triển rất mạnh trên thế giới, nhằm liên kết ế giới, nhằm liên kếtcông ngh n n t ng trong các d án Grid ngày nay là FAFNER (Factoring viaệ Thông Tin ềm, đường truyền và nhiều ải những bài toán cực lớn Nó cho ực lớn Nó choNetwork – Enabled Recursion) và I-WAY (Information Wide Area Year) ra đ i.ờng Đại Học Công Nghệ Thông TinKhái ni m Grid đã ra đ i phòng thí nghi m Argonne Nationalệ Thông Tin ờng Đại Học Công Nghệ Thông Tin ở bất kỳ môi trường lưới, phải có cơ chế để cung cấp ệ Thông TinLaboratory vào tháng 7/1997, sau đó được đưa vào quyển sách "The Grid:Blueprint for a New Computing Infrastructure" viết bởi tiến sỹ Ian Foster(Argonne National Laboratory) và Carl Kesselman (University of SouthernCalifornia) năm 1998 Ian Foster đã từng tham gia dự án I-WAY, CarlKesselman là người tham gia dự án Globus Toolkit, một dự án nền tảng của côngnghệ Grid và Metacomputing
Từ đó đến nay, việc phát triển công nghệ Grid trở nên rất sôi động với sựtham gia nghiên cứu, đầu tư của nhiều tổ chức, tập đoàn công nghệ thông tin,nhiều quốc gia, và đã thu được những thành tựu bước đầu
Trang 5Có thể nói, việc phát triển và xây dựng hệ thống Grid là sự kế thừa và pháttriển các ý tưởng, các công nghệ hiện hành ở mức cao hơn Sự phát triển khôngngừng của cơ sở hạ tầng, phần cứng máy tính, mạng đã giúp các hệ thống Gridngày nay thực hiện được nhiều điều hơn những ý tưởng trước đây.
Khái ni m tính toán l ệm tính toán lưới ưới i
Cũng như các công nghệ tính toán khác, tính toán lưới (grid computing) rađời xuất phát từ nhu cầu tính toán của con người Thực tế, ngày càng có nhiều bàitoán phức tạp hơn được đặt ra và do đó các tổ chức cũng cần phải có những nănglực tính toán mạnh mẽ hơn Có thể giải quyết vấn đề này bằng hai cách:
Thứ nhất: Đầu tư thêm trang thiết bị, cơ sở hạ tầng tính toán (mua thêm máychủ, máy trạm, siêu máy tính, cluster ) Rõ ràng là cách làm này hết sức tốn kém.Thứ hai: Một cách thực hiện hiệu quả hơn là phân bố lại hợp lý các nguồn tàinguyên trong tổ chức hoặc thuê thêm các nguồn tài nguyên từ bên ngoài (dĩ nhiên
là với chi phí rẻ hơn nhiều so với việc đầu tư cho cơ sở hạ tầng tính toán) Thực tếcho thấy có một phần lớn các nguồn tài nguyên của chúng ta đang bị sử dụng lãngphí: các máy để bàn công sở thường chỉ hoạt động khoảng 5% công suất, ngay cảcác máy chủ cũng có thể chỉ phải hoạt động với 20% công suất Việc tận dụng hiệuquả các nguồn tài nguyên này có thể mang lại một sức mạnh tính toán khổng lồ
Hình I.2.1: Mô hình Grid Computing và các tài nguyên mạngCách giải quyết thứ hai này chính là mục tiêu của tính toán lưới Tính toánlưới hướng đến việc chia sẻ và sử dụng hiệu quả các nguồn tài nguyên thuộc vềnhiều tổ chức trên một quy mô rộng lớn (thậm chí là quy mô toàn cầu) Chính cáccông nghệ mạng và truyền thông phát triển mạnh mẽ trong những năm qua đã biến
Trang 6những khả năng này dần trở thành hiện thực Các nghiên cứu về tính toán lưới đã
và đang được tiến hành nhằm tạo ra một cơ sở hạ tầng lưới cho phép dễ dàng chia
sẻ và quản lý các tài nguyên đa dạng và phân tán trong môi trường lưới
Các thách thức mà công nghệ tính toán lưới đang phải giải quyết bao gồm:
- Các tài nguyên hết sức đa dạng, không đồng nhất Tài nguyên ở đây đượchiểu theo nghĩa hết sức tổng quát Đó có thể là các tài nguyên phần cứng:tài nguyên tính toán, tài nguyên lưu trữ, các thiết bị đặc biệt khác ; các tàinguyên phần mềm: các CSDL, các phần mềm đặc biệt và đắt giá ; cácđường truyền mạng Các tài nguyên này có thể rất khác nhau về mặt kiếntrúc, giao diện, khả năng xử lý Việc tạo ra một giao diện thống nhất chophép khai thác và sử dụng hiệu quả các nguồn tài nguyên này hoàn toànkhông dễ dàng Ban đầu tính toán lưới được đặt ra chủ yếu là để tận dụngcác nguồn tài nguyên tính toán nhưng hiện nay mục tiêu của nó đã được
mở rộng sang rất nhiều nguồn tài nguyên khác như đã kể trên
- Các tài nguyên không chỉ thuộc về một tổ chức mà thuộc về rất nhiều tổchức tham gia lưới Các tổ chức phải tuân thủ một số quy định chung khitham gia vào lưới còn nhìn chung là hoạt động độc lập tức là các tàinguyên này đều có quyền tự trị Các tổ chức khác nhau thường có chínhsách sử dụng hay cho thuê tài nguyên của họ khác nhau và do vậy cũnggây khó khăn cho việc quản lý
- Các tài nguyên phân tán rộng khắp về mặt địa lý do vậy phải có các cơ chếquản lý phân tán
- Đảm bảo an toàn thông tin cho một môi trường phức tạp như môi trườnglưới là rất khó khăn trong khi đây là một trong những điểm ưu tiên hàngđầu
Các định nghĩa tính toán lưới:
Khái niệm Tính toán lưới đã bắt đầu xuất hiện vào đầu thập niên 90 với nghĩa
ẩn dụ là làm cho việc sử dụng sức mạnh của máy tính dễ dàng như là việc sử dụngđiện năng Ngày nay có rất nhiều định nghĩa về tính toán lưới Một định nghĩa vềGrid khá hoàn chỉnh được đưa ra bởi tiến sỹ Ian Foster như sau:
“Grid là một loại hệ thống song song, phân tán cho phép chia sẻ, lựa chọn, kết hợp các tài nguyên phân tán theo địa lý, thuộc nhiều tổ chức khác nhau dựa trên tính sẵn sàng, khả năng, chi phí của chúng và yêu cầu về chất lượng dịch vụ (QoS) của người dùng để giải quyết các bài toán, ứng dụng có quy mô lớn trong khoa học, kỹ thuật và thương mại Từ đó hình thành nên các VO (Virtual Organization (VO)), các liên minh tạm thời giữa các tổ chức và tập đoàn, liên kết với nhau để chia sẻ tài nguyên và/hoặc kỹ năng nhằm đáp ứng tốt hơn các cơ hội
Trang 7kinh doanh hoặc các dự án có nhu cầu lớn về tính toán và dữ liệu, toàn bộ việc liên minh này dựa trên các mạng máy tính”.
Một hệ thống Grid có 3 đặc điểm chính:
- Có sự kết hợp, chia sẻ các tài nguyên không được quản lý tập trung: Gridtích hợp và phối hợp tài nguyên, người dùng thuộc nhiều vùng quản lýkhác nhau, nhiều đơn vị khác nhau trong một tổ chức, hay nhiều tổ chứckhác nhau Công nghệ Grid tập trung giải quyết các vấn đề về bảo mật,chính sách quản trị, chi phí, thành viên,… nảy sinh trong quá trìnhchia sẻ và sử dụng tài nguyên
- Sử dụng các giao diện và giao thức chuẩn, mang tính mở, đa dụng: Gridđược xây dựng trên các giao thức và giao diện tổng quát, đa dụng để giảiquyết các vấn đề cơ bản như chứng thực người dùng, phân quyền, tìmkiếm và truy xuất tài nguyên
- Đáp ứng yêu cầu cao về chất lượng dịch vụ: Grid cho phép sử dụng phốihợp các tài nguyên để cung cấp nhiều loại dịch vụ với các mức chất lượngkhác nhau, liên quan đến ví dụ như thời gian đáp ứng, hiệu suất, tính sẵnsàng, bảo mật, cho phép kết hợp nhiều kiểu tài nguyên để đáp ứng nhu cầuphức tạp của người dùng Mục tiêu là phải phối hợp làm sao để khả năngcủa hệ thống sau khi kết hợp phải lớn hơn hẳn tổng khả năng của từng đơn
vị cấu thành nên Grid
Hình I.2.2: Mô hình Grid Computing
Các đ nh nghĩa khác: ịch sử phát triển
Trang 8- Plaszczak/Weller định nghĩa kỹ thuật lưới là “kỹ thuật cho phép ảo hoá
tài nguyên dự trữ theo yêu cầu, và chia sẻ dịch vụ, tài nguyên giữa các tổchức”
- IBM thì định nghĩa, “Lưới là khả năng sử dụng một tập các nguồn mở và
giao thức để có thể truy nhập tới các ứng dụng và dữ liệu, năng lực xử lý,khả năng lưu trữ và một loạt các tài nguyên tính toán khác trên Internet.Một lưới là một loại hệ thống song song và phân tán cho phép chia sẻ giữanhiều khu vực dựa trên sự sẵn có, dung lượng, hiệu năng, giá cả và các yêucầu về chất lượng dịch vụ của người sử dụng”
- Buyya định nghĩa Lưới là “một kiểu hệ thống song song và phân tán cho
phép chia sẻ, lựa chọn và kết hợp động các tài nguyên phân tán theo địa lýtại thời điểm thực thi dựa trên sự sẵn sàng, dung lượng, hiệu năng, giá vànhững yêu cầu về chất lượng dịch vụ
- CERN, một trong những tổ chức lớn nhất sử dụng công nghệ Lưới, nói về
Lưới như sau: “một dịch vụ để chia sẻ năng lực của máy tính và dunglượng lưu trữ dữ liệu qua Internet”
Bản chất của tính toán lưới giống một nền tảng dạng khái niệm hơn là một tàinguyên vật lý Lưới được tận dụng để cung cấp tài nguyên cho một nhiệm vụ tínhtoán Mục tiêu của công nghệ lưới liên quan tới những yêu cầu của việc cung cấptài nguyên linh hoạt vượt ra khỏi các khu vực cục bộ
So sánh tính toán l ưới ới i v i m t s mô hình tính toán khác ột số mô hình tính toán khác ố mô hình tính toán khác
- World Wide Web (Web computing): WWW hiện nay đang phát triển
mạnh mẽ và được sử dụng rộng khắp Sử dụng các chuẩn mở và các giaothức mở (TCP, HTTP, XML, SOAP), WWW có thể được sử dụng để xâydựng các tổ chức ảo tuy nhiên nó thiếu một số đặc tính quan trọng như các
cơ chế chứng thực một lần, ủy nhiệm, các cơ chế phối hợp sự kiện
- Các hệ thống tính toán phân tán (Distributed computing systems): Cáccông nghệ tính toán phân tán hiện tại bao gồm CORBA, J2EE và DCOMrất thích hợp cho các ứng dụng phân tán tuy nhiên chúng không cung cấpmột nền tảng phù hợp cho việc chia sẻ tài nguyên giữa các thành viên của
tổ chức ảo Một số khó khăn có thể kể ra trong việc khai phá tài nguyên,đảm bảo an ninh và xây dựng động các tổ chức ảo Thêm nữa việc tươngtác giữa các công nghệ này cũng gặp phải khó khăn Tuy nhiên cũng đã cómột số nghiên cứu nhằm mở rộng những công nghệ này cho môi trườnglưới, ví dụ như Java JINI
- Các hệ thống tính toán ngang hàng (Peer - to - peer Computing Systems):Tính toán ngang hàng cũng là một lĩnh vực của tính toán phân tán Nhữngđiểm khác biệt chính giữa tính toán ngang hàng và tính toán lưới là:
Trang 9o Tính toán lưới có cộng đồng người sử dụng có thể nhỏ hơn tuy nhiêntập trung nhiều vào các ứng dụng và có yêu cầu cao hơn về an ninhcũng như tính toàn vẹn của ứng dụng Trong khi đó các hệ thống mạngngang hàng có thể có số người sử dụng rất lớn bao gồm cả các ngườidùng đơn lẻ và các tổ chức tuy nhiên không đòi hỏi cao về an ninh và
mô hình chia sẻ tài nguyên cũng đơn giản hơn
o Môi trường lưới liên kết các nguồn tài nguyên mạnh hơn, đa dạng hơn
và chặt chẽ hơn
- Tính toán cụm: Tính toán lưới thường bị nhầm lẫn với tính toán cụm Tuynhiên sự khác biệt giữa hai kiểu tính toán này là: một cụm tính toán là mộttập đơn các nút tính toán tập trung trên một khu vực địa lý nhất định,trong khi một lưới bao gồm nhiều cụm tính toán và những loại tài nguyênkhác (như mạng, các thiết bị lưu trữ)
I.2- Tài nguyên c a tính toán l ủa tính toán lưới ướp: i
Tài nguyên tính toán
Đây là tài nguyên phổ biến nhất, là các chu kỳ tính toán (computingcycles) được cung cấp bởi bộ vi xử lý của các thiết bị trong Grid Các bộ vi xử
lý không cần phải cùng loại mà có thể có tốc độ, kiến trúc, chạy phần mềmkhác nhau
Có 3 cách để khai thác tài nguyên tính toán của Grid:
- Cách đơn giản nhất là chạy các ứng dụng hiện có trên một node của Gridthay vì chạy trên máy tính cục bộ
- Thiết kế ứng dụng, tách các công việc thành các phần riêng rẽ để có thểthực thi song song trên nhiều bộ xử lý khác nhau
- Chạy ứng dụng thực thi nhiều lần trên nhiều node khác nhau trong Grid
Tài nguyên phổ biến thứ nhì trong Grid là tài nguyên lưu trữ Mỗi thiết bịtrong Grid thường cung cấp một số dung lượng lưu trữ phục vụ cho việcthực thi ứng dụng trên Grid Tài nguyên lưu trữ có thể là bộ nhớ trong, ổ đĩacứng hoặc các thiết bị lưu trữ khác Bộ nhớ trong thường dùng để lưu trữ
dữ liệu tạm thời cho ứng dụng, trong khi các thiết bị lưu trữ ngoài có thểđược sử dụng để tăng không gian lưu trữ, tăng hiệu suất, khả năng chia sẻ vàđảm bảo tính tin cậy của dữ liệu
Ph ương tiện liên lạc ng ti n liên l c ệm tính toán lưới ạc
Khả năng liên lạc giữa các máy tính phát triển nhanh chóng đã giúp chocông nghệ Grid trở nên hiện thực, do đó đây cũng là một tài nguyên quan
Trang 10trọng Ở đây bao gồm việc liên lạc, trao đổi dữ liệu giữa các thành phần trongGrid và giao tiếp giữa Grid với bên ngoài Một số công việc đòi hỏi một lượng
dữ liệu lớn nhưng các dữ liệu này thường không nằm trên máy đang thực thicông việc Khả năng về băng thông trong những trường hợp như vậy là một tàinguyên then chốt, ảnh hưởng đến khả năng của Grid
Việc giao tiếp với bên ngoài được thực hiện thông qua mạng Internet.Grid có thể sử dụng các kết nối Internet để liên lạc giữa các node Vì các kếtnối này không chia sẻ một đường truyền nên làm tăng băng thông truy cậpInternet
Các đường truyền dự phòng đôi khi cần thiết để giải quyết tốt hơn các vấn
đề về hư hỏng mạng và truyền dữ liệu lớn
Ph n m m, và ng d ng ần mềm, và ứng dụng ềm, và ứng dụng ứng dụng ụng
Grid có thể được cài đặt các phần mềm mà có thể quá mắc để cài trên tất
cả mọi máy tính trong Grid Các phần mềm này chỉ cần được cài trên một sốnode Thông qua Grid, khi một công việc cần đến chúng, nó sẽ gửi dữ liệuđến node đã được cài đặt phần mềm và cho thực thi Đây có thể là một giảipháp tốt để tiết kiệm chi phí về bản quyền phần mềm
Các thi t b đ c bi t ết bị đặc biệt ịch sử phát triển ặc biệt ệm tính toán lưới
Là các thiết bị dùng trong khoa học, kỹ thuật như kính viễn vọng, các bộcảm biến (sensor),… Các thiết bị này chủ yếu thu thập các dữ liệu khoa học,phục vụ cho các bước phân tích, xử lý sau này
Các tài nguyên trên đây đến từ nhiều nguồn khác nhau, có thể khôngthuộc quyền quản lý của một tổ chức, của một đơn vị mà có thể thuộcnhiều tổ chức, ở nhiều nơi khác nhau Một số tài nguyên có thể được sửdụng tự do, trong khi một số khác được sử dụng dưới những chính sáchnhất định Các tài nguyên được “ảo hóa” (virtualize) để che dấu sự phứctạp, đa dạng nhằm đưa ra một cái nhìn thống nhất, đơn giản về toàn bộ tàinguyên trên Grid sao cho dưới mắt của người dùng, các tài nguyên Grid là
một khối thống nhất Hình I.2.1 minh hoạ ý tưởng này.
Trang 11Hình I.2.1: Tài nguyên Grid dưới quan điểm của người dùng, là một
khối thống nhất có được nhờ sự ảo hoá
Các tài nguyên ảo được tổ chức lại thành các VO, đến lượt nó, các tổchức ảo lại thực hiện chia sẻ tài nguyên của mình để hình thành Grid lớnhơn, tạo thành một kho tài nguyên khổng lồ
I.3- Phân lo i ại l ướp: i và công ngh l ện: ướp: i
Công nghệ Grid có thể được sử dụng theo nhiều cách khác nhau để giảiquyết các loại yêu cầu ứng dụng Thông thường Grid được phân loại bởikiểu của ứng dụng cần giải quyết Có 3 loại Grid như trình bày dướiđây Tuy nhiên không có ranh giới phân biệt rõ ràng giữa các loại Grid vàtrong thực tế, các giải pháp Grid thường là sự kết hợp 2 hay nhiều loại khácnhau
Grid tính toán (Computation Grid)
Loại Grid này tập trung chủ yếu vào việc sử dụng năng lực tính toán Ởdạng Grid này, phần lớn các node là các máy tính hay các nhóm máytính (cluster) có năng lực xử lý, tính toán rất lớn
Hình thức thực hiện là chia tác vụ tính toán lớn thành nhiều công việc nhỏthực thi song song trên các node của Grid Việc phân tán các tác vụ tính toántrong Grid sẽ làm giảm rất đáng kể toàn bộ thời gian xử lý và tăng khả năng tậndụng hệ thống Thông thường một hệ thống chính sẽ chia khối dữ liệu cần
xử lý thành các phần nhỏ, sau đó phân phối đến các node trên Grid Mỗi node
sẽ thực hiện xử lý dữ liệu và trả kết quả về hệ thống chính để hệ này tổng hợp
Trang 12và trình diễn kết quả toàn cục cho người dùng Hình I.3.1 minh họa quá trìnhnày.
Hình I.3.1: Hình thức hoạt động của Grid Tính toán
Grid d li u (Data Grid) ữ liệu (Data Grid) ệu (Data Grid)
Ở đây, không gian lưu trữ là tài nguyên Một Grid Dữ liệu chịu tráchnhiệm lưu trữ và cung cấp khả năng truy cập dữ liệu cho nhiều tổ chức khácnhau Người dùng không cần biết chính xác vị trí dữ liệu khi thao tác với dữliệu
Các cơ sở dữ liệu, đặc biệt các cơ sở dữ liệu liên hợp, đóng vai tròquan trọng trong các Grid Dữ liệu, nhất là khi có nhiều nguồn dữ liệu và xuấthiện nhu cầu kết hợp các thông tin từ các nguồn dữ liệu này
Các Grid Dữ liệu có thể được sử dụng trong lĩnh vực khai thác dữliệu(data mining) hoặc các hệ thống thương mại thông minh Trong trườnghợp này, không chỉ có hệ thống file hay các cơ sở dữ liệu mà toàn bộ dữ liệucủa tổ chức cần tập hợp lại Ở đây có thể phải kết hợp giữa Grid Dữ liệu vàGrid Tính toán
Scavenging Grid
Một Scavenging Grid thường được dùng với một lượng lớn các máy tính
để bàn Các máy tính thường được kiểm tra định kỳ để xem khi nào bộ xử lý vàcác tài nguyên khác rảnh rỗi để thực hiện các tác vụ Grid Chủ nhân củamáy để bàn thường có quyền xác định khi nào thì chia sẻ chiếc máy của mình
S đ Grid (Grid Topology) ơng tiện liên lạc ồ Grid (Grid Topology)
Grid có thể được xây dựng theo nhiều kích cỡ khác nhau, từ một nhóm vàimáy tính đặt trong một phòng ban đến hàng trăm nhóm máy tính tổ chức theokiểu phân cấp trải rộng khắp thế giới Grid Topology đơn giản nhất là
Trang 13SimpleGrid, chỉ bao gồm một số máy tính đồng nhất ở cùng một vị trí Độphức tạp của Grid Topology tương ứng với số lượng tổ chức tham gia Grid vàcác ràng buộc về địa lý Phần này sẽ giới thiệu sơ nét về một số Grid Topology
cơ bản Hình I.3.2 cho thấy độ lớn của các Grid Topology
Hình I.3.2: Các Grid Topology
SimpleGrid
Hình I.3.3: SimpleGrid Grid TopologyMột SimpleGrid chỉ bao gồm vài máy tính, tất cả đều có cùng kiến trúcphần cứng, chạy cùng một hệ điều hành, kết nối vào mạng cục bộ DạngGrid này sử dụng các hệ thống đồng nhất nên ít phức tạp, thường chỉ dùng
để thử nghiệm, làm quen với các phần mềm Grid Các máy tính thuộc mộtphòng ban trong tổ chức nên việc sử dụng chúng cho Grid không cần các chínhsách đặc biệt về quản lý cũng như bảo mật Các máy tính chạy cùng hệ điềuhành, cùng kiến trúc phần cứng nên việc chọn các phần mềm ứng dụng khá
Trang 14đơn giản, dễ dàng SimpleGrid này khiến người ta liên tưởng đến các clusterhơn là Grid.
IntraGrid
Hình I.3.4: IntraGrid Grid Topology
Mở rộng hơn một chút so với SimpleGrid là IntraGrid Lúc này xuất hiệncác hệ thống không đồng nhất, nhiều loại tài nguyên mới trong Grid Sử dụngcùng một chính sách bảo mật, sử dụng mạng nội bộ để kết nối các hệ thốngtrong Grid là các đặc tính quan trọng của Grid Topology này
Hệ thống Grid cần có các module lập lịch Việc chia sẻ file có thể sử dụng các
hệ thống file mạng (network filesytem) Các máy tính tham gia Grid có thể thuộc nhiều phòng ban khác nhau nhưng vẫn trong cùng một tổ chức
Khi Grid mở rộng ra nhiều phòng ban, các chính sách mới về cách sử dụngGrid cần phải được xác lập và áp dụng Ví dụ: cần phải có chính sách quyđịnh những công việc nào được thực hiện trên Grid, vào thời điểm nào;
độ ưu tiên của các phòng ban,… Bên cạnh đó vấn đề bảo mật cũng cầnđược quan tâm, các dữ liệu nhạy cảm của một phòng ban cần được bảo vệ khỏi
sự truy cập từ các công việc của các phòng ban khác
Các máy tính dành riêng cho Grid bắt đầu được đưa vào để làm tăng chấtlượng dịch vụ của Grid, thay vì phải trông chờ vào các tài nguyên rảnh rỗi
ExtraGrid
Vẫn trong cùng một tổ chức, ExtraGrid là sự kết hợp 2 hay nhiều IntraGrid.Như trong h ình I.3.5, ExtraGrid liên quan đến nhiều vùng quản lý khácnhau, phân tán theo địa lý, sử dụng các kết nối truy cập từ xa hay WAN, do
đó độ phức tạp trong quản lý tăng lên rất nhiều Đối với ExtraGrid, các tàinguyên mang tính động hơn, Grid cần phải linh động trong việc quản lý cáctài nguyên, cần có cơ chế kiểm soát và phục hồi lỗi
Trang 15Cần có các dịch vụ cung cấp thông tin (information service) để tìm kiếm tài nguyên.
Hình I.3.5: ExtraGrid Grid Topology
Trong dạng Grid này, cấp độ bảo mật cao nhất cần được áp dụng để ngănngừa các khả năng bị tấn công và gián điệp InterGrid cung cấp khả năngtrao đổi, mua bán, tìm kiếm tài nguyên ở mức toàn cầu Các tài nguyên cóthể được mua từ các nhà cung cấp tin cậy
Trang 16Hình I.3.6: InterGrid Grid Topology
I.4- Các yêu c u c a tính toán l ầu của tính toán lưới ủa tính toán lưới ướp: i
Qu n lý tài nguyên (Resource Management) ản lý tài nguyên (Resource Management)
Mục tiêu của công nghệ Grid Computing là chia sẻ, phối hợp, sử dụng hiệuquả nhiều loại tài nguyên đến từ nhiều nguồn khác nhau Để thực hiện đượcđiều đó, cần phải giải quyết các thách thức và yêu cầu chính sau đây:
Tài nguyên thu c nhi u vùng qu n tr khác nhau ộc nhiều vùng quản trị khác nhau ều vùng quản trị khác nhau ản trị khác nhau ị khác nhau
Các tài nguyên Grid phân tán theo địa lý qua nhiều vùng quản trị và được
sở hữu và quản lý bởi nhiều tổ chức khác nhau Không thể chờ đợi một sựthống nhất chung về các chính sách sử dụng, chia sẻ, bảo mật giữa các tổchức Grid cần phải tôn trọng, tương thích với các chính sách quản trị và sửdụng tài nguyên cục bộ Cần có một cơ chế chia sẻ có tính mềm dẻo cao, từ
mô hình client-server đến peer-to-peer để kiểm soát chi tiết, chính xác cách
sử dụng các tài nguyên chia sẻ, bao gồm kiểm soát truy cập, ủy quyền, ápdụng các chính sách cục bộ và toàn cục Để chia sẻ nhiều loại tài nguyên khácnhau từ các chương trình, file, dữ liệu đến các máy tính, sensor,…và cho nhiềuphương thức sử dụng khác nhau từ đơn người dùng đến đa người dùng, từhướng hiệu suất đến hướng chi phí, từ đó đưa ra mô hình chất lượng dịch
vụ, lập lịch, phối hợp cấp phát tài nguyên và thanh toán chi phí
Cần có cơ chế dàn xếp việc chia sẻ tài nguyên giữa các bên tham gia(bên cung cấp và bên sử dụng) hợp lý Việc chia sẻ này phải được quản lýchặt chẽ và đặc tả rõ ràng giữa các bên cung cấp và sử dụng về những gì đượcchia sẻ, ai được phép chia sẻ, ở điều kiện nào thì việc chia sẻ được thực hiện
Tài nguyên đa d ng, h n t p ạng, hỗn tạp ỗn tạp ạng, hỗn tạp
Grid phải quản lý nhiều tài nguyên không đồng nhất về bản chất, sử
Trang 17dụng nhiều công nghệ, các hệ thống quản lý tài nguyên cục bộ khác nhau Ngay
cả khi có 2 site cùng sử dụng một công nghệ, một hệ quản lý tài nguyên cục bộnhưng có cấu hình khác nhau cũng dẫn đến có các chức năng khác nhau
Dưới đây là bảng đặc tính các đối tượng cần quản lý cho thấy sự phứctạp
trong quản lý tài nguyên:
Vi c t n t i c a tài nguyên trong Grid thay đ i theo th i gian ệu (Data Grid) ồn tại của tài nguyên trong Grid thay đổi theo thời gian ạng, hỗn tạp ủa tài nguyên trong Grid thay đổi theo thời gian ổi theo thời gian ời gian
Trong Grid, các tài nguyên có thể xuất hiện hoặc biến mất mà không hềbáo trước do nhiều nguyên do khác nhau như lỗi hệ thống, lỗi mạng, các chínhsách chia sẻ của nhà cung cấp,…Đây cũng là một thách thức lớn để đảm bảotính tin cậy của hệ thống Cần có các cơ chế tìm kiếm, xác định tài nguyên,phát hiện và phục hồi lỗi
V n đ ph i h p c p phát tài nguyên ấn đề phối hợp cấp phát tài nguyên ều vùng quản trị khác nhau ối hợp cấp phát tài nguyên ợp cấp phát tài nguyên ấn đề phối hợp cấp phát tài nguyên
Các ứng dụng có nhiều đòi hỏi về tài nguyên mà chỉ có thể đáp ứng bằngcách sử dụng song song các tài nguyên trên nhiều site khác nhau Các chínhsách quản trị cục bộ của các site cùng với khả năng bị lỗi trong quá trình cấpphát tài nguyên đòi hỏi phải có các cơ chế đặc biệt để phối hợp cấp phát nhiềutài nguyên, khởi tạo các quá trình tính toán, theo dõi, và quản lý chúng trên cáctài nguyên
Trang 18V n đ đi u khi n tr c tuy n, theo th i gian th c (online) ấn đề điều khiển trực tuyến, theo thời gian thực (online) ềm, và ứng dụng ềm, và ứng dụng ển ực tuyến, theo thời gian thực (online) ết bị đặc biệt ời gian thực (online) ực tuyến, theo thời gian thực (online)
Cần có cơ chế cho phép thoả thuận sử dụng tài nguyên trong thời gianthực thi để đáp ứng nhu cầu của ứng dụng, nhất là trong trường hợp các yêucầu và tính chất các tài nguyên thay đổi trong quá trình thực thi
B o m t (Security) ản lý tài nguyên (Resource Management) ật (Security)
Các hệ thống Grid cần phải cung cấp đầy đủ các chức năng bảomật truyền thống như chứng thực, phân quyền, bảo vệ thông điệp, toàn vẹn dữliệu, … ngoài ra cần đáp ứng các yêu cầu sau:
Đăng nh p m t l n (Single sign-on) ập một lần (Single sign-on) ộc nhiều vùng quản trị khác nhau ần (Single sign-on)
Một tính toán đơn giản cũng cần phải sử dụng nhiều tài nguyên khác nhau,
vì thế nếu cứ mỗi lần truy xuất tài nguyên lại cần phải chứng thực người dùng
là điều không thực tế và không thể chấp nhận được Thay vào đó, hệ thốngGrid cần có cơ chế cho phép người dùng chỉ cần chứng thực một lần mà cóthể sử dụng nhiều tài nguyên khác nhau
Cho phép y quy n ủa tài nguyên trong Grid thay đổi theo thời gian ều vùng quản trị khác nhau
Đây là một yêu cầu quan trọng, để thực hiện được yêu cầu “đăng nhậpmột lần” thì cần phải có sự uỷ quyền Người dùng cần có khả năng uỷ quyềncho các chương trình sử dụng các quyền của mình, để chương trình có thể truycập đến các tài nguyên được phép khác của người dùng, và chương trình, đếnlượt nó cũng cần có khả năng ủy quyền cho các chương trình khác
Có kh năng tích h p đ ản trị khác nhau ợp cấp phát tài nguyên ượp cấp phát tài nguyên ới các chính sách bảo mật cục bộ c v i các chính sách b o m t c c b ản trị khác nhau ập một lần (Single sign-on) ục bộ ộc nhiều vùng quản trị khác nhau
Mỗi site hoặc nhà cung cấp tài nguyên đều có chính sách bảo mật riêngcủa mình Do đó, các giải pháp bảo mật trên Grid cần phải liên kết được vớicác giải pháp cục bộ, không được thay thế toàn bộ các giải pháp này mà chophép kế thừa, sử dụng lại
S d ng các quan h tin c y l n nhau d a theo ng ử dụng các quan hệ tin cậy lẫn nhau dựa theo người dùng ục bộ ệu (Data Grid) ập một lần (Single sign-on) ẫn nhau dựa theo người dùng ựa theo người dùng ười gian i dùng
Để cho phép người dùng sử dụng kết hợp tài nguyên từ nhiều nhà cungcấp khác nhau, hệ thống bảo mật không được yêu cầu các nhà cung cấp phảihợp tác, liên lạc với nhau để thiết lập môi trường bảo mật Ví dụ, nếu ngườidùng có quyền sử dụng 2 site A và B, thì người dùng cũng có thể sử dụng kếthợp 2 site A, B cùng lúc mà không cần các chuyên gia bảo mật của site A, Bliên lạc với nhau
H tr b o m t liên l c nhóm ỗn tạp ợp cấp phát tài nguyên ản trị khác nhau ập một lần (Single sign-on) ạng, hỗn tạp
Một quá trình tính toán được cấu thành từ nhiều tiến trình khác nhau,những tiến trình này cần phải liên lạc với nhau theo từng nhóm Các nhóm có
Trang 19thể thay đổi trong suốt quá trình tính toán Grid cần có giải pháp để thực hiệnbảo mật cho các nhóm này.
Đ m b o tính riêng t ản trị khác nhau ản trị khác nhau ư
Một trong những khả năng của Grid là cho phép xử lý dữ liệu trên máy tính
ở xa Từ đây cũng nảy sinh vấn đề cần bảo vệ tính riêng tư của dữ liệu, saocho các người dùng hay nhà quản trị trên máy tính ở xa không thể xâm nhập,
sử dụng các dữ liệu đang được xử lý trên máy tính của mình
Cho phép có nhi u cài đ t khác nhau ều vùng quản trị khác nhau ặt khác nhau
Các giải pháp bảo mật không nên chỉ tập trung vào một cài đặt cụ thể mànên cài đặt theo nhiều công nghệ khác nhau dựa trên một nền tảng chung Điềunày đảm bảo tính tương thích với nhiều hệ thống khác nhau
Các giải pháp bảo mật trên Grid cũng nên cung cấp sự hỗ trợ mềm dẻo chocông tác bảo vệ liên lạc (ví dụ như điều khiển được mức độ bảo vệ, bảo vệ cácgói dữ liệu trong các protocol không đảm bảo tính tin cậy (UDP), hỗtrợ các protocol vận chuyển tin cậy khác ngoài TCP,…) và cho phép các nhàcung cấp ra quyết định về phân quyền cũng như hạn chế ủy quyền theo nhiềucách khác nhau
Qu n lý thông tin ản lý tài nguyên (Resource Management)
- Hệ thống thông tin Grid cần có các cơ chế hỗ trợ việc truy cập, tìmkiếm thông tin các loại về hệ thống Grid một cách nhanh chóng, chínhxác Cần có các chức năng để xác định đặc tính phần cứng, phần mềmcũng như các thông tin trạng thái như tải hiện tại và trạng thái hàng đợitrong trường hợp tài nguyên được lập lịch sử dụng và có các cơ chế cungcấp các thông tin này gần như theo thời gian thực
- Hệ thống thông tin cần hỗ trợ theo dõi thông tin của một lượng rất lớncác thành phần, cho phép nhiều loại thực thể truy cập, tìm kiếmthông tin trong khi giảm thiểu các chi phí về công sức và tài nguyêncần thiết để tạo lập, cập nhật các thông tin cả ở từng site lẫn toàn bộ Grid
- Một trong những mục tiêu của hệ thống thông tin là đơn giản hoá việctìm kiếm thông tin để ra các quyết định sử dụng tài nguyên thích hợp,
do đó hệ thống thông tin cần phải được xây dựng theo mô hình dữ liệuđơn nhất (uniform), cung cấp một giao diện chung để truy xuất nhiềuthông tin khác nhau
- Mô hình quản lý thông tin cần đủ bao quát để biểu diễn các cấu trúc thôngtin trong môi trường tính toán phân tán Một trong những thách thức làbiểu diễn được các thuộc tính liên quan đến nhiều site cùng lúc (ví dụnhư : băng thông liên lạc giữa các site)
Trang 20- Do tài nguyên của Grid rất đa dạng, có thể được thêm bớt theo thời gian,
do đó khả năng tích hợp thêm các thông tin mới vào hệ thống là rất quantrọng Các hệ thống thông tin Grid cần phải có khả năng này
- Các hệ thống thông tin Grid cần có khả năng phát sinh thông tin từ nhiềunguồn khác nhau để cung cấp các thông tin tổng hợp về hệ thống
- Đưa ra các cách thức truy xuất mềm dẻo đến hệ thống thông tin, ngườidùng cần có khả năng đọc, cập nhật cùng với khả năng tìm kiếm, định vịthông tin
- Hệ thống thông tin chỉ có thể hữu dụng khi nó được triển khai rộng rãi, do
đó cần có những kỹ thuật cho phép cài đặt, triển khai, bảo trì dễ dàng trêncác site khác nhau
- Cần có mô hình quản lý thông tin phân tán, nên cho phép uỷ quyền tạo lập
và quản lý thông tin tài nguyên cho các site
Qu n lý d li u ản lý tài nguyên (Resource Management) ữ ệm tính toán lưới
- Cần có mô hình quản lý dữ liệu phân tán, cho phép kết hợp dữ liệu từnhiều nơi khác nhau, hệ thống quản lý dữ liệu cần có các cơ chế quản lýsao cho có thể che đi sự phức tạp của dữ liệu, cung cấp cho người dùngcách thức truy cập đơn giản, hiệu quả thông qua một giao diện chung màkhông cần biết đến vị trí của dữ liệu
- Cho phép sắp xếp các vị trí dữ liệu và có cơ chế lập lịch truy xuất dữ liệutối ưu nhằm nâng cao hiệu suất của Grid
- Cần có cơ chế di chuyển dữ liệu đến nơi xử lý mà không tạo ra hiệu ứng
cổ chai trong hệ thống mạng hoặc các vấn đề về truy xuất dữ liệu khác
- Cần có các cơ chế truyền file hiệu suất cao, đọc ghi một loạt các file hoặccác chức năng chọn lựa, tinh giảm dữ liệu từ xa, các cơ chế điều khiển việccấp phát tài nguyên phục vụ truyền dữ liệu (không gian, băng thông,CPU)
- Việc xây dựng Grid gặp khó khăn hơn nhiều so với các ứng dụngbình thường hiện nay, cần phải đưa ra các mô hình, phương pháp giảiquyết các vấn đề như chia sẻ, chia nhỏ, phân tích, di chuyển , bảo mật,quản lý, dữ liệu, đồng bộ hoá các tiến trình, công việc,… nhằm tận dụngtối đa khả năng của hệ thống
- Cần xây dựng các mô hình, các môi trường lập trình, các bộ công cụ pháttriển ứng dụng cho Grid nhằm đơn giản hóa việc phát triển ứng dụng, tạođiều kiện đưa công nghệ Grid Computing vào thực tế
Trang 21Các v n đ khác ấn đề điều khiển trực tuyến, theo thời gian thực (online) ềm, và ứng dụng
- Khi kích cỡ Grid tăng lên, chi phí quản lý cũng tăng theo, hiệu suất củaGrid cũng giảm xuống, do đó khi xây dựng các công nghệ Grid cần tínhtoán khả năng mở rộng của hệ thống
- Cần có các cơ chế quản lý tiến trình để đặt chỗ trước trên tài nguyên, khởiđộng, kiểm soát, điều khiển việc thực thi của các tiến trình
- Về mã thực thi ứng dụng, dạng đặc biệt của tài nguyên lưu trữ này đòi hỏicác cơ chế để quản lý phiên bản mã nguồn và mã thực thi của các đốitượng để đảm bảo tính tương thích
- Nguời dùng mong muốn có thể dùng môi trường ảo của Grid với chấtlượng gần giống như trên hệ thống cục bộ Do đó, Grid cần phải cung cấpcác công cụ đơn giản để hỗ trợ người dùng để xác định các dịch vụ, sốlượng và chất lượng (QoS ) của chúng, chất lượng trong trường hợp nàyliên quan đến khả năng truy cập dịch vụ một cách nhanh chóng thông quacác giao diện hoàn hảo, các hệ thống chứng thực thông minh và các đườngtruyền tốc độ cao
- Cần có một hệ thống quản lý phân phối hợp lý giữa các nhu cầu của ngườidùng với khả năng của tài nguyên, theo dõi việc sử dụng các dịch vụ, vàcung cấp các dịch vụ cộng thêm khác như quản lý tài nguyên cục bộ, quản
lý hiệu suất, trạng thái tài nguyên, quản lý đăng nhập và bảo mật
- Cần có một giao diện chuẩn để chuyển các yêu cầu của người dùng và khảnăng của tài nguyên thành một ngôn ngữ duy nhất bất kể nền tảng phầncứng, phần mềm của mỗi tài nguyên phân tán nhằm mục đích phối hợphoạt động
I.5- L i ích c a công ngh tính toán l ợi ích của công nghệ tính toán lưới ủa tính toán lưới ện: ướp: i
Hầu hết các tổ chức đều có một lượng lớn các tài nguyên tính toán nhànrỗi, các máy tính cá nhân thường chỉ sử dụng hết 5% thời gian xử lý CPU,ngay cả các server cũng thường “rảnh rỗi” Grid có thể tối ưu sử dụng các tàinguyên nhàn rỗi này theo nhiều cách khác nhau, ví dụ, gửi một công việctrên một máy tính đang bận rộn đến một máy khác rảnh rỗi hơn để xử lý,hoặc phân nhỏ một công việc rồi gửi các công việc con đến các máy tính nhànrỗi khác cho xử lý song song,…
Grid cho phép kết hợp nhiều không gian lưu trữ nhàn rỗi để tạo thànhmột không gian lưu trữ lớn hơn, được cấu hình để tăng hiệu suất, độ tin cậyhơn so với các máy đơn lẻ thông qua các cơ chế quản lý dữ liệu
Một chức năng của Grid nữa là cân bằng sử dụng tài nguyên tốt hơn Một
Trang 22tổ chức thường gặp các vấn đề không mong đợi khi các hoạt động đòi hỏithêm nhiều tài nguyên hơn Với Grid, có thể chuyển hoạt động đến cáctài nguyên nhàn rỗi khác, hoặc có thể thêm các tài nguyên mới một cách dễdàng, từ đó làm tăng khả năng chịu đựng của hệ thống Grid có thể quản lýnhiều loại tài nguyên, do đó có thể cho phép theo dõi tổng quan về các hoạtđộng sử dụng tài nguyên trong các tổ chức lớn, hỗ trợ hoạch định các chiếnlược sử dụng tài nguyên.
Khả năng sử dụng các CPU song song là một đặc tính tuyệt vời củaGrid, ngoài việc hỗ trợ các nhu cầu tính toán của các nhà khoa học, sức mạnhtính toán do Grid cung cấp có thể giúp giải quyết các bài toán đòi hỏi nănglực xử lý lớn trong các ngành khác như y dược, tính toán tài chính, kinh tế,khai thác dầu hoả, dự báo thời tiết, công nghiệp vũ trụ, thiết kế sản phẩm, … vàrất nhiều lĩnh vực khác
Cho phép h p tác trên toàn th gi i ợp tác trên toàn thế giới ết bị đặc biệt ới
Một trong những đóng góp quan trọng của công nghệ Grid Computing làcho phép và đơn giản hoá hợp tác chia sẻ, làm việc giữa một cộng đồngrộng lớn trên toàn thế giới Các công nghệ tính toán phân tán trước đây cũngcho phép hợp tác nhưng chỉ trong một phạm vi nhỏ, còn Grid cho phép mởrộng trên phạm vi toàn cầu khi đưa ra những chuẩn quan trọng cho phép các hệthống không đồng dạng làm việc chung với nhau để tạo nên một hệ thống tínhtoán ảo cung cấp rất nhiều dạng tài nguyên khác nhau
Cho phép chia s , s d ng t t c các lo i tài nguyên ẻ, sử dụng tất cả các loại tài nguyên ử phát triển ụng ấn đề điều khiển trực tuyến, theo thời gian thực (online) ản lý tài nguyên (Resource Management) ạc
Không chỉ cho phép chia sẻ các chu kỳ tính toán, dữ liệu, Grid có thểcho phép chia sẻ tất cả các loại tài nguyên mà trước đây chưa được chia sẻ,như băng thông mạng, các thiết bị đặc biệt, phần mềm, bản quyền, các dịchvụ,… Ví dụ, nếu một người dùng muốn tăng băng thông kết nối Intenet củamình lên để thực hiện một ứng dụng khai thác dữ liệu, ứng dụng đó có thểđược gửi đến nhiều máy tính trong Grid có các kết nối Internet riêng, từ đóbăng thông truy cập Internet của anh ta tăng lên rất nhiều lần,…
Tăng tính tin c y cho các h th ng máy tính ật (Security) ệm tính toán lưới ố mô hình tính toán khác
Hiện nay, các hệ thống tính toán sử dụng các phần cứng chuyên dụng, đắt
đỏ để tăng độ tin cậy Ví dụ, có thể sử dụng các “chip” có các mạch dự phòng
để có thể phục hồi lỗi khi có sự cố về phần cứng Một máy tính có thể sử dụngcác bộ vi xử lý đôi, cho phép “cắm nóng”, để khi có một vi xử lý bị hỏng, cóthể thay thế cái khác mà không làm ngưng hoạt động của hệ thống Các giảipháp này làm tăng độ tin cậy của hệ thống, tuy nhiên với chi quá đắt khi phụkiện đi kèm cũng phải nhân lên
Trang 23Trong tương lai, các hướng tiếp cận mới để giải quyết vấn đề độ tin cậydựa nhiều hơn vào các công nghệ phần mềm hơn là các phần cứng đắt tiền.Grid là sự khởi đầu cho các công nghệ đó Các hệ thống trong Grid thường rẻ
và phân tán theo địa lý, do đó, nếu có sự cố về nguồn điện hay các lỗi hệthống khác tại một vị trí, toàn bộ phần còn lại không bị ảnh hưởng Các phầnmềm quản trị Grid có khả năng thực thi lại công việc trên một node khác khiphát hiện có lỗi hệ thống Nếu quan trọng hơn nữa, trong các hệ thống theothời gian thực, nhiều bản dự phòng của các các công việc quan trọng có thểđược chạy trên nhiều máy tính khác nhau trong Grid để đảm bảo độ tin cậytối đa
Tăng kh năng qu n tr các h th ng ản lý tài nguyên (Resource Management) ản lý tài nguyên (Resource Management) ịch sử phát triển ệm tính toán lưới ố mô hình tính toán khác
Mục tiêu ảo hoá tất cả các tài nguyên và cung cấp giao diện quản lý đơnnhất các hệ thống hỗn tạp đem lại những cơ hội mới để quản trị tốt hơn trongcác cơ sở hạ tầng công nghệ thông tin lớn, phân tán
Bên cạnh đó, đối với tầm quản lý vĩ mô, có nhiều dự án sử dụng cơ sở hạtầng công thông tin, Grid cho phép quản lý độ ưu tiên sử dụng tài nguyên củacác dự án này Trước đây, mỗi dự án thường chịu trách nhiệm quản lý một sốtài nguyên, thường xảy ra tình trạng các tài nguyên của dự án này đang nhànrỗi trong khi dự án khác đang gặp vấn đề, thiếu tài nguyên do gặp các sựkiện không lường trước Với tầm nhìn rộng hơn do Grid cung cấp, các tìnhhuống trên có thể được giải quyết dễ dàng
Trên đây giới thiệu một số ích lợi khi sử dụng công nghệ Grid Computing,Grid còn mang lại rất nhiều lợi ích khác mà không thể kể hết ở đây, tuỳ vàotình huống cụ thể mà đem lại các lợi ích khác nhau Vấn đề là phải hiểu rõbản chất Grid, sử dụng tốt các công cụ nhằm khai khác tốt nhất trong các tìnhhuống cụ thể
Công nghệ Grid Computing có thể được ứng dụng trong các bài toán trongkhoa học lẫn thương mại:
- Đòi hỏi năng lực xử lý lớn (High-performance computing), yêu cầu rútngắn thời gian hoàn thành kết quả càng nhanh càng tốt
- Hướng dữ liệu, đòi hỏi phải thu thập, lưu trữ, phân tích một lượng lớn dữliệu, mang tính phân tán
- Cần sự hợp tác, chia sẻ giữa các cộng đồng
I.6- C s h t ng tính toán l ơ sở hạ tầng tính toán lưới ở hạ tầng tính toán lưới ại ầu của tính toán lưới ướp: i
Một cơ sở hạ tầng (infrastructure) là một công nghệ cho phép chúng ta thựchiện các hoạt động của mình, ví dụ hệ thống đường giao thông cho phép đi lạibằng xe, hệ thống ngân hàng cho phép chuyển tiền một các nhanh chóng
Trang 24Để có thể hữu dụng, cơ sở hạ tầng cần phải được triển khai rộng rãi, điều đócũng có nghĩa là nó phải đơn giản hoặc có giá trị to lớn hoặc cả hai Do đó, cơ
sở hạ tầng Grid cần phải vừa đơn giản, vừa hỗ trợ được nhiều dạng tài nguyênkhác nhau
Phần này sẽ giới thiệu tổng quan về các thành phần chính yếu củamột môi trường Grid Tuỳ theo thiết kế và cách sử dụng Grid, một sốthành phần có thể không cần thiết và đôi khi trong một số trường hợp, có thểkết hợp nhiều thành phần lại thành một thành phần phức hợp
Portal/Giao di n ng ệm tính toán lưới ười gian thực (online) i dùng
Truy cập thông tin trên Grid là việc rất quan trọng, thành phần giaodiện người dùng đảm nhiệm chức năng này Giao diện người dùng thuộcmột trong 2 dạng:
- Giao diện cung cấp bởi ứng dụng đang chạy của người dùng
- Giao diện cung cấp bởi các nhà quản trị Grid giống như portal cho phépkhả năng truy xuất đến các ứng dụng và tài trong Grid như trong mộtkhông gian ảo duy nhất Một Grid portal đưa ra một giao diện cho ngườidùng để chạy các ứng dụng sử dụng các tài nguyên và dịch vụ của Grid.Giao diện kiểu portal cũng có thể giúp người dùng học cách sử dụng Grid
B o m t ản lý tài nguyên (Resource Management) ật (Security)
Các máy tính trong Grid đều được nối mạng và chạy các ứng dụng, chúng
có thể phải xử lý các dữ liệu nhạy cảm hoặc có giá trị lớn, do đó thành phầnbảo mật của Grid là hết sức quan trọng Ở mức cơ sở, bất kỳ môi trường Gridnào cũng phải có các cơ chế bảo mật
Broker
Khi đã được chứng thực, người dùng sẽ thực thi ứng dụng Tùy thuộcvào ứng dụng và các thông số cung cấp bởi người dùng, bước tiếp theo là phảixác định được các tài nguyên thích hợp để sử dụng Việc này đòi hỏi các chứcnăng của một broker
B l p l ch (scheduler) ột số mô hình tính toán khác ật (Security) ịch sử phát triển
Khi các tài nguyên đã được xác định và cấp phát, bước tiếp theo là lậplịch điều phối các công việc chạy trên đó Cần có các bộ lập lịch để xác địnhcác node thực thi ứng dụng và gửi các công việc được yêu cầu đến các node.Việc này có thể đơn giản là lấy tài nguyên sẵn sàng tiếp theo trong hệ thống,nhưng thường thì nó liên quan đến các hàng đợi công việc ưu tiên, quản lýtải, tìm kiếm các tài nguyên đã đăng ký sử dụng, theo dõi tiến trình Nếu
có một tập các công việc riêng lẻ, không phụ thuộc vào nhau thì không cầncác bộ lập lịch phức tạp Tuy nhiên, nếu muốn giữ chỗ các tài nguyên đặcbiệt hay chắc chắn rằng các công việc chạy song song thì nên sử dụng các bộ
Trang 25lập lịch để phối hợp hoạt động của các công việc Lưu ý, các cluster có thểđược xem là một tài nguyên đơn lẻ, chúng có bộ lập lịch riêng để quản lý cácnode của nó Một bộ lập lịch cấp cao hơn dùng để quản lý các công việc cầnthực hiện trên cluster trong khi bộ lập lịch cục bộ của cluster sẽ điều phối cáccông việc cụ thể trên từng máy tính con.
Thành ph n qu n lý d li u (Data management) ần mềm, và ứng dụng ản lý tài nguyên (Resource Management) ữ ệm tính toán lưới
Nếu bất cứ dữ liệu nào, bao gồm cả các module thực thi của ứng dụng,cần phải di chuyển thì cần phải có các phương pháp an toàn, tin cậy để dichuyển các file và dữ liệu qua lại giữa các node trong Grid Do đó, cần phải cóthành phần này
Thành ph n qu n lý công vi c và tài nguyên (Job and resource ần mềm, và ứng dụng ản lý tài nguyên (Resource Management) ệm tính toán lưới management)
Sau khi đã có các tiện nghi như trên, việc tiếp theo là xây dựng các dịch
vụ hỗ trợ việc thực hiện các công việc thật sự trong môi trường Grid Để giảiquyết các tác vụ nòng cốt như khởi chạy ứng dụng với các tài nguyên cụ thể,theo dõi trạng thái các công việc, nhận kết quả, hệ thống Grid cần có thànhphần quản lý công việc và tài nguyên
Các thành ph n khác ần mềm, và ứng dụng
Còn có nhiều thành phần khác để đưa vào môi trường Grid và cần đượcxem xét khi thiết kế và cài đặt ứng dụng Ví dụ : Các tiện ích như liên lạcgiữa các tiến trình (Inter Process Communication) và các dịch vụ hỗ trợ tínhtoán chi phí và chi trả là những tiện ích được yêu cầu nhiều nhất
Trên đây là giới thiệu vắn tắt và tổng quan về các thành phần chính củamôi trường Grid Tuỳ thuộc vào việc triển khai Grid và các yêu cầu của ứngdụng, có nhiều cách khác nhau để kết hợp các thành phần này lại với nhau
để tạo nên một giải pháp Grid
I.7- Ki n trúc tính toán l ến trúc tính toán lưới ướp: i
B n ch t ki n trúc Grid ản lý tài nguyên (Resource Management) ấn đề điều khiển trực tuyến, theo thời gian thực (online) ết bị đặc biệt
VO là đơn vị cơ bản quan trọng trong hệ thống Grid Việc thiết lập, quản
lý, khai thác các quan hệ chia sẻ tài nguyên giữa các tổ chức ảo đòi hỏi phải
có kiến trúc hệ thống mới, kiến trúc Grid Kiến trúc Grid dưới đây được xâydựng dựa trên quan niệm “để các VO hoạt động hiệu quả đòi hỏi phải thiếtlập được các quan hệ chia sẻ với bất kỳ đơn vị tham gia tiềm năng nào” Để làmđược điều này, vấn đề “liên kết hoạt động” (interoperability) cần phảiđược tập trung giải quyết Trong môi trường mạng, “liên kết hoạt động” đồngnghĩa với việc sử dụng các protocol chung Do đó, kiến trúc Grid sẽ là kiếntrúc protocol, với các protocol xác định các cơ chế nền tảng để người dùng
và nhà cung cấp tài nguyên thương lượng, thiết lập, quản lý và khai thác các
Trang 26mối quan hệ chia sẻ tài nguyên.
Kiến trúc Grid phải là kiến trúc dựa chuẩn, hướng mở, để dễ mở rộng,liên kết hoạt động tốt, có tính khả chuyển (portability) cao Các protocol chuẩn
sẽ giúp định nghĩa các service chuẩn, nhờ đó có thể xây dựng các service caocấp hơn một cách dễ dàng Sau khi có được kiến trúc Grid, việc tiếp theo làxây dựng các hàm API và các bộ SDK để cung cấp các công cụ cần thiết đểphát triển các ứng dụng chạy trên nền Grid
Sở dĩ vấn đề “liên kết hoạt động” được xem là vấn đề cơ bản vì các mốiquan hệ chia sẻ có thể phải được thiết lập giữa các bên tham gia khác nhau
về các chính sách, giữa các môi trường khác nhau về nền tảng, ngônngữ, môi trường lập trình,…Nếu không có nó, các thành viên trong VO sẽthực hiện các chính sách chia sẻ song phương và không chắc rằng các cơ chế
sử dụng cho 2 thành viên này sẽ mở rộng được cho các thành viên khác Điềunày khiến cho việc thành lập các VO động là không thể thực hiện hoặc cũngchỉ thành lập được VO theo một kiểu nào đó mà thôi Cũng giống như Web
đã làm bùng nổ việc chia sẻ thông tin bằng cách cung cấp các protocol và cúpháp chuẩn (HTTP và HTML) dùng cho việc trao đổi thông tin, ở đây cũngcần các protocol và cú pháp chuẩn để chia sẻ tài nguyên
Để giải quyết vấn đề “liên kết hoạt động”, việc xây dựng các protocol làquan trọng Vì protocol xác định cách các thành phần phân tán trao đổi vớinhau để đạt được một mục đích nào đó, xác định các cấu trúc thông tin cầnthiết trong quá trình trao đổi Các VO thường hay thay đổi, nên các cơ chế xácđịnh, chia sẻ và sử dụng tài nguyên cần phải mềm dẻo, gọn nhẹ, để các thỏathuận chia sẻ tài nguyên có thể được thiết lập, thay đổi một cách nhanh chóng.Các cơ chế chia sẻ không được ảnh hưởng đến các chính sách cục bộ, và phảicho phép các thành viên quản lý được các tài nguyên của họ Vì các protocolquy định việc giao tiếp giữa các thành viên chứ không quy định thành viên
đó phải như thế nào, nên khi dùng các protocol, các chính sách cục bộđược giữ lại Do đó các protocol được cần đến
Khi đã có các protocol, thì việc xây dựng các service là cần thiết và quantrọng, các service là bản cài đặt cụ thể của các protocol Việc xây dựng cácservice cơ bản phục vụ truy cập đến tài nguyên tính toán, dữ liệu, tìm kiếm tàinguyên, lập lịch và đồng bộ hoá, sao chép dữ liệu,… cho phép xây dựng cácservice cao cấp hơn cho ứng dụng đồng thời trừu tượng hoá các chi tiết về tàinguyên
Cũng cần phải xây dựng các bộ API và SDK, vì các nhà phát triển ứngdụng cần phải có công cụ để hỗ trợ phát triển các ứng dụng phức tạp trongmôi trường Grid, người dùng cũng phải có khả năng thực thi được các ứngdụng này Sức mạnh, tính đúng đắn của ứng dụng, chi phí phát triển và bảotrì là những mối quan tâm quan trọng Các API và SDK có thể giúp tăng tốcviệc phát triển mã, cho phép chia sẻ mã, tăng tính khả chuyển cho ứng dụng
Trang 27Tất nhiên, API và SDK chỉ hỗ trợ thêm chứ không thể thay thế các protocolđược.
Ki n trúc Grid t ng quát ết bị đặc biệt ổng quát
Sau gần 10 năm tập trung nghiên cứu, phát triển, tích luỹ kinh nghiệm,các nhà phát triển công nghệ Grid đã có những thống nhất đáng kể về kiếntrúc Grid Một trong những kiến trúc Grid được chấp nhận nhiều nhất đượcđưa ra bởi Ian Foster, phần dưới đây sẽ giới thiệu về kiến trúc này
Kiến trúc Grid, theo Ian Foster, là một kiến trúc phân tầng như tronghình I.7.1 Các thành phần trong một tầng có chung đặc điểm, tính chất, có thểđược xây dựng từ bất cứ tầng dưới nào Các thành phần được phân tầng dựatheo vai trò của chúng trong hệ thống Grid Đây là một kiến trúc mở
Kiến trúc này chỉ quy định các yêu cầu chung nhất về thiết kế và triểnkhai với mục đích chính là để tham khảo Việc xây dựng, cài đặt cụ thể tuỳthuộc vào từng dự án, từng lĩnh vực ứng dụng
Dưới đây là chi tiết của kiến trúc:
Hình I.7.1: Kiến trúc Grid tổng quát
Tầng Fabric
Đây là tầng thấp nhất của kiến trúc, đại diện cho các thiết bị vật lý và toàn
bộ tài nguyên của Grid mà các tổ chức, người dùng muốn chia sẻ, sử dụng Cáctài nguyên có thể tồn tại dưới dạng vật lý như các máy tính, hệ thống lưu trữ,các danh mục, tài nguyên mạng, các loại sensor, cũng có thể là các thực thểlogic, một thực thể trừu tượng, đại diện cho một tập các tài nguyên vật lý, như
hệ thống file phân tán, các cluster,… Trong trường hợp các thực thể logic,việc triển khai có thể liên quan đến các protocol cục bộ (ví dụ các protocolphục vụ dạng truy cập NFS, hoặc protocol quản lý tài nguyên, tiến trình trongcluster,…) nhưng các protocol này không liên quan đến kiến trúc Grid
Các thành phần của tầng Fabric thực hiện các hoạt động cục bộ trên
Trang 28các tài nguyên cụ thể (vật lý lẫn logic) như là bước tiếp sau của các hoạtđộng chia sẻ tài nguyên của các tầng trên Do đó, có một mối liên hệ phụthuộc chặt chẽ giữa các chức năng của tầng Fabric với các hoạt động chia sẻđược hỗ trợ Các chức năng của tầng Fabric càng mạnh, càng nhiều sẽ chophép các hoạt động chia sẻ phức tạp, phong phú hơn Kinh nghiệm cho thấy,việc quản lý tài nguyên ở tầng này ít nhất cũng phải có cơ chế cung cấpthông tin để xác được cấu trúc, trạng thái, năng lực của tài nguyên và cơ chếđiều khiển chất lượng dịch vụ.
Tầng Connectivity
Tầng Connectivity định nghĩa các protocol liên lạc và chứng thực cơbản cần thiết cho các giao dịch mạng đặc trưng của Grid Các protocol liên lạccho phép trao đổi dữ liệu giữa các tài nguyên tầng Fabric Các protocol chứngthực xây dựng trên các dịch vụ liên lạc nhằm cung cấp các cơ chế mã hóa, bảomật, xác minh và nhận dạng các người dùng và tài nguyên Việc liên lạc đòihỏi các công việc như vận chuyển, định tuyến, đặt tên Trong tương lai, việcliên lạc của Grid có thể cần các protocol mới, nhưng hiện nay nên xây dựngtrên các protocol có sẵn của bộ TCP/IP protocol stack, cụ thể là các tầngNetwork (IP và ICMP), Transport (TCP,UDP) và Application (DNS,OSPF,…)
Về khía cạnh bảo mật của tầng Connectivity, các giải pháp phải dựatrên các chuẩn bảo mật hiện hành khi có thể Cũng giống như liên lạc, rất nhiềuchuẩn bảo mật đã được phát triển với bộ Internet protocol có thể áp dụng được.Việc chứng thực, phân quyền trong môi trường Grid là rất phức tạp Cáccông nghệ bảo mật truyền thống chủ yếu tập trung bảo vệ các giao dịch giữa cácmáy client và server Trong Grid, việc phân biệt client/server không tồn tại, vìcác mỗi tài nguyên trong một lúc nào đó có thể là server (khi nó nhận yêu cầu),một lúc khác lại là client (khi nó đề xuất yêu cầu đến các tài nguyên khác) Do
đó, các giải pháp chứng thực cho các môi trường VO nên đạt được các yêu cầu
về bảo mật trong Grid như đã giới thiệu ở trên
Tầng Resource
Tầng Resource dựa trên các protocol liên lạc và chứng thựccủa tầng Connectivity để xây dựng các protocol, API và SDK nhằm hỗtrợ việc thương lượng, khởi tạo, theo dõi, điều khiển, tính toán chi phí và chitrả cho các hoạt động chia sẻ trên từng tài nguyên riêng lẻ một cách an toàn.Bản cài đặt các protocol của tầng Resource sẽ gọi các chức năng của tầngFabric để truy cập và điều khiển các tài nguyên cục bộ
Các protocol tầng Resource tập trung toàn bộ vào các tài nguyên riêng lẻ,không quan tâm đến trạng thái toàn cục và các hoạt động trong các tập tàinguyên phân tán
Các protocol tầng Resource được phân thành 2 dạng chính như sau:
- Các protocol thông tin: Sử dụng để thu thập thông tin về cấu trúc và
Trang 29trạng thái các tài nguyên ví dụ như cấu hình hiện tại, tải hiện tại, chínhsách sử dụng,…
- Các protocol quản lý: Sử dụng để thượng lượng truy xuất đến một tàinguyên chia sẻ, xác định rõ, ví dụ, các yêu cầu về tài nguyên (bao gồmluôn việc giữ chỗ tài nguyên và chất lượng dịch vụ) và các thao táccần được thực hiện như tạo tiến trình, hoặc truy xuất dữ liệu Do cácprotocol quản lý chịu trách nhiệm đại diện cho các quan hệ chia sẻ,đảm bảo các hoạt động sử dụng tài nguyên phải phù hợp với các chínhsách chia sẻ tài nguyên, bao gồm luôn việc tính toán và chi trả chiphí Mỗi protocol cũng nên hỗ trợ việc theo dõi trạng thái và điềukhiển các hoạt động
Với những yêu cầu như vậy, tập các protocol tầng Resource (vàConnectivity) nên nhỏ gọn và tập trung Các protocol này chỉ nên đáp ứng đượccác cơ chế chia sẻ với nhiều loại tài nguyên khác nhau (ví dụ, các hệ thốngquản lý tài nguyên cục bộ khác nhau) là đủ
Các chức năng chính của tầng Resource cũng giống như của tầng Fabriccộng thêm nhiều ngữ nghĩa mới với cơ chế báo lỗi tin cậy khi hoạt độngkhông thành công
Tầng Collective
Trong khi tầng Resource tập trung vào các tài nguyên đơn lẻ, tầngCollective chứa các protocol, service, API, SDK không liên hệ đến bất kỳmột tài nguyên cụ thể nào mà thực hiện quản lý toàn cục, tập trung vào cácgiao tác giữa các tập tài nguyên
Tầng Collective có thể bổ sung thêm nhiều loại hoạt động chia sẻmới ngoài những gì đã có từ tầng Resource mà không cần bổ sung thêm cácyêu cầu mới cho các tài nguyên đang được chia sẻ Ví dụ:
- Directory service: Cho phép các thành phần tham gia VO phát hiện sựtồn tại và/hoặc đặc tính của các tài nguyên trong VO Một directoryservice có thể cho phép người truy vấn tài nguyên qua tên và/hay cácthuộc tính như kiểu, khả năng, tải, …
- Co-allocation, scheduling, và broker service: Cho phép các thành phầntham gia VO yêu cầu cấp phát các tài nguyên cho các mục đích cụ thể
và lập lịch cho các tác vụ trên các tài nguyên tương ứng
- Monitoring ang dianostics sevice: Hỗ trợ việc kiểm soát các tài nguyêncủa VO, kiểm tra xem có bị lỗi, bị tấn công, bị quá tải,… hay không
- Data replication service: Hỗ trợ quản lý tài nguyên lưu trữ của VO đểtối ưu hiệu suất truy cập dữ liệu theo các độ đo như thời gian đáp ứng,tính toàn vẹn, tin cậy, chi phí,…
- Grid-enable programming system: Cho phép các sử dụng các mô hìnhlập trình hiện tại trong môi trường Grid, sử dụng nhiều loại dịch vụ