Nguyềẫn Linh Giang... d ng Internet nh hi n nay tr nến khỗng câền thiếết.
Trang 1ĐI N TOÁN ĐÁM MÂY VÀ B O M T ĐI N TOÁN ĐÁM MÂY Ệ Ả Ậ Ệ
Gi ng viền h ả ướ ng dẫẫn: PGS.TS Nguyềẫn Linh Giang
Trang 2PHÂỀN M ĐÂỀU Ở 4
1 Lý do ch n đềề tài ọ 4
2 M c đích nghiền c u ụ ứ 4
3 Đốối t ượ 4 ng 4 Ph ươ ng pháp nghiền c u ứ 4
5 Bốố c c đềề tài ụ 4
CH ƯƠ NG 1: T NG QUAN VỀỀ ĐI N TOÁN ĐÁM MÂY VÀ B O M T ĐI N TOÁN ĐÁM MÂY Ổ Ệ Ả Ậ Ệ 6
1.1 T ng quan đi n toán đám mẫy ổ ệ 6
1.2 L ch s phát tri n đi n toán đám mẫy ị ử ể ệ 6
1.3 Thềố nào là b o m t đi n toán đám mẫy? ả ậ ệ 7
CH ƯƠ NG 2: ĐI N TOÁN ĐÁM MÂY - XU THỀẾ QUAN TR NG TRONG NỀỀN CÔNG NGHI P CÔNG Ệ Ọ Ệ NGH THÔNG TIN Ệ 8
2.1 Đ c tnh c a đi n toán đám mẫy (Cloud computng – CC) ặ ủ ệ 8
2.2 Các cống ngh th ệ ườ ng đ ượ ử ụ c s d ng đ tri n khai đi n toán đám mẫy ể ể ệ 8
2.3 Cách th c ho t đ ng c a đi n toán đám mẫy bao gốềm: L u tr và x lý d li u ứ ạ ộ ủ ệ ư ữ ử ữ ệ 9
2.3.1 H thốống l u tr phẫn tán NFS và AFS ệ ư ữ 9
2.3.2 H thốống l u tr HDFS ệ ư ữ 10
2.3.3 C s d li u NoSql ơ ở ữ ệ 12
2.3.4 Mố hình tnh toán MapReduce/Hadoop 14
2.4 Phẫn lo i các mố hình đi n toán đám mẫy ạ ệ 15
2.5 u và nh Ư ượ c đi m c a đi n toán đám mẫy ể ủ ệ 16
2.6 Th c tềố vi c áp d ng, s d ng cống ngh đám mẫy ự ệ ụ ử ụ ệ 17
CH ƯƠ NG 3: B O M T ĐI N TOÁN ĐÁM MÂY: C H I VÀ THÁCH TH C Ả Ậ Ệ Ơ Ộ Ứ 19
3.1 T ng quan vềề b o m t đi n toán đám mẫy ổ ả ậ ệ 19
3.2 Các vẫốn đềề vềề an toàn và b o m t trền các tẫềng d ch v đám mẫy ả ậ ị ụ 19
3.3 Các c chềố b o m t đi n toán đám mẫy ơ ả ậ ệ 21
3.3.1 Quy trình qu n lý r i ro vềề an toàn và b o m t: ả ủ ả ậ 21
3.3.2 C chềố, kyẫ thu t đ đ m b o an toàn b o m t ơ ậ ể ả ả ả ậ 21
3.3.3 Kiềốn trúc h thốống đám mẫy nhằềm đ m b o an toàn b o m t ệ ả ả ả ậ 28
3.4 M t sốố mố hình b o m t th c tềố ộ ả ậ ự 34
Trang 33.4.1 Mố hình b o m t 3 l p d li u đi n toán đám mẫy ả ậ ớ ữ ệ ệ 34
3.4.2 Mố hình b o v d li u s d ng VPN Cloud ả ệ ữ ệ ử ụ 35
3.5 L i ích c a b o m t đi n toán đám mẫy ợ ủ ả ậ ệ 35
3.5.1 Các b n vá và b o m t ả ả ậ 36
3.5.2 B o v chốống l i DDoS ả ệ ạ 36
3.5.3 B o m t v t lí ả ậ ậ 37
3.5.4 B o m t d li u ả ậ ữ ệ 37
3.6 Các khía c nh c a b o m t đi n toán đám mẫy ạ ủ ả ậ ệ 37
3.6.1 An ninh và s riềng t ự ư 37
3.6.2 Chính sách 38
3.7 Thách th c và gi i pháp b o m t đi n toán đám mẫy ứ ả ả ậ ệ 39
3.7.1 Thách th c ứ 39
3.7.2 Gi i pháp ả 40
PHÂỀN KỀẾT LU N Ậ 42
Tài li u tham kh o ệ ả 43
Trang 4b n nhiếều m c đ ki m soát, đ linh ho t và kh năng qu n lý khác nhau Vi cạ ứ ộ ể ộ ạ ả ả ệnăếm băết s khác bi t gi a c s h tâềng dự ệ ữ ơ ở ạ ưới d ng d ch v , nếền t ng dạ ị ụ ả ưới d ngạ
d ch v và phâền mếềm dị ụ ưới d ng d ch v cũng nh các chiếến lạ ị ụ ư ược tri n khai màểchúng ta có th s d ng seỗ giúp quyếết đ nh xem b d ch v nào phù h p nhâết v iể ử ụ ị ộ ị ụ ợ ớnhu câều c a chúng ta.ủ
S phát tri n c a d ch v đi n toán đám mây là xu thếế chung, và các doanh nghi pự ể ủ ị ụ ệ ệbăết đâều chuy n và l u gi khỗếi lể ư ữ ượng d li u l n, các ng d ng c a t ch c lếnữ ệ ớ ứ ụ ủ ổ ứđám mây đ dếỗ làm vi c m i n i khi khỗng có t i văn phòng… Đi kèm v i sể ệ ở ọ ơ ạ ớ ựphát tri n, bến c nh đó luỗn luỗn tỗền t i các mỗếi đe d a an ninh d li u Đây seỗ làể ạ ạ ọ ữ ệvâến đếề râết quan tr ng và khỗng th thiếếu trong doanh nghi p Thếế nh ng hi nọ ể ệ ư ệ
ch a có nhiếều báo cáo t ng quan vếề đếề tài này vì v y nhóm 20 đã t ng h p l i vàư ổ ậ ổ ợ ạtrình bày trong bài báo cáo này
2 M c đích nghiền c u ụ ứ
V n d ng nh ng hi u biếết, tm hi u và nh ng kiếến th c đậ ụ ữ ể ể ữ ứ ược h c trến l p đ viếếtọ ớ ể
ra tài li u này Tài li u này giúp m i ngệ ệ ọ ười có th hi u rõ h n và có cái nhìn t ngể ể ơ ổquan vếề Đi n toán đám mây và vâến đếề B o m t đi n toán đám mâyệ ả ậ ệ
3 Đốối t ượ ng
Đỗếi t ượng chính c a nhóm hủ ướng t i là Đi n toán đám mây và vâến đếề b o m tớ ệ ả ậ
c a đi n toán đám mây.ủ ệ
Trang 5Chương 2: Đi sâu vào tm hi u nh ng đ c đi m, nh ng ch c năng, xu hể ữ ặ ể ữ ứ ướng pháttri n tể ương lai c a đi n toán đám mâyủ ệ
Ch ương 3: Tìm hi u nh ng lỗỗ h ng đang tỗền t i, cách th c tâến cỗng và gi i phápể ữ ổ ạ ứ ảvếề đi n vâến đếề này.ệ
Trang 6CH ƯƠ NG 1: T NG QUAN VỀỀ ĐI N TOÁN ĐÁM MÂY VÀ B O M T ĐI N TOÁN Ổ Ệ Ả Ậ Ệ ĐÁM MÂY
1.1 T ng quan đi n toán đám mẫy ổ ệ
M t cách đ n gi n, Đi n toán đám mây là vi c phân phỗếi các tài nguyến CNTTộ ơ ả ệ ệtheo nhu câều qua Internet v i chính sách thanh toán theo m c s d ng Thay vìớ ứ ử ụmua, s h u và b o trì các trung tâm d li u và máy ch v t lý, b n có th tếếp c nở ữ ả ữ ệ ủ ậ ạ ể ậcác d ch v cỗng ngh , nh năng lị ụ ệ ư ượng đi n toán, l u tr và c s d li u, khi câềnệ ư ữ ơ ở ữ ệthiếết, t nhà cung câếp d ch v đám mây nh Amazon Web Services (AWS).ừ ị ụ ư
Nh v y, trư ậ ước đây đ có th tri n khai m t ng d ng (ví d m t trang Web), b nể ể ể ộ ứ ụ ụ ộ ạ
ph i đi mua/thuế m t hay nhiếều máy ch (server), sau đó đ t máy ch t i cácả ộ ủ ặ ủ ạtrung tâm d li u (data center) thì nay đi n toán đám mây cho phép b n gi n lữ ệ ệ ạ ả ượcquá trình mua/thuế đi
Đi n toán đám mây khỗng nến nhâềm lâỗn v i đi n toán lệ ớ ệ ướ i, tnh toán t n ích,ệ
ho c t tr tnh toán liến quan đếến s tặ ự ị ự ương tác c a m t sỗế tài nguyến o hóa.ủ ộ ảĐám mây máy ch ™ kếết nỗếi và chia s thỗng tn d a trến m c đ l u lủ ẻ ự ứ ộ ư ượng truy
c p trang web trến toàn b m ng Đi n toán đám mây thậ ộ ạ ệ ường đ ược cung câếp như
m t d ch v “qua Internet”, thộ ị ụ ường là dưới hình th c c s h tâềng nh m t d chứ ơ ở ạ ư ộ ị
v (IaaS), nếền t ng nh m t d ch v (PaaS), ho c phâền mếềm nh m t d ch vụ ả ư ộ ị ụ ặ ư ộ ị ụ(SaaS)
1.2 L ch s phát tri n đi n toán đám mẫy ị ử ể ệ
Khái ni m vếề đi n toán đám mây đệ ệ ược gi i thi u lâền đâều tến vào nămớ ệ
1961, nh ng năm sau đó, nhiếều cỗng tn cỗng ngh đữ ệ ược thành l p vàậinternet đã băết đâều được kh i nguỗền ở
Năm 1971, b vi x lý đâều tến độ ử ược intel gi i thi u, cùng v i vi c m t ngớ ệ ớ ệ ộ ứ
d ng g i tn nhăến gi a 2 máy tnh cũng đụ ử ữ ược m t kyỗ s c a h t o ra,ộ ư ủ ọ ạ
tương t nh email ngày nay.ự ư
Năm 1974, Microsof được thành l p 2 năm sau, Apple đậ ược thành l p,ậcũng trong năm này, khái ni m ethernet đệ ược trình bày m t cách rõ ràng.ộ
Năm 1981, IBM đ a ra mâỗu PC đâều tến và ch 1 năm sau, h điếều hành MS-ư ỉ ệDOS được Microsof trình làng Năm 1984, h điếều hành Macintosh ra đ iệ ờ
và ngay trong năm tếếp theo, phiến b n Windows đâều tến ra đ i (Windowsả ờ1.0)
Trang 7 Năm 1991, World Wide Web (www) m t phộ ương th c kếết nỗếi ch a t ng có,ứ ư ừ
được phát hành b i CERN Ngay sau đó 2 năm, trình duy t đâều tến cũngở ệ
đ ược phát tri n và câếp phép cho các cỗng ty t nhân s d ng.ể ư ử ụ
Năm 1994, Netscape được thành l p Năm 1995, Ebay và Amazon đậ ượcthành l p T i cuỗếi th p niến 90, vi c phát tri n m nh meỗ c a internet vàậ ớ ậ ệ ể ạ ủcác thiếết b chính là điếều ki n đ đi n toán đám mây phát tri n ị ệ ể ệ ể
Salesforce.com đ ược ra măết và tr thành trang web thở ương m i đâều tếnạcung câếp các ng d ng kinh doanh Nh ng gì mà t i nay đứ ụ ữ ớ ược g i là đi nọ ệtoán đám mây
Năm 2002, Amazon gi i thi u Amazon Web Services (AWS).ớ ệ
Năm 2004, Facebook ra đ i, dâỗn đếến nhu câều trao đ i thỗng tn cá nhân,ờ ổ
t o ra đ nh nghĩa: Đám mây dành cho cá nhân ạ ị
Năm 2006, thu t ng "đi n toán đám mây" m i th c s trỗỗi d y m nh meỗ.ậ ữ ệ ớ ự ự ậ ạChính trong th i gian này, Amazon đã phát hành các d ch v Elastcờ ị ụCompute Cloud (EC2) - cho phép các cỗng ty thuế kh năng tnh toán và s cả ứ
m nh x lý” đ ch y các ng d ng doanh nghi p c a h Cũng trong nămạ ử ể ạ ứ ụ ệ ủ ọ
2006, Google đã tung ra d ch v Google Docs, ch ng minh s c m nh c aị ụ ứ ứ ạ ủ
đi n toán đám mây và chia s tài li u tr c tếếp t i ngệ ẻ ệ ự ớ ười dùng
T nh ng năm 2010, các cỗng ty cỗng ngh đếều đ y m nh các d ch v c aừ ữ ệ ẩ ạ ị ụ ủmình đ ph c v khách hàng m t cách tỗết nhâết S ra đ i c a smartphone,ể ụ ụ ộ ự ờ ủmáy tnh b ng vếề sau cũng giúp cho các d ch v đi n toán đám mây phátả ị ụ ệtri n vể ượt b c.ậ
1.3 Thềố nào là b o m t đi n toán đám mẫy? ả ậ ệ
B o m t đi n toán đám mây (Cloud Security) Khái ni m này nhăềm ch các bi nả ậ ệ ệ ỉ ệpháp b o v d li u đả ệ ữ ệ ượ ưc l u tr tr c tuyếến tránh kh i hành vi tr m căếp, rò r vàữ ự ỏ ộ ỉxóa thỗng tn
Các mỗếi đe d a chính đỗếi v i b o m t đi n toán đám mây bao gỗềm vi ph m dọ ớ ả ậ ệ ạ ữ
li u, mâết d li u, chiếếm đo t tài kho n, chiếếm quyếền điếều khi n l u lệ ữ ệ ạ ả ể ư ượng d chị
v , giao di n chụ ệ ương trình ng d ng khỗng an toàn, l a ch n các nhà cung câếpứ ụ ự ọ
l u tr đám mây kém và cỗng ngh chia s , có th làm t n h i đếến b o m t đi nư ữ ệ ẻ ể ổ ạ ả ậ ệtoán đám mây
Các cu c tâến cỗng t chỗếi d ch v (DDoS) – là nỗỗ l c làm cho ngộ ừ ị ụ ự ười dùng khỗng
th s d ng tài nguyến c a máy tnh - là m t mỗếi đe d a khác đỗếi v i b o m tể ử ụ ủ ộ ọ ớ ả ậ
đi n toán đám mây Các cu c tâến cỗng này đánh s p m t d ch v băềng cách làmệ ộ ậ ộ ị ụ
Trang 8tài kho n d li u tràn ng p đ ngả ữ ệ ậ ể ười dùng khỗng th truy c p vào tài kho n c aể ậ ả ủ
h , ch ng h n nh tài kho n ngân hàng ho c tài kho n email.ọ ẳ ạ ư ả ặ ả
CH ƯƠ NG 2: ĐI N TOÁN ĐÁM MÂY - XU THỀẾ QUAN TR NG TRONG NỀỀN CÔNG Ệ Ọ NGHI P CÔNG NGH THÔNG TIN Ệ Ệ
2.1 Đ c tnh c a đi n toán đám mẫy (Cloud computng – CC) ặ ủ ệ
US NIST (Vi n Tiếu chu n và Kyỗ thu t quỗếc gia c a Hoa Kỳ) đ a ra 5 đ c tnh c aệ ẩ ậ ủ ư ặ ủ
CC nh sau:ư
T ph c v theo yều cẫều: ự ụ ụ
Khách hàng có nhu câều t c th i muỗến s d ng các tài nguyến tnh toán thìứ ờ ử ụ
có th s d ng m t cách t đ ng mà khỗng câền tể ử ụ ộ ự ộ ương tác v i con ngớ ườ ểi đxin đ ược câếp phát
S truy c p m ng r ng rãi: ự ậ ạ ộ
Tài nguyến tnh toán đ ược phân phỗếi qua m ng Internet và đạ ược câếp phát
và s d ng b i râết nhiếều các thiếết b trến nhiếều nếền t ng khác nhau.ử ụ ở ị ả
T p trung tài nguyền: ậ
Râết nhiếều tài nguyến tnh toán và l u tr nh CPU, b nh , … đư ữ ư ộ ớ ược t pậtrung và qu n lý b i nhà cung câếp d ch v đám mây; kếết qu c a vi c t pả ở ị ụ ả ủ ệ ậtrung này là nh ng tài nguyến v t lý trong suỗết v i ngữ ậ ớ ườ ử ụi s d ng, có nghĩa
là ng ười dùng hoàn toàn s d ng đử ụ ược tài nguyến nh h mong muỗếnư ọ
nh ng khỗng biếết v trí tài nguyến v t lý cũng nh cách v n hành c a hư ị ậ ư ậ ủ ệthỗếng bến phía nhà cung câếp
Trang 9 Là cỗng ngh cỗết lõi c a CCệ ủ
B n châết là t o ra nh ng máy o, d ch v o có tnh năng c a các th cả ạ ữ ả ị ụ ả ủ ự
th v t lý nh vi x lý, b nh , …ể ậ ư ử ộ ớ
Cỗng ngh t đ ng hóa giám sát điếều phỗếi tài nguyếnệ ự ộ
Cỗng ngh tnh toán phân tán, h phân tánệ ệ
Tài nguyến tnh toán c a đám mây là t ng th c a râết nhiếều các h tâềngủ ổ ể ủ ạ
Đ ược hỗỗ tr b i hâều hếết các h điếều hànhợ ở ệ
u đi m: trong suỗết v i ngƯ ể ớ ười dùng do h thỗếng t p tn NFS đệ ậ ược ánh
x nh m t th m c trong h thỗếng qu n lý t p tn c c b và khỗng cóạ ư ộ ư ụ ệ ả ậ ụ ộkhác bi tệ
Nh ược đi m: tnh kh m thâếp do các thao tác đ c – ghi ph i th c hi nể ả ở ọ ả ự ệqua kếết nỗếi m ng v i máy ch l u tr NFS, hi u năng seỗ khỗng đ m b oạ ớ ủ ư ữ ệ ả ảtrong điếều ki n tệ ương tranh
Andrew File System (AFS)
Là m t kiếến trúc h thỗếng t p tn phân tán nhăềm m c đích chia s t p tnộ ệ ậ ụ ẻ ậcho m t lộ ượng l n ngớ ười dùng m ngạ
Trang 10 Khi truy c p t p tn, toàn b t p tn seỗ đậ ậ ộ ậ ược sao chép vếề phía máy người
s d ng Khi t p tn đóng l i, n i dung seỗ đử ụ ậ ạ ộ ược c p nh t vếề phía máy chậ ậ ủ
Nh đ c tr ng này mà tnh kh m cao h nờ ặ ư ả ở ơ
2.3.2 H thốống l u tr HDFS ệ ư ữ
a Kiếến trúc HDFS
Trong kiếến trúc HDFS, vì mỗỗi kích thướ ậc t p tn l n nến mỗỗi t p tn đớ ậ ược chia
ra thành các khỗếi và mỗỗi khỗếi này có m t ID đ nh n di nộ ể ậ ệ
Mỗỗi khỗếi seỗ đượ ưc l u thành các b n sao replica nhăềm m c đích an toàn choả ụ
d li uữ ệ
Các khỗếi đượ ưc l u tr phân tán trến các máy ch l u tr cài HDFSữ ủ ư ữ
Trến m t cluster có duy nhâết m t Namenode và có th có nhiếều Datanode,ộ ộ ểtrong đó:
Namenode đóng vai trò là master, ch u trách nhi m duy trì thỗng tn vếề câếuị ệtrúc cây phân câếp t p tn, th m c c a h thỗếng t p tn và siếu d li u khácậ ư ụ ủ ệ ậ ữ ệ
c a h thỗếng t p tnủ ệ ậ
Datanode seỗ l u tr các khỗếi th t s c a t ng t p tn c a HDFS Datanodeư ữ ậ ự ủ ừ ậ ủ
ch u trách nhi m điếều phỗếi các thao tác truy c p (đ c và ghi d li u) c aị ệ ậ ọ ữ ệ ủ
ng ườ ử ụi s d ng lến h thỗếng HDFSệ
Quá trình đ c fleọ
Trang 11(1): client m t p tn câền đ c băềng cách g i yếu câều t i Namenodeở ậ ọ ử ớ
(2): Namenode seỗ ki m tra yếu câều, nếếu h p l , seỗ g i danh sách cácể ợ ệ ửblock c a t p tn cùng v i đ a ch c a Datanode ch a các b n sao c aủ ệ ớ ị ỉ ủ ứ ả ủblock này
(3): Clientnode m các kếết nỗếi t i Datanode và yếu câều nh n block câềnở ớ ậ
đ c và đóng kếết nỗếi v i Datanodeọ ớ
Quá trình ghi fle
Trang 12(1) Client g i yếu câềo t o ch m c t p tn lến khỗng gian tến c a hử ạ ỉ ụ ậ ủ ệthỗếng t p tn đếến Namenodeậ
(2) Namenode seỗ quyếết đ nh danh sách các Datanode seỗ ch a các blockị ứ
c a t p tn và g i l i cho clientủ ậ ử ạ(3) Client seỗ chia d li u c a t p tn câền t o ra thành các block, mỗỗiữ ệ ủ ậ ạblock seỗ đượ ưc l u ra thành nhiếều b n sao trến các Datanode khácảnhau Client g i block cho Datanode th nhâết, Datanode th nhâếtử ứ ứsau khi nh n đậ c block seỗ tếến hành l u l i b n sao th nhâết c aượ ư ạ ả ứ ủblock Quá trình tương t v i Datanode th hai và th ba.ự ớ ứ ứ
(4) Sau khi Datanode cuỗếi cùng nh n đậ ược thành cỗng block, nó seỗ g iử
l i cho Datanode th hai m t gói xác nh n răềng đã l u thành cỗngạ ứ ộ ậ ư
2.3.3 C s d li u NoSql ơ ở ữ ệ
RDBMS – các h qu n tr d li u quan h v i đ c tnh ACID cho phép x lýệ ả ị ữ ệ ệ ớ ặ ửgiao d ch d li u m t cách tn c y ị ữ ệ ộ ậ
Trang 13 ACID (viếết tăết c a Atomicity, Consistency, Isolaton, Durability) là m t kháiủ ộ
ni m c s d li u mà cácệ ơ ở ữ ệ chuyến gia th ường tm kiếếm khi đánh giá các cơ
s d li u và kiếến trúc ng d ng Đỗếi v i m t c s d li u đáng tn c y tâếtở ữ ệ ứ ụ ớ ộ ơ ở ữ ệ ậ
c bỗến thu c tnh câền đ t đả ộ ạ ược
Atomicity là m t đếề xuâết tâết c ho c khỗng có gì Tính châếtộ ả ặ này đ m b oả ảrăềng khi m t giao d ch liến quan đếến hai hay nhiếều x lý, ho c là tâết c cácộ ị ử ặ ả
x lýử được th c hi n ho c khỗng có x lýự ệ ặ ử được th c hi n.ự ệ
Consistency đ m b o răềng m t giao d ch khỗng bao gi đả ả ộ ị ờ ược thỗng qua cơ
s d li u c a b n trong tnh tr ng d dang Tính châết này, ho c là t o raở ữ ệ ủ ạ ạ ở ặ ạtoàn b tr ng thái m i ho c rollback tâết c các x lý đ vếề tr ng thái banộ ạ ớ ặ ả ử ể ạđâều, nh ng khỗng bao gi thỗng quaư ờ c s d li u trong tr ng thái dơ ở ữ ệ ạ ởdang
Isolaton gi giao d ch tách r i nhau cho đếến khi chúng đã hoàn tâết Tínhữ ị ờ
châết này đ m b o răềng hai ho c nhiếều giao d ch khỗng bao gi đả ả ặ ị ờ ược tr nộlâỗn v i nhau, t o ra d li u khỗng chính xác và khỗng phù h p.ớ ạ ữ ệ ợ
Durability đ m b o răềng c s d li u seỗ theo dõi các thay đ i câếp phátả ả ơ ở ữ ệ ổ
trong m t cách mà các máy ch có th ph c hỗềi t m t s kếết thúc bâếtộ ủ ể ụ ừ ộ ự
th ường Tính châết này đ m b o răềng trong trả ả ường h p thâết b i hay d ch vợ ạ ị ụ
kh i đ ng l i các d li u có săỗn trong trở ộ ạ ữ ệ ước khi g p lỗỗi.ặ
Tuy nhiến lượng d li u l u tr ngày càng l n và vữ ệ ư ữ ớ ượt ra kh i gi i h n x lýỏ ớ ạ ử
c a m t máy ch RDBMS duy nhâết.ủ ộ ủ
NoSQL ra đ i v i tnh kh m cao, so v i RDBMS có nh ng khác bi t c b nờ ớ ả ở ớ ữ ệ ơ ảsau:
Mỗ hình d li u đ n gi n hóa: NoSql khỗng t ch c d li u dữ ệ ơ ả ổ ứ ữ ệ ướ ại d ng các
b ng quan h mà dả ệ ưới bỗến nhóm sau:
Trang 14d ng Internet nh hi n nay tr nến khỗng câền thiếết NoSql l a ch n tnh khụ ư ệ ở ự ọ ả
m thay vì cam kếết b o đ m ACID.ở ả ả
2.3.4 Mố hình tnh toán MapReduce/Hadoop
Mỗ hình tnh toán MapReduce/Hadoop đ ược sinh ra đ gi i quyếết vâến đếềể ả
d li u l n trong đi n toán đám mây Mapreduce có th hi u là m tữ ệ ớ ệ ể ể ộ
phương th c th c thi đ giúp các ng d ng có th x lý nhanh m t lứ ự ể ứ ụ ể ử ộ ượng
d li u l n trến mỗi trữ ệ ớ ường phân tán Các máy tnh này seỗ ho t đ ng songạ ộsong nh ng đ c l p v i nhau, m c đích là làm rút ngăến th i gian x lý toànư ộ ậ ớ ụ ờ ử
b d li u.ộ ữ ệ
Ưu đi m c a MapReduceể ủ
X lý tỗết bài toán vếề lử ượng d li u l nữ ệ ớ
Map và Reduce đ n gi n nh ng đ c t đơ ả ư ặ ả ược hâều hếết các bài toán trếnmỗi trường phân tán
Mỗ hình th c hi n MapReduce có kh năng ch u lỗỗi cao Khi có lỗỗi x y raự ệ ả ị ả
t i m t nút tnh toán thì có th th c hi n l i nút đó mà khỗng làm nhạ ộ ể ự ệ ạ ở ả
h ưởng đếến toàn b h thỗếngộ ệ
Tính toán MapReduce được phân tán trến các nút l u tr Mã chư ữ ươngtnh được sao chép t i các nút l u tr đ th c thi ớ ư ữ ể ự khỗng câền ph i diảchuy n d li u l n đếến các nút tnh toánể ữ ệ ớ
Trang 15 Nguyến tăếc ho t đ ng c a MapReduceạ ộ ủ
Hàm Map, lâếy đâều vào là m t c p key/value và đ a đâều ra là m t t p cácộ ặ ư ộ ậ
c p key/value trung gian Các c p này sau đó g p l i và các c p trungặ ặ ộ ạ ặgian có cùng khóa seỗ được chuy n cho hàm Reduce.ể
Hàm Reduce tnh toán trến các c p trung gian và đ a ra các giá tr t ngặ ư ị ổquan h n là kếết qu cuỗếi cùng.ơ ả
2.4 Phẫn lo i các mố hình đi n toán đám mẫy ạ ệ
3 mỗ hình đ ược phân lo i d a trến các đỗếi tạ ự ượng khách hàng s d ng d ch v :ử ụ ị ụ
Infrastructure as a Service (IaaS)
Cung câếp tài nguyến x lý, l u tr , m ng và các tài nguyến c b n khácử ư ữ ạ ơ ả
Khách hàng t tri n khai và qu n lý các phâền mếềm nh h điếều hành vàự ể ả ư ệ
ng d ng nh ng khỗng th can thi p xuỗếng h tâềng
Platform as a Service (PaaS)
Cung câếp cho khách hàng kh năng tri n khai ng d ng c a h băềng vi cả ể ứ ụ ủ ọ ệ
s d ng ngỗn ng l p trình, th vi n, d ch v c a bến th ba.ử ụ ữ ậ ư ệ ị ụ ủ ứ
Người dùng khỗng câền qu n lý h tâềng phía dả ạ ưới nh máy ch o, hư ủ ả ệđiếều hành, … nh ng có th câếu hình cho mỗi trư ể ường ch y ng d ng c aạ ứ ụ ủhọ
Trang 16 Sofware as a Service (SaaS)
Cung câếp cho khách hàng s d ng các d ch v phâền mếềm c a nhà cungử ụ ị ụ ủcâếp ng d ng đứ ụ ược tri n khai trến h tâềng đám mâyể ạ
Khách hàng khỗng qu n lý ho c ki m soát h tâềng phía dả ặ ể ạ ưới
2.5 u và nh Ư ượ c đi m c a đi n toán đám mẫy ể ủ ệ
Ưu đi m:ể
Tri n khai nhanh chóng:ể
Thỗng th ường khi muỗến tri n khai m t ng d ng thì ngể ộ ứ ụ ười dùng ph iảtnh toán đếến vi c mua các thiếết b , cài đ t và câếu hình râết nhiếều phâềnệ ị ặmếềm khác nhau, điếều này có th dâỗn đếến mâết râết nhiếều th i gian,ể ờtếền b c mà có th hi u qu đem l i khỗng tỗếi u (hi u qu ph thu cạ ể ệ ả ạ ư ệ ả ụ ộvào trình đ kĩ thu t c a ngộ ậ ủ ười dùng)
D ch v đi n toán đám mây cung câếp săỗn h tâềng, ngị ụ ệ ạ ười dùng khỗng
ph i lo lăếng vếề vâến đếề câếu hình, ch n mua phâền c ng, b o trì, … màả ọ ứ ả
ch vi c quan tâm đếến phát tri n và tri n khai ng d ng c a mình lếnỉ ệ ể ể ứ ụ ủtrến đám mây
Gi m chi phíả
Trang 17 Đa ph ương t n truy c p: s đ c l p gi a thiếết b và v trí làm cho ngệ ậ ự ộ ậ ữ ị ị ườidùng có th truy c p h thỗếng băềng cách s d ng trình duy t web màể ậ ệ ử ụ ệkhỗng quan tâm đếến v trí hay thiếết b c a hị ị ủ ọ
Tính riếng t : h tâềng b o m t trong đi n toán đám mây vâỗn là bài toánư ạ ả ậ ệ
l n ch a đớ ư ược gi i quyếết tri t đả ệ ể
Các gói d ch v đị ụ ược đ nh nghĩa trị ước và vi c t câếu hình chi tếết cácệ ựthỗng sỗế ch a th c hi n đư ự ệ ược
2.6 Th c tềố vi c áp d ng, s d ng cống ngh đám mẫy ự ệ ụ ử ụ ệ
L i ích c a vi c s d ng đi n toán đám mây:ợ ủ ệ ử ụ ệ
B n có th nhanh chóng thu th p tài nguyến khi câền t các d ch v c sạ ể ậ ừ ị ụ ơ ở
h tâềng, nh đi n toán, l u tr , và c s d li u, đếến Internet of Things,ạ ư ệ ư ữ ơ ở ữ ệmachine learning, kho d li u và phân tch, … T đó cho phép nhanhữ ệ ừchóng tri n khai các phâền mếềm, ng d ngể ứ ụ
Quy mỗ linh ho t giúp tỗếi u hóa vi c s d ng tài nguyến: t i m t th iạ ư ệ ử ụ ạ ộ ờ
đi m, b n để ạ ược cung câếp tài nguyến mà b n th c s câền và có th tăng,ạ ự ự ể
gi m quy mỗ các lo i tài nguyến này theo nhu câềuả ạ
Tiếết ki m chi phí, th i gian cho vi c l a ch n phâền c ng, câếu hình choệ ờ ệ ự ọ ứcác phâền mếềm h thỗếngệ
Th trị ường đi n toán đám mây đã khá n i tếếng v i thếế gi i, v i các d ch vệ ổ ớ ớ ớ ị ụ
đi n toán đệ ược cung câếp b i Microsof (Azure), Amazon (AWS), Googleở(GAE), … nh ng t i Vi t Nam thì còn khá m i m ư ạ ệ ớ ẻ
M t vài cỗng ty ch tri n khai d án Đi n toán đám mây m c kh o sát vàộ ỉ ể ự ệ ở ứ ảnghiến c u ch ch a th t s ng d ng cỗng ngh Đi n toán đám mây này.ứ ứ ư ậ ự ứ ụ ệ ệ
T i Đỗng Nam Á, doanh thu t th trạ ừ ị ường đi n toán đám mây ệ ướ ược l ng
đ t 40 t đỗ trong năm 2025, trong đó Vi t Nam là m t trong nh ng nạ ỷ ệ ộ ữ ước
Trang 18có tỗếc đ tăng trộ ng kinh tếế nhanh nhâết liến quan đếến s d ng đi n toánưở ử ụ ệđám mây, t năm 2010 đếến 2016, tỗếc đ tăng trừ ộ ưởng đ t 64.4%.ạ
Trong m t sỗế cỗng bỗế đã qua nghiến c u trong VIO (ộ ứ Viet Nam ICT Outlook)cho biếết có kho ng:ả
25% th trị ường vâỗn đang trong giai đo n nghiến c u, tm hi u thỗngạ ứ ể
tn nh ng ch a có kếế ho ch s d ng đám mây.ư ư ạ ử ụ
8% th trị ường cho biếết h seỗ s d ng Đi n toán đám mây sau th iọ ử ụ ệ ờgian tm hi u.ể
39% th trị ường đã dâến thân và đang s d ng Đi n toán đám mây.ử ụ ệ
19% th trị ường còn l i đã hoàn toàn b “thu ph c” b i Đi n toán đámạ ị ụ ở ệmây và đã lến kếế ho ch phát tri n, s d ng lâu dài trến th trạ ể ử ụ ị ường
Đi n toán đám mây 2020.ệ
3% còn l i cho biếết h hoàn toàn khỗng có d đ nh tri n khai d ánạ ọ ự ị ể ựđám mây
Trang 19CH ƯƠ NG 3: B O M T ĐI N TOÁN ĐÁM MÂY: C H I VÀ THÁCH TH C Ả Ậ Ệ Ơ Ộ Ứ
3.1 T ng quan vềề b o m t đi n toán đám mẫy ổ ả ậ ệ
B o m t đi n toán đám mẫy ả ậ ệ (cloud computng security hay viếết tăết cloudsecurity) là m t lĩnh v c nghiến c u bao gỗềm các vâến đếề chính sách, cỗng ngh , vàộ ự ứ ệđiếều khi n đ b o v d li u và kiếến trúc c a đi n toán đám mây.ể ể ả ệ ữ ệ ủ ệ
Trến th c tếế, đi n toán đám mây đ n gi n ch là m t bự ệ ơ ả ỉ ộ ước tếến khác trong cách
m ng cỗng ngh thỗng tn Mỗ hình đám mây đạ ệ ược phát tri n d a trến 3 yếếu tỗếể ự
c b n gỗềm máy tnh trung ơ ả ương, máy ch /khách và ng d ng Web Nh ng b nủ ứ ụ ư ảchâết c a 3 thành phâền này đếều tỗền t i các vâến đếề vếề b o m t.ủ ạ ả ậ
v i các d ch v cung câếp m c “user – ngớ ị ụ ở ứ ười dùng” nh v y thì gánhư ậ
n ng vếề an toàn b o m t thu c vếề phía service provider.ặ ả ậ ộ
Các d ch v cung câếp theo PaaS nh : Windows Azure, Heroku, … ị ụ ư
nh ng d ch v đữ ị ụ ược cung câếp m c này hỗỗ tr nhiếều h n kh năng canở ứ ợ ơ ảthi p và m r ng.ệ ở ộ
Các d ch v cung câếp theo ki u IaaS: vmware, AWS, … ị ụ ể
d ch v m c h tâềng cho phép ngị ụ ở ứ ạ ườ ử ụi s d ng có kh năng can thi p vàả ệđỗềng th i ch u trách nhi m l n nhâết vếề an toàn b o m t.ờ ị ệ ớ ả ậ
Vâến đếề b o m t đỗếi v i SaaS:ả ậ ớ
Trang 20 B o m t ng d ng ả ậ ứ ụ : người dùng thường truy nh p t i các app qua Webậ ớbrowser Sai sót trong các trang web, app có th t o nến lỗỗ h ng có th bể ạ ổ ể ịkhai thác b i atacker dâỗn đếến mâết d li u, rò r thỗng tn, …ở ữ ệ ỉ
Nhiềều ng ườ i thuề đốềng th i ờ : nếếu d ch v SaaS đị ụ ược xây d ng theo mỗựhình nhiếều ng ười thuế đỗềng th i thì m t th hi n ng d ng seỗ đờ ộ ể ệ ứ ụ ược chia sẻcho nhiếều ng ười thuế Điếều này có h qu là: tài nguyến đệ ả ược s d ng tỗếtử ụ
h n nh ng các vâến đếề vếề tnh toàn v n d li u và b o m t kho d li u cóơ ư ẹ ữ ệ ả ậ ữ ệ
th x y ra do d li u c a ngể ả ữ ệ ủ ười dùng đượ ưc l u tr trến cùng m t CSDLữ ộ
B o m t d li u ả ậ ữ ệ : d li u đữ ệ ược x lý thử ường dở ướ ại d ng b n rõ, đả ược x lýử
và l u tr trến đám mây Vi c sao l u d li u cũng seỗ t o nến vâến đếề nếếuư ữ ệ ư ữ ệ ạnhà cung câếp d ch v đám mây kí h p đỗềng v i bến th 3 khỗng tn c yị ụ ợ ớ ứ ậ
Truy c p d ch v ậ ị ụ: các d ch v SaaS có hỗỗ tr nhiếều ki u truy c p (t PC,ị ụ ợ ể ậ ừmobile, …) mang l i nhiếều thu n l i Tâết nhiến, điếều này cũng tếềm n nguyạ ậ ợ ẩ
c d li u b đánh căếp ho c rò r b i các phâền mếềm trến di đ ng, kho ngơ ữ ệ ị ặ ỉ ở ộ ứ
d ng khỗng an toàn, …ụ
Vâến đếề b o m t đỗếi v i PaaS d a trến hai khía c nh: b o m t trong n i t i c aả ậ ớ ự ạ ả ậ ộ ạ ủ
d ch v PaaS và b o m t trong phâền mếềm c a user tri n khai trến d ch v ị ụ ả ậ ủ ể ị ụ
An toàn và b o m t c a bền th ba: ả ậ ủ ứ d ch v PaaS thị ụ ường khỗng ch cungỉcâếp mỗi tr ường phát tri n ng d ng c a nhà cung câếp d ch v mà đỗi khiể ứ ụ ủ ị ụcho phép s d ng d ch v m ng c a bến th ba ử ụ ị ụ ạ ủ ứ vâến đếề b o m t trongả ậ
d ch v c a bến th ba này.ị ụ ủ ứ
Vòng đ i c a ng d ng ờ ủ ứ ụ : các ng d ng trong quá trình nâng câếp có th gâyứ ụ ể
ra nh ng vâến đếề vếề an toàn và b o m t.ữ ả ậ
Vâến đếề b o m t đỗếi v i IaaS:ả ậ ớ
Ả o hóa: B n thân các máy o, các mỗi trả ả ường o cũng là nh ng phâền mếềm,ả ữ
do đó cũng tỗền t i vâến đếề vếề b o m t.ạ ả ậ
Giám sát máy o ả : thành phâền này có ch c năng giám sát và qu n lý các máyứ ả
o đả ượ ạc t o trến máy v t lý Nếếu thành phâền này b t n thậ ị ổ ương, các máy oả
có th b t n thể ị ổ ương
Trang 21 Tài nguyền chia s : ẻ các máy o trến h thỗếng thả ệ ường chia s m t sỗế tàiẻ ộnguyến chung nh CPU, RAM, I/O, … vi c s d ng “chung” này cũng là m tư ệ ử ụ ộtrong nh ng đi m có th phát sinh s mâết an toàn b o m t.ữ ể ể ự ả ậ
M ng o: ạ ả m ng o có th đạ ả ể ược chia s b i nhiếều ngẻ ở ười thuế trong m tộvùng ch a tài nguyến Khi đó các vâến đếề vếề an toàn b o m t có th phátứ ả ậ ểsinh gi a các ngữ ười thuế này, ví d : m t máy o có th nghe tr m các b nụ ộ ả ể ộ ả