Hiện nay, có rất nhiều nhà cung cấp sản phẩm máy chủ và phần mềm đầu tư vào việc nghiên cứu và phát triển công nghệ ảo hóa và đã có rất nhiều sản phẩm cho phép chúng ta ảo hóa hệ thống m
Trang 1VIỆN CÔNG NGHỆ THÔNG TIN
NGUYỄN MẠNH TUẤN
GIẢI PHÁP ĐẢM BẢO AN TOÀN DỮ LIỆU
TRÊN NỀN TẢNG ẢO HÓA
Ngành: Công nghệ thông tin
Chuyên ngành: Quản lý hệ thống thông tin
Mã số: Chuyên ngành đào tạo thí điểm
TÓM TẮT LUẬN VĂN THẠC SĨ
Hà Nội - 2014
Trang 2Mở Đầu:
Ngày nay, với sự phát triển mạnh mẽ của công nghệ thông tin, các máy tính ra đời với hiệu năng vô cùng lớn nhưng một các tổ chức trên thế giới chỉ sử dụng từ 10% đến 30% hiệu năng của các máy chủ mà họ sở hữu Điều này đặt ra cho các nhà khoa học một bài toán là làm thế nào để sử dụng máy chủ hết công suất của chúng, giảm thiểu chi phí về giá thành thiết bị, chi phí vận hành, chi phí bảo trì hệ thống Chính vì vậy công nghệ ảo hóa ra đời Ảo hóa cho phép chúng ta chạy nhiều máy chủ trên một nền tảng phần cứng duy nhất, điều này làm cho chi phí về phần cứng, chi phí về điện, chi phí bảo trì hệ thống, không gian lắp đặt máy chủ tại các datacenter, … đồng thời cũng giúp chúng ta sử dụng hết năng lực của máy chủ vật lý
Hiện nay, có rất nhiều nhà cung cấp sản phẩm máy chủ và phần mềm đầu tư vào việc nghiên cứu và phát triển công nghệ ảo hóa và đã có rất nhiều sản phẩm cho phép chúng ta ảo hóa
hệ thống mày chủ của mình như Red Hat, Oracle, IBM, Microsoft, VMware với rất nhiều sản phẩm đang được ngày một hoàn thiện và chiếm lĩnh thị trường trên toàn thế giới Trong đó, với hơn 80% thị phần ảo hóa trên toàn thế giới, VMware đang là hãng đi đầu về triển khai công nghệ
ảo hóa
Một trong những nỗi lo lắng của người dùng khi sử dụng công nghệ ảo hóa là vấn đề an toàn dữ liệu Hầu hết người sử dụng lo lắng về việc dữ liệu của mình khi dùng chung có thể bị đánh cắp dễ dàng hơn, khả năng khôi phục khi có sự cố hay thảm họa thiên nhiên, khả năng đáp ứng của hệ thống, và đặc biệt là vì không thể nhìn thấy nơi mà dữ liệu của chúng ta được lưu trữ
và cũng không được trực tiếp sao lưu và phục hồi nên người sử dụng vẫn lo ngại không muốn chuyển sang dùng ảo hóa
Trên thế giới đã có nhiều hãng sản xuất phần cứng cũng như phần mềm đầu tư nghiên cứu để cải thiện khả năng đảm bảo an toàn dữ liệu của hệ thống ảo hóa như Veeam, Vmware, Microsoft, Trendmicro, Norton, … nhưng hầu hết mới chỉ đảm bảo được một trong những khả năng phục hồi khi có thảm họa xảy ra, khả năng sao lưu và phục hồi khi cần thiết, khả năng đáp ứng của hệ thống ảo hóa chứ chưa có một giải pháp tổng thể cho vấn đề an ninh dữ liệu trên nền tảng ảo hóa Điều này khiến người dùng trên thế giới e ngại khi ảo hóa máy chủ của doanh nghiệp, máy tính cá nhân và lưu trữ những thông tin nhạy cảm trên mạng
Nhận thức được sự cần thiết và khả năng phát triển mạnh mẽ của công nghệ ảo hóa và yêu cầu cấp thiết của việc phát triển công nghệ nhằm đảm bảo sự an toàn của dữ liệu, Luận văn
“Giải Pháp Đảm Bảo An Toàn Dữ Liệu Trên Nền Tảng Ảo Hóa” của tôi đã phần nào giới thiệu được cái nhìn tổng quan về công nghệ ảo hóa, tổng quan về an toàn dữ liệu trên môi trường ảo hóa, đi sâu nghiên cứu về cách thức an toàn dữ liệu trong môi trường ảo hóa của VMware, đồng thời đưa ra giải pháp cơ bản cho việc an toàn dữ liệu trong môi trường ảo hóa Bố cục của luận văn gồm có 5 chương:
Trang 3Chương 1: Tổng quan về ảo hóa và an toàn dữ liệu: trong chương này tôi sẽ trình bày định nghĩa về dữ liệu và an toàn dữ liệu, sơ lược về công nghệ ảo hóa cũng như các phương thức
an toàn dữ liệu trên nền tảng ảo hóa trên nền tảng VMware Đồng thời, trong chương này tôi cũng
sẽ đưa ra những yêu cầu đối với an toàn dữ liệu trên nền tảng ảo hóa
Chương 2: Giải pháp an toàn dữ liệu trên nền tảng ảo hóa: Trong chơng này tôi sẽ đi sâu nghiên cứu về các phương pháp sao lưu, phục hồi dữ liệu trên nền tảng ảo hóa, các phương pháp
để phục hồi sau thảm họa Đồng thời cũng đi sâu tùm hiểu về Vmare vPhere Data Protection để
an toàn cho hệ thống ảo hóa VMware
Chương 3: Xây Dựng hệ thống ảo hóa an toàn với VMware vSphere Data Protection: Trong chương này, tôi sẽ đi xây dựng một hệ thống máy chủ chạy trên nền ảo hóa VMware vSphere và triển khai một số phương thức an toàn dữ liệu VMware vSphere Data Protection
Chương 4: Đề xuất giải pháp tăng cường an toàn dữ liệu trên nền tảng ảo hóa: trong chương này tôi sẽ đưa ra những lý thuyết về mã hóa dữ liệu quan trọng, sau đó là giải pháp của tôi để an toàn dữ liệu trên nền tảng ảo hóa
Chương 5: Kết luận: trong chương này tôi sẽ đi tổng kết lại những gì đã làm được và hướng nghiên cứu tiếp theo của tôi trong tương lai
Trang 4Chương 1: tổng quan về ảo hóa và an toàn dữ liệu
1.1 Dữ liệu là gì?
1.1.1 Định nghĩa thông tin Thông tin là một khái niệm cơ bản của khoa học cũng à khái niệm trung tâm của xã hội trong thời đại của chúng ta Mọi quan hệ, mọi hoạt động của con người đều dưa trên một hình thức giao lưu thông tin nào đó Mọi tri thức đều bắt nguồn bằng một thông tin về những điều đã diễn ra, về những điều mà người ta đã biết, đã nói, đã làm Vậy thông tin là tất cả những sự việc,
sự kiện, ý tưởng, phán đoán làm tăng thêm hiểu biết của con người Thông tin hình thành trong quá trình giao tiếp giữa người với người, qa các phương tiện thông tin đại chúng, từ các ngân hang dữ liệu, hoặc từ tất cả các hiện tượng quan sát được trong môi trường xung quanh
1.1.2 Định nghĩa dữ liệu Con người tạo ra rất nhiều cách thức để lưu trữ thông tin nhằm truyền lại cho thế hệ sau Những thông tin được lưu trữ này được gọi là dữ liệu
Cùng với sự bùng nổ thông tin ngày nay, con người càng nghĩ ra nhiều công cụ để quản trị và lưu trữ dữ liệu một cách an toàn để đảm bảo những thông tin được lưu trữ sẵn sang truy cập với những người được phép, không bị sửa đổi một cách trái phép, không bị truy cập trái phép, …
1.2 Ảo Hóa là gì?
Ảo hóa không phải là một mốt nhất thời, rất nhiều doanh nghiệp trên toàn thế giới chuyển sang sử dụng ảo hóa hoặc có ý định chuyển sang sử dụng ảo hóa trong tương lai gần là vì những lợi ích tuyệt vời mà nó mang lại Công nghệ ảo hóa trưởng thành với một tốc độ nhanh chóng, VMware là hãng dẫn đầu về công nghệ này trong gần như tất cả các lĩnh vực với các tính năng tiên tiến và được phổ biến rộng rãi toàn thế giới Trong phần này, tôi sẽ đi vào một số khái niệm quan trọng của ảo hóa, giải thích các loại khác nhau của ảo hóa cũng như đi vào chi tiết các thành phần của một máy ảo VMware Tôi sẽ giới thiệu về các loại máy ảo khác nhau được đặt trên một máy chủ vật lý và tại sao để quản lý các máy ảo cần có một tư duy hoàn toàn khác cũng như việc sử dụng các công cụ đặc biệt để làm việc với môi trường ảo hóa
1.2.1 Máy Ảo là gì?
Chúng ta nghe về máy ảo ở bất cứ đâu, làm việc với máy ảo hàng ngày, vậy đã bao giờ bạn tự hỏi chính xác máy ảo là gì? Nó bao gồm những thành phần nào? Trong khi máy ảo tồn lại trong RAM của máy chủ vật lý, không có một sự hiện diện vật chất nào Trong phần này tôi sẽ đi sâu tìm hiểu về các thành phần để tạo nên một máy ảo
a Đóng gói
Một máy ảo được đóng gói vào một tệp tin đĩa cứng ảo duy nhất, điều này làm cho nó có tính
cơ động cao Nếu chúng ta phải di chuyển một máy chủ vật lý sang một máy chủ vật lý khác, công việc chúng ta cần làm vô cùng lớn, chúng ta cần phải sao chép tất cả các tệp tin của mình và mang sang máy chủ mới Một hệ điều hành khách đang chạy trên máy chủ vật lý có tất cả các tệp tin được đóng gói vào một tệp tin đĩa cứng ảo duy nhất Một máy ảo có thể có nhiều ổ đĩa ảo nhưng các ổ đĩa sẽ
Trang 5được đóng gói thành các tệp tin Lợi ích của việc đóng gói này là chúng ta có thể dễ dàng sao chép
một máy ảo tới một thiết bị lưi trữ khác thậm trí là một USB nhỏ gọn Điều này có nghĩa là chúng ta
có thể vận chuyển một máy ảo bằng một thiết bị lưu trữ di động, sao chép nó vào máy chủ vật lý và
khởi động nó một cách bình thường
b Phần cứng của máy ảo
Các máy ảo được tạo ra vơi phần cứng giống nhau với bất kì máy chủ vật lý nào, không bị ảnh
hưởng bởi phần cứng vật lý của máy chủ Khi chúng ta tạo ra một máy ảo và xác định các thành phần
như ổ DVD, ổ cứng, chip, ram … các thành phần này sẽ được nhìn thấy bởi hệ điều hành khách như
các thành phần phần cứng cụ thể
Hình 1.1 phần cứng máy ảo
c Các tệp tin máy ảo
Trong khi phần cứng ảo chỉ được tạo thành trong RAM của máy chủ và hiển thị mỗi khi máy
ảo đó được bật lên, một máy ảo cũng có các tệp tin thực mà tất cả dữ liệu của nó được lưu trữ trong
đó Những tệp tin này được lưu trữ trong thư mục chính của máy ảo và được lưu trữ trên ổ cứng nội bộ
hoặc một kho dữ liệu chia sẻ được kết nối với máy chủ vật lý
Hình 1.2 các thành phần của máy ảo
Trang 6Hầu hết các tệp tin của máy ảo thường có tên của máy ảo ở phần đầu và có phần mở rộng khác nhau cho các thành phần khác nhau của máy ảo Những tập tin này lưu trữ các thông tin về các ổ đĩa
ảo cũng như cấu hình của máy ảo, BIOS, swap và tệp tin trạng thái Tùy thuộc vào trạng thái của máy
ảo mà có một số tệp tin được sinh ra hoặc bị xóa đi
Những tệp tin này là những gì tạo nên một máy ảo và thường được đặt trong thư mục gốc của máy ảo đó Có thể thay đổi vị trí của các tệp tin đĩa, tệp tin swap của máy ảo và các snapshot đến vị trí nằm trong kho dữ liệu Chúng ta có thể xem các tệp tin bằng cách sử dụng tính năng Datastore Browser của vSphere Client hoặc sử dụng các công cụ khác cho phép truy cập vào tệp tin trên máy chủ
d ổ đĩa cứng ảo
trong khi có nhiều loại định dạng tệp tin vmdk thì cũng có nhiều loại định dạng ổ đĩa cứng ảo
có ba loại chính được sử dụng là raw, thin và thick
1.2.2 Ưu và Nhược điểm của Ảo Hóa
- Hạn chế thời gian chết của hệ thống và khôi phục ngay lập tức khi phát sinh sự cố bằng các công nghệ có sẵn như High Availability, load Balancing, …
- Có thể linh hoạt trong quá trình cài đặt triển khai hoặc thay đổi kiến trúc mạng, hệ thống môt cách nhanh chóng, tiện lợi mà không làm ảnh hưởng đến người dùng cuối
Trang 7xem các thông tin cá nhân, những thông tin nhạy cảm… những công cụ dùng để sao lưu và phục hồi dữ liệu cho các máy chủ ảo còn ít, các công cụ bảo vệ dữ liệu còn thiếu
1.3 An toàn dữ liệu 1.3.1 An toàn dữ liệu:
An toàn dữ liệu một trạng thái tốt của dữ liệu và cơ sở hạ tầng trong đó khả năng dữ liệu bị đánh cắp, giả mạo, gián đoạn thông tin và dịch vụ được giữ ở mức thấp hoặc chấp nhận được
1.3.2 Các thuộc tính của an toàn dữ liệu:
An toàn dữ liệ phụ thuộc vao năm yếu tố chính: tính bảo mật, tính toàn vẹn, tính sẵn sang, tính xác thực và tính không phủ nhận
Tính bảo mật: là sự đảm bảo rằng dữ liệu chỉ có thể được truy cập bởi những người được phép Vi phạm tính bảo mật có thể xảy ra do quá trình xử lý thông tin, phân quyền sai hoặc
Tính không phủ nhận: là khả năng đảm bảo rằng một bên trong hợp đồng hoặc một giao dịch không thể phủ nhận tính xác thực chữ ký của họ trên tài liệu hoặc gửi tin nhắn họ tạo ra
Đó là cách đảm bảo rằng người gửi tin nhắn không thể phủ nhận việc đã gửi tin nhắn và người nhận không thể phủ nhận việc đã nhận tin nhắn
1.4 Những yêu cầu của an toàn dữ liệu trên nền tảng ảo hóa Với đặc thù ảo hóa, an toàn dữ liệu cần có những yêu cầu riêng để đáp ứng yêu cầu của doanh nghiệp, chính phủ, … những khách hàng sử dụng dịch vụ Những yêu cầu này là những mong muốn của người sử dụng
1.4.1 Phục hồi nhanh các máy ảo Một trong những yêu cầu căn bản của doanh nghiệp là tính liên tục khi sử dụng nếu môt máy tính bị lỗi, gần như ngay lập tức nó phải được phục hồi lại để đảm bảo công việc cho tất cả nhân viên Một trong những các tiếp cận truyền thống là chúng ta sẽ sao lưu toàn bộ dữ liệu bằng cách bất
kì dữ liệu nào được ghi vào máy tính, chúng ta sẽ lưu nó ở 2 nơi khác nhau Điều này đảm bảo mục
Trang 8tiêu thời gian phục hồi nhanh, đáng tin cậy nhưng chúng ta cần trả một số tiền lớn cho việc lưu trữ
dữ liệu và băng thông mạng cho việc sao lưu
1.4.2 Kiểm tra các máy ảo được sao lưu Một máy ảo được sao lưu là vô ích nếu máy ảo đó bị hỏng hoặc mất một số tập tin quan trọng Ví dụ: một bản sao lưu bị thiếu mất tập tin registry của windows Khi cần phục hồi, chúng ta phục hồi bằng bản sao lưu này Kết quả là sau khi phục hồi chúng ta sẽ không thể khởi động được windows Điều đó đặt ra yêu cầu các công cụ sao lưu cần phải có khả năng kiểm tra sự không đầy đủ của các bản sao lưu, các bản sao lưu bị hỏng hoặc không thể phục hồi lại được Thêm vào đó nó cần hiển thị khả năng xác minh để các nhà quản trị có thể yên tâm các hệ thống sao lưu được vận hành an toàn
1.4.3 Phục hồi mịn Đôi khi các máy ảo chỉ cần phục hồi một phần Điều này xảy ra do quá trình sử dụng và giao tiếp giữa phần mềm và người sử dụng ví dụ: chúng ta xóa nhầm các tài liệu quan trọng của công ty, các thiết lập email, … Trong trường hợp này, sẽ hiệu quả hơn rất nhiều nếu chúng ta chỉ cần phả phục hồi các thành phần mong muốn chứ không phải là phục hồi toàn bộ máy ảo
1.4.4 Băng thông yêu cầu và ổ cứng lưu trữ dành cho sao lưu thấp Việc sao lưu và phục hồi dữ liệu đảm bảo cho việc truy cập một cách liên tục của dữ liệu nhưng nó khiến doanh nghiệp pải tra một khoản phí lớn về không gian lưu trữ và băng thông mạng Hai kĩ thuật làm giảm bớt chi phí này là nén và chống trùng lặp
Nén giúp giữ các máy ảo được sao lưu nhưng giảm số lượng dữ liệu được lưu trữ trên đĩa cứng khi một hoặc nhiều máy ảo được sao lưu Điều này cũng làm giảm lưu lượng mạng trong quá trình sao lưu máy ảo Hơn nữa, nếu máy ảo sao lưu cần được chuyển sang một trung tâm dữ liệu sao lưu thì phương châm là càng nhỏ càng tốt đối với chi phí cho mạng diện rộng
Chống trùng lặp là kĩ thuật so sánh máy ảo đang hoạt động với máy ảo đã được sao lưu trước
đó và sao lưu phần dữ liệu sai khác Sau đó tạo một con trỏ đến phần dữ liệu sai khác được sao lưu này Khi phần sao lưu được gọi, hệ thống sẽ gọi bản sao lưu đầu tiên sau đó sao lưu đến phần dữ liệu sai khác
Trang 9Chương 2: Giải pháp an toàn dữ liệu trên nên ảo hóa
2 1 Phương thức sao lưu và phục hồi dữ liệu
2 1 1 Phương pháp sao lưu và phục hồi dữ liệu truyền thống
a Sao lưu hệ điều hành dựa trên agent
Phương pháp này dựa trên một agent được cài đặt trên hệ điều hành Các máy chủ sao lưu liên
lạc với các agent, mà luôn chạy trên máy chủ, và thiết lập một phiên kết nối TCP/IP đến agent Khi kết
nối được thiết lập, các agent sẽ sao chép tất cả các dữ liệu từ hệ thống tệp tin của hệ điều hành và gửi
chúng đến các máy chủ sao lưu Bởi vì các agent sao lưu được cài đặt bên trong hệ điều hành nên nó
có thể đọc các tệp tin hệ thống của tất cả các ổ cứng được cấu hình trên máy chủ Các agent có thể truy
cập vào các Master File Table của hệ điều hành để xác định tất cả các tệp tin tồn tại trên các phân vùng
của ổ cứng và gửi chúng đến máy chủ sao lưu Đây là phương pháp sao lưu máy chủ ở mức tệp tin
(file level backup) bởi vì các tệp tin được sao chép đến một hệ thống tệp tin nằm trên một thiết bị
khác, điều này giống như chúng ta vào windows và copy các thư mục đến thiết bị lưu trữ được chia sẻ
Để hỗ trợ việc sao lưu được nhanh chóng, một giá trị bit lưu trữ được thiết lập, bất kì khi nào hệ điều
hành thay đổi một tệp tin, bit lưu trữ này sẽ tăng lên và các agent sẽ nhận biết rằng tệp tin đã thay đổi
so với lần sao lưu trước, các agent sau đó sẽ tiến hành sao lưu tệp tin và chuyển bit lưu trữ về giá trị
ban đầu
Hình 2.1 Sao lưu trên máy vật lý
b lập lịch và thực thi sao lưu
Có một số mô hình sao lưu dữ liệu khác nhau có thể được kết hợp để có được hệ thống sao lưu
tốt nhất Các phương pháp sao lưu khác nhau được thiết kế để giảm cả về thời gian sao lưu lẫn dung
lượng mà bản sao lưu yêu cầu Có một số phương pháp sao lưu như sau:
- Sao lưu toàn bộ: Đây là phương pháp mà tất cả các dữ liệu trên máy chủ nguồn được
sao chép vào các thiết bị sao lưu Bản sao lưu đầy đủ đòi hỏi nhiều thời gian để thực hiện cũng
như nhiều không gian lưu trữ nhất Bản sao lưu đầy đủ là nền tảng cho các phương pháp sao lưu
khác
- Sao lưu tổng hợp: với phương pháp sao lưu tổng hợp, một bản sao lưu đầy đủ sẽ được
thực hiện duy nhất 1 lần và những lần sao lưu tiếp theo tất cả là các bản sao lưu gia tăng Phương
pháp này cho phép thời gian sao lưu ngắn hơn, tiêu thụ ít tài nguyên hơn so với phương pháp sao
Trang 10lưu truyền thống vì chúng ta không cần phải sao lưu toàn bộ hệ thống đến lần thứ 2 Những sao lưu gia tăng được kết hợp với nhau để tạo thành một bản sao lưu đầy đủ Bằng cách này, một bản sao lưu đầy đủ cập nhật luôn luôn đạt được mà không cần thiết phải thực hiện sao lưu toàn bộ Chúng ta có thể khôi phục lại các dữ liệu cũ bởi tất cả các thay đổi được sao lưu và lưu lại dưới dạng tệp tin rollback và xlieuej lược sử được sử dụng để tính toán thời điểm cần phục hồi Phương pháp này gọi là reverse-delta
- Sao lưu gia tăng: phương pháp này chỉ sao lưu dữ liệu đã thay đổi kể từ bản sao lưu đầy đủ hoặc bản sao lưu gia tăng trước đó Phương pháp này dựa trên một bit lưu trữ được xóa ngay sau khi sao lưu Khi một tệp tin thay đổi, các bit lưu trữ sẽ được thiết lập và chỉ ra các tệp tin
đã thay đổi kể từ lần sao lưu cuối cùng Sao lưu gia tăng sau đó chỉ sao lưu những tệp tin mà có bit lưu trữ được bật và sau đó xóa bit lưu trữ khi quá trình sao lưu hoàn thành Phương pháp này cho phép quá trình sao lưu nhanh chóng nhưng quá trình phục hồi lại các tệp tin sẽ mất rất nhiều thời gian do cần khôi phục lại các tệp tin đã thay đổi kể từ lần sao lưu đầy đủ cuối cùng
- Sao lưu khác biệt: đây là phương pháp tương tự với sao lưu gia tăng, nhưng tất cả các
dữ liệu thay đổi từ bản sao lưu đầy đủ cuối cùng sẽ được sao lưu mỗi khi sao lưu khác biệt được thực thi Các tệp tin được thay đổi sẽ được sao lưu với sao lưu khác biệt, các bit lưu trữ sẽ không được tắt, vì vậy tất cả các tệp tin đã được thay đổi từ lần sao lưu toàn bộ cuối cùng sẽ được sao lưu bằng sao lưu khác biệt, kể cả nó đã được sao lưu bởi một bản sao lưu khác biệt trước đó Trong phương pháp này, việc sao lưu sẽ tốn thời gian và không gian nhớ hơn so với sao lưu gia tăng nhưng thời gian cần thiết để khôi phục lại hệ thống lại giảm đi đáng kể vì chúng ta chỉ cần khôi phục sao lưu đầy đủ cuối cùng và phiên bản sao lưu khác biệt được chọn
Hầu hết các doanh nghiệp thực hiện một lịch trình sao lưu bao gồm các bản sao lưu đầy
đủ được thực hiện định kỳ và tiếp theo là các bản sao lưu gia tăng hoặc khác biệt được thực hiện cho đến khi bản sao lưu đầy đủ tiếp theo xảy ra và quá trình được lặp lại theo chu kì Lịch trình sao lưu sẽ thay đổi tùy theo yêu cầu của mỗi công ty như thời gian, ngân sách và cơ sở hạ tầng
c phục hồi dữ liệu
Có 2 cách để phục hồi dữ liệu từ bản sao lưu đó là phục hồi lại các tệp tin và thư mục riêng hoặc phục hồi tất cả dữ liệu trên máy Phục hồi một số các tệp tin là loại phổ biến nhất của phục hồi dữ liệu Để phục hồi một số tệp tin, chúng ta cần chọn thời điểm mà bản sao lưu tồn tại trên máy chủ Các tệp tin muốn được phục hồi thì cần phải có trên các thiết bị sao lưu trước khi quá trình phục hồi bắt đầu Sau khi xác định được thời gian phục hồi và dữ liệu phục hồi, tệp tin cần phục hồi được chép lại vào vị trí ban đầu của nó, ghi đè lên các bản sao hiện có hoặc được chép vào một vị trí thay thế để có thể được truy cập mà không làm ảnh hưởng đến tệp tin gốc
d kiểm tra và xác thực tệp tin sao lưu:
Sao lưu là một phần quan trọng của bất kì máy chủ nào nhưng việc đảm bảo phục hồi thành công còn quan trọng hơn rất nhiều Sao lưu sẽ là vô nghĩa nếu chúng ta không thể phục hồi Sao lưu giống như một chính sách bảo hiểm, bạn phải trả phí hàng ngày với hi vọng không bao giờ phải sử dụng chúng, nhưng khi một điều gì xấu xảy ra với hệ thống của chúng ta, chúng ta cần có một cách
Trang 11nào đó để có thể khôi phục lại Chính vì vậy chúng ta không nên tin tưởng vào một bản sao lưu đã được sao lưu thành công mà cần phải kiểm tra bản sao lưu đó bằng cách cố gắng phục hồi dữ liệu thành công từ bản sao lưu đó
2 1 2 Phương pháp sao lưu dữ liệu trong môi trường ảo hóa
a sao lưu mức hình ảnh
Với hệ thống ảo hóa, chúng ta sẽ đạt hiệu quả cao hơn nếu sao lưu các tệp tin lớn thành nhiều đĩa ảo (vmdk) ở lớp ảo hóa thay vì truy cập vào hệ điều hành để sao lưu các dữ liệu cá nhân Kiểu sao lưu này gọi là sao lưu mức hình ảnh vì chúng ta sao lưu một đĩa ảo giống hệt với các tệp tin đang chạy trên đĩa của máy ảo Phương pháp này hiệu quả hơn vì chỉ cần sao lưu một tệp tin lớn thay vì hàng ngàn tệp tin nhỏ Trong khi đó, phương pháp này cũng có hạn chế là khi sao lưu mức hình ảnh, chúng
ta sao lưu cả khối đĩa trống và các tệp tin đã bị xóa trước đó thì trên bản sao lưu nó cũng không tồn tại
ví dụ: nếu chúng ta có một máy tính có ổ cứng ảo với dung lương 80GB nhưng nó chỉ đang sử dụng 20GB và 60GB trống, việc sao lưu mức hình ảnh sẽ tạo ra một bản sao lưu với dung lượng 80GB Để khắc phục điều này, các người ta thường kiểm tra các khối đĩa ở lớp ảo hóa để phát hiện ra các khối đĩa trống và bỏ qua chúng Trong khi kiểm tra các khối đĩa trống thì các phần mềm bảo vệ dữ liệu cho
ảo hóa cũng sử dụng một thuật toán chống trùng lặp để phát hiện ra các khối trùng lặp và bỏ qua việc sao lưu đối với những khối này
b sao lưu mức tệp tin
Sao lưu mức tệp tin truyền thống được thực hiện bằng cách sử dụng một agent bên trong hệ điều hành khách có nhiệm vụ sao lưu tất cả các tệp tin cá nhân Điều này có thể được thực hiện trong môi trường ảo hóa nhưng nó sẽ gây ra việc sử dụng tài nguyên quá mức trên các máy chủ lưu trữ, có thể gây ảnh hưởng tiêu cực đến các máy ảo khác trên máy chủ đó Sao lưu sử dụng các agent trên hệ điều hành của máy ảo cần được điều hướng thông tin qua lớp ảo hóa để thực hiện sao lưu trên lớp hệ điều hành khách như sau:
c snapshot máy ảo
Snapshot là một tính năng tuyệt vời của ảo hóa cung cấp khả năng sao lưu khi nâng cấp, vá các phần mềm và hệ điều hành Snapshot là một hình ảnh trong một thời gian của máy ảo, nó lưu trữ các thông tin trên đĩa, trên bộ nhớ hệ thống của máy ảo Chúng ta có thể tạo ra nhiều bản snapshot của máy ảo, do đó chúng ta có thể có nhiều điểm khôi phục sẵn sàng để được khôi phục Khi chúng ta tạo một snapshot tất cả các tiến trình ghi vào tệp tin trên ổ đĩa cứng được dừng lại và ổ đĩa cứng được chuyển sang trạng thái chỉ đọc từ thời điểm đó Tất cả các tệp tin được ghi vào ổ cứng sau thời điểm chúng ta snapshot sẽ được ghi vào một tệp tin –delta vmdk được tạo ra khi chúng ta tiến hành snapshot Khi chúng ta xóa tất cả các snapshot của máy ảo, tất cả các tệp tin –delta vmdk được hợp nhất với nhau để trở thành tệp tin vmdk trên đĩa Nếu chúng ta xóa đi một snapshot nào đó, nó sẽ hợp nhất với bản snapshot trước nó và xóa tệp tin –delta vmdk đó đi
d các trạng thái sao lưu phù hợp
Khi một snapshot máy ảo được thực hiện, các dữ liệu trên đĩa của máy ảo được giữ nguyên, tuy nhiên, có thể tồn tại các dữ liệu trên bộ nhớ mà chưa được ghi vào đĩa Điều này có thể làm mất dữ
Trang 12liệu hoặc có thể gây ra việc dữ liệu được sao lưu bị lỗi một phần hoặc không đầy đủ Bởi vậy, trước khi thực hiện snapshot cần tạm thời dừng hệ điều hành và các ứng dụng sau khi chúng đã ghi toàn bộ
dữ liệu vào ổ cứng Sau khi hoạt động này kết thúc, snapshot được thực hiện và hệ điều hành cùng với các ứng dụng có thể hoạt động bình thường Hành động này đảm bảo dữ liệu có thể được phục hồi một cách chính xác nhất Có nhiều trạng thái khác nhau mà một máy chủ có thể đạt được khi quá trình snapshot được thực hiện
Sao lưu ứng dụng phù hợp là vô cùng quan trọng để đảm bảo rằng dữ liệu của chúng ta được sao lưu đúng Hầu hết các công cụ sao lưu tận dụng các ứng dụng VMware Tools được cài đặt trên các máy ảo để dừng hệ điều hành và ứng dụng trước khi tạo ra một snapshot cho việc sao lưu
e VCB và các vStorage API
Sản phẩm đầu tiên của VMware để an toàn dữ liệu là VMware Consolidated Backup (VCB) VCB hoạt động như một máy chủ proxy để giảm tải việc sao lưu từ các máy ảo bằng cách găn các ổ đĩa ảo lên máy chủ VCB và sau đó sao lưu mức hình ảnh mà không cần đến máy chủ hoặc máy ảo Điều này chuyển việc sao lưu từ máy ảo đến máy chủ sang việc sao lưu từ máy ảo sang máy chủ proxy
f Đặt lịch và hiệu năng của sao lưu
Với môi trường máy chủ vật lý, các máy chủ không chia sẻ chung tài nguyên như máy ảo, chúng ta có thể sao lưu mà không quan tâm đến lập lịch vì các tiến trình sao lưu có thể chạy cùng một lúc Lập lịch sao lưu trong hệ thống ảo hóa là một yêu cầu cần thiết Lý do cho điều này là chúng ta không muốn quá nhiều máy ảo cùng thực hiện sao lưu tại một thời điểm khiến cho các tài nguyên trên máy chủ và trên các thiết bị lưu trữ cạn kiệt, khi đó sẽ không còn tài nguyên dành cho những ứng dụng đang chạy trên máy ảo khác Các nguồn tài nguyên được sử dụng sẽ phụ thuộc vào kiểu sao lưu mà chúng ta lựa chọn Khi sao lưu máy ảo bằng cách sử dụng agent được cài đặt trên hệ điều hành của máy ảo đó, tài nguyên của máy chủ sẽ được sử dụng một cách tối đa Khi chúng ta sao lưu dữ liệu sử dụng sao lưu mức hình ảnh, lượng tài nguyên được sử dụng trên máy chủ sẽ giảm đi Khi tận dụng khả năng của vStorage API, việc sử dụng tài nguyên của máy chủ sẽ tiếp tục giảm
2 1 3 Phương pháp phục hồi dữ liệu trong môi trường ảo hóa
Sao lưu dữ liệu trong môi trường ảo hóa là một quá trình khá dễ dàng và đơn giản, nhưng toàn
bộ những điểm sao lưu phải có khả năng phục hồi dữ liệu khi cần thiết Tất cả nhứng bit 1 và bit 0 được lưu trữ trên đĩa cứng của chúng ta trong trung tâm dữ liệu là những tài sản vô cùng quý giá của doanh nghiệp và chúng ta không thể để mất chúng Trong bất cứ môi trường nào, ảo hóa hay vật lý, việc chúng ta không thể phục hồi dữ liệu là hoàn toàn có thể xảy ra Không có cảm giác nào tồi tệ hơn việc chúng ta đã sao lưu máy chủ của mình hàng tháng, hàng năm nhưng khi phục hồi thì không thể docacs bản sao lưu không hoạt động một cách chính xác Trong nhiều trường hợp, việc tin tưởng một cách mù quáng vào khả năng sao lưu thành công thì phục hồi cũng sẽ hoạt động tốt khiến chúng ta phải trả giá Thực hiện kiểm tra phục hồi định kì có thể xác nhận rằng các bản sao lưu đang hoạt động chính xác, nhưng nó có thể mất thời gian và là một quá trình phức tạp
Trang 13Khôi phục dữ liệu trong môi trường ảo hóa có thể phức tạp hơn hoạt động này trong môi
trường vật lý rất nhiều Trong phần này chúng ta sẽ đi tìm hiểu những phương pháp và thách thức cho
việc khôi phục và kiểm tra dữ liệu trong môi trường ảo hóa
a Phục hồi dữ liệu máy ảo
Về cơ bản có ba cấp độ mà chúng ta có thể sao lưu máy chủ ảo:
- Mức ứng dụng: sử dụng khi chúng ta muốn sao lưu một đối tượng bên trong một tệp
tin
- Mức tệp tin: sử dụng sao lưu các tệp tin nằm trên một phân vùng đĩa ảo
- Mức hình ảnh: sử dụng để sao lưu tất cả các khối của một phân vùng đĩa ảo
Các mức này tạo thành một hệ thống phân cấp mà trên cùng là mức ứng dụng và thấp nhất là
mức hình ảnh
Hình 2.2 các mức phục hồi dữ liệu máy ảo
b Kiểm tra và Xác thực sao lưu
Trong khi các bản sao lưu tốt là rất quan trọng, có các bản phục hồi tốt còn quan trọng hơn rất
nhiều lần Sao lưu sẽ không có ý nghĩa nếu chúng ta không thể phục hồi lại khi cần thiết Chúng ta
không nên cho rằng chỉ cần phần mềm sao lưu không báo bất kì lỗi nào xảy ra trong quá trình sao lưu
dữ liệu là quá trình sao lưu hoàn tất và chúng ta không gặp bất cứ vấn đề gì khi phục hồi dữ liệu
Chúng ta cần phải thường xuyên kiểm tra và xác thực rằng các bản sao lưu của chúng ta được phục hồi
thành công bằng cách khôi phục dữ liệu trên các thiết bị sao lưu và sau đó truy cập vào để đảm bảo
rằng nó được đọc đúng Để xác minh sự thích hợp của các bản sao lưu, chúng ta cần kiểm tra khả năng
phục hồi ở nhiều cấp độ khác nhau: cấp độ tệp tin, cấp độ ứng dụng và cấp độ hệ điều hành Điều này
xác thực các bản sao lưu của chúng ta và đảm bảo rằng chúng ta có thể khôi phục dữ liệu từ bất kì tình
huống nào
2 2 Giải Pháp VMware vSphere Data Protection
VMware vSphere Data Protection (VDP) là một giải pháp sao lưu và phục hồi dựa trên ổ đĩa
mạnh mẽ và đễ triển khai rủa VMware VDP được tích hợp hoàn toàn bên trong các máy chủ VMware
vCenter và cho phép quản lý tập trung và hiệu quả các bản sao lưu trong cùng một địa chỉ lưu trữ
Việc sử dụng VDP mang lại rất nhiều lợi ích cho doanh nghiệp và trung tâm dữ liệu VDP
khiến doanh nghiệp không còn lo lắng về an toàn dữ liệu và giảm thiểu chi phí về sao lưu cũng như
phục hồi dữ liệu ngay khi cần Những lợi ích đó bao gồm: