Dữ liệu là tài sản quý giá đối với mỗi cá nhân và mỗi doanh nghiệp. Nhưng khả năng xảy ra sự cố về dữ liệu luôn tiềm ẩn xung quang mỗi chúng ta bởi một số nguyên nhân: Nguyên nhân khách quan: Sự cố xảy ra ngoài ý muốn, con người không thể biết trước được, thường là các thảm họa (VD: thiên tai, cháy nổ,…). Nguyên nhân chủ quan: Sự cố xảy ra do những thao tác không chính xác của con người (ví dụ: lỗi phần cứng, lỗi phần mềm, thao tác nhầm…),do hacker xâm nhập.Chính vì vậy, dù dữ liệu thông thường hay dữ liệu được bảo mật thì bạn cũng nên sao lưu chúng thường xuyên để tránh những rủi ro đáng tiếc có thể xảy ra. Qúa trình tiến hành backup, ta cần xác định:1. Cần phải backup những gì2. Backup như thế nào3. Chọn loại backup nào4. Backup vào đâu (nơi lưu backup)Với mỗi môi trường khác nhau có những công cụ và phương pháp sao lưu và phục hồi dữ liệu tương ứng.Trong phạm vi bài tiểu luận chúng ta sẽ cùng tìm hiểu backup dữ liệu và các phương pháp backup trên Linux
Trang 1
BỘ GIÁO VÀ ĐÀO TẠO
HỌC VIỆN KĨ THUẬT MẬT MÃ - KHOA AN TOÀN THÔNG TIN
BÁO CÁO
Tìm hiểu về backup phục hồi
dữ liệu trên Linux
Môn học: Hệ điều hành Linux
Nguyễn Thị Huế MSSV: AT13CLC0109 Nguyễn Thị Kim Huế MSSV: AT13CLC0110
Hà Nội, tháng 9, năm 2018
Trang 2LỜI NÓI ĐẦU
Dữ liệu là tài sản quý giá đối với mỗi cá nhân và mỗi doanh nghiệp Nhưngkhả năng xảy ra sự cố về dữ liệu luôn tiềm ẩn xung quang mỗi chúng ta bởi một
Chính vì vậy, dù dữ liệu thông thường hay dữ liệu được bảo mật thì bạncũng nên sao lưu chúng thường xuyên để tránh những rủi ro đáng tiếc có thể xảy
ra
Qúa trình tiến hành backup, ta cần xác định:
1 Cần phải backup những gì
2 Backup như thế nào
3 Chọn loại backup nào
4 Backup vào đâu (nơi lưu backup)
Với mỗi môi trường khác nhau có những công cụ và phương pháp sao lưu
và phục hồi dữ liệu tương ứng.Trong phạm vi bài tiểu luận chúng ta sẽ cùng tìmhiểu backup dữ liệu và các phương pháp backup trên Linux
Trang 3NHẬN XÉT CỦA GIÁO VIÊN
Trang 4
MỤC LỤC
LỜI NÓI ĐẦU
CHƯƠNG I: TỔNG QUAN VỀ BACKUP VÀ RESTORE DỮ LIỆU TRÊN
LINUX 4
I Backup là gì? 4
II Backup trong linux 4
CHƯƠNG II: QUÁ TRÌNH BACKUP 5
I Các loại backup 5
1 Full Backup 5
2 Differential Backup 5
3 Incremental Backup 6
II Nơi lưu trữ dữ liệu 7
III Các công cụ hỗ trợ backup và phục hồi dữ liệu trên Linux 8
1: fwbackups 8
2: Bacula 8
3: Rsync 9
4: Mondorescue 9
5: Simple Backup Solution 10
CHƯƠNG III: MỘT SỐ LỖI KHI BACKUP DỮ LIỆU TRÊN LINUX 10
1 Không thường xuyên backup hệ thống 10
2.Không kiểm tra các file backup 10
3 Không sử dụng Application-Aware Backup Application 11
4 Một phần dữ liệu backup bị lỗi 11
5 Không xét đến hậu quả của việc sử dụng giải pháp bảo mật dữ liệu backup 11
6 Chỉ backup dữ liệu 12
7 Chỉ sử dụ ng một phương pháp backup disk-to-disk 12
8 Chu kỳ sử dụng lại thiết bị lưu trữ quá ngắn 12
9 Các giải pháp backup dữ liệu hữu hiệu 12
10 Tổ chức tệp tin 13
11 Backup tiện nghi 13
12 Sử dụng ổ USB 13
13 Backup dữ liệu trực tuyến 14
CHƯƠNG IV: DEMO 14
1 Demo với tool Backup 14
2 Demo Partimage……… 18
3 Backup và restore bằng câu lệnh hệ thống Tar 18
KẾT LUẬN
TÀI LIỆU THAM KHẢO
Trang 6CH ƯƠNG I: TỔNG QUAN VỀ BACKUP VÀ RESTORE DỮ NG I: T NG QUAN V BACKUP VÀ RESTORE D ỔNG QUAN VỀ BACKUP VÀ RESTORE DỮ Ề BACKUP VÀ RESTORE DỮ Ữ
LI U TRÊN LINUX ỆU TRÊN LINUX
I Backup là gì?
Backup là hình thức sao lưu lại toàn bộ dữ liệu trong máy tính về một nơi antoàn Người backup phải đảm bảo rằng nơi lưu trữ dữ liệu của họ sẽ không bị tấncông hay đánh cắp Khi nguồn dữ liệu chính bị xâm hại hoặc xâm nhập thì bạnvẫn có thể restore lại dữ liệu và đảm bảo rằng dữ liệu chính của bạn vẫn đượclưu trữ đầy đủ
II Backup trong linux
Các lý do sử dụng Linux như là hệ điều hành cho việc chạy backup:
• Windows không thể đọc các partition Linux của bạn mà không có cácadd-on của nhóm thứ ba
• Ngược lại, Linux có thể (vốn có) đọc các partition FAT 32 vàNTFS
• Nó hoàn toàn không phức tạp để tạo một kịch bản backup đi kèmvới các partition, back up chúng, sau đó gỡ bỏ chúng
• Việc backup với Linux có thể lấy lại được bất kỳ một file bịnhiễm virus nào đã chậm chạp
• Bạn đã từng bỏ mặc máy tính Windows chạy qua đêm không đượcgiám sát?
Đối với hệ thống Linux ta có thể:
• Sao lưu và phục hồi toàn bộ hệ thống
• Sao lưu và phục hồi một phần của hệ thống
• Ví dụ: sao lưu các thư mục /home, /var, /etc…
• Backup nguyên bản hay như người dùng bình thường?
• Một nguyên tắc có thể nhận ra là thử và chạy nhiều lần không cần sửdụng tài khoản gốc
• Backup các file hệ thống như root và backup thư mục /home táchbiệt bằng việc sử dụng tài khoản người dùng thông thường
Trang 7• Điều này làm cho nó trở nên dễ dàng hơn để khôi phục dữ liệu ngườidùng thông thường, dễ dàng truy cập hơn root.
CH ƯƠNG I: TỔNG QUAN VỀ BACKUP VÀ RESTORE DỮ NG II: QUÁ TRÌNH BACKUP
I Các lo i backup ại backup
1.1 Full Backup
Full Backup có nghĩa là backup toàn bộ dữ liệu đang có của bạn
Ưu điểm của Full Backup :
• Dễ dàng phục hồi lại dữ liệu Khi cần phục hồi lại thì sẽ phục hồi lại toàn
bộ dữ liệu của ngày Backup Full.
• Tính an toàn cao cho dữ liệu
Nhược điểm của Full Backup:
• Thời gian backup lâu Dữ liệu càng nhiều thì thời gian backup càng lâu
• Tốn dung lượng lưu trữ Nếu mỗi ngày đều chạy full backup thì rất tốndung lượng ổ cứng Ví dụ một ổ cứng 1TB nếu backup full mỗi ngày thìtrong 1 tuần sẽ cần 7TB lưu trữ
• Chi phí đầu tư thiết bị lưu trữ lớn
1.2 Differential Backup
Differential Backup là backup những gì thay đổi so với lần Full Backup gần nhất
Ví dụ : Trong thư mục có 4 file dữ liệu : 1 2 3 4
Khi cấu hình backup: Full Backup vào Chủ Nhật, Differential Backup vào ThứHai, Thứ Ba, Thứ Tư, Thứ Năm, Thứ Sáu, và Thứ Bảy
Nếu thứ 2 trong thư mục có thêm một file số 5 : 1 2 3 4 5 thì Differential backup
sẽ sao lưu file số : 5
Trang 8Nếu thứ 3 trong thư mục có thêm file số 6: 1 2 3 4 5 6 –> Differential backup sẽsao lưu phần thay đổi so với ngày Full Backup gần nhất là chủ nhật nên sẽ saolưu file số 5 6
Tương tự như vậy cho các ngày tiếp theo
Ưu điểm của Differential Backup :
• Thời gian backup nhanh hơn
• Dung lượng backup nhỏ hơn so với Full Backup Tiết kiệm dung lượnglưu trữ
• Tốc độ phục hồi dữ liệu sẽ nhanh hơn so với Incremental Backup
Nhược điểm của Differential Backup :
• Khi cần khôi phục dự liệu cần có 2 bản backup
1 3 Incremental Backup
Incremental Backup là backup những gì thay đổi so với lần Incremental
Backup gần nhất
Ví dụ: Trong thư mục có 4 file dữ liệu : 1 2 3 4
Khi cấu hình backup: Full Backup vào Chủ Nhật, Incremental Backup vào ThứHai, Thứ Ba, Thứ Tư, Thứ Năm, Thứ Sáu, và Thứ Bảy
Nếu Thứ 2 trong thư mục có thêm một file số 5 : 1 2 3 4 5 thì Incremental Backup sẽsao lưu file số : 5
Nếu Thứ 3 trong thư mục có thêm file số 6: 1 2 3 4 5 6 –> Incremental Backup sẽsao lưu phần thay đổi so với ngày Incremental Backup gần nhất là Thứ 2 nên sẽsao lưu file số 6
Ưu điểm của Incremental Backup :
• Thời gian backup nhanh nhất
• Dung lượng backup bé nhất
Trang 9Nhược điểm của Incremental Backup :
• Khi cần khôi phục dữ liệu phải có đủ các bản backup :
• 1 File Full backup lần gần nhất và tất cả các File IncrementalBackup từ thời điểm Full Backup đến thời điểm cần restore
• Thời gian Restore lâu hơn so với Differential Backup
Bảng so sánh :
Giải pháp được các nhà backup khuyến cáo nên lựa chọn thường như sau :
Full Backup hàng tháng
Differential Backup hàng tuần
Incremental Backup hàng ngày
II N i l u tr d li u ơi lưu trữ dữ liệu ưu trữ dữ liệu ữ dữ liệu ữ dữ liệu ệu
- Backup dữ liệu offline: Là việc bạn sao lưu dữ liệu đến các thiết bị như ổ
cứng, usb, thẻ nhớ hay đĩa CD Hầu hết các phần mềm backup miễn phí đều hỗtrợ tính năng này
- Backup dữ liệu online: Là việc bạn sao lưu dữ liệu đến một máy chủ online vàkhôi phục khi dữ liệu chính gặp sự cố Đây là giải pháp backup tối ưu nhất, nókhắc phục được nhược điểm của các phương pháp backup dữ liệu khác
Trang 10Mô hình backup dữ liệu online và offline
III Các công c h tr backup và ph c h i d li u trên Linux ụ hỗ trợ backup và phục hồi dữ liệu trên Linux ỗ trợ backup và phục hồi dữ liệu trên Linux ợ backup và phục hồi dữ liệu trên Linux ụ hỗ trợ backup và phục hồi dữ liệu trên Linux ồi dữ liệu trên Linux ữ dữ liệu ệu
1: fwbackups
Đây vẫn được xem là giải pháp sao lưu dễ thực hiện nhất trên Linux.Fwbackups hỗ trợ đa nền tảng, giao diện thân thiện và bạn có thể thực hiện cáctác vụ sao lưu tức thời hoặc theo lịch Fwbackups cho phép thực hiện tác vụ nàytrên máy hoặc từ xa và lưu lại thành định dạng nén tar, tar.gz, tar.bZ, hay rsync.Người dùng có thể sao lưu toàn bộ PC hoặc một tập tin duy nhất nào đó Khônggiống như nhiều ứng dụng sao lưu khác, tiện ích này rất dễ cài đặt vì bạn có thểtìm thấy trên hầu hết các “cửa hàng” ứng dụng có sẵn cùng bản phân phối “chimcánh cụt” Cả tác vụ sao lưu và phục hồi đều rất dễ dàng
2: Bacula
Bacula là giải pháp sao lưu hệ thống mạnh mẽ trên Linux đồng thời là mộttrong số ít các ứng dụng mã nguồn mở Linux sẵn sàng hỗ trợ giới doanh nghiệp
Trang 11Không giống như các tiện ích cùng nhóm, Bacula gồm tập hợp một số công cụchi tiết như Director (ứng dụng hiển thị thông tin tổng thể), Console (đánh giámối tương tác của người dùng với Bacula Director), File (ứng dụng cài đặt trênmáy sẽ thực hiện sao lưu), Catalog (quản lý việc sử dụng dữ liệu), Monitor (theodõi trạng thái của hàng loạt công cụ của Bacula)
Bacula không phải là giải pháp sao lưu dễ dàng nhất để tùy biến và sửdụng Tuy nhiên, đây lại là công cụ rất mạnh mẽ Nếu bạn quan tâm tới một giảipháp cao cấp và hỗ trợ nhiều tác vụ khác, đây là lựa chọn không tồi
3: Rsync
Rsync là một trong những giải pháp sao lưu trên Linux được sử dụng rãinhất hiện nay Với rsync, bạn có một công cụ sao lưu linh hoạt, thực hiện ngaytrên máy hoặc từ xa Rsync có thể cập nhật toàn bộ các cây thư mục và hệ thốngtập tin, lưu lại link, người sở hữu, quyền truy cập, sử dụng rsh, ssh hay các kếtnối thông thường khác, kể cả các kết nối ẩn tên vv
Rsync là một công cụ thực hiện bằng dòng lệnh, mặc dù vẫn có “người anhem” Grsync hỗ trợ giao diện đồ họa Tuy nhiên, khi thực hiện trên rsync, đặcđiểm của một công cụ thực hiện bằng dòng lệnh đã giúp cho ứng dụng này cókhả năng tùy biến cao Ngoài ra, một điểm lợi thế quan trọng khác bạn cũng cóthể tự mình tạo các script đơn giản để dùng Ở điểm này, rsync tỏ ra tương đốihoàn hảo
4: Mondorescue
Mondorescue sẽ là công cụ hữu ích khi hệ thống của bạn gặp trục trặc vìmột trong số những điểm mạnh của ứng dụng này là khả năng sao lưu toàn bộquá trình cài đặt Ngoài ra, Mondorescure có thể sao lưu và lưu trữ trên nhiều hệthống khác nhau như CD, DVD, băng từ, NFS, ổ cứng
Mondo hỗ trợ hàng loạt định dạng như LVM 1/2, RAID, ext2, ext3, ext4,JFS, XFS, ReiserFS, và VFAT Nếu tập tin hệ thống của bạn không có ở trên,hãy gửi yêu cầu tới nhà phát triển để được hỗ trợ Mondo được sử dụng bởi hàng
Trang 12loạt công ty lớn, chẳng hạn như Lockheed-Martin, do đó, bạn hoàn toàn có thểđặt niềm tin vào công cụ này.
5: Simple Backup Solution
Simple Backup Solution (SBS) hướng đến trước hết cho việc thực hiện saolưu trên desktop Công cụ này có thể sao lưu các tập tin, thư mục và cho phép sửdụng vào những mục đích riêng Vì SBS sử dụng hệ thống lưu trữ nén, nênkhông hẳn là tiện ích tốt nhất cho việc sao lưu dữ liệu có dung lượng lớn chưađược nén (như các tập tin media) Một trong những điểm mạnh của SBS là khảnăng hỗ trợ sao lưu các thư mục như /var/, /etc/, /usr/local SBS có khả năng saolưu linh hoạt, như thực hiện “bằng tay”, sao lưu theo lịch Giao diện rất thânthiện Một trong những hạn chế cơ bản của SBS là không có công cụ phục hồinhư fwbackups
CH ƯƠNG I: TỔNG QUAN VỀ BACKUP VÀ RESTORE DỮ NG III: M T S L I KHI BACKUP D LI U TRÊN ỘT SỐ LỖI KHI BACKUP DỮ LIỆU TRÊN Ố LỖI KHI BACKUP DỮ LIỆU TRÊN ỖI KHI BACKUP DỮ LIỆU TRÊN Ữ ỆU TRÊN LINUX LINUX
1 Không th ưu trữ dữ liệuờng xuyên backup hệ thống ng xuyên backup h th ng ệu ống
Trong môi trườ ng Windows, nhữ ng file backup trạng thái hệ thố ng cũng
2.Không ki m tra các file backup ểm tra các file backup
Nhữ ng file backup cầ n được kiể m tra định kỳ, tuy nhiên đây lại là mộttrong nhữ ng tác vụ thườ ng bị lãng quên và rất nhiều quản trị viên đã bỏ quathao tác này sau khi thự c hiện backup
Trang 13Backup chỉ là thao tác đầu tiên, cũng như mộ t file dữ liệu thông thường, vìmột lí do nào đó file backup này cũng có thể bị lỗ i, đồ ng nghĩa vớ i việ c chúng
ta sẽ không thể sử dụng nó khi cần thiết
Do đó, chúng ta cần phải đảm bảo rằng mọi file backup luôn ở trạng tháitốt và chúng ta có thể sử dụng khi cầ n thiết
3 Không s d ng Application-Aware Backup Application ử dụng Application-Aware Backup Application ụ hỗ trợ backup và phục hồi dữ liệu trên Linux
Nếu không sử dụng những công cụ backup nhận biết ứng dụng thì mọi dữliệu đã được backup sẽ đượ c lưu với trạng thái xung đột
Chúng ta cần phải liệt kê mọi ứng dụng đang được sử dụng trên máy chủ
và nhữ ng ứ ng dụng nào yêu cầ u mộ t công cụ backup riêng
4 M t ph n d li u backup b l i ột phần dữ liệu backup bị lỗi ần dữ liệu backup bị lỗi ữ dữ liệu ệu ị lỗi ỗ trợ backup và phục hồi dữ liệu trên Linux
Hệ thố ng file backup là không chỉ là mộ t công cụ bả o vệ dữ liệu
Nếu mộ t máy chủ nào đó gặ p phả i sự cố , thì các file backup sẽ là công
cụ chính giúp máy chủ đó hoạ t độ ng trở lại
File backup đặ c biệ t quan trọng, nên chúng ta cầ n thiết lậ p một cấ u trúcbackup phù hợ p để giả m thiể u sự cố cho một file nào đó trong hệ thống này.Chúng ta có thể backup lại toàn bộ những file backup
5 Không xét đ n h u qu c a vi c s d ng gi i pháp b o ến hậu quả của việc sử dụng giải pháp bảo ậu quả của việc sử dụng giải pháp bảo ả của việc sử dụng giải pháp bảo ủa việc sử dụng giải pháp bảo ệu ử dụng Application-Aware Backup Application ụ hỗ trợ backup và phục hồi dữ liệu trên Linux ả của việc sử dụng giải pháp bảo ả của việc sử dụng giải pháp bảo
m t d li u backup ậu quả của việc sử dụng giải pháp bảo ữ dữ liệu ệu
Với nhiề u tổ chứ c lớ n việ c bả o mậ t dữ liệu là ưu tiên hàng đầu Tuynhiên đôi khi bả o mật lạ i phả n tác dụng
Đặ t mậ t khẩ u bả o vệ cho file backup nhưng khi sử dụ ng đế n lại khôngthể nhớ ra mậ t khẩu
Hay khi sử dụ ng mộ t công cụ mã hóa phầ n cứng, sau đó nâng cấ p lên mộ
t thiế t bị phầ n cứ ng mớ i không hỗ trợ công cụ mã hóa đã áp dụ ng trước đó thìnhữ ng file backup chuyể n sang từ thiết bị cũ cũng không thể sử dụng
Trang 146 Ch backup d li u ỉ backup dữ liệu ữ dữ liệu ệu
Nếu chỉ backup dữ liệ u để tiế t kiệ m vùng trống bộ nhớ và thời gian thay
vì backup lạ i mọi thứ trong hệ điề u hành và ứ ng dụng củ a máy chủ thì hoàntoàn sai lầm
Máy chủ trong hệ thố ng mạ ng bị lỗi và chúng ta cầ n thự c hiện tiế n trìnhkhôi phụ c hoàn toàn, khi đó, nế u chỉ backup dữ liệu chúng ta sẽ phải cài đặ t lạ
i thủ công hệ điề u hành và mọ i ứng dụ ng sau đó khôi phụ c lạ i dữ liệu
Cài đặ t thủ công các ứ ng dụ ng thì tố t nhiề u thời gian
Do đó chúng ta cầ n một bả n backup đầ y đủ
7 Ch s d ng m t ph ỉ backup dữ liệu ử dụng Application-Aware Backup Application ụ hỗ trợ backup và phục hồi dữ liệu trên Linux ột phần dữ liệu backup bị lỗi ưu trữ dữ liệuơi lưu trữ dữ liệu ng pháp backup disk-to-disk
Phương pháp backup disk-to-disk (sử dụ ng mộ t máy chủ lưu trữ các filebackup chuyên dụ ng) có nhiề u thuậ n lợi hơn so với phương pháp backup sửdụng thiế t bị lưu trữ truyề n thống
Đôi khi máy chủ có thể xảy ra nhữ ng hiểm họ a không thể
lường trướ c được do đó chúng ta nên sử dụ ng thêm công cụ khác
Phương pháp backup truyề n thố ng như sử dụ ng băng từ, đĩa CD,
8 Chu kỳ s d ng l i thi t b l u tr quá ng n ử dụng Application-Aware Backup Application ụ hỗ trợ backup và phục hồi dữ liệu trên Linux ại backup ến hậu quả của việc sử dụng giải pháp bảo ị lỗi ưu trữ dữ liệu ữ dữ liệu ắn
Quay vòng sử dụng thiế t bị lưu trữ là một phương pháp mà nhiề u công ty
sử dụng để tiế t kiệm chi phí
Đây là mộ t phương pháp khá hiệ u quả , tuy nhiên cần phải lên mộ t chu
kỳ sử dụ ng lạ i nhữ ng thiế t bị này cho phù hợp
Ngoài việ c kiể m tra định kỳ dữ liệ u backup, chúng ta cầ n phải lên kế hoạ
ch xoay vòng sử dụ ng ổ đĩa lưu trữ cho phù hợ p, tốt nhất nên dành riêng ra một
số ổ đĩa để lưu các dữ liệu quan trọng
9 Các gi i pháp backup d li u h u hi u ả của việc sử dụng giải pháp bảo ữ dữ liệu ệu ữ dữ liệu ệu
• Backup bằ ng thiế t bị lưu trữ lớn
• Tổ chức tệp tin
• Backup tiện nghi
• Sử dụ ng ổ USB