Tinh cấp thiết của luận văn Thực hiện chỉ thị 58-CT/TW về đây mạnh ứng dụng và phát triển công nghệ thông tin phục vụ sự nghiệp công nghiệp hóa, hiện đại hóa và ĐỀ án 06 tin học hoá ho
Trang 1TRONG HE THONG THONG TIN DIEN TU
Ngành — Công nghề thông tin
Trang 2MUC LUC
MUC LUC
LOI CAM DOAN, "
DANH MỤC BANG BIBU
DANH MỤC KÝ HIỂU
MỞ DẤÂU cnoneee
Chương 1: GIỚI THIÊU CHƯNG
1.1 Sự cần thiết về sao lưu, khôi phục dữ liệu
1.3 Ứng dụng sao lưu, khôi phục dữ liệu trong hệ thống thông tin điện tử
của các cơ quan Đảng
1.3.1 Các phần mềm ứng dụng dùng chung -2- ¿c5
1.3.2 Những hạn chế tồn lại
1.3.3 Hướng giải quyết hạn chế tổn tại
Chương 2: CÁC PHƯƠNG PHÁP SAO LƯU, KHÔI PHỤC CƠ SỞ DỮ
LIEU
2.1 Khái niêm cơ bản
2.1.1 Dinh nghĩa sao lưu, khi :
2.1.2 Phân loại các kiểu sao lưu, khôi phục phục dữ liệu
2.1.3 Tiêu chí đánh giá địch vụ sao lưu, khôi phục dữ liệu
phục dữ liệu
2.2 Các phương pháp sao lưu, khôi phục cơ sỡ đữ liệu
2.2.1 Sao Tưu, khôi phục cơ sở đữ liệu mức hệ điều hành
2.2.2 Sao hưu, khôi phục cơ sở dữ liệu mức hệ quản trị cơ sở đỡ liệu
Trang 32.2.3 Sao lưu, khôi phục cơ sở dữ liệu mức ứng dung,
2.3 Dánh giá các phương pháp sao lưu, khôi phục cơ sở dữ liệu
Chương 3: ĐÉ XUẤT GIẢI PHÁP SAO LƯU, KHÔI PHỤC CÁC CƠ SỞ
TÀI LIÊU THAM KHẢO
A Cai đặt và cách sử dụng chương trình
B Mã nguồn chương trình
€ Cơ chế chạy tự động cron trong Linux "
D Cơ chế chạy Lự động Scheduled Tasks tong Windows
29 31
Trang 4
DANH MUC BANG BIEU
M6 hinh hé thing lu trit DAS (Direct Access Storage}
Mô hình NAS (Network Attached Storage)
6 hinh SAN (Storage Area Network)
Tinh 4 So sách các phương pháp sao lưu dữ liệu
Dl
TTình 6 Mô hình tiến trình sao lưu dữ liệu
nh 7 Mõ hình tiến trình khối phục dữ liệu
¡ Hình 8 So sánh các giải pháp lưu trữ dữ liệu
[ Binh 6: Tiểu chỉ đánh giá dịch vụ khôi phục thấm hoa
Hình 1Ú Sao lưu cơ sở dữ liệu mức hệ điều hành
Hinh 11 Sao lưu, khôi phục cơ sở dữ liệu mức hệ quân trị cơ sở đữ liệu
Sao lưu, khôi phục cơ sở dữ
[iSRETS” Giao diện của chương trình khối phục đữ hệu
Hinh 19” Bang kết quả chương trình khôi phục dữ liệu
Mẫn hình các ứng dune chay trong ché dé crontab
Man hinh chon tép chay tu déng trong Scheduled Tasks
Man hinh chon thời gian chạy ứng đụng trong Scheduled Tasks | 70 Mân hình kết thúc quá trình dat lich chay trong Scheduled 'Lasks
Trang 5
DANII Muc CÁC KỶ TIỆU
3 | Backup offline Sao luu không trực tuyên
4 | Backup online Sao lưu trực tuyên
6 | Cron Cứ chế chạy tự động trong Linux
7 | Control File Tép didu khién
9 | Database Cơ sở dữ liệu
10) Iatabase Access |.ibraries 'Ihư viện truy xuất cơ sở dữ liệu
11] DMS Hệ thông quản trị tải liệu
13] Database need to backup Cơ sở dữ liệu cần sao lưu
15] Full Backup Sao lưu toàn bộ
16| Tneremnenta] Backup Sao lưu gia tăng
" Công nghệ phát triển các ứng dụng web,
chay trên máy áo lava
20] Java Complier Bộ địch java
21] Modul Là một đoạn chương trình có khả năng thực hiện một chức nắng cụ thê
Trang 6
22] Transaction log 'Tệp ghi lại nhật ký các giao dich
27| Recovery Point ObjccUvc — Thời gian khôi phục
30| Scheduled Tasks Cø chế chạy tư động trong Windows
32] Type of database Loại cơ sở đữ liệu
Trang 7MỞ ĐẦU
1 Tinh cấp thiết của luận văn
Thực hiện chỉ thị 58-CT/TW về đây mạnh ứng dụng và phát triển công
nghệ thông tin phục vụ sự nghiệp công nghiệp hóa, hiện đại hóa và ĐỀ án 06
tin học hoá hoạt đông của các các cơ quan Dang giai đoạn 2006 — 2010 nhằm
xây dựng các hệ thống thông tin điện tử của các cấp uỷ Đăng đấm bảo cung
cấp thông tín và trao đổi thông tin từ rung ương xuống các địa phương, Các
ung dung ding chung trong hé théng các cơ quan Dảng được xây dụng trên
hộ thống mã nguồn mỡ, cài đặt trên nền hệ điều hành Linux, cơ sở dữ liệu
Posgresql, MySQL MicroSoft SQL Webserver la ‘lomcat, Application Server
là Tboss
Đây là hệ thắng thông tin diện tử phục vụ sự lãnh dạo, chỉ đạo, diễu
hành của các cấp uỷ Đảng, nơi chứa các thông tin quan trọng của Đảng Do
vậy, cần đảm bảo hệ thông nảy hoạt động liên tục và an toàn Cáo ứng dựng
hiện nay đang được sao lưu, khôi phục một cách cục bộ Mỗi ứng dụng sử
dụng một chương trình sao lưu riêng, việc sao lưu tương đối phức tạp, đòi hỏi
người quán trị mạng phải có kiên thức nhất định về cơ sớ dữ liệu mình quán
lý Việc xây dựng giải pháp sao lưu vả khôi phục các cơ sở đữ liệu một cách
tập trung, tự động là rất quan trọng và rất cần thiết
2 Mục dịch của luận văn
- Nghiên cứu tổng quan về các giải pháp sao lưu, khôi phục đữ liệu
~ Nghiên cửu dễ xuất giải pháp tự dộng sao lưu và khôi phục các cơ sở
dữ liệu (hê thống va img dụng) một cách tập trung, phù hợp với kiến trúc của
các hệ thống thông tin điện tử,
Trang 83 Di tượng nghiên cứu
Đôi tượng nghiên cửu của luận văn là hệ thông các cơ sở đữ liệu trong
mạng diện rộng của các cơ quan Dắng
4 Phạm vị nghiền cứu
Luận văn nghiên cứu một cách tương đối có hệ thống về nguyên tắc, cơ
chế hoạt dộng của các phương pháp sao lưu, khôi phục đữ liệu cơ bán Nghiên
cứu cơ chế các phần mềm sao lưu, khôi phục của các hãng chuyên sao lưu
khối phục trên thế giới, đánh giá ưu nhược diém, ur dé dưa ra giải pháp và
xây dựng công cụ giúp sao lưu, khỏi phục dữ liệu tự động trong các hệ thông,
thông tín điện tử
5 Phương pháp nghiên cứu
luận văn kết hợp giữa mô hình nghiên cứu lí thuyết và ứng dung minh
họa để kiểm chứng, Nói chính xác hơn là, từ những nghiên cứu lí thuyết và
giải pháp lí thuyết, đánh giá ưu nhược điểm của các giải pháp về sao lưu, khôi
phục, luận vẫn xây dựng một chương trình cho phép sao lưu, khôi phục dữ
liệu một cách lập trung với nhiều tính năng vượi trội
Hệ thống được kiểm nghiệm trên một số cơ sở đữ liệu ding chung
trong cdc co quan Bang
6¥ nghia khoa hec va thuc tiễn của luận văn
Luuận văn không chỉ nghiên cứu một cách khoa học, nguyên lý các cách
thức sao lưu, khôi phục dữ liêu, dánh giá các giải pháp dang có trên thị
trường, phân tích ưu nhược điểm của các giải pháp đó, mả côn để xuất một
giải pháp cũng dựa trên các nguyên lắc cơ bắn về sao lưu, khôi phục dữ liệu
nhưng dược cải tiến một số nhược điểm mà các giải pháp trước dó pặp phải
Như vậy, luận văn đã đạt được ý nghĩa khoa học vả khẳng định tỉnh thực tiễn
Trang 9oda minh Né déng góp một phần quan trọng trong việc đầm bảo an toàn dữ liệu và đâm bảo hoạt đông liên tục của các hệ thống thông tin điện tử đang
hoạt động trong mạng điện réng cla Dang
7 Kết cầu luận văn
Ngoài phần Mỡ đầu và phần Kết luận, luận văn gầm có 3 chương sau:
Chương 1- Giới thiệu ting quan về sự cần thiết sao lưu, khôi phục
đữ liệu và hiện trạng thục hiện các hệ thông thông tin điện tử trong
các cơ quan Đáng
Chương 2 Nghiên cứu các giải pháp sao lưu, khôi phục đữ liệu,
đánh giá ưu nhược điểm của từng piải pháp
Chương 3: Để xuất giải pháp sao lưu, khôi phục các cơ sở dữ liệu
áp dụng cho các hệ thống thông tin diện tử trong các cơ quan Đảng.
Trang 10Chương 1: GIỚI THIỆU CHUNG
1.1 Sự cần thiết sao lựa, khôi phạc dữ liệu
Trong thời đại ngày nay, thông tin dóng vai tr hết sức quan trọng
trong hầu hết các cơ quan, tễ chức Xét trên khía cạnh công nghệ, hoạt động của cơ quan, tổ chức là quá trỉnh xử lý, trao đổi đữ liệu và lưu trữ thông tín
Việc sao lưu, khôi phục đữ liệu dễ dãm bão hệ thống hoạt động liên tục, thông,
suốt ngày cảng được quan tâm cao và được đầu tư thỏa đáng
Có nhiều nguyên nhân làm hỏng höc hoặc mắt mát dữ liệu như tệp
chẳng may bị xoá, trục trặc phần cứng, thông tin liền quan nằm ở những tệp không còn truy cập được Một quản trị viên giỏi phái đảm bảo sao cho người
dùng vẫn tham khảo được những tệp “đã mất” như thể Muốn vậy, quản trị
mạng phải sao lưu đữ liệu kịp thời Tương lai của cơ quan bạn và tương lai của bạn tại cơ quan có thể tuỳ thuộc vào việc các người dùng trưy cập được
những tệp đã sao lưu ấy Tại những thời điểm nóng bỏng như thể, bản thân
bạn cũng như các người khác sẽ có cơ hội nhận thức giá trị của thời gian và
công sức để sao chép dữ liệu một cách dều dặn, chặt chế và theo một thởi
điểm đầy đủ Việc sao lưu tệp không mấy hap dẫn, nhưng quản trị viên không
thể không am tường tiển trình sao lưu
Trong quả trình thực hiện sao lưu đữ liệu có thể xảy ra lỗi hệ thống,
nghĩa là đữ liệu có thể bị mất hoặc không được sao hưu đầy đủ, chính xác Các
nguyên nhân chủ yếu gây ra lỗi hệ thống là
- Lỗi do con người: Một trong những nguyên nhân phố biến làm héng
hệ thống là do con người Ví đụ nếu người nào đỏ trong quả trình sử
Trang 11dựng xoá nhằm dữ liệu của một bảng thông tin, lập tức hệ thống sẽ kết nỗi đến các bảng có liên quan để xóa dữ liệu dữ liệu trong các bảng, này Mặc dù chúng ta có thể khôi phục dữ liệu từ các thiết bị lưu trữ
nhưng một số dữ liệu có thổ mắt Cách khắc phục hay dùng là trong cáo
hệ điền hành có phân quyền đến từng người sử dụng, tạo người dùng với những quyền khác nhau trên từng ứng dụng cu thể
- Lễi phần củng: Hệ thống máy móc thiết bị có thế hồng hóc bắt cử lúc
nào, nó có thể hỏng ở bộ xứ lý, bô nhớ, dường vào ra và các thiết bị lưu
trữ Đổi với người quản trị hệ thống thì phải luôn giám sát hệ thẳng,
thông qua các thông báo lỗi của hệ thẳng để tìm cách khắc phục lỗi
~ lỗi trong, phiên giao dịch: 'Irong các phiên giao dịch, đôi khi bị lỗi đo
hệ thống bị treo hay đang cập nhật thông tin Trong trường hợp nảy, hệ
thẳng sẽ có phi nhận một cách thứ tự tắt cả các thao tác chứa trong tệp
nhật ký giao dich (transaction log) kể từ lần nhật ký giao dịch được sao
lưu gần nhất Và do vậy có thể khôi phục dữ liệu vào một thời điểm nao
đó trong quá khứ mà vẫn đầm bảo tính nhất quán (consistent)
- Lỗi do thiên tại : Một số trường hợp hệ thống bị lỗi do các thăm hoa
thiên tai như động đất, sét đánh, cháy, điện không ồn định,
số lượng đữ liệu bị mất, sẽ có cáu mức độ khôi phục khác nhau
ủy thuộc
Trang 121.2 Các hệ thống lưu trữ dữ liệu [22]
Hiện nay có rất nhiều hệ thống lưu trữ dữ liệu để thực hiện việc sao lưu,
khôi phục dữ liêu, trong đó ba hệ thống lưu trữ dữ liệu phổ biến nhất là DAS,
NAS, SAN
1.2.1 Hệ thống lưu trữ DAS
DAS (Direct Access Storage) là hệ thống lưu trữ dữ liệu mà ở đó thiết
bị lưu trữ được gắn trực tiếp vào máy chủ Thiết bị lưu trữ có thể là tủ đĩa đặt
bên ngoài và được nối với máy chủ bởi cáp điều khiển với cổng bên ngoài,
hoặc là những ổ đĩa ở bên trong may chủ Hiên nay hau hết các hệ máy chủ
đều có các hệ thống lưu trữ DAS dùng chuan SCSI hoặc Serial SCSI Trong
hê thống DAS, các máy trạm truy xuất qua máy chủ, trong trường hợp máy
chủ hỏng, các truy xuất dữ liêu sẽ không thực hiện được Với giải pháp này,
mỗi máy chủ sẽ có một hệ thống lưu trữ và phần mềm quản lý lưu trữ riêng
- Card HBA được cài đặt trong máy chủ để kết nồi máy chủ với thiết bị
lưu trữ bên ngoài
~ Ô đĩa lưu trữ được cài đặt vào trong hê thống con của thiết bị lưu trữ
Trang 13Ưu đễm: Dễ lắp đặt, chỉ phí thấp, hiệu năng cao
Nhược điểm:
- Khả năng mở rộng hạn ché, thực tế I3A§ làm việc rất tốt với một máy
chủ (server) nhưng khi dữ liệu tăng, số lượng máy chủ cũng tăng sẽ tạo nên
những vùng dữ liệu phân tản vả gián đoạn Khi đó, người quân tị sẽ phải bd
sung hay thiết lập lại dung lượng vả công việc bảo tri sẽ phải thực hiện trên
từng máy chủ Điều đó sẽ làm tăng chỉ phi lưu trữ tổng thể và sẽ cảng khó
khăn hơn khi sao lưu hay bảo vệ một hệ thống kho lưu trữ đữ liệu đang nằm
Tải rắc và phân tán như vậy
- Khai thác tải nguyên không hiệu quả: Không gian lưu trữ bị chia nhỏ thành các vũng cục bộ nên khai thác không hiệu quả Ví dụ, một máy chủ có
thể số gắng ghi lên một vùng lưu trữ bị đây, trang khi đỏ một vùng lưu trữ
khác thì lại thửa nhưng không khai thác chung được
- Lưu thông mang chậm: Khi chia sẻ dữ liệu qua mạng sẽ làm chậm lưu
thông mạng
- Quần trị phức tạp: Việc chia nhỏ các vùng lưu trữ cục bộ sẽ làm phức
tạp vấn đề quản lý của toàn hệ thống lưu trữ
1.2.2 Hệ thống lưu trữ NAS
NAS (Network Attached Storage) 14 phương pháp lưu trữ đỡ liệu sử
dụng các thiết bị lưu trữ đặc biệt gắn trực tiếp vào mạng TAN như một thiết
bị mạng bình thưởng (tương tự máy tính, switch hay router) Các thiét bi NAS
cũng được gắn các địa chỉ IP cô định và được người dùng truy nhập thông qua
sự điểu khiến của máy chủ 'Irong một số trường hợp, NA8 có thể được truy
cập trực tiếp không cần có sự quản lý cla may chủ NAS cung cập khả năng
chia số tài nguyên lưu trữ cho nhiều người dùng đồng thời Bên cạnh đó, NAS
Trang 14cho phép thực hiện mở rộng về dung lượng lưu trữ khi nhu cầu sử dụng tăng
Storage
‘Server with Server with
External Storage Tape Backup
Hinh 2 M6 hinh hé thong luu trit NAS (Network Attached Storage)
Các trụ điểm của NAS:
- Không tốn chỉ phí cho các card điều hop HBA va RAID
~ Dễ dàng cầu hình vì đây là các thiết bị plug-and-play
~ Có thể truy xuất từ bất kì nơi nào, qua kết nối mạng,
- Hỗ trợ nhiều hệ điều hành
Nhược điểm của N.4S
~ Chỉ cho phép dùng qua LAN
~ BỊ giới hạn băng thông và làm ảnh hưởng đến lưu thông mạng LAN
- Bị giới hạn về khả năng quản lí dung lượng.
Trang 151.2.3 Hé théng Iwu trip SAN
SAN (Storage Area Network) la một mạng riêng tốc độ cao dùng cho việc truyền dữ liệu giữa các máy chủ tham gia vào hệ thống lưu trữ cũng như
giữa các thiết bị lưu trữ với nhau Một mạng SAN cho phép các thành phần
kết nối với nhau thông qua thiết bị như routers, gateways, hubs, switchs Điều
đó cho phép bỏ kết nối lưu trữ vả sao lưu truyền thống giữa một máy chủ với thiết bị lưu trữ, đồng thời bỏ ý niêm một máy chủ chỉ sở hữu và quản lý một
thiết bị lưu trữ
Sử dụng mạng lưu trữ SAN cho phép quản lý toàn bộ hệ thống lưu trữ, cho phép một hay nhiều máy chủ hỗn hợp chia sẻ các tiện ích lưu trữ như dùng chung ô đĩa, băng từ vả các phương tiện lưu trữ quang, mặc dù hệ thông
thiết bị lưu trữ đó được đặt cách xa các máy chủ sử dụng nó bởi kết nối là
những tuyến cáp quang Vì vậy, SAN thường được phát triển ở những trung
Hình 3 Hệ thống luu trit SAN (Storage Area Network)
Hình 3 cho thay SAN kết nối nhiều máy chủ với nhiều hệ thống ứng dụng va
lưu trữ khác nhau Hầu hết mang SAN hiện nay cung cấp cho người sử dụng
5
Trang 16khả năng mở rộng, hiệu năng và tính sẵn sàng cao SAN đặc biệt thích hợp
với các ứng dụng cân tới tốc độ và đô trễ nhỏ, vỉ dụ như ứng dụng xử lý giao địch trong ngành ngân hảng, tải chính
1.2.4 So sánh các hệ thống lưu trữ
Mỗi một hệ thống lưu trữ đều có mặt ưu và nhược điểm khác nhau Tùy
vào quy mô dữ liệu, nhu cầu, kinh phí ma sử dụng hệ thông lưu trữ thích
hợp
Chuyén Sử dụng chung cho các
May chủ, IIĐII các ứng dụng khác
Inhau biệt, tối ưu ứng dụng khác nhau
a (Gan trong’gin ngoai [Gan ngoai |Gan ngoai chia sé
“Thiết bị lưu trữ
Quản trị [Theo nhân sự Tap tung [Tập trung
Ồ lAnh hưởng nhất định (Tăng hiệu
đến hiệu suất mạng |suất mạng
‘Sin sangeao |Bigiớihan |H¡ giới han [Không có điểm gây lỗi
Chap nhận |Chi phí cao nhưng có
Trang 171.3 Ung dung sao lưu, khôi phục dữ liệu trong các hệ thông
thông tin điện tử của Đảng [17]
1.3.1 Các nhần mềm ứng dụng dùng chung
Tiiện tại, trong các cơ quan Đảng đang sử dụng dùng chung, thẳng nhất
một số phần mềm như
a) Phần mềm Hệ thông tin điều hành tác nghiệp thực hiện trên phần
mém nén Lotus Notes, cho phép quản lý, xử lý, trao đổi, khai thác văn bản, tải liệu lưu trữ của Đăng,
b) Phần mềm Hệ thông tin quản lý dữ liệu đảng viên cho phép quản lý,
xử lý, trao đổi, khai thác đữ liệu về đẳng viên, Lễ chức đẳng trong Loàn Đảng,
c) Phần mềm đặc thù chuyên ngành Kiểm tra Pang, cho phớp quần lý,
xử lý, trao đổi khai thác hỗ sơ, tài liệu liên quan đến công tác kiểm tra đảng
Các phần mềm này được phát triển vả hoạt động trên nền hệ điều hành
Windows, sit dung cac hé quan trị cơ sở đữ liệu chuyên biệt cla Lotus Notes hoặc hệ quản trị cơ sở đữ liệu quan hệ SQL; giao điện người dùng, hoặc được phát triển riêng (client softwarc) hoặc là giao diện Wcb
Một trong các định hướng phát triển các hệ thống thông tin điện tử của
các cơ quan Đảng là sử dụng phần mềm mã nguồn mở Phần mềm I1ệ thông
tin điều hành tác nghiệp el3ocMan dược phát triển trên nền phần mềm mã
nguồn mở và đang được triển khai sử dụng trong các cơ quan Đăng, thay thể
cho phần mềm IIệ thông tin điều hành tác nghiệp trên phần mềm nền Lotus
Notes.
Trang 18Kiến trúc của phần mềm eDocman được mô tả trong Hình 5
DOCman - Kiến trúc phan mém
hệ nảy liên hê chặt chẽ với các phân hê cung cấp dich vụ hệ thống như: a)
dịch vụ thư điện tử và thông báo, phục vụ việc trao đổi văn bản giữa các phân
hệ quản lý văn bản khác nhau; b) dịch vụ lưu trữ dữ liệu; e) dịch vụ quản trị
người dùng, bao gồm quản lý tài khoản người dùng, quản lý quyền truy nhập
các cơ sở dữ liệu văn bản, quản lý vai trò người dùng trong xử lý luồng công
việc; và d) xác thực người dùng Ngoài ra, các phân hệ cơ bản của eDocMan còn được tích hợp với dịch vụ ứng dụng khác như: dịch vụ fax, dịch vụ nhận dang van ban OCR, dich vu quet anh van ban (scan document)
Người dùng trao đổi dữ liệu với hệ thống eDocMan thông qua các giao điện trình duyệt Web (Webbrowser) và dịch vụ ODMA, cho phép truy nhập trực tiếp từ các ứng dung văn phòng như: MS Word, MS Powerpoint, vào
cơ sở dữ liệu văn bản được quản lý bởi eDocMIan
Trang 194.3.2 Một số hạn chế tồn tại
- Các phần mềm đã xây dựng nảy đều là các ứng dụng độc lập, chưa có
kiến trúc thống nhất và không được tích hợp, chỉ» sẽ thông tin, dữ liệu tho
các tiêu chuẩn tiên tiến hiện nay
- Chưa có cơ chế sao lưu, khôi phục đữ liệu tập trưng
1.3.3 Hướng giải quyết hạn chế tồn tại
- Nghiên cứu, xây dựng mô hình kiến trúc hồ thống công nghệ thông tin
trong quá trình xây dựng các hệ thống thông tin điện tử của Dang, dam bảo kiến trúc thống nhất cho việc xây đựng và đưa các hệ thông thông tin điện tử
vào vận hành, sử dụng, tránh trùng lắp, lãng phí khi phát triển, giúp người
ding khai thác, sử dụng dễ dàng thuận tiện
- Nghiên cứu, đề xuất xây dựng giải pháp sao lưu các cơ sở đữ liệu một
cách tận trung nhằm dảm báo đữ liệu, thông tin dược hoàn toàn kiểm soát và
đầm bảo độ an toàn trong toản Đảng
Trang 20CHƯƠNG 2: CÁC PHƯƠNG PHÁP SAO LƯU, KHÔI PHỤC
CƠ SỞ DỮ LIỆU
2.1 Khái niệm cơ bản
2.1.1 Định nghĩa sao lưu, khôi phục dữ liệu
đao iu dữ liệu là quả trình tạo ra một bản sao đữ liệu sang các thiết bị
lưu trữ Việc lưu trữ này được sử dụng trong tương lai khi hệ thông ban đầu bị
hỏng,
Tiến trinh
sao lưu
Hình 6 Mô hình tiến trình sao lưu dữ liệu
Trong hầu hết các trường hợp thì nguồn thường là dữ liệu trong dĩa
cứng như các tệp, thư mục, cơ sở dữ liệu vả các ứng dụng Phân mềm thực
hiện quá trình sao lưu đữ liệu sang các thiết bị lưu trữ gọi là phần mềm sao
lưu dữ liêu Dích là các thiết bị lưu trữ như' băng tủ, đĩa từ, đĩa quang,
Trang 21Khéi phyc di liệu là quá trình tạo lại đữ liệu géc từ dữ liệu đã được lưu trữ
Hình 7 Mô hình tiến trình khôi phục đữ liệu
Sao lưu đữ liệu trong môi trường mạng là quá trỉnh sao lưu đữ liệu
trong đó tiến trình sao lưu dữ liệu từ nguồn sang các thiết bị lưu trữ thông qua
môi trường mạng
Sao lưu đữ liệu trong môi trường mạng cần chủ ý một số van dé sau
- Thiết bị sao lưu phải có khả năng kết nối đến bất kỳ hệ thông
máy tính trong mạng
- Định tuyến luỗng dữ liệu sẽ san lưu trong mạng
- Quản trị hoạt động sao lưu đối với bất kỳ hệ thống nảo
- Hỗ trợ sao lưu nhiều loại hệ thống kháu nhau
Saa lưu tự động là quá trình hệ thông tự động sao hưu theo một thời
gian định trước Việc sao lưu tự động đem lại rất nhiễu lợi ích như giúp quản
trị mạng thực hiên công việc sao lưu vào thời điểm không có người dùng truy
cập hệ thống hoặc ít sử đụng tài nguyên hệ thống, tránh các sai sót trong quá
trình sao lưu Trên hệ điều hanh Linux, Unix dé chạy các chương trình tự
động thì thường sử dụng chức năng Cron Đó là chức năng cho phép người
dùng thực hiện các tác vụ theo định kỳ đã được lên kế hoạch và thời gian trước
Trang 222.1.2 Phân loại các kiều sao lưu dữ liệu
Có hai kiểu sao lưu dữ liêu chính : Sao lưu không trưc tuyển (backup
offline) và Sao lưu trực tuyến (backup online)
Sao lưu không trực tuyến: thực hiện khi hệ thông tạm ngừng hoạt đông
và do đỏ không có các thao tác của người dùng tác động vào hệ thống Người
dùng không thể kết nỗi đến các ứng dụng để thực hiện bất kỳ thao tác nảo Sẽ
không có bất cứ hành đông nao tac đông lên hê thống ngoai trừ tiến trình sao lưu
Sao wu true tuyén: Thực hiện quá trình sao lưu ngay cả khi hệ thông
đang hoạt đông Người dùng có thể sử dung các chức năng của chương trình
trong khi tiến trình sao lưu đang thực hiện
Bản thân trong sao lưu trực tuyển và sao lưu không trực tuyển cũng chia ra làm các loại nhỏ đó là sao lưu theo phương thức đầy đủ và sao lưu theo phương thức gia tăng
Loại sao lưu Mô tả Ưu điểm Nhược điểm
Sao lưu đây đủ |Saolưuatoànbộ |Dễ dàng xác | Tến thời gian và
(Full Backup) các tệp trong định dữ liệu để | không gian lưu
thư mục được | sao lưu và khôi | trữ dữ liệu
xác định cần phục
sao lu,
Trang 23
sao lưu đầy đủ
cuối củng với sao lưu toàn
Sao lưu gia tăng | Một xác lập để | Mất ítthời gian | Khi khôi phục
so với lần sao |sao lưu những |vàkhônggian | mat kha nhieu lưu cuối cing tệp có sự thay | lưu trữ nhất thời gian do cân
(Incremental |đổi kế từ lẫn khôi phục bản
Sao lưu gia tăng | Một xác lập để | Mấtítthờigian |Thông tin sao
so với lần sao |saolưunhững |vàkhônggian |lưu cỏn bị lấp
lưu đầy đủ cuối | tệp có sựthay |lưutữhơnso |Hại Sao lưu tốn
nhiều thời gian
hơn so với sao
lưu gia tăng
Hình 8 So sách các phương pháp sao lưu dữ liệu
Sao lưu theo phương thức đầy đủ là sao lưu toàn bộ các tệp trong thư
mục được xác định cần sao lưu hoặc sao lưu toàn bộ ửng dụng bao gồm cả
Trang 24chương trình và dữ liệu Đây là kiểu sao lưu thông dụng, rất dễ Tuy nhiên,
sao lưu theo phương thức này sẽ tốn không gian lưu trữ và thời gian sao lưu
Sao lưu theo phương thức gia tăng là phương thức chỉ sao lưu khi có sự
thay đối trong hệ thống tộp hoặc các đối Lượng trong cơ sở đữ liệu Nó chia ra
làm hai loại, đó là:
4) Sao lưu những tệp hoặc sáo đối tượng trong sơ sở dữ liệu có sự thay
dỗi kể từ lần sao lưu cuối củng thuộc bất kỹ loại sao lưu nào
(Incremental backup)
b) Sao lưu những tếp hoặc các dối tượng trong cơ sở dữ liệu có sự thay
dãi kế từ lần sao lưu cuỗi dây đủ cuối cùng (Differential backup)
2.1.3 Tiêu chí đánh giá dịch vụ sao lưu, khôi phực dữ liệu [5]
Khi nói đến việc khôi phục đữ liệu, đặc biệt là đổi với việc khôi phục
thâm họa, người ta thường nhắc tới hai tiêu chí đó là tiêu chí về thời gian khôi
phue (Recovery Time Objective) va tiêu diểm khôi phục (Reeovery Point
Objective) Tiêu chí thứ nhất xác định khoảng thời gian ngừng hoạt động lớn
nhất có thể chấp nhận được đổi với cơ quan là bao nhiêu Ilay nói cách khác
đó là yêu cầu về thời gian cần thiết dễ khôi phục hoạt đông sau khi xảy ra
thâm họa hoặc sự cễ Tiêu chí thứ hai liên quan đến sự đánh giá mức độ thiệt
hại và ảnh hưởng đến hoạt động khi bị mắt đữ liệu, hay nói cách khác là mức
độ mắt dữ liệu thế nảo được coi là vẫn chấp nhận được trong trường hợp xảy
ra thắm hoạ sự cỗ
Trang 25Các đại lượng liên quan trong cả hai tiêu chí (thời gian khôi phục và
lượng dữ liệu bị mất) càng nhỏ thì chất lượng của dịch vụ khôi phục thảm hoạ
Hình 9 Tiêu chí đánh giá dịch vụ khôi phục thảm họa
Chiều mũi tên chỉ sang phải trong Hình 9, chủng ta có thể nhận thấy thời gian cần thiết để khôi phục thảm họa sẽ phải tăng dần trên trục thời gian
từ nhiều giây, nhiều phút, nhiều giờ, đến nhiều ngày phụ thuộc vào công nghệ được áp dụng cho quá trình khôi phục dữ liệu Thời gian cần thiết để khôi phục hoạt động tăng dần (cũng có nghĩa là chất lượng của dịch vụ khôi phục thảm hoa giảm dẫn) theo sự áp dung của công nghệ: vận hành hệ thống trong chế độ cluster, thực hiện khôi phục dữ liệu bằng các phương pháp không tự động và cuối củng là khôi phục bằng băng từ Tương tự như vậy, theo dõi chiều mũi tên sang trái trong Hình 9, lượng dữ liệu bị mắt khi xảy ra thảm họa
sẽ tăng dần cùng với sự giảm tính năng các công nghệ được áp dung: từ tạo bản sao dữ liệu theo phương pháp đồng bô, tạo bản sao theo phương pháp
không đồng bộ, tạo bản sao theo định kỳ, và cuối cùng là tao ban sao bing
băng từ
wo a
Trang 262.2 Các phương pháp sao lưu, khôi phục cơ sở dữ liệu
Có ba phương pháp chính để sao lưu, khôi phục cơ sở dữ liệu đó là:
~ 8ao lưu, khôi phục mức hệ điều hành
~ Sao lưu, khôi phục mức hệ quản trị cơ sở dữ liệu
~ 8ao lưu, khôi phục mức ứng dụng
2.2.1 Sao lưu, khôi phục cơ sở dữ liệu mức hệ điều hành
a) Khái niệm
Sao lưu, khôi phục dựa ở mức hệ điều hành có nghĩa là sao lưu tất cả
các tệp (file) vật lý liên quan đến cơ sở dữ liêu ra thiết bị lưu trữ
Trang 27Mẫi cơ sở dữ liệu sẽ bao gỗm nhiễu tệp vật lý được chứa trên thiết bị lưu trữ Hệ điều hành sẽ thực hiện quá trình sao lưu các tệp vật lý nảy ra các
thiết bị lưu trữ Như vậy để sao lưu, khôi phục cơ sở đữ liệu mức hệ điêu hành
đôi hỏi phải biết được cấu trúc vật lý của cơ sở dữ liệu cần sao lưu Thông,
thường nó gồm 3 loại tệp
- Tép dit ligu (data file) chứa đữ liệu thực sự trong cơ sở dữ liệu (CSI21) Có hai loại tệp đữ Hiệu: tệp dữ liệu người dủng và tệp đữ liệu hệ
thống Dữ liệu hệ thống cho biết người dủng đúng của cơ số dữ liệu vả nơi
các tệp đữ liệu này được định vị Dữ liệu người dùng được lưu trữ trong
những bảng do người dùng định nghĩa, nhưng chúng cũng chửa từ diến dữ liệu và những kiểu cầu trúc khác Một cơ sở dữ liệu có ít nhất một tệp dữ liệu
- lệp nhật ký khôi phục (Redo log) : những tệp này chứa thông tin ghi
nhận những thay đổi đã làm trên CSDL để có thể khôi phục trong trưởng hợp
có lỗi xây ra
- Têp điều khiển (Control file): Nhiig tệp nảy chửa thông tin cân thiết
để duy trì và kiểm tra tỉnh toàn vẹn CSDL
c) Danh gia
Uu diém:
- Dữ liệu đảm bảo tuyệt đối an toàn, khi có sự cễ đảm bảo khôi
phục chỉnh xác dữ liệu tại thời diễm sao lưu
Nhược điểm:
- Không kiểm tra các lỗi logic trong cơ sở dữ liệu (như đữ liệu bị
sửa đổi, mắt, ghi sai vị tri) vi du bản dữ liệu đó đúng hay sai thì
cũng đều là một tệp vật lý.
Trang 28- Không cho phớp sao lưu một phần của cơ sở dữ liệu khang thé sao lưu một bảng hay một hàm trong cơ sở đữ liệu) mà phải sao
lưu toàn bộ cơ sở dữ liệu do vậy sẽ tén không gian lưu trữ
2.2.2 Sao lưu, khôi phục dựa vào hệ quản trị cơ sở dữ liệu
a) Khái niệm
Sao lưu, khôi phục cơ sở dữ liệu dựa vào hệ quần trị cơ sở đữ liệu lá hình
thức tạo bản sao của cơ sở đữ liệu được thực hiện bởi sự kết hợp một tập hợp các hàm đo cơ sở dữ liệu hỗ trợ trong giao điện không thân thiện cho người
thực hiện sao lưu
b) Kiến trúc, nguyên tắc hoạt động
Trang 29Các cơ sở đữ liệu được tạo ra từ nhiều hệ quan trị cơ sở đữ liệu khác
nhau nên không thể truy cập trực tiến chúng mà thông qua các bộ máy cơ sở
đữ liệu khác nhau Các bộ máy này đóng vai trò trung gian trong quả trình
truy cập vào cơ sở dữ liệu
Hầu hết các cơ sở đữ liệu đều cung cấp phương pháp sao lưu cho chính
co sở dữ liệu đó Người quản trị phải chạy một lập hợp các câu lệnh mà hệ
quan tri cơ sở đữ liệu cung cấp Phần lớn công việc này phải thực hiện Lại máy
có cải đặt cơ sở dữ liệu và người quản trị phải có kiến thức nhất định về cơ sở
đữ liệu mả mình định san lưu, khôi phục Với mỗi loại cơ sở dữ liệu khác
nhau thị cú pháp thực hiện sao lưu cũng khác nhau
b) Dánh giá:
Un diém:
- Hệ quản trị cung cấp các hàm có sẵn để phục vụ việc sao lưu, khôi phục đữ liệu
-_ Có thể sao lưu, khôi phục một phần của cơ sở dữ liệu, ví dụ như sao
lưu một bảng trong cơ sở dữ liệu
Nhược diễm:
- Người quản trị mạng phải có kỹ năng nhật định về cơ sở dữ liệu mình
quân lý, các cơ sở đữ liệu khác nhau có các cú pháp và câu lệnh để sao lưu
khác nhau
- Việc thực hiện sao lưu, khôi phục được thực hiện dưới đạng câu lệnh
sạ! phức tạp tủy từng cơ sở dữ liệu.
Trang 302.2.3 Sao lưu, khôi phục mức ứng dụng
4) Khái niệm:
Sao lưu, khỏi phục cơ sở dữ liệu mức ứng dụng lả hình thức dựa vào
một phân mềm trung gian có nhiều tính năng ưu việt (giao diện thân thiện với
người dùng, tự động sao lưu theo thời gian định trước, sao lưu gia tăng, .) để
thực hiện sao lưu, khôi phục cơ sở dữ liệu
b) Kiến trúc hệ thông, nguyễn tắc hoạt động
Tlinh 15 Sao lưu, khôi phục cơ sở dữ liệu mức ứng dụng
Việc sao lưu cơ sở dữ liệu thông qua chương trỉnh ứng dụng, Chương
trình ứng dụng kết nổi vào cơ sở đữ liệu thông qua bộ máy cơ sở dữ liệu, sau
đó thực hiện sao lưu cơ sở đữ liệu ra các thiết bi lưu trữ Một ứng dựng có thể
30
Trang 31sao lưu một cơ sở dữ liệu hoặc nhiều cơ sở dữ liệu tuỳ thuộc vào tỉnh năng,
của ứng dụng
Hiện nay trên thể giới có rất nhiều hãng phần mềm nổi tiếng đầu tư vào
vide phát triển các phần mềm giúp cho việc sao lưu, khôi phục dữ Hệu Đặu
điểm nỗi bật của các phần mềm này là cung cấp cho người dùng một giao
điện thân thiện; cho phép người quần trị có thể dé dang sao lưu, khôi phục ede
cơ sở đữ liệu của mình mả không cần biết nhiều dén co số dữ liệu đó như thế
Tiảo Các phần mém nay còn hỗ trợ nhiều tính năng ưu việt như: đặt chế độ
sao lưu tự dộng, sao lưu toàn bộ cơ sử dữ liệu hay chỉ sao lưu những dữ liệu
thay déi,
œ) Đánh giá
Uy diém:
~ Giao diện thân thiện
- Có thể sao lưu một phan đữ liệu như sao lưu một bảng trong co sé dé
liệu
- Dặt thời gian sao lưu theo lịch đặt trước
Nhược điểm:
- Giá thành sân phẩm cao
~ Các sẵn phẩm thưởng chí áp dung để sao lưu một cơ sở dữ liệu và hầu
hết các san phẩm nảy chỉ chạy trên một hệ điều hành nhất định Do vậy, nêu
co quan có nhiều ứng dựng trên các cơ sở đừ liệu khác nhau phải mua các
phần mềm sao lưu khác nhau và việc sao lưu, khôi phục đữ liệu không được
†ập trung
31
Trang 322.3 Danh gia các phương pháp sao lưu, khôi phục dữ liệu
Từ những phân tích các phương pháp sao lưu, khôi phục đữ liệu ở trên
1a thấy mỗi phương pháp có những ưu điểm và nhược điểm riêng,
Sao lưu, khôi nhục dữ Saolưu, | Sao lưn, khôi
mức hệ điều hành khôi phục phục đữ liệu
dữ liệu mức | mức ứng dụng
hệ quản trị
cơ sứ dữ
liệu
Tu điểm - Dâm bão tính sẵn sảng cao -Chứcnăng | - Việc saohmiiễn
- Dữ liêu tuyệt đổi an toàn sẵn có trong — | hành đễ đàng, đơn
cơ sở đữ liệu | giàn đổi với người
quán trị
- Gó nhiền tính
Tăng tru việt trang
việc dat lich tu
đồng sao lưu
Nhược điểm | -Không sao hưu, khối phục được - Người quân |- Giáthành cao
mội phẩn trong có số đểiện mà tị phảicókỹ | -Thường chỉ có
hải sao lưu boặo khôi phục toán _ năng nhất định | tác dụng với một
bộ cơ sở đữ liệu về cơ sở đữ loại cơ sở đữ liệu
- Nếu có nhiễu đữ liệu phân tán ligu nhất định
ở nhiêu nơi việc sao lưu mắt
nhiều công sức
- Chỉ thục tiện khi sao lưu ruột
bản chạy tốt, nâu bán đó bị lỗi về
mặt dữ liệu thì việc sao lưu
không có tác dụng
- Nếu có nhiều
dữ liệu phân tin ở nhiễn nơi việc sao lu
mất nhiều
Ilinh 13 Danh gia cdc prong phap sao luu, khôi phục dữ liệu
Trang 33Tuỳ mức độ quan trọng, Lính sẵn sảng của dữ liệu, yêu sầu về thời gian
sao lưu, khôi phục, trình độ người quản trị mạng mà ta chọn các phương pháp
thích hợp hoặc co thể kết hợp các phương pháp đó lại thành một giải pháp
tổng thể Trong các phương pháp trên thì phương pháp sao lưu, khôi phục
mức ứng dụng có nhiễu tính năng vượt trội hơn cả Tuy nhiên, phương pháp
này có nhược điểm rất lớn đó là chỉ phí rất cao, chưa có chức năng cho phép
sao lưu, khôi phục các cơ sử đữ liệu một cách tập trung, chay trên một hệ diều
hành nhật định
lên hành
Từ những nhược diễm của các phương pháp nảy, luận văn dã
nghiên cứu và dé xuất piải pháp Sao lưu, khỏi phục dữ liệu mức ứng dụng,
trong đó cho phép sao lưu, khôi phục các cơ sở đữ liệu một cách tập trung,
chạy trên mọi hệ điểu hành (Windows, Linux, ) hỗ trợ máy ảo lava Giải
pháp này được trình bày chỉ tiết ở chương III
Trang 34Chương 3: ĐÊ XUẤT GIẢI PHÁP SAO LƯU KHÔI PHỤC
CÁC CƠ SỞ DỮ LIỆU
3.1 Mục tiêu, yêu câu
dục tiêu:
Xây dung giải pháp sao lưu, khôi phục đữ liệu ở mức ứng dụng, trong
đó cho phép sao lưu, khôi phục các cơ sở dữ liệu một cách tập trung thông qua giao diện Web Browser, đồng thời có thể chạy trên mọi hệ điêu hành
(Windows, Linux, )
Yêu cầu :
- Cho phép chạy được trên các hệ điều hành: Windows, Linux,
Solaris
- Có chế độ sao lưu tự đông theo lịch trình cho trước
- Có giao điện thân thiện với người sử dụng
- Cho phép sao lưu, phục hỗi các cơ sở đữ liệu một cách lập trung
- Chương trình được đóng gói hoàn chỉnh và cải dit dé ding
34
Trang 353.2 Kiên trúc hệ thống, nguyên tắc hoạt động
3.2.1 Kiến trúc hệ thống [35]
$8 đán ứng mục tiêu, yêu câu đặt ra giải phản đề xuất là xây dựng một
phần mềm tửng đụng để thực hiện việc sao lưu, khôi phục đữ liệu một cách tập
trung thông qua giao diện Wcb Browsor, đồng thời có thể chạy trên mọi hệ
điêu hành (Wimdows, Linux ) dựa trên công nghệ J2HE (Java 2 Piatform, Enterprise Edition), trong đó ngôn ngữ sử đụng viết chương trình lả java có
thể chạy trên mọi hệ diều hành (Unix, Windows ) có hỗ trợ máy äo java
Phần mềm sao lưu, khôi phục dữ liệu phát triển dựa trên mô hình kiến
trúc đa tằng trên nền Java, nhằm tách biệt các tầng xứ lý nghiệp vụ, tầng truy nhập hệ thống dữ liệu và tầng trinh diễn Kiến trúc nảy có những lợi ích đáng,
kế so với kién tric client/server hai tầng và do đó cho phép các ứng dụng
chay nhanh hơn, có khả khả năng mở rộng và liên tác cao hơn
Việc kết nối vào các cơ sở dữ liệu như Posgesal, MySQ1., Microsoft
SQL được thực hiện thông qua chudn JDBC
Tĩnh 14 Mô hình kiến trúc tổng thể hệ thống
Trang 36S LIẾT trộn nà SỐ kan
Với kiến trúo này ta có một số tru việt sau
+ Khả năng mô rộng: Mây chủ ứng dụng hỗ trợ chia xẻ ứng dụng và cung
cấp khá năng mở rộng tối đa Miỗi máy chủ ứng đụng với hệ thống nhiều
bộ vị xử lý hoặc cluster may chủ ứng dụng có thể hỗ trợ một số lượng lớn các giao dịch, không phụ thuộc vào nên phần cứng, hệ điều hành và cấu
hình hệ thống Máy chủ ứng đụng được thiết kế trong môi trường phân tán
gdm cae tray xuất đữ liệu tốc dộ cao, các giao tác với khối lượng lớn và
khả năng mở rộng ứng dụng Nhờ phân hoạch ứng dụng, máy chủ ứng
dụng cung uấp giải pháp có thể mỡ rộng cho một số lượng lớn người dùng
và giao tác, Khả năng mở rộng đạt được trong một hệ thống máy chủ nhờ
thêm vào các hộ vi xử lý (CPU) hay các hệ thắng chạy trên mạng Kiển
trúc chức nang (module) của máy chủ ứng dụng cỏn cho phép đễ dàng mở
rộng hệ thống vả chức năng của ứng dụng ở mọi thời diém hờ việc cải
đặt những module mới, những ứng dụng có thể được oung cấp những chứu
năng mới Những đặc trưng này làm cho phần mềm trên máy chủ ứng
dụng có khả năng thích nghỉ cao với sự thay đổi môi trường hoạt động
+ Khả năng quản lý theo như cầu công việc Với khả năng quản lý theo
trạng thái và theo phiên làm việc, máy chủ ứng dụng hỗ trợ những yêu cầu phức tạp, nhiều bước Iiệ thắng quản lý sẽ hỗ trợ quản lý tài nguyên, đữ
liệu, giao tác, tự đông xác nhân truy vẫn quay vòng, xác nhận thành công,
để không thực hiện lại nhiều lần Máy chủ ímg dụng cung cấp khả năng truy xuất đữ liệu dùng phụng và truy xuất một cách thống nhất cáo táo vụ
dựa trên giao tiếp chuẩn tới những hệ thống đữ liệu không đồng nhất
+ Khả năng triển khai nhanh và sử dụng lại mã nguồn: Với kiển trúc máy
chủ mở rộng, người phát triển có thể thiết kế các ứng dụng nhằm đáp ửng,
36