Cụm Cluster Công nghệ này được dùng cho các ứng dụng Stateful các ứng dụnghoạt động thường xuyên trong thời gian dài bao gồm các máy chủ cơ sở dữliệu như là Microsoft MySQL Server, Micro
Trang 2MỤC LỤC
LỜI CẢM ƠN i
MỤC LỤC ii
DANH MỤC HÌNH vi
DANH MỤC HÌNHDANH MỤC VIẾT TẮT vii
CHƯƠNG I MỞ ĐẦU 1
1.1 Đặt vấn đề 1
1.2 Mục đích và yêu cầu 1
CHƯƠNG II GIỚI THIỆU MỘT SỐ CÔNG NGHỆ VÀ SẢN PHẨM 2
2.1 Công nghệ cụm (Clustering) 2
2.1.1 Định nghĩa Clustering 2
2.1.2 Yêu cầu của hệ thống Clustering 2
2.1.2.1 Yêu cầu về tính sẵn sàng cao (High availability) 2
2.1.2.2 Yêu cầu về độ tin cậy cao (reliability) 2
2.1.2.3 Yêu cầu về khả năng mở rộng được (scalability) 2
2.1.3 Phân loại công nghệ Clustering 2
2.1.3.1 Cụm (Cluster) 2
2.1.3.2 Cân bằng tải (Network Load Balancing-NLB) 3
2.1.4 Cấu trúc của Cluster 3
2.1.4.1 Cấu trúc song song 3
2.1.4.2 Cấu trúc độc lập 4
Trang 32.1.4.3 Cấu trúc chủ động – thụ động (active - passive) 4
2.1.5 Nguyên lý hoạt động của cluster 5
2.1.6 Tính mở rộng của Cluster 7
2.2 Các công nghệ và sản phẩm của các hãng Microsoft, HP và Citrix 7
2.3 Giải pháp của các hãng Microsoft, HP và Citrix 8
CHƯƠNG III MÔ HÌNH PHÒNG NGỪA RỦI RO VÀ HIỆU NĂNG CAO 10
3.1 Sự hoạt động liên tục của hệ thống máy tính (Business Continuity) 10
3.2 Tính sẵn sàng cao (High Availability) 10
3.2.1 Định nghĩa High Availability 10
3.2.2 Lợi ích của High Availability 10
3.2.3 Cách xây dựng High Availability 11
3.2.3.1 Khái niệm điểm lỗi đơn (Single points of failure) 11
3.2.3.2 Xây dựng High Availability 11
3.2.4 Ứng dụng của High Availability cho các dịch vụ 13
3.2.4.1 Sẵn sàng cao cho dịch vụ Microsoft Active Directory 13
3.2.4.2 Sẵn sàng cao cho dịch vụ Email 13
3.2.4.3 Sẵn sàng cao cho các cơ sở dữ liệu và máy chủ cơ sở dữ liệu 14
2.2.4.4 Sắn sàng cao cho các ứng dụng quan trọng 14
3.3 Khôi phục thảm họa (Disaster recovery) 15
3.3.1 Khái niệm 15
3.3.2 Mô hình Disaster Recovery 15
3.3.3 Các công nghệ đồng bộ dữ liệu 15
Trang 43.3.3.1 Replication 15
3.3.3.2 Application-based replication 16
3.3.3.3 Sao lưu Host-based replication 17
3.3.3.4 Storage-based replication 17
3.3.4 Các phương thức Backup dữ liệu 18
3.3.4.1.Sao lưu ngoại tuyến (Offline backup) 18
3.3.4.2 Sao lưu trực tuyến “ấm” (Warm online backup) 18
3.3.4.3 Sao lưu trực tuyền “nóng” (Hot online backup) 18
3.3.5 Các loại backup dữ liệu 19
3.3.5.1 Sao lưu đầy đủ (Full backup) 19
3.3.5.2 Sao lưu tăng dần (Incremental backup) 19
3.3.5.3 Sao lưu cộng dồn (Differential backup) 19
3.3.5.4 Sao lưu tổng hợp (Synthetic Backup) 20
3.3.5.5 Sao lưu tăng tiến (Progressive Backup) 20
3.3.5.6 Sao lưu nhiều mức tăng dần (Multilevel Incremental Backup) 21
3.3.6 Các giải pháp xây dựng hệ thống chịu lỗi (Disaster Recovery) 21
3.3.6.1 Các yếu tố để xây dựng hệ thống Disaster Recovery 21
3.3.6.2 Sử dụng băng từ (Tape backup) 22
3.3.6.3 Remote Mirroring 23
3.3.6.4 Đồng bộ dữ liệu mức phần cứng ( Hardware Replication) 24
3.3.6.5 Đồng bộ dữ liệu dùng phần mềm (software replication) 25
3.3.6.6 Đồng bộ cơ sở dữ liệu (Database replication) 26
3.3.6.7 Campus Clustering 28
Trang 53.3.3.8 Fibre Channel over IP (FCIP) 29
CHƯƠNG IV CÀI ĐẶT VÀ CẤU HÌNH SQL SERVER CLUSTER 31
4.1 Mở đầu 31
4.2 Cài đặt SQL Server 2005 Clustering 31
4.2.1 Yêu cầu cài đặt 31
4.2.2 Các bước thực hiện 32
4.2.3 Mô hình của hệ thống 32
4.2.3 Một số giao diện của chương trình 33
CHƯƠNG V KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN CỦA ĐỀ TÀI 37
5.1 Kết Luận 37
5.2 Hướng phát triển của đề tài 37
TÀI LIỆU THAM KHẢO 38
Trang 6DANH MỤC HÌNH
Hình 2.1 Cấu trúc của hệ thống song song 3
Hình 2.2 Cấu trúc của hệ thống độc lập 4
Hình 2.3 Cấu trúc của hệ thống chủ động, thụ động 5
Hình 2.4 Nguyên lý hoạt động của hệ thống cluster 5
Hình 3.1 Nguyên lý sẵn sàng cao cho hệ thống thư dùng cơ chế DAG 14
Hình 3.2 Mô hình của hệ thống sẵn sàng cao 15
Hình 3.3 Biểu đồ chi phí và thời gian khôi phục hệ thống 22
Hình 3.4 Mô hình hệ thống Remote Mirroring 23
Hình 3.5 Mô hình hệ thống đồng bộ hóa dùng phần cứng 24
Hình 3.6 Mô hình hệ thống đồng bộ hóa dùng phần mềm 25
Hình 3.7 Mô hình hệ thống đồng bộ hóa dùng cơ sở dữ liệu 26
Hình 3.8 Mô hình hệ thống Campus Clustering 28
Hình 4.1 Mô hình hệ thống sử dụng cluster 32
Hình 4.2 Tạo Cluster trên node1 33
Hình 4.3 Node 1 đã được tạo Cluster 33
Hình 4.4 Đưa node2 vào cluster 34
Hình 4.5 Cluster bao gồm node1 và node2 đã được tạo 34
Hình 4.6 Cài đặt SQL server 2005 35
Hình 4.7 Tạo các tài nguyên Disk, IP address, Network name, Server Agent cho Cluster 35
Hình 4.8 Shutdown node 2 36
Hình 4.9 Truy vấn thành công cơ sở dữ liệu khi node 2 shutdow 36
Trang 7DANH MỤC VIẾT TẮT
HA High Availability Tính sẵn sàng cao
DR Disaster Recovery Khôi phục từ thảm họaVPN Virtual Private Network Mạng riêng ảo
DC Domain Controller Quản lý trong miền
NLB Network Load Balancing Cân bằng tải
SAN Storage Area Network Mạng lưu trữ nội bộ
IP Internet Protocol Giao thức liên mạng
DAG Database Availability Group Sẵn sàng cao cơ sở dữ liệuiSCSI Internet Small Computer System
Interface
Là một chuẩn công nghiệpdùng để truyền tải các lệnh qua mạng IPFTP File Tranfer Protocol Giao thức truyền tải file
DHCP Dynamic Host Configuration
Protocol
Giao thức cấu hình động máy chủ
CPU Center Processing Unit Bộ xử lý trung tâm
RAM Random Access Memory Bộ nhớ truy xuất nhanhFSMO
Flexible Single Master Operations
Là một Role trong Windown Server
NAS Network Atteched Storage Mạng lưu trữ nội bộ
RAID Redundant Arrays of Independent
Disks
Công nghệ lưu trữ dữ liệu
Trang 8CHƯƠNG I MỞ ĐẦU
1.1 Đặt vấn đề
Trong thời đại bùng nổ công nghệ thông tin hiện nay, mạng máy tínhđóng vai trò ngày càng quan trọng hơn trong hoạt động của các doanhnghiệp, tổ chức cũng như các cơ quan nhà nước Thậm chí ở một số đơn vị,chẳng hạn như các công ty hàng không hoặc các ngân hàng lớn, mạng máytính có thể ví như hệ thần kinh điều khiển hoạt động của toàn doanh nghiệp
Sự ngừng hoạt động của mạng máy tính trong những cơ quan này có thể làm têliệt các hoạt động chính của đơn vị, và thiệt hại khó có thể lường trước được
Chúng ta đều biết máy chủ mạng là trái tim của mạng máy tính, nếumáy chủ mạng hỏng, hoạt động của hệ thống sẽ bị ngưng trệ Điều đáng tiếc
là dù các hãng sản xuất đã cố gắng làm mọi cách để nâng cao chất lượng củathiết bị, nhưng những hỏng hóc với các thiết bị mạng nói chung và các máychủ nói riêng là điều không thể tránh khỏi Do vậy, vấn đề đặt ra là cần cómột giải pháp để đảm bảo cho hệ thống vẫn hoạt động tốt ngay cả khi có sự
cố xảy ra đối với máy chủ mạng Do đó đề tài này nghiên cứu về “Tìm hiểu
về hệ thống máy tính chịu đựng lỗi, sẵn sàng cao ” nhằm giúp cơ quan,
doanh nghiệp vẫn hoạt động tốt khi gặp thảm họa
1.2 Mục đích và yêu cầu
Mục đích :
Tìm hiểu về hệ thống máy tính có khả năng chịu lỗi
Xây dựng thành công một hệ thống máy tính có khả năng chịuđựng lỗi và tính sẵn sàng cao
Giúp cho hoạt động của cơ quan, doanh nghiệp hiệu quả hơn.Yêu cầu :
Nghiên cứu các khái niệm liên quan đến hệ thống
Hiểu được các mô hình của hệ thống
Hiểu được các công nghệ để xây dựng hệ thống
Trang 9CHƯƠNG II GIỚI THIỆU MỘT SỐ CÔNG NGHỆ VÀ SẢN PHẨM
2.1 Công nghệ cụm (Clustering)
2.1.1 Định nghĩa Clustering
Clustering là một kiến trúc nhằm đảm bảo nâng cao khả năng sẵn sàngcho các hệ thống mạng máy tính Clustering cho phép sử dụng nhiều máy chủkết hợp với nhau tạo thành một cụm có khả năng chịu đựng lỗi hay chấp nhậnsai sót nhằm nâng cao độ sẵn sàng của hệ thống mạng
2.1.2 Yêu cầu của hệ thống Clustering
2.1.2.1 Yêu cầu về tính sẵn sàng cao (High availability)
Các tài nguyên mạng phải luôn sẵn sàng trong khả năng cao nhất đểcung cấp và phục vụ các người dùng cuối và giảm thiểu sự ngưng hoạt động
hệ thống ngoài ý muốn
2.1.2.2 Yêu cầu về độ tin cậy cao (reliability)
Độ tin cậy cao của clustering được hiểu là khả năng giảm thiểu tần sốxảy ra các sự cố, và nâng cao khả năng chịu đựng sai sót của hệ thống
2.1.2.3 Yêu cầu về khả năng mở rộng được (scalability)
Hệ thống phải có khả năng dễ dàng cho việc nâng cấp, mở rộng trongtương lai Việc nâng cấp mở rộng bao hàm cả việc thêm các thiết bị, máy tínhvào hệ thống để nâng cao chất lượng dịch vụ, cũng như việc thêm số lượngngười dùng, thêm ứng dụng, dịch vụ và thêm các tài nguyên mạng khác
2.1.3 Phân loại công nghệ Clustering
Công nghệ Clustering được chia làm hai kỹ thuật nhỏ hơn bao gồm
Cluster và Network Load Balancing
2.1.3.1 Cụm (Cluster)
Công nghệ này được dùng cho các ứng dụng Stateful (các ứng dụnghoạt động thường xuyên trong thời gian dài) bao gồm các máy chủ cơ sở dữliệu như là Microsoft MySQL Server, Microsoft Exchange Server, File andPrint Server… Tất cả các node (một server thuộc một Cluster nào đó mà trên
đó các ứng dụng và dịch vụ Cluster được cài đặt) trong Cluster dùng chung
một nơi lưu trữ dữ liệu có thể dùng công nghệ SCSI hoặc Storage AreaNetwork (SAN) Windows Sever 2003 Enterprise và Datacenter hỗ trợ cluster
Trang 10lên đến 8 node trong khi đó Windows 2000 Advance Server hỗ trợ 2 node cònWindows 2000 Datacenter Server được 4 node.
2.1.3.2 Cân bằng tải (Network Load Balancing-NLB)
Là một loại khác của kỹ thuật Clustering có khả năng chia tải và nâng
cao khả năng chịu lỗi của hệ thống được tốt hơn Được dùng cho các ứngdụng Stateless (các ứng dụng hoạt động mang tính nhất thời) như Web, FileTranfer Protocol (FTP), Virtual Private Network (VPN), DHCP…Mỗi nodephải dùng riêng một nơi lưu trữ cục bộ (Local Storage) cho nên cần phải cóquá trình đồng bộ hóa dữ liệu ở mỗi nơi lưu trữ, số lượng node càng nhiều thìthời gian cho việc đồng bộ hóa càng lâu chính vì điều này nên ta không nêntriển khai các ứng dụng Stateful trên kỹ thuật NLB này nhằm đảm bảo tínhchính xác của dữ liệu
2.1.4 Cấu trúc của Cluster
Trong Cluster, tùy theo nhu cầu mà chúng ta có thể triển khai nhiềuứng dụng trên cùng một cluster hay cài đặt trên mỗi node một ứng dụng, nóichung cấu trúc của một cluster không cố định nhưng chủ yếu chúng ta thấyhữu ích nhất là các loại cấu trúc sau:
2.1.4.1 Cấu trúc song song
Nếu ta triển khai hai ứng dụng stateful trên hệ thống cluster thì có mộtphương pháp đơn giản là cài đặt cả hai ứng dụng ấy vào mỗi node củacluster Ở cấu trúc này thì hai ứng dụng trên cùng một server do đó nếu ứngdụng này bị lỗi thì sẽ ảnh hưởng đến ứng dụng kia, hiệu quả của hệ thốngcluster sẽ thấp
Hình 2.1 Cấu trúc của hệ thống song song
Trang 11Hình 2.2 Cấu trúc của hệ thống độc lập
2.1.4.3 Cấu trúc chủ động – thụ động (active - passive)
Triển khai cả hai ứng dụng trên cùng một cluster, mỗi node cài một ứngdụng nhưng khác với cấu trúc song song là sẽ có một cluster làm nhiệm vụsao lưu dữ liệu Cụ thể, hình dưới cho ta thấy hệ thống này có một node chủđộng (active) dùng làm sao lưu và cài cả hai ứng dụng của node 1 và node 2(hai node active) Nếu một trong hai node này bị lỗi thì node thụ động(passive) sẽ thay thế chức năng của node bị lỗi Hệ thống này có hiệu quả caohơn hai loại trước
Trang 12Hình 2.3 Cấu trúc của hệ thống chủ động, thụ động
2.1.5 Nguyên lý hoạt động của cluster
Mỗi máy chủ trong cluster được gọi là một nút (cluster node), và có thểđược thiết lập ở chế độ chủ động (active) hay thụ động (passive) Khi một nút
ở chế dộ chủ động, nó sẽ chủ động xử lý các yêu cầu Khi một nút là thụđộng, nó sẽ nằm ở chế độ dự phòng nóng (stanby) chờ để sẵn sàng thay thếcho một nút khác nếu bị hỏng Nguyên lý hoạt động của Cluster có thể biểudiễn như trong hình dưới đây
Hình 2.4 Nguyên lý hoạt động của hệ thống cluster
Trang 13Trong một cluster có nhiều node có thể kết hợp cả node chủ động và node thụ động Trong những mô hình loại này việc quyết định một node được cấu hình là chủ động hay thụ động rất quan trọng Để hiểu lý do tại sao, hãy xem xét các tình huống sau:
Nếu một node chủ động bị sự cố và có một node thụ động đang sẵn
sàng, các ứng dụng và dịch vụ đang chạy trên node hỏng có thể lập tức được
chuyển sang node thụ động Vì máy chủ đóng vai trò node thụ động hiện tạichưa chạy ứng dụng hay dịch vụ gì cả nên nó có thể gánh toàn bộ công việccủa máy chủ hỏng mà không ảnh hưởng gì đến các ứng dụng và dịch vụ cungcấp cho người dùng cuối (ngầm định rằng các các máy chủ trong cluster cócấu trúc phần cứng giống nhau)
Nếu tất cả các máy chủ trong cluster là chủ động và có một node bị sự
cố, các ứng dụng và dịch vụ đang chạy trên máy chủ hỏng sẽ phải chuyển
sang một máy chủ khác cũng đóng vai trò node chủ động Vì là node chủđộng nên bình thường máy chủ này cũng phải đảm nhận một số ứng dụng haydịch vụ nào đó, khi có sự cố xảy ra thì nó sẽ phải gánh thêm công việc củamáy chủ hỏng Do vậy để đảm bảo hệ thống hoạt động bình thường kể cả khi
có sự cố thì máy chủ trong cluster cần phải có cấu hình dư ra đủ để có thểgánh thêm khối lượng công việc của máy chủ khác khi cần
Trong cấu trúc cluster mà mỗi node chủ động được dự phòng bởi một nodethụ động, các máy chủ cần có cấu hình sao cho với khối lượng công việctrung bình, chúng sử dụng hết khoảng 50% CPU và dung lượng bộ nhớ
Trong cấu trúc cluster mà số node chủ động nhiều hơn số node bị động,các máy chủ cần có cấu hình tài nguyên CPU và bộ nhớ mạnh hơn nữa để cóthể xử lý được khối lượng công việc cần thiết khi một node nào đó bị hỏng
Trang 14Các node trong một cluster thường là một bộ phận của cùng một vùng(domain) và có thể được cấu hình là máy điều khiển vùng (domaincontrollers) hay máy chủ thành viên Lý tưởng nhất là mỗi cluster nhiều node
có ít nhất hai node làm máy điều khiển vùng và đảm nhiệm việc failover (mộthành động khi có sự cố sảy ra) đối với những dịch vụ vùng thiết yếu Nếukhông như vậy thì khả năng sẵn sàng của các tài nguyên trên cluster sẽ bị phụthuộc vào khả năng sẵn sàng của các máy điều khiển trong vùng
2.1.6 Tính mở rộng của Cluster
Hệ thống clustering cung cấp khả năng mở rộng cao Tuỳ theo yêu cầu
cụ thể, các cluster có thể cần phải thêm các máy chủ vào Cluster hoặc thêmCPU và RAM cho các máy chủ để tăng khả năng đảm nhận công việc cho cácmáy chủ đã có Khi các ứng dụng trong Cluster sử dụng tài nguyên hệ thốngvượt quá khả năng của nó, ta có thể dễ dàng thêm node vào cluster để đáp ứngnhu cầu truy cập hay dễ dàng thêm vào nhiều bộ xử lý
Ví dụ: ta có thể thêm được 8 CPU cho bản Windows Server 2003
Enterprise Edition và 32 CPU cho Windows Server Datacenter Edition hoặcthêm 8GB bộ nhớ RAM cho bản Windows Server 2003 Enterprise Edition và64GB cho bản Datacenter Edititon
2.2 Các công nghệ và sản phẩm của các hãng Microsoft, HP và Citrix
Các tổ chức phải duy trì sự sẵn sàng cao hoạt động doanh nghiệp củamình trong trường hợp doanh nghiệp ngừng hoạt động có kế hoạch trước hoặckhông có kế hoạch Sự tiếp tục hoạt động của hệ thống là một giải pháp thiết
kế để ngăn chặn thời gian chết cung cấp tính sẵn sang cao để duy trì hoạtđộng trong trường hợp hệ thống gặp sự cố và khôi phục thảm họa trên mộttrạm thứ hai khi trạm chính không hoạt động Tuy nhiên do chi phí, độ phức
Trang 15tạp hoạt động của các doanh nghiệp mà các giải pháp cho sự hoạt động củadoanh nghiệp buộc phải ưu tiên các tài sản của doanh nghiệp mà họ có thểbảo vệ nếu có.
Một giải pháp chung của Microsoft, HP và Citrix là làm giảm chi phí,
độ phức tạp và mức độ hoạt động của việc để duy trì sự hoạt động liên tục của
hệ thống doanh nghiệp Giải pháp này nhanh chóng và dễ dàng để thiết lậpcác hệ thống sẵn sàng cao, duy trì sự hoạt động liên tục Kết quả là các tổchức, doanh nghiệp được bảo vệ tốt nhất nếu không phải là tất cả thì là dữ liệu
và tài sản thông tin Giải pháp mà Microsoft, HP và Citrix đưa ra để duy trì sựhoạt động liên tục của tổ chức, doanh nghiệp trong trường hợp hệ thốngngừng hoạt động có kế hoạch hoặc không có kế hoạch trước với một thànhphần, hệ thống hoặc thậm chí là toàn bộ một hệ thống trạm phục hồi
2.3 Giải pháp của các hãng Microsoft, HP và Citrix
Các giải pháp truyền thống cho tính sẵn sàng cao thì rất tốn kém Giảipháp cho tính sẵn sàng cao bằng phần mềm tốn kém vì các chi phí này đượcpha trộn bởi sự cần thiết phải dư thừa phần cứng dự phòng và dung lượng lưutrữ Tổng chi phí cho tính sẵn sàng cao có thể lên đến hàng triệu đô la
Các giải pháp truyền thống cũng yêu cầu cần mở rộng hướng dẫn cấuhình để đảm bảo sự kiện failover xảy ra một cách chính xác Quá trình cấuhình máy chủ và lưu trữ cho các hệ thống sẵn sàng cao là không hiệu quả bởi vì nóđòi hỏi những nỗ lực của hai nhóm và có thể mất vài tuần hoặc vài tháng Khi một
hệ thống ngừng hoạt động, các thao tác bằng tay là cần thiết để bắt đầu chuyển đổi
dự phòng, kết quả làm tăng thời gian chết của hệ thống
Một sự kết hợp của công nghệ làm giảm chi phí và sự phức tạp của tính sẵn sàng cao và đơn giản hóa việc quản lý của tổ chức, doanh nghiệp Chúng bao gồm
ảo hóa, Clustering, sao lưu đồng bộ, lưu trữ sẵn sàng cao và các giải pháp mới
Ảo hóa – Môi trường ảo hóa giúp giảm chi phí thông qua một máy chủ
thống nhất, cho phép các tổ chức giảm sự dư thừa về phần cứng bằng cách
Trang 16chạy nhiều máy ảo thực hiện sao lưu trên phần cứng vật lý như nhau Điềunày cung cấp chính sách failover mà không cần máy chủ hoàn toàn rảnh rỗi.Máy ảo có thể được sao lưu, di chuyển hoặc sao chép vào bất cứ máy chủ nàokhông gặp sự cố trong hoạt động của hệ thống Ngoài ra môi trường ảo hóa hỗtrợ sẵn sàng cao thông qua thiết bị điều khiển có sẵn của máy chủ, trongtrường hợp máy chủ thất bại, khởi động lại máy ảo thay thế.
Clustering – Cụm máy chủ có tính sẵn sàng cao đảm bảo rằng nếu một
máy chủ gặp sự cố, các máy ảo sẽ tự động khởi động lại trên một máy chủkhác thay thế mà không làm gián đoạn các hoạt động của người dùng Cụmmáy chủ bao gồm hai hoặc nhiều máy chủ vật lý hay máy ảo chạy cùng cấuhình Ứng dụng phần mềm Clustering giữ cho dữ liệu cập nhật trên cả hai máy vàkhởi động lại máy chủ sao lưu trong trường hợp máy chủ chính gặp sự cố
Sao lưu đồng bộ - Trong khi hầu hết các Cluster nằm trong một trạm
duy nhất, các cụm máy chủ có thể phát triển rộng ra nhiều địa điểm khác.Clusters yêu cầu sử dụng sao lưu đồng bộ, giúp đồng bộ dữ liệu trên các máythành viên của cùng một cụm máy chủ, bởi dữ liệu của các cụm máy chủ địaphương và cụm máy chủ từ xa cùng một thời gian Bởi vì độ trễ của nó và nhucầu sử dụng băng thông, sao lưu đồng bộ thường được sử dụng chỉ khi cáccụm máy chủ chính và cụm máy chủ phục hồi đều nằm ở gần gần nhau, thôngthường ít hơn 80 kilomet
Chia sẻ dữ liệu - Các tổ chức phải có lưu trữ được chia sẻ hoặc chia sẻ
bởi tất cả các máy chủ trong Cluster Việc lưu trữ dữ liệu trên chính nó cũngcần phải có tính sẵn sàng cao Sau tất cả, máy chủ chuyển đổi dự phòng có rất
ít thực tế tác động đến sự hoạt động liên tục của tổ chức, doanh nghiệp nếukhông có sự lưu trữ Tất cả các máy ảo phải nằm trên một kênh chia sẻ hoặciSCSI trong đó hợp nhất một khu lưu trữ cho các máy chủ trong Cluster
Quản lý phần mềm – Các tổ chức cần có một giải pháp đơn giản hóa
các thiết lập và cung cấp các môi trường ảo hóa của họ
Trang 17CHƯƠNG III MÔ HÌNH PHÒNG NGỪA RỦI RO VÀ HIỆU NĂNG CAO
Phần này sẽ trình bày về tính sẵn sàng cao, khả năng khôi phục từ thảmhọa và qua đó đưa ra các giải pháp để xây dựng hệ thống máy tính đảm bảotính sẵn sàng cao cũng như khả năng khôi phục lại hệ thống khi xảy ra mộtthảm họa
3.1 Sự hoạt động liên tục của hệ thống máy tính (Business Continuity)
Business Continuity là một tập hợp các hành động và thủ tục được địnhtrước để cho phép một hệ thống tiếp tục hoạt động sau khi xảy ra một thảmhọa nào đó.Một tiến trình xử lý dữ liệu bị lỗi có thể do những nguyên nhânnhư mất mạng hoặc do thiên tai quy mô lớn chẳng hạn như động đất, lũ lụt,các cuộc tấn công hoặc sự kiện bất ngờ nào đó Do có rất nhiều thảm họa cóthể xảy ra nên một giải pháp duy nhất để khắc phục chúng là không tối ưu.Thay vào đó là một loạt các kỹ thuật được sử dụng Nói chung, có hai loạichính được áp dụng đó là: High Availability (tính sẵn sàng cao) và DisasterRecovery (khôi phục từ thảm họa)
3.2 Tính sẵn sàng cao (High Availability)
3.2.1 Định nghĩa High Availability
High Availability có nghĩa là các ứng dụng hoặc dịch vụ sẵn sàng ở tất
cả các thời gian, địa điểm và các yếu tố khác có thể ảnh hưởng đến sự sẵn sàng của ứng dụng như vậy Nói chung, nó có khả năng tiếp tục một dịch vụ trong thời lượng rất dài mà không bị bất kỳ sự gián đoạn nào
3.2.2 Lợi ích của High Availability
Mô hình High Availabilility được xây dựng đảm bảo cho hệ thống tácnghiệp hoạt động một cách thông suốt và hiệu năng cao, mang lại cho ngườidùng đầu cuối sự liên tục hoạt động của hệ thống tác nghiệp với thời gian hệthống bị gián đoạn là nhỏ nhất có thể
Mô hình này khắc phục những lỗi hoạt động của hệ thống tác nghiệpnhư một bộ phận của hệ thống, vì lý do nào đó ngừng hoạt động, lỗi của một
Trang 18server trong hệ thống, lỗi đĩa cứng Các xử lý của High Availabilility sẽ giớihạn tại những lỗi mang tính cục bộ địa lý của hệ thống (localized failures).Những lỗi có thể được bao quát trong High Availabilility như lỗi của ngườivận hành hệ thống, lỗi xử lý tiến trình và một số lỗi khác.
Không những thế mô hình High Availabilility được xây dựng nhằmkhai thác tối đa các tài nguyên sẵn có của hệ thống và mang lại cho ngườidùng đầu cuối môi trường vận hành nhanh nhất, tốt nhất
Tính sẵn sàng cao cung cấp các giải pháp cho sự hoạt động liên tục của
hệ thống máy tính đối với những sự cố ở ngay từng trạm, chẳng hạn như một máy chủ gặp sự cố hoặc đĩa cứng bị lỗi
3.2.3 Cách xây dựng High Availability
3.2.3.1 Khái niệm điểm lỗi đơn (Single points of failure)
Điểm lỗi đơn là những lỗi mà khi nó xảy ra làm cho hệ thống ngừng hoạt động hoàn toàn
Ví dụ : hệ thống chỉ có một nguồn điện và khi mất điện thì hệ thống
không hoạt động được nữa…
3.2.3.2 Xây dựng High Availability
Tính sẵn sàng cao có nghĩa là có dư thừa phần cứng và phần mềm vìthế mà bình thường những thao tác có thể tiếp tục sau khi xảy ra một điểm lỗiđơn Lý tưởng là những điểm lỗi đơn không xảy ra ở tất cả các thành phần ,
có nghĩa là các thành phần phải làm việc tại tất cả các thời gian Để tạo tínhsẵn sàng cao về phần cứng thì chúng ta có thể tạo nhiều các thiết bị phần cứngtrong một đơn vi duy nhất hoặc nếu có nhiều đơn vị thì phải được cài đặt vàhoạt động trên các đơn vị đó Còn đối với phần mềm để tạo tính sẵn sàng caothì chúng ta cho chạy các phần mềm đồng thời trên các thiết bị phần cứng,cấu hình này được gọi là active/active bởi vì cả hai thành phần đang hoạtđộng tại cùng một thời gian Một phương pháp khác là cấu hình active/passive trong đó passive là thành phần dự phòng có thể được đưa lên thành
Trang 19active khi active bị lỗi Trong một giải pháp sẵn sàng cao khi một điểm lỗiđơn xảy ra thì chi phí để khắc phục nó tương đối thấp cũng như phương phápactive /active Nhưng đôi khi có những thảm họa mà chúng ta không thểlường trước được thì tính sẵn sàng cao là không đủ Khi đó, chúng ta lại phải
sử dụng Disastor Recovery (DR)
Để xây dựng hệ thống đảm bảo tính High Availability người ta phải tìmcách loại bỏ các điểm lỗi đơn này bằng cách sau :
Node Sử dụng nhiều node
Power source Sử dụng nhiều nguồn hoặc những nguồn dự phòng tốtNetwork adapter
Sử dụng nhiều Disk adapter và nhiều phần cứng
Sử dụng nhiều Disk với mirroring hoặc raidApplication Thêm các node để takeover, cấu hình ứng dụng điều
khiểnVIO server Các cổng vào/ra nên dual hết
Site Tăng thêm các Trạm
Công nghệ tiêu biểu cho HA bao gồm nguồn điện dự phòng và nhiềuquạt dành cho Server, RAID (Redundant Array of Inexpensive /IndependentDisks) cấu hình cho các ổ đĩa, các cụm máy chủ, các card mạng và các router
dự phòng cho hệ thống mạng
Trang 203.2.4 Ứng dụng của High Availability cho các dịch vụ
3.2.4.1 Sẵn sàng cao cho dịch vụ Microsoft Active Directory
Để tăng tính sẵn sàng cao cho dịch vụ Microsoft Active Directory tacần cài đặt thêm máy chủ Additional DC vào trạm Disastor Recovery, sau đóđồng bộ dữ liệu với các máy có vài trò FSMO của Forest (rừng) và Domain(miền)
3.2.4.2 Sẵn sàng cao cho dịch vụ Email
Để tăng tính sẵn sàng cao cho ứng dụng là dịch vụ Email, ta phải thực hiện :
- Bổ sung thêm các máy chủ Client Access Server, Mailbox Server, Hub Transport vào trạm Disaster Recovery như một trạm Exchange mới
- Mailbox của người dùng ở được phân bố ở các mailbox DB khác nhau
để giảm thiểu độ trễ truy nhập, dễ đồng bộ dữ liệu
- Dùng cơ chế DAG của MS Exchange 2007 hoặc 2010 để lưu redundantcác mailbox database tại DR Site
- Mailbox databases ở hai hệ thống DC, DR là hoàn toàn giống nhau (môhình full-redundant); như vậy tất cả các database đều có ít nhất 02 phiên bản:active và passive ở 2 trạm
- Các máy chủ CAS ở 02 trạm sẽ dùng chung Global name, do đó ngườidùng có thể truy nhập mailbox ở một trong hai trạm để chia sẻ tải; cũng nhưviệc phân bổ: người dùng ở IP subnet nào sẽ truy nhập ở CAS tương ứng ởmột trong hai trạm Khi hệ thống mail có sự cố, người dùng sẽ truy nhập đếntrạm còn lại và không mất thư
Trang 21Hình 3.1 Nguyên lý sẵn sàng cao cho hệ thống thư dùng cơ chế DAG
3.2.4.3 Sẵn sàng cao cho các cơ sở dữ liệu và máy chủ cơ sở dữ liệu
Có hai phương án sẵn sàng cao cho các cơ sở dữ liệu cũng như máy chủ cơ sở dữ liệu
Với cơ sở dữ liệu :
- Dùng cơ chế tạo ra các bản CSDL dự phòng standby database (dùng Oracle Data Guard)
Với máy chủ CSDL:
- Cấu hình phần cứng có tính dự phòng cho máy chủ (CPU, RAM, fans, power supply, NIC, HBA…)
- Dùng cơ chế clustering các máy chủ (có thể dùng cơ chế clustering của
hệ điều hành); ngoài ra có thể kết hợp Oracle RAC extensition (vì hệ thống
có 02 trạm ở xa nhau và CSDL ở các tủ đĩa lưu trữ khác nhau
2.2.4.4 Sắn sàng cao cho các ứng dụng quan trọng
- Cấu hình phần cứng có tính dự phòng cho máy chủ (CPU, RAM, fans, power supply, NIC, HBA…)
- Dùng cơ chế clustering các máy chủ (có thể dùng cơ chế clustering của
hệ điều hành)
Trang 223.3 Khôi phục thảm họa (Disaster recovery)
3.3.1 Khái niệm
Khôi phục thảm họa là một quá trình, chính sách và thủ tục liên quan
để chuẩn bị cho việc phục hồi hoặc tiếp tục cơ sở hạ tầng công nghệ quantrọng cho một số tổ chức sau khi sảy ra một thảm họa thiên nhiên hoặc do conngười gây ra Khôi phục thảm họa là một phần của tính năng liên tục của hệthống máy tính Trong khi tính năng liên tục của hệ thống máy tính liên quanđến việc lập kế hoạch để giữ tất cả các khía cạnh hoạt động của một doanhnghiệp, phục hồi thảm họa tập trung vào công nghệ IT hoặc hệ thống có hỗtrợ chức năng liên tục
3.3.2 Mô hình Disaster Recovery
Hình 3.2 Mô hình của hệ thống sẵn sàng cao
3.3.3 Các công nghệ đồng bộ dữ liệu
3.3.3.1 Replication
Việc sao lưu dữ liệu ra băng từ hay các đĩa CD, DVD rồi chuyển đến
hệ thống DR và đưa vào hoạt động cũng có thể coi là một dạng củaReplication Tuy nhiên với cách làm này thì hệ thống DR sẽ không còn ýnghĩa về mặt hoạt động do các giá trị RTO và RPO sẽ đẩy lên tới vài ngàyhay vài tuần Đó là điều không thể chấp nhận được trong hệ thống hoạt động