đồ án kỹ thuật cơ khí Tìm hiểu về hệ thống máy tính chịu đựng lỗi, sẵn sàng cao

Cụm Cluster Công nghệ này được dùng cho các ứng dụng Stateful các ứng dụnghoạt động thường xuyên trong thời gian dài bao gồm các máy chủ cơ sở dữliệu như là Microsoft MySQL Server, Micro

Trang 2

MỤC LỤC

LỜI CẢM ƠN i

MỤC LỤC ii

DANH MỤC HÌNH vi

DANH MỤC HÌNHDANH MỤC VIẾT TẮT vii

CHƯƠNG I MỞ ĐẦU 1

1.1 Đặt vấn đề 1

1.2 Mục đích và yêu cầu 1

CHƯƠNG II GIỚI THIỆU MỘT SỐ CÔNG NGHỆ VÀ SẢN PHẨM 2

2.1 Công nghệ cụm (Clustering) 2

2.1.1 Định nghĩa Clustering 2

2.1.2 Yêu cầu của hệ thống Clustering 2

2.1.2.1 Yêu cầu về tính sẵn sàng cao (High availability) 2

2.1.2.2 Yêu cầu về độ tin cậy cao (reliability) 2

2.1.2.3 Yêu cầu về khả năng mở rộng được (scalability) 2

2.1.3 Phân loại công nghệ Clustering 2

2.1.3.1 Cụm (Cluster) 2

2.1.3.2 Cân bằng tải (Network Load Balancing-NLB) 3

2.1.4 Cấu trúc của Cluster 3

2.1.4.1 Cấu trúc song song 3

2.1.4.2 Cấu trúc độc lập 4

Trang 3

2.1.4.3 Cấu trúc chủ động – thụ động (active - passive) 4

2.1.5 Nguyên lý hoạt động của cluster 5

2.1.6 Tính mở rộng của Cluster 7

2.2 Các công nghệ và sản phẩm của các hãng Microsoft, HP và Citrix 7

2.3 Giải pháp của các hãng Microsoft, HP và Citrix 8

CHƯƠNG III MÔ HÌNH PHÒNG NGỪA RỦI RO VÀ HIỆU NĂNG CAO 10

3.1 Sự hoạt động liên tục của hệ thống máy tính (Business Continuity) 10

3.2 Tính sẵn sàng cao (High Availability) 10

3.2.1 Định nghĩa High Availability 10

3.2.2 Lợi ích của High Availability 10

3.2.3 Cách xây dựng High Availability 11

3.2.3.1 Khái niệm điểm lỗi đơn (Single points of failure) 11

3.2.3.2 Xây dựng High Availability 11

3.2.4 Ứng dụng của High Availability cho các dịch vụ 13

3.2.4.1 Sẵn sàng cao cho dịch vụ Microsoft Active Directory 13

3.2.4.2 Sẵn sàng cao cho dịch vụ Email 13

3.2.4.3 Sẵn sàng cao cho các cơ sở dữ liệu và máy chủ cơ sở dữ liệu 14

2.2.4.4 Sắn sàng cao cho các ứng dụng quan trọng 14

3.3 Khôi phục thảm họa (Disaster recovery) 15

3.3.1 Khái niệm 15

3.3.2 Mô hình Disaster Recovery 15

3.3.3 Các công nghệ đồng bộ dữ liệu 15

Trang 4

3.3.3.1 Replication 15

3.3.3.2 Application-based replication 16

3.3.3.3 Sao lưu Host-based replication 17

3.3.3.4 Storage-based replication 17

3.3.4 Các phương thức Backup dữ liệu 18

3.3.4.1.Sao lưu ngoại tuyến (Offline backup) 18

3.3.4.2 Sao lưu trực tuyến “ấm” (Warm online backup) 18

3.3.4.3 Sao lưu trực tuyền “nóng” (Hot online backup) 18

3.3.5 Các loại backup dữ liệu 19

3.3.5.1 Sao lưu đầy đủ (Full backup) 19

3.3.5.2 Sao lưu tăng dần (Incremental backup) 19

3.3.5.3 Sao lưu cộng dồn (Differential backup) 19

3.3.5.4 Sao lưu tổng hợp (Synthetic Backup) 20

3.3.5.5 Sao lưu tăng tiến (Progressive Backup) 20

3.3.5.6 Sao lưu nhiều mức tăng dần (Multilevel Incremental Backup) 21

3.3.6 Các giải pháp xây dựng hệ thống chịu lỗi (Disaster Recovery) 21

3.3.6.1 Các yếu tố để xây dựng hệ thống Disaster Recovery 21

3.3.6.2 Sử dụng băng từ (Tape backup) 22

3.3.6.3 Remote Mirroring 23

3.3.6.4 Đồng bộ dữ liệu mức phần cứng ( Hardware Replication) 24

3.3.6.5 Đồng bộ dữ liệu dùng phần mềm (software replication) 25

3.3.6.6 Đồng bộ cơ sở dữ liệu (Database replication) 26

3.3.6.7 Campus Clustering 28

Trang 5

3.3.3.8 Fibre Channel over IP (FCIP) 29

CHƯƠNG IV CÀI ĐẶT VÀ CẤU HÌNH SQL SERVER CLUSTER 31

4.1 Mở đầu 31

4.2 Cài đặt SQL Server 2005 Clustering 31

4.2.1 Yêu cầu cài đặt 31

4.2.2 Các bước thực hiện 32

4.2.3 Mô hình của hệ thống 32

4.2.3 Một số giao diện của chương trình 33

CHƯƠNG V KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN CỦA ĐỀ TÀI 37

5.1 Kết Luận 37

5.2 Hướng phát triển của đề tài 37

TÀI LIỆU THAM KHẢO 38

Trang 6

DANH MỤC HÌNH

Hình 2.1 Cấu trúc của hệ thống song song 3

Hình 2.2 Cấu trúc của hệ thống độc lập 4

Hình 2.3 Cấu trúc của hệ thống chủ động, thụ động 5

Hình 2.4 Nguyên lý hoạt động của hệ thống cluster 5

Hình 3.1 Nguyên lý sẵn sàng cao cho hệ thống thư dùng cơ chế DAG 14

Hình 3.2 Mô hình của hệ thống sẵn sàng cao 15

Hình 3.3 Biểu đồ chi phí và thời gian khôi phục hệ thống 22

Hình 3.4 Mô hình hệ thống Remote Mirroring 23

Hình 3.5 Mô hình hệ thống đồng bộ hóa dùng phần cứng 24

Hình 3.6 Mô hình hệ thống đồng bộ hóa dùng phần mềm 25

Hình 3.7 Mô hình hệ thống đồng bộ hóa dùng cơ sở dữ liệu 26

Hình 3.8 Mô hình hệ thống Campus Clustering 28

Hình 4.1 Mô hình hệ thống sử dụng cluster 32

Hình 4.2 Tạo Cluster trên node1 33

Hình 4.3 Node 1 đã được tạo Cluster 33

Hình 4.4 Đưa node2 vào cluster 34

Hình 4.5 Cluster bao gồm node1 và node2 đã được tạo 34

Hình 4.6 Cài đặt SQL server 2005 35

Hình 4.7 Tạo các tài nguyên Disk, IP address, Network name, Server Agent cho Cluster 35

Hình 4.8 Shutdown node 2 36

Hình 4.9 Truy vấn thành công cơ sở dữ liệu khi node 2 shutdow 36

Trang 7

DANH MỤC VIẾT TẮT

HA High Availability Tính sẵn sàng cao

DR Disaster Recovery Khôi phục từ thảm họaVPN Virtual Private Network Mạng riêng ảo

DC Domain Controller Quản lý trong miền

NLB Network Load Balancing Cân bằng tải

SAN Storage Area Network Mạng lưu trữ nội bộ

IP Internet Protocol Giao thức liên mạng

DAG Database Availability Group Sẵn sàng cao cơ sở dữ liệuiSCSI Internet Small Computer System

Interface

Là một chuẩn công nghiệpdùng để truyền tải các lệnh qua mạng IPFTP File Tranfer Protocol Giao thức truyền tải file

DHCP Dynamic Host Configuration

Protocol

Giao thức cấu hình động máy chủ

CPU Center Processing Unit Bộ xử lý trung tâm

RAM Random Access Memory Bộ nhớ truy xuất nhanhFSMO

Flexible Single Master Operations

Là một Role trong Windown Server

NAS Network Atteched Storage Mạng lưu trữ nội bộ

RAID Redundant Arrays of Independent

Disks

Công nghệ lưu trữ dữ liệu

Trang 8

CHƯƠNG I MỞ ĐẦU

1.1 Đặt vấn đề

Trong thời đại bùng nổ công nghệ thông tin hiện nay, mạng máy tínhđóng vai trò ngày càng quan trọng hơn trong hoạt động của các doanhnghiệp, tổ chức cũng như các cơ quan nhà nước Thậm chí ở một số đơn vị,chẳng hạn như các công ty hàng không hoặc các ngân hàng lớn, mạng máytính có thể ví như hệ thần kinh điều khiển hoạt động của toàn doanh nghiệp

Sự ngừng hoạt động của mạng máy tính trong những cơ quan này có thể làm têliệt các hoạt động chính của đơn vị, và thiệt hại khó có thể lường trước được

Chúng ta đều biết máy chủ mạng là trái tim của mạng máy tính, nếumáy chủ mạng hỏng, hoạt động của hệ thống sẽ bị ngưng trệ Điều đáng tiếc

là dù các hãng sản xuất đã cố gắng làm mọi cách để nâng cao chất lượng củathiết bị, nhưng những hỏng hóc với các thiết bị mạng nói chung và các máychủ nói riêng là điều không thể tránh khỏi Do vậy, vấn đề đặt ra là cần cómột giải pháp để đảm bảo cho hệ thống vẫn hoạt động tốt ngay cả khi có sự

cố xảy ra đối với máy chủ mạng Do đó đề tài này nghiên cứu về “Tìm hiểu

về hệ thống máy tính chịu đựng lỗi, sẵn sàng cao ” nhằm giúp cơ quan,

doanh nghiệp vẫn hoạt động tốt khi gặp thảm họa

1.2 Mục đích và yêu cầu

Mục đích :

 Tìm hiểu về hệ thống máy tính có khả năng chịu lỗi

 Xây dựng thành công một hệ thống máy tính có khả năng chịuđựng lỗi và tính sẵn sàng cao

 Giúp cho hoạt động của cơ quan, doanh nghiệp hiệu quả hơn.Yêu cầu :

 Nghiên cứu các khái niệm liên quan đến hệ thống

 Hiểu được các mô hình của hệ thống

 Hiểu được các công nghệ để xây dựng hệ thống

Trang 9

CHƯƠNG II GIỚI THIỆU MỘT SỐ CÔNG NGHỆ VÀ SẢN PHẨM

2.1 Công nghệ cụm (Clustering)

2.1.1 Định nghĩa Clustering

Clustering là một kiến trúc nhằm đảm bảo nâng cao khả năng sẵn sàngcho các hệ thống mạng máy tính Clustering cho phép sử dụng nhiều máy chủkết hợp với nhau tạo thành một cụm có khả năng chịu đựng lỗi hay chấp nhậnsai sót nhằm nâng cao độ sẵn sàng của hệ thống mạng

2.1.2 Yêu cầu của hệ thống Clustering

2.1.2.1 Yêu cầu về tính sẵn sàng cao (High availability)

Các tài nguyên mạng phải luôn sẵn sàng trong khả năng cao nhất đểcung cấp và phục vụ các người dùng cuối và giảm thiểu sự ngưng hoạt động

hệ thống ngoài ý muốn

2.1.2.2 Yêu cầu về độ tin cậy cao (reliability)

Độ tin cậy cao của clustering được hiểu là khả năng giảm thiểu tần sốxảy ra các sự cố, và nâng cao khả năng chịu đựng sai sót của hệ thống

2.1.2.3 Yêu cầu về khả năng mở rộng được (scalability)

Hệ thống phải có khả năng dễ dàng cho việc nâng cấp, mở rộng trongtương lai Việc nâng cấp mở rộng bao hàm cả việc thêm các thiết bị, máy tínhvào hệ thống để nâng cao chất lượng dịch vụ, cũng như việc thêm số lượngngười dùng, thêm ứng dụng, dịch vụ và thêm các tài nguyên mạng khác

2.1.3 Phân loại công nghệ Clustering

Công nghệ Clustering được chia làm hai kỹ thuật nhỏ hơn bao gồm

Cluster và Network Load Balancing

2.1.3.1 Cụm (Cluster)

Công nghệ này được dùng cho các ứng dụng Stateful (các ứng dụnghoạt động thường xuyên trong thời gian dài) bao gồm các máy chủ cơ sở dữliệu như là Microsoft MySQL Server, Microsoft Exchange Server, File andPrint Server… Tất cả các node (một server thuộc một Cluster nào đó mà trên

đó các ứng dụng và dịch vụ Cluster được cài đặt) trong Cluster dùng chung

một nơi lưu trữ dữ liệu có thể dùng công nghệ SCSI hoặc Storage AreaNetwork (SAN) Windows Sever 2003 Enterprise và Datacenter hỗ trợ cluster

Trang 10

lên đến 8 node trong khi đó Windows 2000 Advance Server hỗ trợ 2 node cònWindows 2000 Datacenter Server được 4 node.

2.1.3.2 Cân bằng tải (Network Load Balancing-NLB)

Là một loại khác của kỹ thuật Clustering có khả năng chia tải và nâng

cao khả năng chịu lỗi của hệ thống được tốt hơn Được dùng cho các ứngdụng Stateless (các ứng dụng hoạt động mang tính nhất thời) như Web, FileTranfer Protocol (FTP), Virtual Private Network (VPN), DHCP…Mỗi nodephải dùng riêng một nơi lưu trữ cục bộ (Local Storage) cho nên cần phải cóquá trình đồng bộ hóa dữ liệu ở mỗi nơi lưu trữ, số lượng node càng nhiều thìthời gian cho việc đồng bộ hóa càng lâu chính vì điều này nên ta không nêntriển khai các ứng dụng Stateful trên kỹ thuật NLB này nhằm đảm bảo tínhchính xác của dữ liệu

2.1.4 Cấu trúc của Cluster

Trong Cluster, tùy theo nhu cầu mà chúng ta có thể triển khai nhiềuứng dụng trên cùng một cluster hay cài đặt trên mỗi node một ứng dụng, nóichung cấu trúc của một cluster không cố định nhưng chủ yếu chúng ta thấyhữu ích nhất là các loại cấu trúc sau:

2.1.4.1 Cấu trúc song song

Nếu ta triển khai hai ứng dụng stateful trên hệ thống cluster thì có mộtphương pháp đơn giản là cài đặt cả hai ứng dụng ấy vào mỗi node củacluster Ở cấu trúc này thì hai ứng dụng trên cùng một server do đó nếu ứngdụng này bị lỗi thì sẽ ảnh hưởng đến ứng dụng kia, hiệu quả của hệ thốngcluster sẽ thấp

Hình 2.1 Cấu trúc của hệ thống song song

Trang 11

Hình 2.2 Cấu trúc của hệ thống độc lập

2.1.4.3 Cấu trúc chủ động – thụ động (active - passive)

Triển khai cả hai ứng dụng trên cùng một cluster, mỗi node cài một ứngdụng nhưng khác với cấu trúc song song là sẽ có một cluster làm nhiệm vụsao lưu dữ liệu Cụ thể, hình dưới cho ta thấy hệ thống này có một node chủđộng (active) dùng làm sao lưu và cài cả hai ứng dụng của node 1 và node 2(hai node active) Nếu một trong hai node này bị lỗi thì node thụ động(passive) sẽ thay thế chức năng của node bị lỗi Hệ thống này có hiệu quả caohơn hai loại trước

Trang 12

Hình 2.3 Cấu trúc của hệ thống chủ động, thụ động

2.1.5 Nguyên lý hoạt động của cluster

Mỗi máy chủ trong cluster được gọi là một nút (cluster node), và có thểđược thiết lập ở chế độ chủ động (active) hay thụ động (passive) Khi một nút

ở chế dộ chủ động, nó sẽ chủ động xử lý các yêu cầu Khi một nút là thụđộng, nó sẽ nằm ở chế độ dự phòng nóng (stanby) chờ để sẵn sàng thay thếcho một nút khác nếu bị hỏng Nguyên lý hoạt động của Cluster có thể biểudiễn như trong hình dưới đây

Hình 2.4 Nguyên lý hoạt động của hệ thống cluster

Trang 13

Trong một cluster có nhiều node có thể kết hợp cả node chủ động và node thụ động Trong những mô hình loại này việc quyết định một node được cấu hình là chủ động hay thụ động rất quan trọng Để hiểu lý do tại sao, hãy xem xét các tình huống sau:

 Nếu một node chủ động bị sự cố và có một node thụ động đang sẵn

sàng, các ứng dụng và dịch vụ đang chạy trên node hỏng có thể lập tức được

chuyển sang node thụ động Vì máy chủ đóng vai trò node thụ động hiện tạichưa chạy ứng dụng hay dịch vụ gì cả nên nó có thể gánh toàn bộ công việccủa máy chủ hỏng mà không ảnh hưởng gì đến các ứng dụng và dịch vụ cungcấp cho người dùng cuối (ngầm định rằng các các máy chủ trong cluster cócấu trúc phần cứng giống nhau)

 Nếu tất cả các máy chủ trong cluster là chủ động và có một node bị sự

cố, các ứng dụng và dịch vụ đang chạy trên máy chủ hỏng sẽ phải chuyển

sang một máy chủ khác cũng đóng vai trò node chủ động Vì là node chủđộng nên bình thường máy chủ này cũng phải đảm nhận một số ứng dụng haydịch vụ nào đó, khi có sự cố xảy ra thì nó sẽ phải gánh thêm công việc củamáy chủ hỏng Do vậy để đảm bảo hệ thống hoạt động bình thường kể cả khi

có sự cố thì máy chủ trong cluster cần phải có cấu hình dư ra đủ để có thểgánh thêm khối lượng công việc của máy chủ khác khi cần

Trong cấu trúc cluster mà mỗi node chủ động được dự phòng bởi một nodethụ động, các máy chủ cần có cấu hình sao cho với khối lượng công việctrung bình, chúng sử dụng hết khoảng 50% CPU và dung lượng bộ nhớ

Trong cấu trúc cluster mà số node chủ động nhiều hơn số node bị động,các máy chủ cần có cấu hình tài nguyên CPU và bộ nhớ mạnh hơn nữa để cóthể xử lý được khối lượng công việc cần thiết khi một node nào đó bị hỏng

Trang 14

Các node trong một cluster thường là một bộ phận của cùng một vùng(domain) và có thể được cấu hình là máy điều khiển vùng (domaincontrollers) hay máy chủ thành viên Lý tưởng nhất là mỗi cluster nhiều node

có ít nhất hai node làm máy điều khiển vùng và đảm nhiệm việc failover (mộthành động khi có sự cố sảy ra) đối với những dịch vụ vùng thiết yếu Nếukhông như vậy thì khả năng sẵn sàng của các tài nguyên trên cluster sẽ bị phụthuộc vào khả năng sẵn sàng của các máy điều khiển trong vùng

2.1.6 Tính mở rộng của Cluster

Hệ thống clustering cung cấp khả năng mở rộng cao Tuỳ theo yêu cầu

cụ thể, các cluster có thể cần phải thêm các máy chủ vào Cluster hoặc thêmCPU và RAM cho các máy chủ để tăng khả năng đảm nhận công việc cho cácmáy chủ đã có Khi các ứng dụng trong Cluster sử dụng tài nguyên hệ thốngvượt quá khả năng của nó, ta có thể dễ dàng thêm node vào cluster để đáp ứngnhu cầu truy cập hay dễ dàng thêm vào nhiều bộ xử lý

Ví dụ: ta có thể thêm được 8 CPU cho bản Windows Server 2003

Enterprise Edition và 32 CPU cho Windows Server Datacenter Edition hoặcthêm 8GB bộ nhớ RAM cho bản Windows Server 2003 Enterprise Edition và64GB cho bản Datacenter Edititon

2.2 Các công nghệ và sản phẩm của các hãng Microsoft, HP và Citrix

Các tổ chức phải duy trì sự sẵn sàng cao hoạt động doanh nghiệp củamình trong trường hợp doanh nghiệp ngừng hoạt động có kế hoạch trước hoặckhông có kế hoạch Sự tiếp tục hoạt động của hệ thống là một giải pháp thiết

kế để ngăn chặn thời gian chết cung cấp tính sẵn sang cao để duy trì hoạtđộng trong trường hợp hệ thống gặp sự cố và khôi phục thảm họa trên mộttrạm thứ hai khi trạm chính không hoạt động Tuy nhiên do chi phí, độ phức

Trang 15

tạp hoạt động của các doanh nghiệp mà các giải pháp cho sự hoạt động củadoanh nghiệp buộc phải ưu tiên các tài sản của doanh nghiệp mà họ có thểbảo vệ nếu có.

Một giải pháp chung của Microsoft, HP và Citrix là làm giảm chi phí,

độ phức tạp và mức độ hoạt động của việc để duy trì sự hoạt động liên tục của

hệ thống doanh nghiệp Giải pháp này nhanh chóng và dễ dàng để thiết lậpcác hệ thống sẵn sàng cao, duy trì sự hoạt động liên tục Kết quả là các tổchức, doanh nghiệp được bảo vệ tốt nhất nếu không phải là tất cả thì là dữ liệu

và tài sản thông tin Giải pháp mà Microsoft, HP và Citrix đưa ra để duy trì sựhoạt động liên tục của tổ chức, doanh nghiệp trong trường hợp hệ thốngngừng hoạt động có kế hoạch hoặc không có kế hoạch trước với một thànhphần, hệ thống hoặc thậm chí là toàn bộ một hệ thống trạm phục hồi

2.3 Giải pháp của các hãng Microsoft, HP và Citrix

Các giải pháp truyền thống cho tính sẵn sàng cao thì rất tốn kém Giảipháp cho tính sẵn sàng cao bằng phần mềm tốn kém vì các chi phí này đượcpha trộn bởi sự cần thiết phải dư thừa phần cứng dự phòng và dung lượng lưutrữ Tổng chi phí cho tính sẵn sàng cao có thể lên đến hàng triệu đô la

Các giải pháp truyền thống cũng yêu cầu cần mở rộng hướng dẫn cấuhình để đảm bảo sự kiện failover xảy ra một cách chính xác Quá trình cấuhình máy chủ và lưu trữ cho các hệ thống sẵn sàng cao là không hiệu quả bởi vì nóđòi hỏi những nỗ lực của hai nhóm và có thể mất vài tuần hoặc vài tháng Khi một

hệ thống ngừng hoạt động, các thao tác bằng tay là cần thiết để bắt đầu chuyển đổi

dự phòng, kết quả làm tăng thời gian chết của hệ thống

Một sự kết hợp của công nghệ làm giảm chi phí và sự phức tạp của tính sẵn sàng cao và đơn giản hóa việc quản lý của tổ chức, doanh nghiệp Chúng bao gồm

ảo hóa, Clustering, sao lưu đồng bộ, lưu trữ sẵn sàng cao và các giải pháp mới

 Ảo hóa – Môi trường ảo hóa giúp giảm chi phí thông qua một máy chủ

thống nhất, cho phép các tổ chức giảm sự dư thừa về phần cứng bằng cách

Trang 16

chạy nhiều máy ảo thực hiện sao lưu trên phần cứng vật lý như nhau Điềunày cung cấp chính sách failover mà không cần máy chủ hoàn toàn rảnh rỗi.Máy ảo có thể được sao lưu, di chuyển hoặc sao chép vào bất cứ máy chủ nàokhông gặp sự cố trong hoạt động của hệ thống Ngoài ra môi trường ảo hóa hỗtrợ sẵn sàng cao thông qua thiết bị điều khiển có sẵn của máy chủ, trongtrường hợp máy chủ thất bại, khởi động lại máy ảo thay thế.

 Clustering – Cụm máy chủ có tính sẵn sàng cao đảm bảo rằng nếu một

máy chủ gặp sự cố, các máy ảo sẽ tự động khởi động lại trên một máy chủkhác thay thế mà không làm gián đoạn các hoạt động của người dùng Cụmmáy chủ bao gồm hai hoặc nhiều máy chủ vật lý hay máy ảo chạy cùng cấuhình Ứng dụng phần mềm Clustering giữ cho dữ liệu cập nhật trên cả hai máy vàkhởi động lại máy chủ sao lưu trong trường hợp máy chủ chính gặp sự cố

 Sao lưu đồng bộ - Trong khi hầu hết các Cluster nằm trong một trạm

duy nhất, các cụm máy chủ có thể phát triển rộng ra nhiều địa điểm khác.Clusters yêu cầu sử dụng sao lưu đồng bộ, giúp đồng bộ dữ liệu trên các máythành viên của cùng một cụm máy chủ, bởi dữ liệu của các cụm máy chủ địaphương và cụm máy chủ từ xa cùng một thời gian Bởi vì độ trễ của nó và nhucầu sử dụng băng thông, sao lưu đồng bộ thường được sử dụng chỉ khi cáccụm máy chủ chính và cụm máy chủ phục hồi đều nằm ở gần gần nhau, thôngthường ít hơn 80 kilomet

 Chia sẻ dữ liệu - Các tổ chức phải có lưu trữ được chia sẻ hoặc chia sẻ

bởi tất cả các máy chủ trong Cluster Việc lưu trữ dữ liệu trên chính nó cũngcần phải có tính sẵn sàng cao Sau tất cả, máy chủ chuyển đổi dự phòng có rất

ít thực tế tác động đến sự hoạt động liên tục của tổ chức, doanh nghiệp nếukhông có sự lưu trữ Tất cả các máy ảo phải nằm trên một kênh chia sẻ hoặciSCSI trong đó hợp nhất một khu lưu trữ cho các máy chủ trong Cluster

 Quản lý phần mềm – Các tổ chức cần có một giải pháp đơn giản hóa

các thiết lập và cung cấp các môi trường ảo hóa của họ

Trang 17

CHƯƠNG III MÔ HÌNH PHÒNG NGỪA RỦI RO VÀ HIỆU NĂNG CAO

Phần này sẽ trình bày về tính sẵn sàng cao, khả năng khôi phục từ thảmhọa và qua đó đưa ra các giải pháp để xây dựng hệ thống máy tính đảm bảotính sẵn sàng cao cũng như khả năng khôi phục lại hệ thống khi xảy ra mộtthảm họa

3.1 Sự hoạt động liên tục của hệ thống máy tính (Business Continuity)

Business Continuity là một tập hợp các hành động và thủ tục được địnhtrước để cho phép một hệ thống tiếp tục hoạt động sau khi xảy ra một thảmhọa nào đó.Một tiến trình xử lý dữ liệu bị lỗi có thể do những nguyên nhânnhư mất mạng hoặc do thiên tai quy mô lớn chẳng hạn như động đất, lũ lụt,các cuộc tấn công hoặc sự kiện bất ngờ nào đó Do có rất nhiều thảm họa cóthể xảy ra nên một giải pháp duy nhất để khắc phục chúng là không tối ưu.Thay vào đó là một loạt các kỹ thuật được sử dụng Nói chung, có hai loạichính được áp dụng đó là: High Availability (tính sẵn sàng cao) và DisasterRecovery (khôi phục từ thảm họa)

3.2 Tính sẵn sàng cao (High Availability)

3.2.1 Định nghĩa High Availability

High Availability có nghĩa là các ứng dụng hoặc dịch vụ sẵn sàng ở tất

cả các thời gian, địa điểm và các yếu tố khác có thể ảnh hưởng đến sự sẵn sàng của ứng dụng như vậy Nói chung, nó có khả năng tiếp tục một dịch vụ trong thời lượng rất dài mà không bị bất kỳ sự gián đoạn nào

3.2.2 Lợi ích của High Availability

 Mô hình High Availabilility được xây dựng đảm bảo cho hệ thống tácnghiệp hoạt động một cách thông suốt và hiệu năng cao, mang lại cho ngườidùng đầu cuối sự liên tục hoạt động của hệ thống tác nghiệp với thời gian hệthống bị gián đoạn là nhỏ nhất có thể

 Mô hình này khắc phục những lỗi hoạt động của hệ thống tác nghiệpnhư một bộ phận của hệ thống, vì lý do nào đó ngừng hoạt động, lỗi của một

Trang 18

server trong hệ thống, lỗi đĩa cứng Các xử lý của High Availabilility sẽ giớihạn tại những lỗi mang tính cục bộ địa lý của hệ thống (localized failures).Những lỗi có thể được bao quát trong High Availabilility như lỗi của ngườivận hành hệ thống, lỗi xử lý tiến trình và một số lỗi khác.

 Không những thế mô hình High Availabilility được xây dựng nhằmkhai thác tối đa các tài nguyên sẵn có của hệ thống và mang lại cho ngườidùng đầu cuối môi trường vận hành nhanh nhất, tốt nhất

 Tính sẵn sàng cao cung cấp các giải pháp cho sự hoạt động liên tục của

hệ thống máy tính đối với những sự cố ở ngay từng trạm, chẳng hạn như một máy chủ gặp sự cố hoặc đĩa cứng bị lỗi

3.2.3 Cách xây dựng High Availability

3.2.3.1 Khái niệm điểm lỗi đơn (Single points of failure)

Điểm lỗi đơn là những lỗi mà khi nó xảy ra làm cho hệ thống ngừng hoạt động hoàn toàn

Ví dụ : hệ thống chỉ có một nguồn điện và khi mất điện thì hệ thống

không hoạt động được nữa…

3.2.3.2 Xây dựng High Availability

Tính sẵn sàng cao có nghĩa là có dư thừa phần cứng và phần mềm vìthế mà bình thường những thao tác có thể tiếp tục sau khi xảy ra một điểm lỗiđơn Lý tưởng là những điểm lỗi đơn không xảy ra ở tất cả các thành phần ,

có nghĩa là các thành phần phải làm việc tại tất cả các thời gian Để tạo tínhsẵn sàng cao về phần cứng thì chúng ta có thể tạo nhiều các thiết bị phần cứngtrong một đơn vi duy nhất hoặc nếu có nhiều đơn vị thì phải được cài đặt vàhoạt động trên các đơn vị đó Còn đối với phần mềm để tạo tính sẵn sàng caothì chúng ta cho chạy các phần mềm đồng thời trên các thiết bị phần cứng,cấu hình này được gọi là active/active bởi vì cả hai thành phần đang hoạtđộng tại cùng một thời gian Một phương pháp khác là cấu hình active/passive trong đó passive là thành phần dự phòng có thể được đưa lên thành

Trang 19

active khi active bị lỗi Trong một giải pháp sẵn sàng cao khi một điểm lỗiđơn xảy ra thì chi phí để khắc phục nó tương đối thấp cũng như phương phápactive /active Nhưng đôi khi có những thảm họa mà chúng ta không thểlường trước được thì tính sẵn sàng cao là không đủ Khi đó, chúng ta lại phải

sử dụng Disastor Recovery (DR)

Để xây dựng hệ thống đảm bảo tính High Availability người ta phải tìmcách loại bỏ các điểm lỗi đơn này bằng cách sau :

Node Sử dụng nhiều node

Power source Sử dụng nhiều nguồn hoặc những nguồn dự phòng tốtNetwork adapter

Sử dụng nhiều Disk adapter và nhiều phần cứng

Sử dụng nhiều Disk với mirroring hoặc raidApplication Thêm các node để takeover, cấu hình ứng dụng điều

khiểnVIO server Các cổng vào/ra nên dual hết

Site Tăng thêm các Trạm

Công nghệ tiêu biểu cho HA bao gồm nguồn điện dự phòng và nhiềuquạt dành cho Server, RAID (Redundant Array of Inexpensive /IndependentDisks) cấu hình cho các ổ đĩa, các cụm máy chủ, các card mạng và các router

dự phòng cho hệ thống mạng

Trang 20

3.2.4 Ứng dụng của High Availability cho các dịch vụ

3.2.4.1 Sẵn sàng cao cho dịch vụ Microsoft Active Directory

Để tăng tính sẵn sàng cao cho dịch vụ Microsoft Active Directory tacần cài đặt thêm máy chủ Additional DC vào trạm Disastor Recovery, sau đóđồng bộ dữ liệu với các máy có vài trò FSMO của Forest (rừng) và Domain(miền)

3.2.4.2 Sẵn sàng cao cho dịch vụ Email

Để tăng tính sẵn sàng cao cho ứng dụng là dịch vụ Email, ta phải thực hiện :

- Bổ sung thêm các máy chủ Client Access Server, Mailbox Server, Hub Transport vào trạm Disaster Recovery như một trạm Exchange mới

- Mailbox của người dùng ở được phân bố ở các mailbox DB khác nhau

để giảm thiểu độ trễ truy nhập, dễ đồng bộ dữ liệu

- Dùng cơ chế DAG của MS Exchange 2007 hoặc 2010 để lưu redundantcác mailbox database tại DR Site

- Mailbox databases ở hai hệ thống DC, DR là hoàn toàn giống nhau (môhình full-redundant); như vậy tất cả các database đều có ít nhất 02 phiên bản:active và passive ở 2 trạm

- Các máy chủ CAS ở 02 trạm sẽ dùng chung Global name, do đó ngườidùng có thể truy nhập mailbox ở một trong hai trạm để chia sẻ tải; cũng nhưviệc phân bổ: người dùng ở IP subnet nào sẽ truy nhập ở CAS tương ứng ởmột trong hai trạm Khi hệ thống mail có sự cố, người dùng sẽ truy nhập đếntrạm còn lại và không mất thư

Trang 21

Hình 3.1 Nguyên lý sẵn sàng cao cho hệ thống thư dùng cơ chế DAG

3.2.4.3 Sẵn sàng cao cho các cơ sở dữ liệu và máy chủ cơ sở dữ liệu

Có hai phương án sẵn sàng cao cho các cơ sở dữ liệu cũng như máy chủ cơ sở dữ liệu

Với cơ sở dữ liệu :

- Dùng cơ chế tạo ra các bản CSDL dự phòng standby database (dùng Oracle Data Guard)

Với máy chủ CSDL:

- Cấu hình phần cứng có tính dự phòng cho máy chủ (CPU, RAM, fans, power supply, NIC, HBA…)

- Dùng cơ chế clustering các máy chủ (có thể dùng cơ chế clustering của

hệ điều hành); ngoài ra có thể kết hợp Oracle RAC extensition (vì hệ thống

có 02 trạm ở xa nhau và CSDL ở các tủ đĩa lưu trữ khác nhau

2.2.4.4 Sắn sàng cao cho các ứng dụng quan trọng

- Cấu hình phần cứng có tính dự phòng cho máy chủ (CPU, RAM, fans, power supply, NIC, HBA…)

- Dùng cơ chế clustering các máy chủ (có thể dùng cơ chế clustering của

hệ điều hành)

Trang 22

3.3 Khôi phục thảm họa (Disaster recovery)

3.3.1 Khái niệm

Khôi phục thảm họa là một quá trình, chính sách và thủ tục liên quan

để chuẩn bị cho việc phục hồi hoặc tiếp tục cơ sở hạ tầng công nghệ quantrọng cho một số tổ chức sau khi sảy ra một thảm họa thiên nhiên hoặc do conngười gây ra Khôi phục thảm họa là một phần của tính năng liên tục của hệthống máy tính Trong khi tính năng liên tục của hệ thống máy tính liên quanđến việc lập kế hoạch để giữ tất cả các khía cạnh hoạt động của một doanhnghiệp, phục hồi thảm họa tập trung vào công nghệ IT hoặc hệ thống có hỗtrợ chức năng liên tục

3.3.2 Mô hình Disaster Recovery

Hình 3.2 Mô hình của hệ thống sẵn sàng cao

3.3.3 Các công nghệ đồng bộ dữ liệu

3.3.3.1 Replication

Việc sao lưu dữ liệu ra băng từ hay các đĩa CD, DVD rồi chuyển đến

hệ thống DR và đưa vào hoạt động cũng có thể coi là một dạng củaReplication Tuy nhiên với cách làm này thì hệ thống DR sẽ không còn ýnghĩa về mặt hoạt động do các giá trị RTO và RPO sẽ đẩy lên tới vài ngàyhay vài tuần Đó là điều không thể chấp nhận được trong hệ thống hoạt động

Định dạng
Số trang	45
Dung lượng	2,26 MB