Chương 2 - Tìm hiểu về các mô hình kết nối, công nghệ và các giao thức được sử dụng trong mạng lưu trữ.. TỔNG QUAN VỀ CÔNG NGHỆ MẠNG LƯU TRỮ Trước đây, hướng tiếp cận của các doanh nghiệ
Trang 1ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
Nguyễn Văn Dũng
CÔNG NGHỆ MẠNG LƯU TRỮ VÀ ỨNG DỤNG
LUẬN VĂN THẠC SĨ
Hà nội, 2006
Trang 2ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
Hà nội, 2006
Trang 3MỤC LỤC
LỜI CẢM ƠN 7
DANH SÁCH CÁC KÝ HIỆU, CHỮ CÁI VIẾT TẮT 8
DANH MỤC CÁC HÌNH VẼ 9
MỞ ĐẦU 11
CHƯƠNG 1 TỔNG QUAN CÔNG NGHỆ MẠNG LƯU TRỮ 12
1.1.TỔNGQUANVỀCÔNGNGHỆMẠNGLƯUTRỮ 12
1.1.1 Khái niệm mạng lưu trữ 12
1.1.2 Lợi ích của SAN 13
1.2.CÁCGIẢIPHÁPLƯUTRỮ 14
1.2.1 Thiết bị lưu trữ kết nối trực tiếp (Direct attached storage - DAS) 14
1.2.2 Thiết bị lưu trữ kết nối qua mạng (Network Attached Storage - NAS) 15
1.2.3 Mạng lưu trữ (Storage Area Network – SAN) 16
1.3.CÁCTHÀNHPHẦNTẠONÊNSAN 17
1.3.1 SAN Server 18
1.3.2 Host Bus Adapter (HBA) 18
1.3.3 Hub và Switch kênh quang 19
1.3.4 Router và gateway kênh quang 20
1.3.5 Bridge và Multiplexer kênh quang 20
1.3.6 Thiết bị lưu trữ 21
1.3.7 Thiết bị backup 21
1.3.8 Các thành phần phần mềm 22
CHƯƠNG 2 MÔ HÌNH KẾT NỐI, CÔNG NGHỆ VÀ GIAO THỨC SỬ DỤNG TRONG MẠNG LƯU TRỮ 23
2.1.CÁCMÔHÌNHKẾTNỐITRONGMẠNGLƯUTRỮ 23
2.1.1 Điểm-tới-điểm (Point-to-point) 23
2.1.2 Mạng vòng (FC-AL) 24
2.1.3 Mạng Fabric (FC-SW) 26
2.2.CÁCCÔNGNGHỆSỬDỤNGTRONGMẠNGLƯUTRỮ 29
2.2.1 Công nghệ ảo hóa lưu trữ 29
2.2.2 Công nghệ RAID 33
2.3.CÁCGIAOTHỨCSỬDỤNGTRONGMẠNGLƯUTRỮ 37
2.3.1 Giao thức FC (Fibre Channel) 37
2.3.2 Giao thức iFCP (Internet Fiber Channel Protocol) 52
2.3.3 Giao thức iSCSI (Internet SCSI Protocol) 56
2.3.4 So sánh iFCP và iSCSI 58
CHƯƠNG 3 GIẢI PHÁP CẢI TIẾN MẠNG LƯU TRỮ TRONG MỘT HỆ THỐNG NGÂN HÀNG 60
3.1.MỘTSỐVẤNĐỀCẦNLƯUÝKHICẢITIẾNHỆTHỐNGMẠNGLƯU TRỮ 60
3.2.THỰCTRẠNGMẠNGLƯUTRỮTRONGMỘTHỆTHỐNGNGÂNHÀNG 63
Trang 43.2.1 Hệ thống Xử lý giao dịch trực tuyến - OLTP 63
3.2.2 Hệ thống kho dữ liệu – DataWarehouse 66
3.2.3 Hệ thống đào tạo – Training 67
3.2.4 Một số đánh giá chung về các hệ thống 68
3.3.MỘTSỐGIẢIPHÁPCẢITIẾN 68
3.3.1 Yêu cầu đặt ra của các hệ thống 68
3.3.2 Tích hợp các hệ thống về một SAN thống nhất 69
3.3.3 Tăng cường khả năng sẵn sàng của hệ thống fabric 73
3.3.4 Phương pháp đồng bộ giữa hai tủ đĩa 74
3.3.5 Nâng cao tính sẵn sàng (clustering) 76
3.3.6 Phân vùng (zoning) 78
3.3.7 Cải tiến hệ thống sao lưu và phục hồi dữ liệu 82
3.4.ANTOÀNVÀBẢOMẬTCHOHỆTHỐNGSAN 84
3.4.1 Các đặc trưng chính 85
3.4.2 Các lợi ích thu được khi thiết lập các chính sách bảo mật 86
3.4.3 Một số kỹ thuật sử dụng trong an toàn và bảo mật mạng 87
KẾT LUẬN 106
TÀI LIỆU THAM KHẢO 107
Trang 5Xin cảm ơn Khoa Công nghệ thông tin - Trường Đại học Công nghệ - Đại học Quốc gia Hà nội và các thầy cô giáo đã tạo điều kiện tốt về mọi mặt để tôi hoàn thành được bản luận văn
Hà nội, ngày 20 tháng 11 năm 2006
Tác giả
Trang 6DANH SÁCH CÁC KÝ HIỆU, CHỮ CÁI VIẾT TẮT
ACL - Access Control List
CSDL - Cơ sở dữ liệu
CNTT - Công nghệ thông tin
CRC - Cyclic Redundant Check
DAS - Direct Attached Storage
DES - Data Encryption Standard
FC - Fibre Channel
FC-AL - Fibre Channel Arbitrated Loop
FCP - Fibre Channel Protocol
FCIP - Fibre Channel over IP
GBIC - Gigabit Interface Converters
HBA - Host Bus Adapter
iSCSI - Internet Small Computer System Interface
ISL - Inter-Switch Link
iSNS - Internet Storage Name Services
KDC - Key Distribution Center
LAN - Local Area Network
NAS - Network Attached Storage
NIC - Network Interface Card
OLTP - Online Transaction Processing
PKI - Public Key Infrastructure
QoS - Quality of Service
RAID - Redundant Array of Independent Disk
RD - Running Disparity
SAN - Storage Area Network
SNS - Simple Name Server
SHA - Secure Hash Algorithm
TCP - Transmission Control Protocol
UDP - User Datagram Protocol
ULP - Upper Layer Protocol
WAN - Wide Area Network
WWN - World Wide Name
WWPN - World Wide Port-Name
Trang 7DANH MỤC CÁC HÌNH VẼ
Hình 1-1: Các thành phần trong môi trường mạng SAN 11
Hình 1-2: Thiết bị lưu trữ kết nối trực tiếp - DAS 12
Hình 1-3: Thiết bị lư trữ kết nối qua mạng - NAS 14
Hình 1-4: Mạng lưu trữ - SAN 14
Hình 1-5: Hub 17
Hình 1-6: Switch 17
Hình 1-7: Router kênh quang 18
Hình 1-8: Bridge 19
Hình 2-1: Các mô hình kết nối trong mạng lưu trữ 21
Hình 2-2: Mô hình kết nối điểm - tới - điểm 22
Hình 2 - 3: Mô hình kết nối mạng vòng FC-AL 22
Hình 2-4: Tiến trình tạo mạng vòng 22
Hình 2-5: Chức năng Repeater 23
Hình 2-6: Chức năng kênh vượt cổng 23
Hình 2-7: Mô hình kết nối mạng fabric 24
Hình 2-8: Các thành phần trong fabric 25
Hình 2-9: Ảo hóa lưu trữ 27
Hình 2-10 : Snapshot truyền thống và Vsnap 30
Hình 2-11: RAID 0 32
Hình 2-12: RAID 1 32
Hình 2-13: RAID 0+1 33
Hình 2-14: RAID 2 33
Hình 2-15: RAID 3 34
Hình 2-16: RAID 4 34
Hình 2-17: RAID 5 34
Hình 2-18: RAID 6 35
Hình 2-19: Kiến trúc kênh quang 36
Hình 2-20: Sơ đồ cơ chế kết nối quang Fibre Channel 37
Hình 2-21: Cấu trúc khung 41
Hình 2-22: Mức 1- Flow Control 45
Hình 2-23: Mức 2- Flow Control 45
Hình 2-24: Mức 3- Điều khiển luồng 46
Hình 2-25: Mô hình mạng iFCP 51
Hình 2-26: Mô hình triển khai iFCP 52
Hình 2-27: Cấu trúc iFCP Header 52
Hình 2-28: Ánh xạ FC sang iFCP 53
Hình 2-29: Ánh xạ iFCP sang FC 54
Hình 2-30: Mô hình giao thức iSCSI 55
Hình 3-1: Mô hình hệ thống Xử lý giao dịch trực tuyến 63
Hình 3-2: Mô hình hệ thống Data Warehouse 64
Trang 8Hình 3-3 : Mô hình hệ thống Training 65
Hình 3-4: Mô hình SAN hợp nhất 67
Hình 3-5: Hệ thống OLTP trên mạng lưu trữ hợp nhất 69
Hình 3-6: Hệ thống Data Warehouse trên mạng lưu trữ hợp nhất 70
Hình 3- 7: Hệ thống Training trên mạng lưu trữ hợp nhất 71
Hình 3-8: Mạng fabric của hệ thống lưu trữ hợp nhất 71
Hình 3-9: Nhân bản đồng bộ 72
Hình 3-10: Nhân bản dị bộ 73
Hình 3-11: Mô hình cluster 2 node 74
Hình 3-12: Cluster sau khi xảy ra failover 75
Hình 3-13: Phân vùng trên fabric 77
Hình 3-14: Phân vùng hệ thống OLTP trên fabric 78
Hình 3-15: Phân vùng hệ thống Data Warehouse trên fabric 79
Hình 3-16: Phân vùng hệ thống Training trên fabric 79
Hình 3-17: Phân vùng server quản lý trên fabric 80
Hình 3-18: Mô hình cluster hai Cell Manager 81
Hình 3-19: Cải tiến mô hình backup dữ liệu 82
Hình 3-20: Các lớp “rào chắn” bảo vệ thông tin trên mạng 85
Hình 3-21: Sơ đồ quy trình mật mã 87
Hình 3-22: Xác thực sử dụng khóa bí mật 98
Hình 3-23: Xác thực sử dụng khóa bí mật rút gọn 98
Hình 3-24: Tấn công xác thực 99
Hình 3-25: Xác thực sử dụng KDC 99
Hình 3-26: Giao thức xác thực Needham-Schroeder 99
Hình 3-27: Giao thức xác thực Otway - Rees 100
Hình 3-28: Chữ ký số với Big Brother 101
Hình 3-29: Chữ ký số sử dụng mã hóa công khai 102
Hình 3-30: Chữ ký số sử dụng đại diện thông điệp 103
Trang 9MỞ ĐẦU
Mạng lưu trữ (Storage Area Network - SAN) ngày càng phát triển cùng với sự phát triển của các ứng dụng lớn ví dụ như các hệ thống dữ liệu tài chính, ngân hàng, các hệ thống lưu trữ quốc gia SAN là một mạng nhỏ, tốc độ cao, chia sẽ các thiết bị lưu trữ như các tủ đĩa, tủ tape SAN kết nối các máy chủ, máy trạm với các thiết bị lưu trữ sử dụng các công nghệ kết nối Fibre Channel, SCSI (Small Computer System Interface) Công nghệ kết nối Fibre Channel cung cấp một băng thông ổn định với hiệu suất cao trên một khoảng cách xa, khả năng tạo các đường kết nối dự phòng và cân bằng tải nhằm đảm bảo tính sẵn sàng cao cho hệ thống
Kiến trúc SAN được xây dựng sao cho tất cả các thiết bị lưu trữ đều có thể truy cập từ các server trên mạng này Do các dữ liệu được lưu trữ trực tiếp không nằm trên các server mạng nên công suất của các server được tập trung sử dụng cho các ứng dụng SAN cũng có các thành phần như giống như một mạng LAN, bao gồm các SAN switch, router, các máy chủ, máy trạm và các thiết bị lưu trữ SAN hỗ trợ truyền tốc độ cao giữa các máy chủ và thiết bị lưu trữ theo các cách: server to storage, server to server, storage to storage SAN không dùng giao thức thông điệp TCP/IP (message protocol) mà dùng các giao thức dữ liệu (data protocol) như FCP, iFCP, SCSI, iSCSI SAN cung cấp khả năng linh hoạt chưa từng có về quản lý và cấu hình, đem lại khả năng sẵn sàng, độ tin cậy cao nhất
Nội dung của đề tài tập trung đi vào các vấn đề chính sau đây:
Chương 1 - Tìm hiểu công nghệ mạng lưu trữ hiện nay Trình bày tổng quan về công nghệ mạng lưu trữ SAN, các thành phần của mạng SAN
Chương 2 - Tìm hiểu về các mô hình kết nối, công nghệ và các giao thức được sử dụng trong mạng lưu trữ
Chương 3 - Phân tích về thực trạng mạng lưu trữ tại một hệ thống Ngân hàng Trên cơ sở thực trạng của hệ thống mạng lưu trữ đề xuất một số giải pháp cải tiến hệ thống mạng lưu trữ
Trang 10CHƯƠNG 1 TỔNG QUAN CÔNG NGHỆ MẠNG LƯU TRỮ 1.1 TỔNG QUAN VỀ CÔNG NGHỆ MẠNG LƯU TRỮ
Trước đây, hướng tiếp cận của các doanh nghiệp là các thiết bị lưu trữ sẽ được kết nối trực tiếp tới hệ thống máy chủ Các máy chủ được kết nối và truyền nhận dữ liệu thông qua mạng cục bộ và mạng diện rộng Ngày nay, cùng với sự phát triển của các doanh nghiệp, các thách thức đặt ra là:
- Sự tăng trưởng dung lượng lưu trữ của doanh nghiệp theo hàm mũ
- Yêu cầu hệ thống không dừng
Giải pháp để trả lời cho những thách thức mà doanh nghiệp phải đối mặt đó là dựa trên các công nghệ đã được phát triển, mạng lưu trữ (SAN) được xây dựng nhằm tạo một nền tảng cơ sở cho hệ thống thông tin với khả năng mềm dẻo, đáp ứng tốt với chi phí phù hợp
Mạng lưu trữ SAN được đánh giá là thế hệ tiếp theo của kiến trúc mạng tốc độ cao
1.1.1 Khái niệm mạng lưu trữ
Mạng lưu trữ là mạng tốc độ cao (tốc độ truyền dữ liệu từ 1 đến 2 Gb/s và sau này
có thể lên tới 10 Gb/s) trong có các server cùng truy cập đến một vùng lưu trữ chung gồm các hệ thống lưu trữ
Môi trường SAN cung cấp kết nối (có thể có nhiều đường kết nối) hoặc giữa các server với nhau, hoặc giữa các server với hệ thống lưu trữ, hoặc giữa các hệ thống lưu trữ với nhau [9, 12, 15]
Một mạng SAN có thể được chia thành các phần như sau:
- Lớp client: các client chính là các điểm truy cập SAN
- Lớp server: các thành phần chính của lớp này chính là các server, các HBA,
bao gồm các GBIC và các trình điều khiển HBA truyền thông với lớp Fabric
- Lớp Fabric: là lớp giữa của SAN bao gồm các hub và các switch kết nối với
nhau thành mạng về mặt logic và vật lý
- Lớp storage: bao gồm dữ liệu nằm trong các thiết bị lưu trữ
Trang 11Hình 1-1: Các thành phần trong môi trường mạng SAN
1.1.2 Lợi ích của SAN
SAN cung cấp cho chúng ta một số lợi ích sau:
- Khả năng phục hồi sau thảm họa: các thiết bị trên SAN có thể được ánh xạ qua các thiết bị đặt ở vị trí khác
- Tăng hiệu năng vào ra: SAN hoạt động nhanh hơn so với các ổ đĩa bên trong hoặc các thiết bị lưu trữ được kết nối vào mạng LAN
Ngoài ra, SAN kênh quang (Fibre Channel SAN) còn cung cấp một số lợi ích khác như sau:
- Hiệu năng:
Về khoảng cách: kênh quang cho phép máy chủ và thiết bị được kết nối với khoảng cách có thể lên tới 10km Khả năng về khoảng cách phụ thuộc vào loại cáp được sử dụng
Về tốc độ: kênh quang hỗ trợ tốc độ lên tới 10Gb/s hoặc có thể cao hơn (nhanh gấp năm lần so với SCSI hoặc LAN)
- Hiệu quả:
Độ tin cậy: kênh quang truyền dữ liệu với tỷ lệ lỗi rất thấp
Các thao tác vào/ra độc lập
Khả năng di trú dữ liệu trực tuyến
Hạn chế dừng hệ thống khi thêm mới hoặc thay thế thiết bị
Trang 12- Khả năng quản lý: SAN cung cấp khả năng quản lý tập trung, vì vậy chỉ cần ở một nơi người quản trị có thể quản lý tất cả các hoạt động của SAN ví dụ như các hoạt động sao lưu, lưu trữ và cân bằng tải
- Khả năng kết nối: SAN có thể mở rộng từ 2 đến 14 triệu cổng trong một hệ thống, với nhiều chọn lựa mô hình kết nối khác nhau
- Chi phí hiệu quả: sao lưu không qua server và dùng chung tủ tape
- Hợp nhất thiết bị lưu trữ: dùng chung thiết bị lưu trữ tập trung
1.2 CÁC GIẢI PHÁP LƯU TRỮ
Thiết bị lưu trữ dữ liệu ngày càng trở nên quan trọng cùng với sự phát triển của doanh nghiệp Doanh nghiệp ngày càng cần thiết bị lưu trữ có dung lượng lớn hơn Thiết bị lưu trữ có thể là thiết bị lưu trữ bên trong hoặc là thiết bị lưu trữ mở rộng:
- Thiết bị lưu trữ bên trong: bao gồm các ổ đĩa nằm bên trong máy chủ
- Thiết bị lưu trữ ngoài: kết nối tới thiết bị lưu trữ vật lý riêng Giao tiếp thông qua card HBA trên máy chủ, thường sử dụng giao tiếp kênh quang
Các tổ chức hiện nay đang hướng tới khả năng liên kết các hệ thống, các nhà cung cấp và người dùng tới một hệ thống lưu trữ tập trung Hệ thống này có khả năng cho phép người dùng truy cập dữ liệu từ bất kỳ đâu trong tổ chức Hiện nay có các kiểu kiến trúc mạng lưu trữ đang được sử dụng phổ biến sau [9, 12, 16, 20]:
1.2.1 Thiết bị lưu trữ kết nối trực tiếp (Direct attached storage - DAS)
DAS là thiết bị lưu trữ kết nối trực tiếp tới máy chủ Thiết bị lưu trữ này là kết nối
mở rộng của máy chủ tới một bộ điều khiển thông qua cổng mở rộng Một số thiết bị lưu trữ sử dụng các đặc tính sẵn sàng cao ví dụ như thêm vào các thành phần dự phòng Sơ đồ cấu hình DAS như sau:
Hình 1-2: Thiết bị lưu trữ kết nối trực tiếp - DAS
Hệ thống DAS gồm có các thành phần sau:
Trang 13- Một máy chủ
- Card HBA của máy chủ để có thể truyền thông với thiết bị lưu trữ mở rộng
- Thiết bị lưu trữ
- Server và thiết bị lưu trữ được kết nối qua cáp
Chỉ server kết nối trực tiếp vào hệ thống lưu trữ mới có thể truy cập hệ thống lưu trữ Các client truy cập thiết bị lưu trữ thông qua các server Nếu server không sẵn sàng thì không thể truy cập được thiết bị lưu trữ Khi số lượng kết nối vào server tăng lên, thì lưu lượng mạng sẽ tăng theo DAS chỉ nhanh và tin cậy đối với các mạng có kích thước nhỏ
Nhƣợc điểm của DAS:
- Sử dụng tài nguyên không hiệu quả: Không gian tủ đĩa được chia thành các vùng độc lập Vì vậy, server không thể ghi vào một vùng nhớ này vì hết không gian lưu trữ, trong khi vùng nhớ khác vẫn còn dư thừa không gian nhớ đủ lớn
- Dự phòng không tốt: bản sao của các file có thể nằm trên các server khác nhau
- Lưu lượng mạng: server nằm trên mạng LAN nên làm chậm lưu thông mạng
- Khó quản lý: các vùng nhớ là độc lập nên gây khó khăn cho việc quản lý Nếu server hỏng thì tủ đĩa kết nối trực tiếp với server đó không thể truy cập được
1.2.2 Thiết bị lưu trữ kết nối qua mạng (Network Attached Storage - NAS)
NAS là tủ đĩa nằm trên mạng LAN cùng với server Thiết bị lưu trữ NAS yêu cầu thiết bị lưu trữ cung cấp sự đồng bộ về truy cập file, bảo mật và kết nối mạng NAS có các đặc điểm sau:
- Yêu cầu kết nối mạng
- Server phải có card mạng để truy cập tới tủ đĩa
- Cung cấp ánh xạ file-to-disk
- Các client truy cập theo mức file sử dụng giao thức mạng
- Hỗ trợ FAT, NTFS và NFS file system
Ƣu điểm:
- Có thể được truy cập bởi bất kỳ thiết bị nào được kết nối vào mạng
- Hỗ trợ nhiều hệ điều hành khác nhau
Nhƣợc điểm:
Trang 14- Hạn chế băng thông của mạng LAN
- Hạn chế khả năng xử lý dữ liệu
- Hiệu năng thấp hơn so với SAN
Hình 1-3: Thiết bị lư trữ kết nối qua mạng - NAS
1.2.3 Mạng lưu trữ (Storage Area Network – SAN)
SAN là mạng tốc độ cao trong có các server cùng truy cập đến một vùng lưu trữ chung gồm các hệ thống lưu trữ
Hình 1-4: Mạng lưu trữ - SAN
Các thành phần của SAN bao gồm:
- Client truy cập tới LAN và SAN
- Các server kết nối tới hub hoặc switch có kết nối tới thiết bị lưu trữ
- Thiết bị lưu trữ kết nối tới hub hoặc switch có kết nối tới server
- Các router hoặc bridge kết nối và giao tiếp với thiết bị backup
SAN khác với các mạng truyền thống bởi vì nó được tạo từ các giao tiếp với thiết
bị lưu trữ:
Trang 15- Các giải pháp SAN sử dụng một mạng riêng phía sau server và chủ yếu dựa vào kiến trúc kênh quang
- Kênh quang cung cấp băng thông cao với khoảng cách xa hơn
SAN có thể tránh được hiện tượng tắc nghẽn trong mạng Hỗ trợ truyền nhận trực tiếp, tốc độ cao giữa server và thiết bị lưu trữ
Nhƣợc điểm của SAN:
- RAID kênh quang có chi phí cao hơn so với RAID SCSI
- Các thiết bị kênh quang đắt hơn
1.3 CÁC THÀNH PHẦN TẠO NÊN SAN
Môi trường và các thành phần trong SAN kênh quang đã dẫn tới sự phát triển của các giải pháp cung cấp hiệu năng cao và tính sẵn sàng cao, đó chính là các yêu cầu cơ
Trang 16o Tủ đĩa
o Tủ backup
1.3.1 SAN Server
Các server không chứa dữ liệu (Dataless server):
Dữ liệu được chuyển từ server tới thiết bị lưu trữ Điều đó làm cho server thực hiện tốt hơn bởi vì chúng quản lý dữ liệu ít hơn và có thể tập trung để xử lý các tác vụ khác
Phân cụm (Clustering):
SAN hỗ trợ nhóm cụm các server Cluster là một tập các server độc lập cùng làm việc với nhau để cung cấp tính thứ lỗi Các dịch vụ, ứng dụng và các tài nguyên có thể chạy trên bất kỳ node nào trong cluster Người dùng không nhìn thấy cluster và tương tác với cluster giống như một server đơn
Vai trò của server:
- Server là các điểm truy cập cho client
- Cung cấp tính năng cân bằng tải và đệm dữ liệu để nâng cao hiệu năng
- Lập lịch backup
1.3.2 Host Bus Adapter (HBA)
HBA tương tự như NIC trong mạng LAN Chúng thay thế cho card SCSI truyền thống Một card HBA cung cấp các địa chỉ được mã hóa cứng 64-bit World Wide Name (WWN) và World Wide Port-Name (WWPN) cho thiết bị SAN và các cổng của
nó, và cung cấp nhiều tính năng hơn NIC
Vai trò của HBA
HBA trong SAN cung cấp sự khởi tạo cho các thiết bị kênh quang và các cổng trong mạng vòng hoặc mạng Fabric Ngoài ra, HBA còn cung cấp:
- Hỗ trợ các giao thức mức cao, ví dụ như TCP/IP để đảm bảo cho tương tác giữa SAN và LAN
- Mã hóa dữ liệu theo sơ đồ 8B/10B với cơ chế mã hóa nhanh, bảo mật và tin cậy
Trang 17HBA kênh quang
- Cung cấp công nghệ Gigabit
- Có thể đánh địa chỉ cho nhiều thiết bị hơn SCSI hoặc NIC
- Cung cấp kết nối vào ra tới nhiều thiết bị với khoảng cách xa hơn SCSI
1.3.3 Hub và Switch kênh quang
Hub
Hub trong SAN được sử dụng để triển khai các mô hình kết nối mạng vòng
FC-AL, khác với các hub được sử dụng trong các mạng LAN truyền thống, hub trong mạng SAN có thể hỗ trợ lên tới 126 node
Hình 1-5: Hub
Switch
Switch cung cấp nhiều kết nối hơn so với hub và được sử dụng trong các mô hình kết nối FC-AL hoặc Fabric Chúng thường có từ 8 đến 16 cổng, một switch độc lập có thể tạo một SAN nhỏ Băng thông cho mỗi cổng thường lớn hơn 100Mb/s, vì vậy các khung dữ liệu (frame) được truyền nhận giữa các node trong SAN ở tốc độ cao
Hình 1-6: Switch
Switch FC được chia thành 3 loại:
- Loop switch: chi phí thấp, chúng thường được sử dụng để kết nối các vòng
FC-AL vào fabric
- Fabric switch: giá thành đắt hơn, và thường được sử dụng để triển khai các
fabric
- Director: là loại switch có giá thành đắt nhất, tuy nhiên chúng mang lại hiệu
năng tốt nhất và tin cậy nhất
Trang 18Các dịch vụ khác được cung cấp bởi switch kênh quang như sau:
- Điều khiển luồng buffer-to-buffer
- Các dịch vụ khác, như:
Fabric login: cho phép các node khởi tạo thành công khi tham gia vào môi trường switch (cấp phát một địa chỉ duy nhất), để có thể truyền thông với các node khác trong mạng
Simple Name Server (SNS): giúp node nguồn có thể tìm thấy node đích trong fabric
- Registered State Change Notification (RSCN): thông báo cho các node FC về
sự thay đổi mô hình kết nối hiện có
1.3.4 Router và gateway kênh quang
Router: Router kênh quang cung cấp giao tiếp giữa các thiết bị dựa vào IP, LAN
và SAN Truyền dữ liệu giữa các mạng với nhau bởi việc sử dụng các phương tiện truyền thông và các phương thức định địa chỉ
Gateway: Gateway kênh quang cung cấp kết nối liên mạng sử dụng các giao thức
và phương thức định địa chỉ khác nhau qua mạng WAN Tuy nhiên, chúng có thể thực hiện việc chuyển đổi giao thức
Hình 1-7: Router kênh quang
1.3.5 Bridge và Multiplexer kênh quang
Bridge: Cung cấp khả năng kết nối các thiết bị SCSI song song vào mạng kênh
quang Chúng thực hiện chức năng chuyển đổi giao thức giữa SCSI và FC
Trang 19Thiết bị SCSI song song có thể sử dụng trong SAN cùng với FC-SCSI bridge, các thiết bị lưu trữ song song sử dụng các lệnh SCSI gốc để khởi tạo SCSI truy cập các khối dữ liệu
Hình 1-8: Bridge
Multiplexer: Là loại cầu nối đặc biệt, nó chèn các tín hiệu từ nhiều thiết bị và
truyền chúng đồng thời thông qua một thiết bị truyền nhận
1.3.6 Thiết bị lưu trữ
Các thiết bị dựa vào công nghệ kênh quang có thể kết nối trực tiếp tới mạng kênh quang, cung cấp khoảng cách và tốc độ cao hơn SCSI SAN sử dụng các thiết bị lưu trữ sau:
Thiết bị JBOD: Là một tập các ổ đĩa hoạt động như một thực thể lưu trữ đơn Dữ
liệu được lưu trữ trên JBOB được trải rộng trên nhiều ổ đĩa Tốc độ truy cập dữ liệu trên JBOD chậm Mức dung hòa lỗi và độ tin cậy của JBOD thấp hơn so với tủ đĩa
Tủ đĩa: Là một tủ lưu trữ mở rộng chứa một controller, bộ nguồn, bộ quạt gió, và
các khe cắm đĩa Một tủ đĩa chứa một số ổ đĩa Một số thành phần của tủ đĩa có thể được thay thế nóng
1.3.7 Thiết bị backup
Cấu hình hệ thống backup và phục hồi có thể từ ổ tape gắn trực tiếp vào server cho tới thư viện tape có thể chứa hàng trăm tape
Thƣ viện băng từ: Là hệ thống lưu trữ dữ liệu dung lượng cao dùng cho việc lưu
trữ, tìm kiếm, đọc và ghi trên nhiều băng từ Chúng đáp ứng được về mặt hiệu năng cũng như đặc tính dung lượng của môi trường SAN
Trang 20- Các tài nguyên được quản lý theo các vị trí địa lý khác nhau
Các chức năng của quản lý SAN bao gồm:
- Cài đặt, cấu hình và giám sát thiết bị
- Kiểm kê tài nguyên SAN
- Các tiện ích báo cáo
- Phát hiện các thành phần và switch một cách tự động
- Quản lý cấu hình fabric
- Quản lý bảo mật
- Giám sát hiệu năng và cân bằng tải
Tại mức tủ đĩa, quản lý SAN bao gồm quản lý các mục như ổ đĩa và tủ đĩa, tape và thư viện tape, cáp, hub, switch, gateway, bridge và router, kết nối giữa các switch, các HBA [12, 15]
Trang 21CHƯƠNG 2 MÔ HÌNH KẾT NỐI, CÔNG NGHỆ VÀ GIAO
THỨC SỬ DỤNG TRONG MẠNG LƯU TRỮ 2.1 CÁC MÔ HÌNH KẾT NỐI TRONG MẠNG LƯU TRỮ
Các thiết bị SAN được kết nối trong kênh quang có thể theo một trong ba giao thức sau:
- Điểm - tới - điểm
- Cho phép tồn tại hai đường truyền thông giữa hai thiết bị, tại một thời điểm chỉ
có thể sử dụng được một đường Mỗi thiết bị chỉ có thể truyền hoặc nhận dữ liệu, nhưng không thể thực hiện đồng thời cả hai chức năng
- Các thiết bị SAN trong mạng này phải được kết nối về mặt vật lý để có thể truyền thông với nhau
Trang 22Hình 2-2: Mô hình kết nối điểm - tới - điểm
2.1.2 Mạng vòng (FC-AL)
Là một vòng nối tiếp tạo ra các kết nối điểm - tới - điểm logic hoặc ảo giữa các cổng trong mạng vòng Các thông tin chỉ được truyền theo một hướng trong mạng Các thiết bị trong mạng vòng chia sẻ đường truyền, nhưng chỉ có kết nối hoạt động (active) có toàn bộ băng thông Vì vậy, tại một thời điểm chỉ có một cặp node truyền thông với nhau
Hình 2 -3: Mô hình kết nối mạng vòng FC-AL
Tiến trình tạo vòng lặp trong mạng:
- Cổng truyền của một node sẽ kết nối với cổng nhận của một node khác
- Quá trình này sẽ được tiếp tục cho đến khi cổng truyền cuối cùng kết nối về cổng nhận đầu tiên, khi đó sẽ đóng vòng
- Khi có một node mới được thêm vào, một tiến trình khởi tạo vòng lặp sẽ được thực hiện để gán các địa chỉ vật lý cho các thiết bị trong mạng vòng
Hình 2-4: Tiến trình tạo mạng vòng
Trang 23Đặc điểm của mạng vòng:
- Có thể có nhiều thiết bị trên cùng mạng vòng, tuy nhiên tại một thời điểm chỉ
có hai thiết bị truyền thông với nhau
- Một vòng có tối đa là 126 cổng
- Mỗi cổng sẽ được phát hiện nếu nó nằm trên vòng trong quá trình khởi tạo
- Mỗi thiết bị tham gia trong tiến trình khởi tạo sẽ nhận một địa chỉ duy nhất
Chức năng Repeater
Khi dữ liệu được gửi từ một hướng vòng quanh vòng, từ cổng truyền của một node tới cổng nhận của một node khác, mỗi cổng trên vòng lặp có chức năng giống như một repeater Repeater không cache bất kỳ thông tin nào, và vì vậy, mỗi node trong vòng lặp phải có cùng tốc độ truyền
Hình 2-5: Chức năng Repeater
Kênh vƣợt cổng (port-bypass)
Hình 2-6: Chức năng kênh vượt cổng
Trong cấu hình một mạng vòng, nếu có một thiết bị nào đó bị hỏng, để cho phần còn lại của mạng vòng tiếp tục hoạt động, phải sử dụng kênh vượt cổng Nếu thiết bị hỏng thì kênh vượt cổng sẽ tự động vượt qua thiết bị lỗi để cho mạch vòng tiếp tục hoạt động Nếu cổng và kênh vượt cổng của cổng đó đều bị hỏng thì toàn bộ mạch vòng sẽ bị hỏng
Trang 24Mạng vòng FC-AL là giải pháp kết nối các thiết bị ngoại vi với máy chủ có chi phí thấp Tuy nhiên, khi số node trong mạng vòng lớn thì tốc độ truyền thông sẽ rất chậm
2.1.3 Mạng Fabric (FC-SW)
Mô hình kết nối Switch Fabric
Switch Fabric là một cấu trúc linh động sử dụng một nhóm các switch liên kết qua các Inter-Switch Link (ISL) cung cấp truy cập tới tất cả các thiết bị trong SAN
Hình 2-7: Mô hình kết nối mạng fabric
Một SAN fabric có thể chỉ là một switch fabric đơn hoặc hàng trăm switch fabric Mạng Fabric Switch có các đặc điểm sau:
- Số kết nối trong mạng có thể lên tới 16 triệu node
- Hoạt động như router với các cổng
- Cung cấp băng thông cao
Dịch vụ kết nối bất kỳ và dịch vụ truyền thông điểm tới điểm được cung cấp bởi một fabric là cơ sở của kiến trúc kênh quang Các switch kênh quang có thể truyền thông đồng thời qua giao thức FC-SW
Trang 25Thuật toán khung (frame):
Các switch fabric sử dụng hoặc là thuật toán cut-through hoặc store-and-forward
để truyền dữ liệu từ thiết bị nguồn tới thiết bị đích
- Thuật toán cut-through được sử dụng trong switch fabric để tăng tốc độ định tuyến dữ liệu Khi frame đi vào switch fabric, thuật toán cut-through sẽ tìm kiếm ID đích của frame và định tuyến frame tới cổng tương ứng Bởi vì ID đích nằm trong frame header, nên việc định tuyến xảy ra ngay khi frame đi vào switch
- Phương thức store-and-forward sẽ đọc toàn bộ frame vào buffer trước khi xác định cổng ra
Một phần tử fabric có thể gán các N_Port, gán các mạng vòng FC-AL hoặc phục
vụ như một phần tử gốc cho các thành phần fabric phân tán khác
Hình 2-8: Các thành phần trong fabric
Trang 26Một phần tử fabric là phần tử nhỏ nhất có chức năng giống một mô hình kết nối fabric đầy đủ Nó có ít nhất ba F_port hoặc FL_port để đưa ra các quyết định định tuyến Khi có nhiều phần tử fabric được kết nối vào nó sẽ tạo nên một đơn vị đồng cộng tác cũng giống như một fabric
Liên kết ISL (Inter-switch link):
Kết nối giữa các switch được gọi là ISL Khi các switch được kết nối bởi một ISL, chúng sẽ chia sẻ dữ liệu và thông tin sử dụng giao thức FS-SW Nhiều kết nối ISL có thể cùng tồn tại giữa mỗi port trên switch
Đặc tính của ISL:
- Mỗi kết nối gồm có hai cổng hoạt động trong chế độ E_port
- Số ISL hoạt động đồng thời giữa hai switch là 8
- Nhiều ISL giữa các switch sẽ tăng băng thông khi được yêu cầu bởi môi trường
- Mỗi ISL tạo thành một chặng
- Mỗi chặng được sử dụng trong quá trình thiết kế để đảm bảo fabric tuân theo luật thiết kế
Phân tầng là một dạng liên kết giữa các switch kênh quang Một switch fabric đơn
có thể bao gồm một số switch liên kết với nhau Có hai tùy chọn để tăng số kết nối, đó là:
- Tăng số cổng trên mỗi switch
- Kết nối nhiều switch tạo nên một cấu trúc fabric phân tầng [15]
Trang 272.2 CÁC CÔNG NGHỆ SỬ DỤNG TRONG MẠNG LƯU TRỮ
2.2.1 Công nghệ ảo hóa lưu trữ
Ảo hóa lưu trữ thường được định nghĩa là “sự trừu tượng hóa trong suốt của lưu trữ ở mức block” Ảo hóa phân biệt việc truy cập dữ liệu logic của người dùng với dữ liệu vật lý, quá trình chuyển đổi giữa hai loại trên được thực hiện với ánh xạ mức block
Hình 2-9: Ảo hóa lưu trữ
Trong quá trình ảo hóa, dung lượng vật lý được góp lại thành các vùng chung gọi
là pool, các ổ đĩa ảo được tạo từ các pool này và khi cần thiết sẽ được gán cho máy chủ như các ổ logic (disk hoặc LUN)
Nhìn từ ứng dụng, không có gì thay đổi so với môi trường lưu trữ truyền thống Một ứng dụng truy cập ổ đĩa như nó vẫn thường làm, không quan trọng đó là ổ đĩa vật
lý hay một LUN tạo trên RAID trên thiết bị lưu trữ Ứng dụng không quan tâm đến chi tiết của ổ đĩa Nó chỉ cần đảm bảo có một chỗ trống để lưu dữ liệu và truy cập khi cần thiết
Ảo hóa mức máy chủ
Ở mức máy chủ, công nghệ ảo hoá nằm trên các máy chủ riêng biệt hoặc trên cluster Trong mô hình này, còn gọi là mô hình một-nhiều, một máy chủ/cluster thực hiện vào/ra liên tục tới một pool lưu trữ kết hợp từ nhiều tủ đĩa khác nhau Những môi
Trang 28trường lưu trữ nhỏ có thể tận dụng dung lượng từ việc hợp nhất các thiết bị lưu trữ hiện tại
Ảo hóa mức mạng
Ảo hoá mức mạng là điều kiện chính cho các công cụ lưu trữ, là một pool bao gồm nhiều khối lưu trữ có thể dễ dàng quản lý và cung cấp Ảo hoá mức mạng hoạt động theo mô hình nhiều-nhiều, cho phép các máy chủ đa hệ điều hành thực hiện vào/ra liên tục tới một pool lưu trữ bao gồm nhiều tủ đĩa khác nhau
Ảo hóa mức thiết bị lưu trữ
Ở mức hệ thống lưu trữ, quá trình ảo hoá được thực hiện trên bộ điều khiển của thiết bị lưu trữ, độc lập với máy chủ Những bộ điều khiển thiết bị lưu trữ này cung cấp khả năng tạo ổ đĩa ảo, snapshot và clone thông qua phần mềm quản lý Ảo hoá trên
bộ điều khiển hệ thống lưu trữ riêng biệt là bước tiến tiếp theo của công nghệ RAID cổ điển
Ảo hoá ở mức thiết bị lưu trữ là sự phân tách dung lượng từ phạm vi giới hạn của đĩa cứng vật lý bên dưới để tạo ra những pool lưu trữ lớn phục vụ cho các máy chủ đa
hệ điều hành Những pool có dung lượng ảo này có thể được cấu hình thành các ổ đĩa
ảo và gán cho một hay tất cả các máy chủ kết nối tới chúng Việc thực hiện ảo hoá như vậy cho phép sử dụng hiệu quả hơn dung lượng lưu trữ, quản lý đơn giản và giảm giá thành sản phẩm
2.2.1.2 Nâng cao hiệu năng
Hiệu năng là một trong những lợi ích lớn nhất có được từ việc ảo hoá mức thiết bị lưu trữ Ảo hoá cho phép dữ liệu dàn trải trên nhiều trục quay ổ đĩa, do đó làm tăng đáng kể hiệu năng Các ổ đĩa không cần phải sắp xếp trong các tập hợp RAID truyền thống Thay vào đó, một ổ đĩa “ảo” được định nghĩa, lấy dung lượng từ pool lưu trữ Ngoài ra, tất cả các ổ đĩa ảo trong một pool sẽ dàn trải dung lượng trên toàn bộ các ổ đĩa vật lý trong pool đó
2.2.1.3 Quản lý lưu trữ
Quản lý lưu trữ đơn giản hơn là một ưu điểm lớn khác từ việc ảo hoá ở mức thiết
bị lưu trữ Nó cho phép người quản trị nắm được sự phân bố của lưu trữ chứ không chỉ
là cơ chế quản lý lưu trữ
Trang 29Ảo hoá giúp người dùng tạo nên một mô hình quản lý đơn nhất cho thiết bị lưu trữ của họ, không cần biết đến loại RAID, do đó giảm thiểu các thao tác di chuyển dữ liệu thủ công Điều này làm giảm sự phức tạp khi thực thi lưu trữ, cho phép người quản trị quản lý các tài nguyên lưu trữ như một pool hợp nhất, và chuyển việc quản lý dung lượng từ mức đơn vị riêng lẻ sang mức pool Tất cả các tính năng này thực sự giúp đơn giản việc quản lý lưu trữ và giảm thiểu yêu cầu đào tạo
Mở rộng động dung lƣợng
Khả năng mở rộng động dung lượng ổ đĩa ảo mà không dừng ứng dụng làm tăng đáng kể hiệu năng ở mức hệ thống Ảo hoá cho phép người quản trị giám sát việc sử dụng dung lượng của một pool lưu trữ, và cấp phát động thêm dung lượng khi cần thiết
Snapshot ảo (Vsnap)
Trong một Vsnap, hệ thống lưu trữ không dự trữ trước dung lượng cho ổ đĩa snapshot Dung lượng cho ổ đĩa vsnap chỉ được dùng khi dữ liệu trên ổ đĩa ảo ban đầu thay đổi Ổ đĩa Vsnap là một ổ đĩa ảo mới, đầu tiên dùng chung bảng con trỏ của ổ đĩa
ảo ban đầu, khi ổ đĩa ảo ban đầu được ghi dữ liệu, dung lượng trống được dùng với lượng cần thiết để lưu nội dung ban đầu của Vsnap Vsnap đặc biệt hữu ích khi ổ đĩa
ảo ít thay đổi, hoặc trong trường hợp Vsnap chỉ tồn tại trong thời gian ngắn trước khi sao lưu
Trang 30Hình 2-10 : Snapshot truyền thống và Vsnap
Tại sao Vsnap tốt hơn
Nhiều người tạo snapshot theo định kỳ nhằm thực hiện sao lưu dữ liệu tạm thời Với các thiết bị lưu trữ truyền thống, một snapshot yêu cầu nhân đôi dung lượng dự trữ cho ổ đĩa sao lưu cho dù dung lượng có thực sự cần hay không Kết quả là người dùng
có thể mất trên một nửa dung lượng vì nó bị dành cho các ổ đĩa snapshot Điều này là không hiệu quả và tốn kém – khách hàng phải trả tiền cho phần lưu trữ mà họ không bao giờ sử dụng
Với tính năng ảo hoá, các doanh nghiệp có thể tạo Vsnap mà không cần dự trữ gấp đôi dung lượng trong ổ đĩa sao lưu Dung lượng được dùng bởi ổ đĩa sao lưu sẽ chỉ tăng khi dữ liệu trong ổ đĩa ban đầu thay đổi theo thời gian Nếu snapshot thay đổi nhiều mà muốn giữ trong thời gian dài, có thể chọn phương án dùng snapshot truyền thống hoặc snapclone
Snapclone
Snapclone là một dạng nâng cao của phương thức nhân bản dữ liệu, tương tự như nhân bản truyền thống vì nó tạo bản sao của ổ đĩa được nhân bản Một bản sao của ổ đĩa ảo ban đầu được tạo ra với tốc độ truyền dữ liệu tối đa cho phép, kết quả được hai bản sao dữ liệu độc lập giống hệt nhau trong thời gian ngắn nhất có thể
Điểm khác nhau quan trọng giữa Snapclone và nhân bản truyền thống là, với nhân bản truyền thống thì bản nhân bản sẽ không dùng được cho đến khi quá trình copy được hoàn thành, còn với Snapclone, dữ liệu snapclone có thể được truy cập ảo ngay tức thời
Khi Snapclone được tạo, ổ đĩa ảo sẽ được truy cập và những thay đổi của dữ liệu
từ khi tạo Snapclone sẽ được ghi nhận Dữ liệu tiếp tục được copy từ ổ đĩa ban đầu sang ổ đĩa snapclone, quá trình thực hiện ở bên trong hệ thống lưu trữ, giảm tối đa ảnh hưởng đến hệ thống Các ứng dụng truy cập Snapclone có thể đọc và ghi vào bản nhân bản Nếu dữ liệu được đọc không có trên Snapclone, nó sẽ được đọc từ ổ đĩa ban đầu
Trang 312.2.2 Công nghệ RAID
RAID (Redundant Array of Independent Disk) là công nghệ cho phép nhóm các đĩa cứng vật lý riêng rẽ lại với nhau tạo nên một đơn vị đĩa cứng logic, các đĩa sử dụng công nghệ RAID có khả năng chịu lỗi, có tính dự phòng cao và có hiệu năng lớn [21]
Kỹ thuật Mirroring
Trong kỹ thuật này, một bản sao của dữ liệu được ghi trên một đĩa khác một cách đồng thời, do đó khi có một đĩa bị hỏng thì hệ thống lập tức chuyển sang làm việc với đĩa còn lại mà không bị mất dữ liệu hay gián đoạn dịch vụ
Có hai loại mirror:
- Mirror phần cứng: bộ điều khiển của thiết bị lưu trữ tự động đồng bộ hai đĩa
mà không cần đến sự can thiệp của người quản trị hay hệ điều hành
- Mirror phần mềm: đòi hỏi hệ điều hành của máy chủ phải đồng bộ các đĩa
Kỹ thuật Striping
Là một kỹ thuật trong đó dữ liệu được ghi vào và đọc ra từ những phân đoạn có kích thước giống nhau nằm trải trên tất cả các đĩa trong một nhóm RAID Các đoạn có kích thước giống nhau đó được gọi là các block stripe
Kỹ thuật này có thể được thực hiện bằng cách cấu hình các đĩa chạy ở chế độ RAID-1/0, RAID 3 hoặc RAID 5 Bằng cách cho phép nhiều đầu đọc ghi làm việc đồng thời trong một hoạt động vào/ra, kỹ thuật này làm hiệu năng ghi đọc được tăng lên rất nhiều
Kỹ thuật Parity
Parity là một kỹ thuật được áp dụng nhằm bảo vệ dữ liệu, làm cho dữ liệu luôn sẵn sàng ở mức độ cao Parity giúp cho hệ thống vẫn hoạt động tốt khi có một số đĩa bị lỗi Nếu một đĩa bị lỗi, bộ điều khiển có thể tái tạo dữ liệu từ những dữ liệu còn lại và thông tin parity Nếu đĩa chứa thông tin parity lỗi thì thông tin parity có thể được tính toán lại từ các đĩa dữ liệu
Parity được tính toán trong mỗi lần ghi I/O bằng cách thực hiện một chuỗi phép toán logic XOR giữa các segment dữ liệu được ghi vào đĩa
Trang 322.2.2.1 RAID 0
Đây là dạng RAID có khả năng nâng cao hiệu suất trao đổi dữ liệu của đĩa cứng Đòi hỏi tối thiểu hai đĩa cứng, RAID 0 cho phép máy tính ghi dữ liệu lên đĩa cứng theo một phương thức đặc biệt được gọi là Striping Ví dụ, có 8 đoạn dữ liệu được đánh số
từ 1 đến 8, các đoạn đánh số lẻ (1,3,5,7) sẽ được ghi lên đĩa cứng đầu tiên và các đoạn đánh số chẵn (2,4,6,8) sẽ được ghi lên đĩa thứ hai
Thực tế, RAID 0 vẫn ẩn chứa nguy cơ mất dữ liệu Nguyên nhân chính lại nằm ở cách ghi thông tin xé lẻ vì như vậy dữ liệu không nằm hoàn toàn ở một đĩa cứng nào
và mỗi khi cần truy xuất dữ liệu, máy tính sẽ phải tổng hợp từ các đĩa cứng Nếu một đĩa cứng gặp trục trặc thì dữ liệu đó coi như không thể đọc được và mất luôn Như vậy RAID 0 thực sự thích hợp cho những người dùng cần truy cập nhanh khối lượng dữ liệu lớn
Trang 332.2.2.3 RAID 0+1
RAID 0+1 là loại RAID lưu trữ nhanh như RAID 0, an toàn như RAID 1 Chính vì thế mà hệ thống RAID kết hợp 0+1 đã ra đời, tổng hợp ưu điểm của cả hai “đàn anh” Tuy nhiên chi phí cho một hệ thống kiểu này khá đắt, sẽ cần tối thiểu 4 đĩa cứng để chạy RAID 0+1 Dữ liệu sẽ được ghi đồng thời lên 4 đĩa cứng với 2 ổ dạng Striping tăng tốc và 2 ổ dạng Mirroring sao lưu 4 ổ đĩa này phải giống hệt nhau và khi đưa vào
hệ thống RAID 0+1, dung lượng cuối cùng sẽ bằng ½ tổng dung lượng 4 ổ
Hình 2-13: RAID 0+1
2.2.2.4 RAID 2
RAID 2 xử lý dữ liệu ở mức các bit (thay vì các khối) và sử dụng mã Hamming trong việc sửa lỗi Các đĩa được đồng bộ nhờ các bộ điều khiển để chạy song song nhau Đây là loại RAID đầu tiên và hiện không còn được sử dụng nữa
Hình 2-14: RAID 2
2.2.2.5 RAID 3
RAID 3 xử lý dữ liệu ở mức byte, ghi các byte lên các đĩa khác nhau và dành riêng một đĩa parity RAID 3 hiếm sử dụng trong thực tế RAID 3 thường không cho phép phục vụ nhiều yêu cầu đồng thời do bất cứ khối dữ liệu nào đều được trải đều trên tất
cả các đĩa
Trang 34Hình 2-15: RAID 3
2.2.2.6 RAID 4
RAID 4 sử dụng phương pháp ghi đồng thời các khối dữ liệu lên đĩa và dành riêng
ra một đĩa parity RAID 4 khá giống RAID 3 ngoại trừ nó làm việc với khối dữ liệu thay vì các byte dữ liệu như RAID 3
Như vậy RAID 5 vừa đảm bảo tốc độ có cải thiện, vừa giữ được tính an toàn cao Dung lượng đĩa cứng cuối cùng bằng tổng dung lượng đĩa sử dụng trừ đi một ổ
Hình 2-17: RAID 5
Trang 352.2.2.8 RAID 6
RAID 6 là sự mở rộng của RAID 5 nhằm tăng cường khả năng chịu lỗi bởi việc sử dụng hai thuật toán chẵn lẻ khác nhau Dữ liệu được trải theo mức block trên các ổ đĩa, cũng giống như RAID 5, tập chẵn lẻ thứ hai sẽ được tính toán và ghi lên tất cả các ổ đĩa RAID 6 cho phép nhiều ổ đĩa bị hỏng đồng thời Số lượng ổ đĩa tối thiểu được sử dụng là 4
Hình 2-18: RAID 6
2.3 CÁC GIAO THỨC SỬ DỤNG TRONG MẠNG LƯU TRỮ
Các giao thức nền tảng được sử dụng trong SAN bao gồm: FCP (Fibre Channel Protocol), FCIP (Fibre Channel over IP), iFCP (Internet Fibre Channel Protocol), iSCSI (Internet SCSI), Mỗi giao thức đều có những điểm thuận lợi và những hạn chế riêng Sau đây là giới thiệu về các công nghệ lưu trữ tiêu chuẩn được sử dụng phổ biến hiện nay
2.3.1 Giao thức FC (Fibre Channel)
Mục đích của kênh quang là phát triển các phương tiện thích hợp thực tế, giá thành
hạ đáp ứng nhu cầu truyền dẫn tốc độ cao giữa các máy trạm, mainframe, super computer, desktop, storage device, …
Có hai kiểu truyền dữ liệu cơ bản giữa các bộ xử lý và giữa bộ xử lý với thiết bị ngoại vi, đó là truyền qua kênh và truyền qua mạng Một kênh cho phép các kết nối trực tiếp điểm-tới-điểm hoặc chuyển mạch giữa các thiết bị trao đổi thông tin Kênh là phần cứng chuyên dụng, truyền dẫn dữ liệu tốc độ cao với tổng chi phí thấp Ngược lại, mạng là một tập hợp các node phân tán (như các máy trạm, các file server, các thiết bị ngoại vi) và có các giao thức hỗ trợ tương tác giữa chúng Mạng có chi phí tổng thể cao bởi vì chúng sử dụng phần mềm để truyền dẫn, và do đó tốc độ chậm hơn
so với truyền dẫn qua kênh Mạng có thể mở rộng thực hiện nhiều tác vụ hơn, linh động hơn kênh do chúng có thể điều khiển được các kết nối không định trước, trong
Trang 36khi đó các kênh chỉ điều khiển được một lượng nhỏ các thiết bị với các địa chỉ cho trước
Kênh quang là giao thức kết hợp cả hai loại hình truyền dữ liệu trên, tạo nên một giao diện mới có cả hai đặc tính của truyền dẫn qua kênh và truyền dẫn qua mạng, đáp ứng nhu cầu của cả những người sử dụng muốn sử dụng kênh và những người sử dụng muốn sử dụng mạng
Mặc dù có tên gọi “kênh quang” nhưng kiến trúc của nó không đại diện cho cả topo kênh cũng như topo mạng Nó cho phép một hệ thống các đường kết nối thông minh, gọi là Fabric, kết nối các thiết bị Tất cả những gì mà một cổng kênh quang làm
là quản lý một kết nối điểm - điểm đơn giản giữa nó và Fabric
Kênh quang là công nghệ kết nối nối tiếp có hiệu năng cao, hỗ trợ các giao thức mức cao hơn khác gồm: FDDI, SCSI, HIPPI và IPI Chuẩn kênh quang tập trung vào các yêu cầu truyền dẫn tốc độ rất cao với lượng dữ liệu lớn [5, 8]
Hình 2-19: Kiến trúc kênh quang
Trang 37Hình 2-20: Sơ đồ cơ chế kết nối quang Fibre Channel
Mô đun OFC (Open Fibre Control)
Kênh quang thường dùng tia laser để truyền dữ liệu Trong FC-0, mô đun OFC là
mô đun đảm bảo an toàn được sử dụng để điều khiển mức công suất của các liên kết
dữ liệu qua tia laser sóng ngắn khi công suất quang vượt quá giới hạn an toàn
Khi xảy ra tình trạng vượt quá công suất trong kết nối, bộ thu của cổng có sợi cáp kết nối tới sẽ phát hiện ra và phát một xung yêu cầu điều chỉnh công suất laser xuống mức thấp hơn, bộ thu của cổng bên kia của dây cáp sẽ nhận xung này và điều khiển bộ phát để phát sóng có công suất thấp hơn Tuy nhiên nếu sử dụng tia laser có cường độ thấp thì không nhất thiết phải có thành phần OFC (Non-OFC)
Đầu nối
FC-0 cung cấp 4 loại đầu nối để phù hợp với nhiều phương tiện vật lý và các loại cáp đã tồn tại trước đó, đó là: SC đơn mode, SC đa mode, Coax (cho cáp đồng trục), STP 9-pin (cho cáp đồng)
Các đầu nối SC đơn và SC đa mode kết nối với cáp quang Cáp quang đơn mode mỏng và có băng thông nhỏ hơn cáp quang đa mode do đó cáp quang đơn mode được
sử dụng trong truyền dẫn khoảng cách xa, khoảng 10 km, còn cáp quang đa mode dùng trong truyền dẫn với khoảng cách gần hơn, khoảng 500 m
Chuẩn FC còn cung cấp các đầu nối cho kết nối cáp đồng trục và cáp đồng Với cáp đồng trục, TNC cho đầu thu còn BNC cho đầu phát Với cáp đồng, đầu nối STP (Shield Twisted-pair) 9-pin, loại D (DB9) được sử dụng Để tránh nhầm lẫn trong đấu nối, 5 lỗ ở giữa trong FC DB9 được đổ kín (không sử dụng)
Bước sóng
Trang 38Khái niệm bước sóng laser, liên quan đến các đầu nối đơn và đa mode Laser sóng dài (LW) được sử dụng cho các kết nối FC khoảng cách xa, từ 500 m đến 10 km, chúng thường được sử dụng với các cáp quang đơn mode có lõi 9 µm
Laser sóng ngắn (SW) được sử dụng cho các kết nối FC-AL với khoảng cách tối
đa 500 m, thông thường được sử dụng cho cáp quang đa mode Cáp đa mode thông thường có kích thước lõi 50 µm, tuy nhiên kích thước 62,5 µm cũng được sử dụng để tương thích với các thiết bị theo chuẩn FDDI đã tồn tại
2.3.1.2 Tầng FC-1
FC-1 xác định giao thức truyền dẫn, bao gồm các luật mã hóa và giải mã, các ký tự đặc biệt (các bit đồng bộ) và điều khiển lỗi Các thông tin truyền qua cáp được mã hóa đồng thời từng 8 bit thành 10 bit ký tự truyền dẫn, gọi là cơ chế mã hoá 8B/10B Phương pháp mã hoá này được phát triển bởi IBM và là loại mã hoá tốt nhất trong việc hạn chế tốc độ lỗi bit của hệ thống
8B/10B có thể tìm được các lỗi mà phương pháp kiểm tra chẵn lẻ không phát hiện được, kiểm tra chẵn lẻ không phát hiện ra các bit lỗi ở vị trí lẻ mà chỉ phát hiện các bit lỗi ở vị trí chẵn nhưng 8B/10B phát hiện được hầu hết các lỗi Kênh quang cũng sử dụng cờ CRC (Cyclic Redundant Check) trong khung dữ liệu truyền cũng với mục đích phát hiện lỗi
Để tăng độ tin cậy trong truyền dữ liệu, giao thức truyền dẫn FC sử dụng 12 ký tự đặc biệt (mỗi ký tự 8 bit) Tuy nhiên ở đây chỉ đề cập đến một loại phổ biến, đó là ký
tự 28.5 Hiện tại, đây là ký tự đặc biệt duy nhất được kênh quang sử dụng trong mã hóa 8B/10B
Mỗi ký tự truyền dẫn hợp lệ được gán một tên theo quy tắc: Zxx.y, trong đó Z là biến điều khiển của byte thông tin chưa mã hoá FC-1, xx là giá trị thập phân của số nhị
Trang 39phân tạo nên bởi các bit E, D, C, B, A và y là giá trị thập phân tạo nên bởi các bit F, H,
G trong byte thông tin chưa mã hoá FC-1 theo đúng thứ tự
Ví dụ tên của ký tự truyền dẫn FC-1 được tạo bởi số thập lục phân „BC‟, mã hoá kiểu K là K28.5
Luật mã hóa
Các byte mã hoá 8B/10B có một đặc tính gọi là độ lệch (disparity), thông số này
có thể nhận giá trị âm, giá trị dương hoặc trung lập Một byte 8B/10B được gọi là lệch
âm nếu số bit 1 lớn hơn số bit 0 trong byte đó, ngược lại là lệch dương, và trung lập khi số bit 0 và số bit 1 bằng nhau
Mỗi byte dữ liệu hoặc ký tự đặc biệt có hai mã truyền (không nhất thiết phải khác nhau) Byte dữ liệu và ký tự đặc biệt được mã hóa thành các mã này một cách lần lượt, phụ thuộc vào RD ban đầu
RD là một thông số nhị phân, được tính toán dựa trên sự cân bằng giữa các bit 0 và
1 trong các block con (6 bit đầu tiên và 4 bit cuối cùng) của ký tự truyền dẫn Một RD mới được tính toán từ ký tự đã được truyền ở cả hai bộ phát và bộ thu Nếu ký tự được phát hiện có RD ngược với RD mà lẽ ra bộ phát phải phát (phụ thuộc vào RD của dòng bit trước) thì bộ thu sẽ hiển thị tình trạng không tương ứng
Từ truyền dẫn
Một từ truyền dẫn được tạo bởi 4 ký tự truyền dẫn liền nhau Do luật mã hoá 8B/10B mã 8 bit thành một ký tự 10 bit nên một từ truyền dẫn là một nhóm gồm 40 bit Một từ truyền dẫn có thể thuộc về một trong hai loại sau:
- Dữ liệu: Ký tự truyền dẫn đầu tiên là một byte dữ liệu đã được mã hóa
- Ordered Set: Ký tự truyền dẫn thứ 4 là ký tự đặc biệt K28.5
Trang 40Để truyền dữ liệu qua các liên kết, các khối dưới đây đã được định nghĩa bởi chuẩn
- Frame delimiter: Phân định các khung, SOF (bắt đầu khung) và EOF (kết
thúc khung) là các Ordered Set
- Primitive signal: Tín hiệu gốc, có hai loại:
Một loại dùng để điều khiển dòng buffer-to-buffer
Một loại dùng để lấp đầy các khoảng trống giữa các khung do trong kênh quang, bộ phát phải liên tục phát ra các tín hiệu qua môi trường Việc này giúp đồng bộ các bit, byte và word cũng như giúp tăng tốc độ truyền dẫn
- Primitive sequence: Một dãy gồm ba ordered set đồng nhất sử dụng để điều
khiển kết nối Chúng được dành cho việc thông báo tình trạng lỗi kết nối hoặc mất đồng bộ
2.3.1.3.2 Khung (Frame)
Các khối cơ bản nhất của một kết nối kênh quang là các khung Các khung chứa
dữ liệu, địa chỉ cổng nguồn/đích và các thông tin điều khiển kết nối Các khung được phân loại thành khung dữ liệu và khung điều khiển kết nối
Nếu một khung là khung điều khiển kết nối thì trường dữ liệu của nó có giá trị bằng 0 Còn nếu là khung dữ liệu thì trường dữ liệu có thể là một số bất kỳ giữa 0 và