Nghiên cứu chuẩn hạ tầng trung tâm dữ liệu và giải pháp cho trường Đại học Bách Khoa Hà Nội Nghiên cứu chuẩn hạ tầng trung tâm dữ liệu và giải pháp cho trường Đại học Bách Khoa Hà Nội Nghiên cứu chuẩn hạ tầng trung tâm dữ liệu và giải pháp cho trường Đại học Bách Khoa Hà Nội luận văn tốt nghiệp,luận văn thạc sĩ, luận văn cao học, luận văn đại học, luận án tiến sĩ, đồ án tốt nghiệp luận văn tốt nghiệp,luận văn thạc sĩ, luận văn cao học, luận văn đại học, luận án tiến sĩ, đồ án tốt nghiệp
Trang 1Bộ giáo dục và đào tạo Trường Đại học bách khoa Hà nội
-
Luận Văn Thạc sỹ khoa học
Ngành : Xử lý thông tin và truyền thông
NGHIấN CỨU CHUẨN HẠ TẦNG TRUNG TÂM
DỮ LIỆU VÀ GIẢI PHÁP CHO TRƯỜNG
ĐẠI HỌC BÁCH KHOA HÀ NỘI
Trang 2Trường Đại học bách khoa Hà nội
-
Luận Văn Thạc sỹ khoa học
DỮ LIỆU VÀ GIẢI PHÁP CHO TRƯỜNG
ĐẠI HỌC BÁCH KHOA HÀ NỘI
Ngành: Xử lý thông tin và truyền thông Mã số: / /
PHAN DỨC CHèNH
Hà nội 2009
Trang 3LỜI CAM ĐOAN
Tôi xin cam đoan luận văn này là công trình nghiên cứu của chính bản thân Các nghiên cứu trong luận văn này dựa trên những tổng hợp lý thuyết và hiểu biết thực
tế, không sao chép
Tác giả
Phan Đức Chình
Trang 4Trong lời đầu tiên của báo cáo Luận văn tốt nghiệp “Nghiên cứu chuẩn hạ tầng Trung tâm dữ liệu và giải pháp cho Trường Đại Học Bách Khoa Hà nội”,
tôi muốn gửi những lời cảm ơn chân thành nhất đến tất cả những người đã hỗ trợ, giúp đỡ tôi về chuyên môn, vật chất và tinh thần trong suốt quá trình thực hiện Luận văn
Trước hết, tôi xin chân thành cảm ơn thầy giáo TS Nguyễn Kim Khánh đã trực tiếp hướng dẫn , giúp đỡ tôi trong quá trình nghiên cứu hoàn thành luận văn này
Xin cảm ơn các thầy, cô Viện Công nghệ Thông tin và Truyền Thông đã giảng dạy, truyền thụ kiến thức cho tôi trong suốt quá trình học tập
Xin được gửi lời cảm ơn chân thành đến Viện Đào tạo Sau Đại học, viện đã tạo điều kiện hết sức thuận lợi trong quá trình học tập của học viên nói riêng và lớp Xử lý Thông tin và Truyền thông nói chung
Cho phép tôi gửi lời cảm ơn đến Ban giám đốc và các anh chị em đồng nghiệp tại Trung tâm Mạng Thông Tin - Đại Học Bách Khoa Hà nội, nơi tôi đang công tác đã tạo điều kiện tốt nhất trong suốt quá trình tôi thực hiện đề tài
Cuối cùng, tôi xin bày tỏ lòng biết ơn đến gia đình và bạn bè đã giúp đỡ, động viên tôi rất nhiều trong suốt quá trình học tập và làm Luận văn tốt nghiệp
Trong khuôn khổ của luận văn không tránh khỏi những thiếu sót nhất định tôi rất mong nhận được sự đóng góp ý kiến của thầy cô giáo và các bạn
Hà nội, ngày 27 tháng 11 năm 2009
Học viên
Phan Đức Chình
Trang 5MỤC LỤC
MỤC LỤC 1
DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ, VIẾT TẮT 4
DANH MỤC HÌNH VẼ 6
MỞ ĐẦU 8
CHƯƠNG 1 : TỔNG QUAN VỀ TRUNG TÂM DỮ LIỆU 12
1.1 Lịch sử phát triển và sự ra đời của trung tâm dữ liệu 12
1.2 Vai trò của trung tâm dữ liệu 13
1.3 Các yêu cầu khi xây dựng hạ tầng các trung tâm dữ liệu 14
1.4 Các xu hướng thiết kế trung tâm dữ liệu 16
1.4.1 Một số nhược điểm của kiểu thiết kế truyền thống 16
1.4.2 Xu hướng thiết kế ngày nay 17
1.5 Các thành phần của một trung tâm dữ liệu 18
CHƯƠNG 2 : CÁC CÔNG NGHỆ NÂNG CAO HIỆU QUẢ LƯU TRỮ TRONG TRUNG TÂM DỮ LIỆU 19
2.1 Giới thiệu chung 19
2.2 Sự cần thiết phải có một hạ tầng kiến trúc lưu trữ mới 20
2.3 Các giải pháp nâng cao hiệu quả lưu trữ 27
2.3.1 NAS (Network attached storage) 27
2.3.2 SAN (Storage Area Network) 28
2.3.2.1 Kênh quang (Fibre Channel) 30
2.3.2.2 Những lợi ích một mạng Fibre Channel SAN mang lại 33
2.4 Lưu trữ dựa trên nguyên lý phân mức tầm quan trọng của dữ liệu (Tiered- storage) 41
2.5 Quản lý vòng đời dữ liệu (Infomation lifecycle Management) 43
2.6 Ảo hóa hệ thống lưu trữ.(Storage Virtualization) 46
Trang 6CHƯƠNG 3 : NỘI DUNG TIÊU CHUẨN TIA-942 CHO HẠ TẦNG TRUNG
TÂM DỮ LIỆU 50
3.1 Sự ra đời của TIA-942 50
3.2 Nội dung của TIA-942 50
3.2.1 Sơ đồ tổng thể và không gian cần thiết 51
3.2.2 Hạ tầng cáp 54
3.2.3 Mức độ sẵn sàng 55
3.2.4 Các yếu tố môi trường 56
3.2.5 Việc cấp nguồn 56
3.2.6 Vấn đề làm mát 57
CHƯƠNG 4 GIẢI PHÁP XÂY DỰNG HẠ TẦNG TRUNG TÂM DỮ LIỆU CHO ĐHBK HÀ NỘI 58
4.1 Hiện trạng hệ thống mạng và hệ thống máy chủ lưu trữ ĐHBK 58
4.2 Những nhược điểm hiện nay của hệ thống máy chủ và hệ thống lưu trữ trường ĐHBK Hà nội 60
4.2 Các yêu cầu chung của việc thiết kế trung tâm dữ liệu cho ĐHBK 61
4.3 Giải pháp cho hạ tầng trung tâm dữ liệu 63
4.3.1 Hệ thống phân phối nguồn điện 64
4.3.2 Hệ thống chống sét 68
4.3.3 Hệ thống thông gió và điều hoà nhiệt độ 69
4.3.4 Hệ thống phòng cháy chữa cháy 72
4.3.5 Hệ thống sàn nâng kỹ thuật 76
4.3.6 Hệ thống an ninh cho trung tâm dữ liệu 78
4.3.7 Không gian triển khai Trung tâm dữ liệu 80
4.3.8 Giải pháp cho hạ tầng Cáp mạng (cabling) 83
4.3.9 Hệ thống tủ phân phối 86
4.3.10 Hệ thống máng cáp phân phối 87
4.4 Giải pháp cho hệ thống máy chủ và lưu trữ 88
Trang 74.4.1 Hệ thống máy chủ 88
4.4.2 Hệ thống lưu trữ 91
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 101
TÀI LIỆU THAM KHẢO 103
Trang 8DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ, VIẾT TẮT
Kênh quang
Kênh quang thông qua giao thức IP
Tính sẵn sàng cao
Card kết nối SAN
Phần mềm quản lý đa đường
Mạng nội bộ
Đĩa logical trên SAN
Trung tâm dữ liệu chính
Công nghệ lưu trữ qua LAN RAID Redundant Array of Independent Disks
Công nghệ dãy đĩa dự phòng độc lập
Mạng lưu trữ SCSI Small Computer Systems Interface
Chuẩn giao tiếp máy chủ với thiết bị ngoại vi SNMP Simple Network Management Protocol
Trang 9Giao thức quản lý mạng đơn giản
Mạng diện rộng ĐHBKHN Đại học Bách Khoa Hà nội
IDC Trung tâm dữ liệu Internet
TIA Telecommunications Industry Association
Hiệp hội công nghiệp viễn thông UPS Uninterruptible Power Supply
Hệ thống lưu điện dự phòng
Tủ phân phối điện
Hệ thống điều hoà không khí chính xác ILM Information Lifecycle Management
Quản lý lưu trữ theo vòng đời dữ liệu
Trang 10DANH MỤC HÌNH VẼ
Hình 2.8 : Hợp nhất lưu trữ giúp hiệu quả hơn khi chia xẻ dung lượng 34
Hình 2.9 : Hợp nhất về mặt logical các hệ thống đĩa phân tán 35
Hình 2.10 : Sao lưu sử dụng giao thức TCP/IP 37
Hình 2.11 : Giải pháp SAN cho môi trường thương mại điện tử 40
Hình 2.12 : So sánh các mức lưu trữ on-line, near-line và off-line 43
Hình 2.13: Tầm quan trọng của dữ liệu thay đổi theo thời gian 44
Hình 2.14 : Mô hình chức năng của sản phẩm ảo hoá lưu trữ IBM SVC 47
Hình 3.1 Sơ đồ kết nối các khu vực chức năng trong một trung tâm dữ liệu 53
Hình 3.2 Bố trí khu vực chức năng trong một trung tâm dữ liệu 54
Hình 3.3: Sơ đồ bố trí hệ thống tủ Rack và phân phối các luồng không khí trong trung tâm dữ liệu 57
Hình 4.6 Mô hình phân phối nguồn điện trong Trung tâm dữ liệu 64
Hình 4.7 Hệ thống UPS Symmetra PX của hãng APC 65
Hình 4.8 Máy phát điện của hãng Kohler 65
Hình 4.9 Hình minh họa PDU 67
Hình 4.10 Hệ thống trống sét và tiếp mát cho hệ thống máy chủ 68
Hình 4.11 Hình minh họa hệ thống làm mát chính xác sử dụng trong trung tâm dữ liệu 71
Hình4.11 Hệ thống điều hòa hiệu năng cao 72
Hình 4.12 Các thiết bị chữa cháy Pyrogen 73
Trang 11Hình 4.13 Hệ thống chữa cháy FM 200 74
Hình 4.14 Hình minh họa hệ thống chữa cháy Stat-X 75
Hình 4.15 Hình minh họa hệ thống sàn giả 76
Hình 4.16 Hình minh họa vật liệu sử dụng trong sàn giả 77
Hình 4.17 Hình minh họa hệ thống điều khiển truy nhập 78
Hình 4.18 Hình minh họa hệ thống camera an ninh 80
Hình 4.19 Sơ đồ mặt bằng bố trí Trung tâm dữ liệu 81
Hình 4.20 : Sơ đồ bố trí các khu vực chức năng của Trung tâm dữ liệu ĐHBK Hà nội 82
Hình 4.21 Hình minh họa hệ thống cáp cấu trúc 83
Hình 4.22 Mô hình bố trí các khu vực chức năng trong phòng networking 86
Hình 4.23 Hình minh họa hệ thống máng cáp trong trung tâm dữ liệu 87
Hình 4.24 Mô hình bố trí hệ thống máng cáp trong Trung tâm dữ liệu 88
Hình 4.25 so sánh một số chức năng của Server Rack và blade server 91
Hình 4.27: Mô hình kết nối Clustering 94
Hình 4.28: Mô hình kết nối đa đường 94
Hình 4.29: Tính năng chuyển lỗi đa đường 94
Hình 4.30: Mô hình kết nối clustering sử dụng HDLM 95
Hình 4.31: Tủ đĩa lưu trữ SAN 96
Hình 4.32: Kiến trúc của Hitachi AMS1000 97
Trang 12M Ở ĐẦU
Công nghệ thông tin ngày nay đã trở thành một trong những yếu tố quan trọng hàng đầu của mỗi tổ chức, doanh nghiệp, cũng như học tập và nghiên cứu Việc ứng dụng công nghệ thông tin không những nâng cao chất lượng sản phẩm dịch
vụ, nâng cao sức mạnh cạnh tranh mà còn hỗ trợ đắc lực cho công tác quản trị điều hành hoạt động kinh doanh của doanh nghiệp theo hướng tập trung, hiệu quả và kịp thời
Cùng với sự phát triển nhanh chóng về quy mô của hạ tầng Công nghệ thông tin, các dịch vụ của hệ thống thông tin cũng đòi hỏi phải được nâng cao về mặt chất lượng Nhưng hiện nay, hạ tầng kỹ thuật của hệ thống thông tin được đầu tư chưa đảm bảo cho nhu cầu về chất lượng dịch vụ đặt ra Do đó, đã dẫn đến một số vấn đề bất cập xảy ra gây ảnh hưởng tới khả năng đáp ứng nhu cầu về dịch vụ của
hệ thống thông tin như:
• Các máy chủ dịch vụ nằm rải rác phân tán khắp nơi, khó kiểm soát
• Các máy chủ có cấu hình chưa đủ khả năng đáp ứng nhu cầu dịch vụ, hoặc cấu hình không đồng bộ, khó nâng cấp
• Không thống nhất về cơ sở dữ liệu
• Không đồng bộ trong việc lưu trữ dữ liệu
• Phòng máy chủ, mặc dù đã có UPS, chống sét đường nguồn, tiếp đất Nhưng vẫn chưa đạt chuẩn Vì vậy, vẫn có thể bị sự cố nguồn làm dừng dịch vụ
• Môi trường về nhiệt độ, độ ẩm cũng còn nhiều nguy cơ gây ra sự cố
• Hầu hết các phòng máy chủ hiện nay không được thiết kế phòng ngừa thảm họa
Với những bất cập của hạ tầng kỹ thuật hiện tại, cần phải xây dựng một hạ tầng
kỹ thuật mới, tiên tiến, có kế thừa hệ thống cũ Nhưng phải đảm bảo được những
Trang 13yêu cầu về mặt dịch vụ ngày càng tăng cao Vì vậy, hạ tầng kỹ thuật cần phải đảm bảo các yêu cầu sau:
• Hệ thống có tính sẵn sàng và tin cậy cao
• Lưu trữ, xử lý hợp nhất dữ liệu
• Đảm bảo an toàn thông tin tối đa
• Hệ thống máy chủ có khả năng tính toán hiệu năng cao, đồng bộ, hợp nhất
• Hệ thống xây dựng theo dạng module có tính mở cao
• Đảm bảo về nguồn điện và chống sét, tiếp đất theo tiêu chuẩn
• Đảm bảo về môi trường làm việc theo chuẩn
• Có dự phòng tương lai và phòng ngừa thảm họa
Là cán bộ kỹ thuật đang công tác tại một đơn vị có chức năng quản trị Mạng Campus của một trường đại học, tôi ý thức rõ nhưng vấn đề và yêu cầu đặt
ra trong công tác quản trị và vận hành hệ thống mạng đang ngày một phát triển Vì
vậy, tôi quyết định chọn đề tài: “Nghiên cứu chuẩn hạ tầng Trung tâm dữ liệu
và giải pháp cho Trường Đại Học Bách Khoa Hà nội” với mục đích: lựa chọn,
tích hợp được một giải pháp Trung tâm dữ liệu tối ưu và phù hợp nhất có thể cho Trường Đại Học Bách Khoa Hà Nội (ĐHBK HN) và cũng là mô hình tham khảo cho các trường, các cơ quan tổ chức khác hiện nay
Với những yêu cầu trên, Tôi sẽ thực hiện nhũng nhiệm vụ trong luận văn như sau:
• Tìm hiểu các yêu cầu và xu hướng thiết kế Trung tâm dữ liệu
• Tìm hiểu về các công nghệ sử dụng và tiêu chuẩn TIA-942 trong một trung tâm dữ liệu
• Trên cơ sở lý thuyết và thực tiễn, đề xuất giải pháp xây dựng Trung
Trang 14• Đánh giá giải pháp đưa ra
Nội dung cụ thể bao gồm :
Chương 1: Tổng quan về Trung tâm dữ liệu:
Trình bầy về lịch sử phát triển, ra đời và vai trò của Trung tâm dữ liệu Tìm hiểu về các xu hướng thiết kế và các thành phần của Trung tâm dữ liệu
Chương 2: Các hướng công nghệ nâng cao hiệu quả lưu trữ trong Trung tâm
dữ liệu:
Trình bầy về sự cần thiết phải xây dựng trung tâm dữ liệu thay thế cho hệ thống cũ Tìm hiểu về các giải pháp công nghệ lưu trữ đang được triển khai trong các trung tâm dữ liệu hiện nay Mặt khác, trong chương này cũng trình bầy về các nguyên tắc lưu trữ được dùng phổ biến
Chương 3: Nội dung tiêu chẩn TIA-942 quy định hạ tầng cần thiết cho Trung tâm dữ liệu:
Trình bầy bộ chuẩn TIA-942 qui định các tiêu chuẩn hạ tầng cần thiết cho một trung tâm dữ liệu:
- Không gian cần thiết và sơ đồ tổng thể của một trung tâm dữ liệu
- Hệ thống hạ tầng cable
- Độ tin cậy của trung tâm dữ liệu
- Các yếu tố môi trường
Chương 4: Giải pháp cho Trung tâm dữ liệu ĐHBK Hà Nội:
Khảo sát những điều kiện cụ thể của hạ tầng kỹ thuật hệ thống thông tin hiện tại của Trường Đại Học Bách Khoa Hà nội, thấy được những vấn đề cấp thiết hiện nay, từ đó đặt ra những yêu cầu cụ thể và đưa ra giải pháp xây dựng hạ tầng Trung tâm dữ liệu cho Trường Đại Học Bách Khoa Hà Nội
Trang 15Kết luận và hướng phát triển: Trình bầy đánh giá kết quả đạt được và hướng
phát triển tiếp theo của đề tài
Trang 16CHƯƠNG 1 : TỔNG QUAN VỀ TRUNG TÂM DỮ LIỆU
Trung tâm dữ liệu ngày nay có nguồn gốc xuất phát từ phòng máy tính lớn của thời kỳ đầu ngành công nghiệp máy tính Từ rất sớm hệ thống máy tính đã được thiết lập, để hoạt động và để duy trì nó cần yêu cầu một môi trường đặc biệt để nó làm việc Nhiều hệ thống cáp cần thiết để kết nối tất cả các thành phần, và các phương pháp để điều tiết, chẳng hạn như rack chuẩn để lắp thiết bị, và khay cáp (cài đặt trên không hoặc dưới sàn) Ngoài ra, các máy vi tính cũ cần rất nhiều năng lượng, và phải được làm mát bằng nước để tránh nóng quá mức, an ninh đã được chú trọng Các máy tính và thiết bị đắt tiền được trang bị cho các hệ thống này và
nó thường được dùng cho các mục đích quân sự
Trong quá trình phát triển vượt bậc của ngành công nghiệp máy tính, và đặc biệt là trong những năm 1980, máy vi tính bắt đầu được triển khai ở khắp mọi nơi Tuy nhiên khi hoạt động của các phòng máy tính này bắt đầu phát triển phức tạp Các công ty phát triển nhận thức được sự cần thiết để kiểm soát các nguồn lực CNTT Với nhu cầu của các khách hàng có nhu cầu tính toán máy chủ, trong những năm 1990 các máy chủ bắt đầu được đưa vào các khu vực của các phòng máy tính đặc biệt Tính sẵn có của các thiết bị mạng, kết hợp với các tiêu chuẩn mới cho cáp mạng, đã làm cho nó có thể sử dụng một thiết kế theo cấp bậc các máy chủ được đặt trong một căn phòng được thiết kế riêng trong công ty Việc sử dụng thuật ngữ “trung tâm dữ liệu”, áp dụng cho các phòng máy tính thiết kế đặc biệt, bắt đầu đạt được sự công nhận phổ biến khoảng thời gian này
Sự bùng nổ của các Trung tâm dữ liệu là khi các công ty nhận thấy sự cần thiết kết nối Internet nhanh và không gián đoạn hoạt động để triển khai các hệ thống và thiết lập một sự hiện diện trên Internet Để trang bị một hệ thống như vậy
là không khả thi cho nhiều công ty nhỏ hơn Nhiều công ty bắt đầu xây dựng các
Trang 17cơ sở rất lớn, được gọi là trung tâm dữ liệu Internet (IDC), trong đó cung cấp cho các doanh nghiệp với một loạt các giải pháp cho các hệ thống triển khai và hoạt động Một loạt các tiêu chuẩn từ các tổ chức, nhóm công nhận chuyên nghiệp, chẳng hạn như Hiệp hội Công nghiệp viễn thông, chỉ định các yêu cầu về thiết kế trung tâm dữ liệu Hiện vẫn còn rất nhiều sự phát triển đang được thực hiện trong thực tiễn hoạt động, và cũng có các thiết kế thân thiện với môi trường của các trung tâm dữ liệu
Các trung tâm dữ liệu hiện nay là nơi tập trung nhiều thành phần tài nguyên mật độ cao (hardware, software ), làm chức năng lưu trữ, xử lý toàn bộ dữ liệu hệ thống với khả năng sẵn sàng và độ ổn định cao
Nơi tích hợp tất cả các công nghệ hàng đầu về mạng, hệ thống và phần mềm ứng dụng được sử dụng trong hệ thống
Mạng được thiết kế dành riêng đáp ứng yêu cầu cao về tốc độ truyền giữa các thiết bị, tính ổn định được coi trọng và vấn đề bảo mật cho hệ thống mạng được đặt lên hàng đầu Được cấu hình tối ưu và hỗ trợ khi một kết nối bị hỏng với một thiết bị thì thiết bị vẫn hoạt động bình thường với kết nối luôn ở tốc độ cao
Với hệ thống máy chủ có hiệu năng cực cao đáp ứng các ứng dụng chạy trên
nó với độ trễ nhỏ nhất, thời gian đáp ứng thấp nhất, hỗ trợ nhiều ứng dụng và cấu hình hoàn hảo giúp hệ thống chạy 24/7 Đáp ứng các ứng dụng khắt khe nhất Các phần mềm hỗ trợ sử dụng tối đa hiệu năng của phần cứng, giúp liên kết các máy chủ chạy song song tăng sức mạnh cho máy chủ và khả năng backup dữ liệu Khi có sự cố xảy ra chỉ trong một thời gian ngắn hệ thống có thể đi vào hoạt động như bình thường
Cuộc cách mạng Internet đang đóng vai trò quan trọng trong xã hội thông tin
Trang 18trong việc cập nhật, ứng dụng và xử lý thông tin Đặt biệt đối với doanh nghiệp lại càng quan trọng hơn khi ứng dụng các phần mềm quản trị doanh nghiệp, thương mại điện tử, multimedia, chia sẻ dữ liệu dùng chung… do đó nhu cầu lưu trữ càng lớn, hình thành nên các trung tâm lưu trữ lớn và ngày càng phức tạp, tinh vi Từ đó thúc đẩy doanh nghiệp phải tính toán, tổ chức hệ thống lưu trữ của mình nhằm đáp ứng tối đa nhu cầu sử dụng cũng như giảm chi phí cài đặt, vận hành nhằm đem lại hiệu quả cao về mặt kinh tế lẫn sử dụng
Trung tâm lưu trữ dữ liệu trong doanh nghiệp chưa được quan tâm và đầu tư đúng mức, chưa tương xứng với sự phát triển không ngừng và mở rộng hoạt động kinh doanh của doanh nghiệp Chính vì sự thiếu quan tâm này mà trước đây doanh nghiệp phải đối mặt nhiều thách thức trong hoạt động kinh doanh Từ những vấn
đề trên, hiện nay các doanh nghiệp vừa và lớn đã nhìn nhận vai trò quan trọng của Trung tâm dữ liệu là ưu tiên hàng đầu, không thể thiếu, những lợi ích cũng như hiệu quả mà Trung tâm dữ liệu mang lại nhằm phục vụ nhu cầu kinh doanh rất to lớn, do đó việc chú trọng đầu tư vào Trung tâm dữ liệu là quyết định đúng đắn và mang tính bắt buộc, nơi được ví như là “trái tim” trong môi trường IT và kinh doanh của doanh nghiệp
Các trung tâm dữ liệu hiện đại cần phải được thiết kế tuân thủ các yêu cầu sau:
- Tính module hóa cao
- Khả năng mở rộng dễ dàng
- Triển khai các giải pháp mới tối ưu về nguồn và làm mát
- Tối ưu hóa TCO & ROI cho các Trung tâm dữ liệu lớn
- Khả năng hỗ trợ hợp nhất Server và thiết bị lưu trữ mật độ cao
- An ninh cần được đảm bảo ở mức cao nhất
Trang 19Dựa vào các tiêu chuẩn quốc tế TIA-942 (TIA:Telecommunications
Industry Association - Hiệp hội công nghiệp viễn thông) về xây dựng, Trung
tâm dữ liệu tuân theo các tiêu chí sau:
Ngoài việc cung cấp nguồn điện lưới cho trung tâm dữ liệu, để đảm bảo cho hệ thống hoạt động xuyên suốt không xảy ra sự cố về nguồn điện,
do đó phải cung cấp thêm nguồn điện dự phòng (UPS và máy phát điện dự phòng)
Hệ thống điều hòa nhiệt độ phải được sử dụng loại máy lạnh chính xác vì môi trường của trung tâm dữ liệu đòi hỏi rất cao sự ổn định của nhiệt
độ nhằm đáp ứng độ mát nhất định cho máy móc, thiết bị hoạt động bên trong Trung tâm dữ liệu
Trung tâm dữ liệu sẽ được cung cấp hệ thống chữa cháy dùng khí sạch cho máy chủ, mạng, phòng điều khiển trung tâm Tường và cửa có khả năng chịu nhiệt cao trong thời gian dài
Hệ thống sàn nâng: sàn được thiết kế làm thông gió cho hệ thống điều hòa cung cấp cho thiết bị tin học đặt bên trên Sàn cũng được tận dùng
để đi dây cáp nguồn và cáp mạng
Hệ thống an ninh (Access control và hệ thống Camera) cho trung tâm dữ liệu sẽ dùng đầu đọc thẻ hoặc sinh trắc học để tăng cường an ninh
Hệ thống Camera quan sát có thể dùng IP camera hoặc Analog camera để quan sát mọi hoạt động bên trong Trung tâm dữ liệu
Trung tâm dữ liệu sẽ được cung cấp hệ thống chiếu sáng theo đúng tiêu chuẩn, cung cấp ánh sáng đầy đủ trong trường hợp khẩn cấp Nâng cao hiệu quả công việc có tính trực giác
Giám sát môi trường theo dõi thường xuyên hoạt động của Trung
Trang 20hưởng toàn bộ hệ thống Trung tâm dữ liệu bình thường và dữ liệu được bảo
vệ không bị mất
Thiết kế base trên diện tích không gian phòng:
Việc thiết kế này dẫn đến việc không chính xác trong tính toán công suất cung cấp năng lượng, làm mát cho các thiết bị Công suất cung cấp cho các thiết bị là ngang hàng nhau
Thiết kế mang tính cố định:
Việc đầu tư ngay từ ban đầu một lần duy nhất hệ thống năng lượng, làm mát cực lớn phục vụ cho các thiết bị hiện tại và tương lai Không có tính module để dễ dàng mở rộng, đầu tư theo nhu cầu Kết quả là gây ra sự lãng phí đầu tư và chi phí vận hành lớn
Quá nhiều nhà cung cấp khác nhau :
Các phần cứng mạng thường được mua từ nhiều nhà cung cấp khác nhau do có các tính năng riêng biệt chuyên sâu Tuy nhiên điều này có thể dẫn tới các vấn đề
về sự tương thích, làm cho hiệu suất không đạt cao nhất hoặc có thể gây lỗi hệ thống ở một số tình huống không biết trước được
Hệ thống làm lạnh thường thổi dưới sàn lên :
Việc khí lạnh được thổi lên từ dưới sàn giả thường không đáp ứng khả năng cung cấp làm mát cho các thiết bị hạn chế Không phù hợp với các thiết bị công nghệ cao sau này như Blade server, thiết bị Storage
Hệ thống cáp nguồn và cáp data thường được đi dưới sàn nâng :
Trang 21Việc bố trí này dẫn đến khó khăn trong việc vận hành, nâng cấp Điều này cũng là nguyên nhân dẫn tới ngăn chặn luồng khí lạnh lên trên sàn để tới các thiết
bị IT nếu thiết kế không khéo
Từ các điểm hạn chế của thiết kế truyền thống nói trên, các hãng cung cấp giải pháp, thiết bị đều có xu hướng ngừng sử dụng và sản xuất các sản phẩm truyền thống, thay vào đó đẩy mạnh đưa ra các giải pháp, kèm theo các sản phẩm nhằm nâng cao chất lượng sử dụng, tối ưu hóa hệ thống và khả năng sẵn sàng cao
Các xu hướng thiết kế như sau :
Thay vì tính toán, thiết kế base trên không gian phòng thì ngày nay chủ yếu base theo tủ RACK Mục đích là sẽ xác định được công suất nguồn, làm mát chính xác tới từng thiết bị trên tủ Rack Do vậy với các tủ chứa các máy chủ, storage sẽ phân bổ công suất lớn hơn, trong khi các tủ về thiết bị mạng sẽ phân bổ công suất vừa phải Rất dễ dàng phân bổ công suất tùy theo nhu cầu thiết bị Điều này khác hẳn với cách truyền thống
Hệ thống làm mát: các thiết bị làm mát cũng được thiết kế theo dạng In-row, thiết bị làm mát được thiết kế theo dạng Rack, sẽ bố trí ngay bên cạnh các tủ thiết
bị máy chủ Cho phép cung cấp công suất lên tới hàng chục đến hàng trăm KW, đáp ứng tốt cho các tủ Rack mật độ công suất cao
Module: các thiết bị có khả năng mở rộng theo nhu cầu, dễ dàng phân bổ chi phí đầu tư Chính vì thiết kế theo module, nên dễ dàng thay thế, nâng cấp mà không làm gián đoạn hệ thống đang hoạt động Điều này trong thiết kế truyền thống khó có thể đạt được
Hệ thống cabling được thiết kế đi nổi trên các máng treo trần nhà hoặc hệ thống máng cáp trên nóc các tủ RACK thay vì đi dưới sàn truyền thống Lý do thứ
Trang 22cabling rất đa dạng) Thứ 2, về mặt triển khai vận hành rất dễ dàng Cuối cùng là đảm bảo tuân thủ các tiêu chuẩn, trong đó cũng không làm ảnh hưởng tới luồng khí mát như cách bố trí cable truyền thống
Hệ thống nguồn điện: Được thiết kế theo các tier khác nhau, nâng cao khả năng
dự phòng, công suất lớn hơn và độ ổn định cao
Green DataCenter: nói đến một trung tâm dữ liệu xanh, tức là khả năng tiêu thụ của hệ thống là 100% và hạn chế tính dư thừa gây lãng phí trong sử dụng
1.5 Các thành ph ần của một trung tâm dữ liệu
Hệ thống lưu điện UPS (Uninterruptible Power Supply)
Máy phát điện
Tủ phân phối điện PDU (Power Distribution Unit)
Hệ thống điều hoà không khí chính xác PCU (Precision Cooling Unit)
Hệ thống chống cháy (Fire Protection)
Hệ thống giám sát ra vào cửa (Access Control)
Trang 23CHƯƠNG 2 : CÁC CÔNG NGHỆ NÂNG CAO HIỆU QUẢ
LƯU TRỮ TRONG TRUNG TÂM DỮ LIỆU
Trong thời đại hiện nay, hoạt động và sự thành công trong hoạt động của hầu hết các doanh nghiệp/cơ quan/tổ chức (sau này gọi chung là doanh nghiệp), phụ
thuộc rất nhiều vào hạ tầng công nghệ thông tin của họ Xét trên khía cạnh IT, cốt
lõi cơ bản trong hoạt động của các doanh nghiệp là các quá trình lưu trữ, xử lý và trao đổi dữ liệu, thông tin Liên quan đến các quá trình này, và cũng là một trong
những thành phần quan trọng bậc nhất của cơ sở hạ tầng thông tin là hệ thống lưu trữ Khái niệm “hệ thống lưu trữ” chỉ đến tập hợp của tất cả các tài nguyên sử dụng cho mục đích lưu trữ dữ liệu của hệ thống, bao gồm:
• Các thiết bị lưu trữ, như ổ đĩa cứng trong của các máy chủ, các tủ đĩa ngoài, các thiết bị băng từ
• Các phần mềm quản lý, điều khiển hoặc cung cấp tính năng phụ trợ (như sao chép, sao lưu vv ) cho các thiết bị lưu trữ
• Các giao thức và phụ kiện cho kết nối và trao đổi dữ liệu giữa các thiết bị lưu trữ
Để hoạt động trên nền tảng IT của doanh nghiệp được thông suốt và hiệu quả,
hệ thống lưu trữ cần được thiết kế và vận hành với sự quan tâm cao, được đầu tư xứng đáng cả về giá trị kinh tế và về công nghệ kỹ thuật Tất cả các dữ liệu cần thiết cho quá trình hoạt động của doanh nghiệp phải được lưu trữ đầy đủ (yêu cầu
đủ về dung lượng), với độ an toàn và tính bảo mật cao, cho phép truy xuất với tốc
độ nhanh, được sử dụng và xử lý một cách hiệu quả và hợp lý (yêu cầu về hiệu năng và quản trị lưu trữ)
Trang 24Đáp ứng những yêu cầu như trên, ngành công nghệ lưu trữ đang có một lộ trình phát triển nhanh chóng với nhiều bước tiến mới về công nghệ nhằm nâng cao giá trị và hiệu quả sử dụng của hệ thống lưu trữ Theo dõi tình hình nghiên cứu và triển khai thực tế, có thể thấy xu thế phát triển hiện nay của công nghệ lưu trữ đang tập trung vào các công nghệ như sau:
- Sử dụng mạng lưu trữ riêng biệt, tốc độ cao cho mục đích lưu trữ dữ liệu (SAN: Storage Area Network)
- Phân mức tầm quan trọng của dữ liệu, trên cơ sở đó dùng thiết bị và công nghệ lưu trữ phù hợp, giảm thiểu chi phí đầu tư và vận hành Nguyên lý lưu trữ phù hợp với tầm quan trọng của dữ liệu có thể được áp dụng là phân mức lưu trữ (Tiered-Storage)
- Quản lý lưu trữ theo vòng đời dữ liệu (ILM: Information Lifecycle Management)
- Tiến hành hợp nhất hệ thống lưu trữ theo phương pháp ảo hóa (Storage Virtualization), nâng cao hiệu quả sử dụng
Từ những năm đầu của thập kỷ 90, hầu hết các kiến trúc máy tính đều dựa trên
mô hình chủ/khách (client/server) Ngày nay, rất nhiều tổ chức với hàng triệu máy trạm, hàng nghìn máy chủ được cài đặt để cung cấp các dịch vụ tới người dùng Các máy chủ hiện tại, với tốc độ xử lý, khả năng lưu trữ và cấp phát lớn hơn rất nhiều lần so với các hệ máy mainframe của những năm 1990
Lưu trữ trong hầu hết các trường hợp được kết nối trực tiếp từ máy chủ tới thiết bị lưu trữ Các máy chủ được kết nối và chuyển đổi dữ liệu thông qua mạng cục bộ (LAN) và mạng diện rộng (WAN) Hình dưới đây mô tả kiến trúc client/server (Hình 1.1) Cùng với sự tăng trưởng của các tổ chức, dung lượng lưu trữ (từ vài chục cho tới hàng trăm GB) và tốc độ của bộ vi xử lý của các hệ thống
Trang 25tăng theo từng năm Nhưng vấn đề gặp phải hiện nay là băng thông truyền giữa các hệ thống không thay đổi nhiều so với các năm trước đây Điều này đồng nghĩa với việc mặc dù mức chi phí đầu tư hàng năm là rất lớn, nhưng hiệu quả đạt được lại không cao
Với mô hình hiện tại, các máy chủ và các máy trạm thường được chọn và chỉ định theo từng mục đích sử dụng, các máy chủ sẽ phải chạy các hệ điều hành khác nhau (như Windows 2000/2003/2008, OS/400, UNIX, Linux, Sun Solaris, Novell Netware, VMS .) để đáp ứng với các yêu cầu của cơ sở dữ liệu (như DB2, Oracle, Informix, SQL ) Do vậy, trong một hệ thống mạng sẽ bao gồm rất nhiều kiểu file hệ thống và các định dạng dữ liệu khác nhau
Workstation
Storage CPU
Workstation
Storage CPU
Workstation
Storage CPU
Workstation
Storage Server
Workstation
Storage Client Workstation
Storage Client
Workstation
Storage Client
Kiến trúc client/Server
Hình 2.1 : Mô hình các h ệ thống phân tán sử dụng kiến trúc Client/Server
Quản lý nhiều phần cứng, phần mềm, nhiều nhà cung cấp thiết bị sẽ làm cho môi trường mạng trở nên phúc tạp và chi phí bảo trì cao Do vậy, việc kết hợp các phần mềm quản lý hệ thống của các nhà cung cấp sẽ đòi hỏi người quản trị phải có
Trang 26nguyên, dữ liệu của nhiều hệ điều hành khác nhau Một nghiên cứu cho thấy chi phí phải bỏ ra để quản lý một hệ thống lưu trữ phân tán thường gấp khoảng 10 lần chi phí cần bỏ ra để quản lý một hệ thống lưu trữ tập trung Tổng chi phí này bao gồm việc quản lý sao lưu, phục hồi, các tài nguyên, hiệu suất và các kế hoạch phục hồi khi có thảm họa
Các thiết bị lưu trữ thường được tích hợp theo các hệ thống máy chủ (clusters) của từng hãng và rất khó khăn trong việc nâng cấp (giá thành tính trên đơn vị GB) Các tủ RAID hoặc các thư viện băng từ phải được kết nối trực tiếp tới một máy trạm hoặc máy chủ và thường không thể sử dụng được với các hệ thống máy chủ khác (hoặc sẽ không hiệu quả khi sử dụng các tài nguyên phần cứng) Trong trường hợp này, các tổ chức khi muốn nâng cấp về mặt dung lượng lưu trữ thường phải mua thêm các hệ thống cluster mới Như hình dưới đây mô tả
Khoảng trống
Đã sử dụng
Win 2k3
Win 2k8
SUN 1
SUN 2
AIX
Còn rất nhiều khoảng trống trên từng server
Hình 2 2 : Dung lượng đĩa bị lãng phí trên mỗi hệ thống mở
Trong một hệ thống lưu trữ, dung lượng lưu trữ chỉ là một phần nhỏ Ngoài ra, các hệ thống lưu trữ hiện tại sẽ rất khó khăn khi muốn đảm bảo rằng có một môi trường cân bằng, ổn định, đảm bảo hiệu suất cho các ứng dụng thương mại điện
tử
Trang 27Dữ liệu lưu trữ trên một hệ thống không thể sẵn sàng cung cấp tài nguyên tới người dùng trong trường hợp hệ thống chính xảy ra sự cố Ngoại trừ trong trường hợp tạo một bản sao dữ liệu hoặc khôi phục dữ liệu từ các thư viện băng từ Việc sao chép một lượng lớn các dữ liệu tới thư viện băng từ hay các hệ thống máy chủ khác sẽ làm giảm hiệu suất của toàn bộ mạng (LAN/WAN), gây ra xung đột giũa các ứng dụng quan trọng Nhiều bản sao chép của cùng một cơ sở dữ liệu có thể gây ra sự không ổn định giữa các bản sao chép Dữ liệu phân chia trên nhiều hệ thống nhỏ rất khó có thể kết hợp để chia sẻ các ứng dụng trong một môi trường giao dịch lớn như thương mại điện tử (e-business), Enterprise Resource Planning (ERP), Data Warehouse và Business Intelligence (BI)
Sao lưu và phục hồi thông qua mạng LAN có thể bị ngắt quãng bởi sự quá tải của băng thông Thậm chí, hiện nay thông qua đường truyền Gigabit Ethernet, ta cũng mất gần 1 giờ để có thể sao lưu 40 GB dữ liệu Do vậy, thời gian sao lưu sẽ tăng rất nhiều đối với các hệ thống có dung lượng khoảng 300 GB cần sao lưu đầy
đủ Điều này khó có thể chấp nhận đối với các tổ chức đa quốc gia Đây là đặc trưng khó có thể khắc phục của mô hình client/server với giá thành cao, nhưng sử dụng không hiệu quả Mô hình này đã không thể phù hợp với các doanh nghiệp lớn Hình dưới đây mô tả chi tiết về việc sử dụng dữ liệu phân tán
Trang 28Môi trường lưu trữ client/server phổ biến
Dữ liệu được lưu trữ tại mỗi server
Hình 2.3 : Mô hình dữ liệu phân tán
Giải pháp tốt nhất đối với các tổ chức hiện nay để có thể tối ưu được chi phí, hiệu quả hơn trong sử dụng là xây dựng một nền tảng vững chắc về lưu trữ Một trong những bước quan trọng đầu tiên là cần phải điều khiển được các tài nguyên
và thông qua đó có thể cải thiện được khả năng kết nối
Trước hết, ta hãy xem xét một số ưu điểm và nhược điểm của kiến trúc lưu trữ hiện nay
Chuẩn giao tiếp SCSI (Small Computer Systems Interface)
Hiện tại đang là chuẩn được sử dụng nhiều nhất để kết nối máy chủ tới các thiết bị ngoại vi (ổ đĩa cứng, băng từ, máy in ) trong môi trường client/server Như tên gọi, chuẩn SCSI chỉ được sử dụng cho PC và môi trường doanh nghiệp vừa và nhỏ
Chuẩn SCSI sử dụng kiến trúc mạng bus, sử dụng cable kết nối song song giữa máy chủ và thiết bị lưu trữ Các thiết bị SCSI thường có giá thành cao, cấu hình phức tạp và dễ xảy ra lỗi
Trang 29Số lượng các thiết bị lưu trữ được gắn tới một thiết bị được xác định dựa theo tổng số ID trên một kênh truyền Chính vì giới hạn này, số lượng các thiết bị lưu trữ kết nối tới máy chủ là hữu hạn Dữ liệu cần truy cập sẽ bị mất trong trường hợp một kết nối có sự cố, điều này cũng đúng khi ta khởi tạo (reset) kênh truyền, toàn
bộ thiết bị SCSI trên kênh sẽ bị khởi tạo lại Điều này không phù hợp với các ứng dụng ngày nay yêu cầu thời gian trễ thấp
Dữ liệu được truyền trên các kênh SCSI được xác định dựa trên số các bit được truyền đồng thời trong một chu kỳ xung của kênh SCSI (đơn vị tính theo MHz), ta có thể nhận thấy, nếu giảm chu kỳ xung, có thể tăng được tốc độ truyền Nhưng khoảng cách vẫn là giới hạn không thể vượt qua trong chuẩn SCSI Với công nghệ hiện tại các kênh SCSI đang sử dụng đường truyền 64 bit
Phụ thuộc vào tốc độ truyền và chu kỳ xung nhịp, khoảng cách cực đại từ máy chủ đến các thiết bị lưu trữ từ khoảng 2m – 25m, đây là khoảng cách tối đa trên một kênh truyền với tất cả các thiết bị được gắn trên kênh SCSI
Hình dưới đây mô tả khoảng cách và tốc độ truyền tối đa trên các kênh truyền SCSI sử dụng các băng thông khác nhau
Trang 30Giới hạn khoảng cách của SCSI
Hình 2.4 : Các giới hạn về khoảng cách của đường truyền SCSI
Thông thường, đối với kênh SCSI chỉ có một thiết bị có thể truyền dữ liệu tại một thời điểm SCSI sử dụng một giao thức để xác định và cấp phép cho thiết bị được phép truyền dữ liệu Giao thức này hoạt động trước và sau mỗi tiến trình truyền dữ liệu Điều này sẽ làm quá tải và không tận dụng được băng thông Trên thực tế, tốc độ truyền của một kênh SCSI thường chỉ bằng 50% tốc độ lý thuyết
Do cơ chế truyền dữ liệu song song, các kênh SCSI thường phải tốn nhiều tài nguyên của bộ nhớ và CPU để tái sắp xếp lại dữ liệu, làm giảm tốc độ xử lý của hệ thống
Ngoài ra, SCSI cũng sử dụng một giao thức để gửi lệnh và điều khiển các khối
dữ liệu truyền/nhận giữa máy chủ và thiết bị lưu trữ Các lệnh này được quản lý bởi máy chủ, nhằm đáp ứng tới các yêu cầu dữ liệu Ngày nay, nhờ sự phát triển
về phần cứng và phần mềm, các thiết bị SCSI để có thể có khả năng tự đảm nhận một số công việc nhưng giá thành cho các thiết bị này sẽ cao hơn
Trang 31Từ những đánh giá trên, ta nhận thấy rằng các thiết bị SCSI thường bị giới hạn
về khoảng cách, tốc độ, tính sẵn sàng Do vậy, để đảm bảo hiệu suất tốt nhất cho các hệ thống máy chủ, ta cần có một kiến trúc hạ tầng mới cho các thiết bị lưu trữ
Các tổ chức lớn hiện nay đang hướng tới khả năng liên kết các hệ thống, các nhà cung cấp và người dùng tới một hệ thống lưu trữ tập trung Hệ thống này phải
có khả năng cho phép người dùng truy cập dữ liệu từ bất kỳ đâu trong tổ chức Có hai kiểu kiến trúc mạng lưu trữ hiện có và đang được sử dụng rộng rãi:
• NAS (Network attached storage)
• SAN (Storage Area Network)
2.3.1 NAS (Network attached storage)
Giải pháp lưu trữ sử dụng các mạng LAN hiện có, thông qua các giao thức như TCP/IP hoặc NetBIOS để truyền/nhận dữ liệu
Hình 2.5 : Lưu trữ trên mạng LAN
Trang 32truy cập tới thiết bị thông qua các hệ thống files chuẩn NFS, CIFS
Các máy chủ có thể chia xẻ thiết bị NAS như là một thiết bị được sử dụng để sao lưu và phục hồi dữ liệu
Nhờ vậy, các thiết bị NAS có một vài ưu điểm như mở rộng khoảng cách, tạo một hệ thống files sử dụng chung giữa nhiều người dùng, tăng dung lượng lưu trữ của hệ thống Nhưng các thiết bị này vẫn sử dụng mạng LAN là phương tiện truyền thông, nên vẫn bị giới hạn về băng thông và sự quá tải của mạng TCP/IP
Do đó, NAS chỉ phù hợp với các tổ chức nhỏ, chỉ có yêu cầu về tăng dung lượng lưu trữ và chỉ cần có thêm một hệ thống như File Server
Giải pháp NAS có giá thành thấp, dễ cài đặt và tích hợp vào các mạng LAN hiện có Các thiết bị NAS hiện tại thường được sử dụng với hai mục đích chính:
File servers
Backup/archive servers
Các thiết bị NAS không phù hợp cho các cơ sở dữ liệu hoặc các ứng dụng đòi hỏi nhiều băng thông, hiệu suất cao vì vậy xu hướng hiện nay khi thiết kế trung tâm dữ liệu không sử dụng kiểu lưu trữ này
2.3.2 SAN (Storage Area Network)
SAN là một kiến trúc chuyên dụng, nhằm phục vụ cho các hệ thống máy chủ kết nối tới thiết bị lưu trữ với băng thông cao và không bị giới hạn về khoảng cách SAN cho dễ dàng tạo các kế nối tới thiết bị lưu trữ thông qua các thành phần như: Routers, gateways, hubs và switches SAN giúp loại trừ những giới hạn của những thiết bị lưu trữ truyền thống, cho phép một hoặc nhiều máy chủ chia xẻ một
hệ thống lưu trữ chung, bao gồm các đĩa cứng, băng từ, đĩa quang
Hình dưới đây mô tả một mạng SAN cơ bản
Trang 33Network & LANs
Win SUN Linux AIX UNIX
Storage Tape
Storage Area Network
Hình2.6 : Mô hình m ạng SAN cơ bản
Một mạng SAN khác với các mạng LAN truyền thống vì nó được xây dựng để phục vụ cho việc truyền/nhận dữ liệu (không truyền/nhận các lệnh truyền thông) Các mạng SAN thường được xây dựng dựa trên các cổng giao tiếp kênh quang Các kênh quang cung cấp một băng thông ổn định với hiệu suất cao trên một khoảng cách xa, khả năng tạo các đường kết nối dự phòng và nạp cân bằng nhằm đảm bảo tính sẵn sàng cao cho hệ thống
Nhờ đó, SAN loại bỏ các tắc nghẽn thường có trên mạng LAN, tạo một kết nối tốc độ cao giữa máy chủ và thiết bị lưu trữ Có ba kiểu truyền dữ liệu chính được sử dụng trong SAN:
Máy chủ tới thiết bị lưu trữ: Đây là đặc trưng chính của SAN Ưu điểm chính của mạng SAN là cho phép một thiết bị lưu trữ có thể được truy cập đồng thời bởi nhiều máy chủ
Máy chủ tới máy chủ: Tạo đường truyền thông tốc độ cao giữa các
hệ thống máy chủ
Thiết bị lưu trữ tới thiết bị lưu trữ: Dữ liệu từ các tủ đĩa có thể được
Trang 34từ mà không đòi hỏi tài nguyên của máy chủ
2.3.2.1 Kênh quang (Fibre Channel)
Một chuẩn mở, được sử dụng cho các kết nối yêu cầu I/O cao, thiết bị phần cứng sử dụng các diode (LED) và kỹ thuật laser để truyền dữ liệu với tốc độ cao trên một khoảng cách xa Các kênh quang có thể sử dụng cáp quang cho khoảng cách xa hoặc sử dụng cáp đồng khi khoảng cách gần và cần tối ưu về chi phí Nhờ vào tốc độ và chất lượng ổn định của kênh quang, cho phép máy chủ nhìn thiết bị lưu trữ như là các tài nguyên cục bộ của hệ thống Bởi vì kỹ thuật quang có khả năng hỗ trợ nhiều giao thức và các thiết bị, ta có thể quản lý hệ thống như trên mạng LAN
Cũng như các công nghệ mạng khác, thông tin sẽ được đóng thành các gói (packet) hoặc các khung (frame) và dữ liệu sẽ được truyền tuần tự trên mạng Nhưng không giống như các kỹ thuật khác, kiến trúc kênh quang cho phép tạo kết nối sử dụng thiết bị phần cứng để đạt hiệu suất tốt nhất Tốc độ hiện thời của các
mạng cáp quang thường là 100MB/s (có thể đạt 200MB/s – 400MB/s khi kết hợp nhiều đường truyền)
Đối với mô hình sử dụng kênh quang, thông tin được gửi trực tiếp từ thiết bị phát đến thiết bị thu, không giống như kỹ thuật Ethernet dữ liệu sẽ có thể cần phải định tuyến (routing) từ nguồn tới đích Có ba mô hình mạng truyền thông chuẩn được sử dụng trên kênh quang
Point to point (FC-P2P): Một kết nối hai chiều (bi-directional) giữa hai node, với băng thông đạt 100MB/s trên mỗi hướng Đây là topo đơn giản nhất nhưng cũng giới hạn nhất
Arbitrated loop (FC-AL): Mô hình kết nối đơn hướng (uni-directional), tương tự như kỹ thuật được sử dụng cho các mạng TokenRing, hỗ trợ tối đa 126 node Mỗi node sẽ gửi dữ liệu đến các node còn lại cho đến khi tìm tới đích Các
Trang 35node sẽ chia sẻ chung một đường kết nối 100MB/s
Kỹ thuật này ngày nay đã không được sử dụng vì băng thông sẽ bị ảnh hưởng rất lớn khi có nhiều node kết nối vào mạng Ngày nay thường được sử dụng để kết nối các hệ thống lưu trữ nhỏ trước khi kết nối tới hệ thống lớn (thường không quá hai máy chủ với một vài thiết bị lưu trữ ngoại vi)
Switched fabric (FC-SW): Thuật ngữ Fabric một kiến trúc chuyển mạch thông minh, được sử dụng để phân phối dữ liệu từ một nguồn tới bất kỳ đích nào trong mạng Các SAN switch thế hệ mới cho phép kết nối 224 các node với nhau, với băng thông 100MB/s cho mỗi đường Mỗi một kết nối nhận được băng thông tối đa cho cổng kết nối của mình (200MB/s)
Các switch fabric chịu trách nhiệm cho việc chuyển mạch thông tin Các SAN switch thường có độ phức tạp hơn nhiều so với các FC switch bởi chúng được quản lý bởi phần mềm, có các hệ điều hành và các tiện ích được xây dựng sẵn bên trong switch Switch fabric là nền tảng cơ sở cho một mạng SAN
Các mô hình mạng có thể được kết hợp với nhau nhằm tạo nên một mô hình mạng tổng thể có thể đáp ứng được các yêu cầu về độ ổn định, khoảng cách và giá thành
Các kênh quang cũng sử dụng cơ chế truyền nối tiếp tương tự như các kỹ thuật mạng khác nhưng với băng thông 100MB (1Gbps hay 1bit/0.94 nanoseconds) Chính nhờ cơ chế truyền nối tiếp, giúp loại bỏ hoàn toàn việc phải sắp xếp lại dữ liệu như trên kênh truyền SCSI
Trang 36Truyền nối tiếp Truyền song song
Hình 2 7 : Phương thức truyền dữ liệu song song và nối tiếp
Phương pháp truyền nối tiếp cho phép dây cable và các đầu kết nối đơn giản hơn, nhờ đó thông tin có thể được định tuyến và chuyển mạch Ngày nay, các kênh quang có khoảng cách từ 10km – 120km nhờ sự hỗ trợ của các bộ lặp (repeater) Cũng giống như mạng LAN sử dụng các đường truyền tốc độ cao (leased line, frame relay) liên kết với nhau tạo thành mạng WAN, ta có thể liên kết các mạng SAN với nhau để tạo thành một mạng SAN rộng
Chuẩn kênh quang rất mềm dẻo, cho phép hỗ trợ nhiều giao thức bao gồm:
Các lệnh và các giao thức I/O : SCSI-3 Fibre Channel Protocol, (viết tắt là FCP, một trong những giao thức đang được sử dụng rộng rãi hiện nay), ESCON, FICON, SSA, và HIPPI
Các giao thức truyền dữ liệu trên mạng Ethernet: TCP/IP hoặc Net BIOS Mặc dù có khả năng truyền dẫn nhiều giao thức, nhưng trên thực tế các kênh quang hiện thời thường chỉ sử dụng một giao thức, giúp kênh quang có thể phân phối dữ liệu với tốc độ cao nhất Từ những nhận định trên, ta thấy rằng chuẩn kênh quang là sự kết hợp những đặc điểm tốt nhất của các công nghệ khác để tạo ra một môi trường mạng lý tưởng:
Trang 37 Cho phép truyền dữ liệu với khoảng cách xa và hiệu suất cao nhờ các thiết
bị phần cứng và một giao thức truyền thông đơn giản
Phương pháp truyền dữ liệu nối tiếp
Các đầu kết nối cable đơn giản, giảm tối đa khả năng lỗi
Truyền dữ liệu ổn định với khả năng xác nhận và phục hồi lỗi trên đường truyền
Dữ liệu được đóng gói trước khi truyền (thuật ngữ trong kênh quang gọi là các frames)
Cho phép truyền nhiều kiểu thông tin khác nhau trên đường truyền (như dữ liệu, âm thanh, hình ảnh, phim)
Có khả năng kết nối các thiết bị đang sử dụng chuẩn SCSI thông qua giao thức FCP
Nếu so sánh với các kênh truyền SCSI, các kênh quang cho phép kết nối một số lượng cực lớn các thiết bị vào trong một mạng (hơn 16 triệu cổng kết nối)
Ngày nay, nhờ vào sự phát triển của thương mại điện tử, đã tạo nên những bước đột phá cho ngành công nghệ thông tin Các giải pháp được xây dựng trên SAN bao gồm một số khả năng chính sau:
• K ết hợp lưu trữ và chia sẻ các tài nguyên:
Các máy chủ kết nối tới thiết bị lưu trữ với khoảng cách xa, cho phép loại bỏ các thiết bị lưu trữ cục bộ SAN cho phép kết hợp các thiết bị lưu trữ, tận dụng tối
đa các tài nguyên, nhờ đó giúp làm giảm chi phí cho thiết bị và dễ dàng trong công tác quản lý Ta có thể chia thành hai phần chính sau:
Trang 38• K ết hợp lưu trữ tại mức vật lý
Kết hợp tất cả các dữ liệu vào trong một hệ thống lưu trữ lớn Hệ thống lưu trữ này có thể chia xẻ cho nhiều máy chủ, cấp phát dung lượng đĩa cho từng máy Ngoài ra, hệ thống còn có khả năng sao chép, mirroring và tái tạo dữ liệu Hình dưới đây mô tả về hệ thống kết hợp lưu trữ vật lý
Lưu trữ hợp nhất
Hình 2.8 : Hợp nhất lưu trữ giúp hiệu quả hơn khi chia sẻ dung lượng
Dung lượng đĩa có thể được cấp phát và thu hồi khi cần thiết, giúp ngăn ngừa việc dư thừa và lãng phí các tài nguyên Một khả năng nổi bật khác là hỗ trợ việc cấp phát động các tài nguyên tới từng máy chủ
• K ết hợp lưu trữ tại mức logical
Dữ liệu từ các thiết bị lưu trữ khác nhau có thể được kết hợp để tạo ra một hệ thống lưu trữ tập trung mà không bị giới hạn về khoảng cách Các thiết bị có thể được kết hợp thành từng nhóm lưu trữ, phục vụ cho từng mục đích và đối tượng người dùng
Hình dưới đây mô tả khả năng kết hợp các thiết bị tại mức logical
Trang 39Cùng một bản dữ liệu cũng có thể được chia sẻ cùng một lúc cho nhiều hệ thống máy chủ khác nhau, thuật ngữ gọi là “true data sharing” Trong môi trường SAN, nhờ sự hỗ trợ của các phần mềm lưu trữ, các máy chủ có thể dễ dàng truy cập đến một cơ sở dữ liệu dùng chung
Điều này là không thể thực hiện được nếu ta sử dụng các hệ thống cluster bởi
vì trên các hệ điều hành khác nhau, ta sẽ có các hệ thống files, các định dạng dữ liệu, cấu trúc mã hoá khác nhau Nhưng khi ta sử dụng các tủ đĩa lưu trữ SAN, cấu trúc dữ liệu trên tủ cho phép các hệ điều hành có khả năng truy cập đồng thời Giúp làm giảm việc phải có nhiều bản sao chép của cùng một cơ sở sở dữ liệu cho mỗi hệ điều hành, giảm giá thành đầu tư cho các hệ thống cluster mới
• H ỗ trợ khả năng mở rộng khi hệ thống thông tin tăng trưởng
Trang 40đặt các ứng dụng và cơ sở dữ liệu như:
tư, nâng cấp các hệ thống máy chủ mới nhằm tăng dung lượng lưu trữ
Sử dụng mạng SAN, với các hệ thống lưu trữ tập trung , kết nối tới máy chủ thông qua các đường cáp quang, cho phép dễ dàng tăng dung lượng lưu trữ mà không cần đầu tư thêm máy chủ Nhờ sự độc lập của hệ thống lưu trữ với máy chủ, các giao dịch kinh doanh sẽ không bị ngắt quãng khi hệ thống lưu trữ được nâng cấp
• C ải thiện thời gian/tốc độ khi sao lưu và phục hồi dữ liệu
Với dung lượng lưu trữ tăng gấp đôi sau mỗi năm, các thao tác sao lưu và phục hồi dữ liệu sẽ rất khó khăn và phức tạp nếu vẫn sử dụng các kênh SCSI và môi trường mạng LAN Hiện tại các hệ thống sao lưu thường sử dụng hai phương pháp chính để sao lưu và phục hồi dữ liệu là:
Sao lưu dữ liệu trực tiếp với các ổ băng từ được kết nối với máy chủ
Sao lưu dữ liệu thông qua mạng
SAN sử dụng hai phương pháp sao lưu mới giúp làm giảm băng thông và tăng hiệu suất cho các tiến trình sao lưu
• Sao lưu thông qua một máy chủ sao lưu quản lý tập trung
Cung cấp cho mỗi máy chủ một ổ băng từ sẽ làm tăng giá thành cho một hệ