1. Trang chủ
  2. » Luận Văn - Báo Cáo

Nghiên cứu chuẩn hạ tầng trung tâm dữ liệu và giải pháp cho trường Đại học Bách Khoa Hà Nội

108 39 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 108
Dung lượng 3,27 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Nghiên cứu chuẩn hạ tầng trung tâm dữ liệu và giải pháp cho trường Đại học Bách Khoa Hà Nội Nghiên cứu chuẩn hạ tầng trung tâm dữ liệu và giải pháp cho trường Đại học Bách Khoa Hà Nội Nghiên cứu chuẩn hạ tầng trung tâm dữ liệu và giải pháp cho trường Đại học Bách Khoa Hà Nội luận văn tốt nghiệp,luận văn thạc sĩ, luận văn cao học, luận văn đại học, luận án tiến sĩ, đồ án tốt nghiệp luận văn tốt nghiệp,luận văn thạc sĩ, luận văn cao học, luận văn đại học, luận án tiến sĩ, đồ án tốt nghiệp

Trang 1

Bộ giáo dục và đào tạo Trường Đại học bách khoa Hà nội

-

Luận Văn Thạc sỹ khoa học

Ngành : Xử lý thông tin và truyền thông

NGHIấN CỨU CHUẨN HẠ TẦNG TRUNG TÂM

DỮ LIỆU VÀ GIẢI PHÁP CHO TRƯỜNG

ĐẠI HỌC BÁCH KHOA HÀ NỘI

Trang 2

Trường Đại học bách khoa Hà nội

-

Luận Văn Thạc sỹ khoa học

DỮ LIỆU VÀ GIẢI PHÁP CHO TRƯỜNG

ĐẠI HỌC BÁCH KHOA HÀ NỘI

Ngành: Xử lý thông tin và truyền thông Mã số: / /

PHAN DỨC CHèNH

Hà nội 2009

Trang 3

LỜI CAM ĐOAN

Tôi xin cam đoan luận văn này là công trình nghiên cứu của chính bản thân Các nghiên cứu trong luận văn này dựa trên những tổng hợp lý thuyết và hiểu biết thực

tế, không sao chép

Tác giả

Phan Đức Chình

Trang 4

Trong lời đầu tiên của báo cáo Luận văn tốt nghiệp “Nghiên cứu chuẩn hạ tầng Trung tâm dữ liệu và giải pháp cho Trường Đại Học Bách Khoa Hà nội”,

tôi muốn gửi những lời cảm ơn chân thành nhất đến tất cả những người đã hỗ trợ, giúp đỡ tôi về chuyên môn, vật chất và tinh thần trong suốt quá trình thực hiện Luận văn

Trước hết, tôi xin chân thành cảm ơn thầy giáo TS Nguyễn Kim Khánh đã trực tiếp hướng dẫn , giúp đỡ tôi trong quá trình nghiên cứu hoàn thành luận văn này

Xin cảm ơn các thầy, cô Viện Công nghệ Thông tin và Truyền Thông đã giảng dạy, truyền thụ kiến thức cho tôi trong suốt quá trình học tập

Xin được gửi lời cảm ơn chân thành đến Viện Đào tạo Sau Đại học, viện đã tạo điều kiện hết sức thuận lợi trong quá trình học tập của học viên nói riêng và lớp Xử lý Thông tin và Truyền thông nói chung

Cho phép tôi gửi lời cảm ơn đến Ban giám đốc và các anh chị em đồng nghiệp tại Trung tâm Mạng Thông Tin - Đại Học Bách Khoa Hà nội, nơi tôi đang công tác đã tạo điều kiện tốt nhất trong suốt quá trình tôi thực hiện đề tài

Cuối cùng, tôi xin bày tỏ lòng biết ơn đến gia đình và bạn bè đã giúp đỡ, động viên tôi rất nhiều trong suốt quá trình học tập và làm Luận văn tốt nghiệp

Trong khuôn khổ của luận văn không tránh khỏi những thiếu sót nhất định tôi rất mong nhận được sự đóng góp ý kiến của thầy cô giáo và các bạn

Hà nội, ngày 27 tháng 11 năm 2009

Học viên

Phan Đức Chình

Trang 5

MỤC LỤC

MỤC LỤC 1

DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ, VIẾT TẮT 4

DANH MỤC HÌNH VẼ 6

MỞ ĐẦU 8

CHƯƠNG 1 : TỔNG QUAN VỀ TRUNG TÂM DỮ LIỆU 12

1.1 Lịch sử phát triển và sự ra đời của trung tâm dữ liệu 12

1.2 Vai trò của trung tâm dữ liệu 13

1.3 Các yêu cầu khi xây dựng hạ tầng các trung tâm dữ liệu 14

1.4 Các xu hướng thiết kế trung tâm dữ liệu 16

1.4.1 Một số nhược điểm của kiểu thiết kế truyền thống 16

1.4.2 Xu hướng thiết kế ngày nay 17

1.5 Các thành phần của một trung tâm dữ liệu 18

CHƯƠNG 2 : CÁC CÔNG NGHỆ NÂNG CAO HIỆU QUẢ LƯU TRỮ TRONG TRUNG TÂM DỮ LIỆU 19

2.1 Giới thiệu chung 19

2.2 Sự cần thiết phải có một hạ tầng kiến trúc lưu trữ mới 20

2.3 Các giải pháp nâng cao hiệu quả lưu trữ 27

2.3.1 NAS (Network attached storage) 27

2.3.2 SAN (Storage Area Network) 28

2.3.2.1 Kênh quang (Fibre Channel) 30

2.3.2.2 Những lợi ích một mạng Fibre Channel SAN mang lại 33

2.4 Lưu trữ dựa trên nguyên lý phân mức tầm quan trọng của dữ liệu (Tiered- storage) 41

2.5 Quản lý vòng đời dữ liệu (Infomation lifecycle Management) 43

2.6 Ảo hóa hệ thống lưu trữ.(Storage Virtualization) 46

Trang 6

CHƯƠNG 3 : NỘI DUNG TIÊU CHUẨN TIA-942 CHO HẠ TẦNG TRUNG

TÂM DỮ LIỆU 50

3.1 Sự ra đời của TIA-942 50

3.2 Nội dung của TIA-942 50

3.2.1 Sơ đồ tổng thể và không gian cần thiết 51

3.2.2 Hạ tầng cáp 54

3.2.3 Mức độ sẵn sàng 55

3.2.4 Các yếu tố môi trường 56

3.2.5 Việc cấp nguồn 56

3.2.6 Vấn đề làm mát 57

CHƯƠNG 4 GIẢI PHÁP XÂY DỰNG HẠ TẦNG TRUNG TÂM DỮ LIỆU CHO ĐHBK HÀ NỘI 58

4.1 Hiện trạng hệ thống mạng và hệ thống máy chủ lưu trữ ĐHBK 58

4.2 Những nhược điểm hiện nay của hệ thống máy chủ và hệ thống lưu trữ trường ĐHBK Hà nội 60

4.2 Các yêu cầu chung của việc thiết kế trung tâm dữ liệu cho ĐHBK 61

4.3 Giải pháp cho hạ tầng trung tâm dữ liệu 63

4.3.1 Hệ thống phân phối nguồn điện 64

4.3.2 Hệ thống chống sét 68

4.3.3 Hệ thống thông gió và điều hoà nhiệt độ 69

4.3.4 Hệ thống phòng cháy chữa cháy 72

4.3.5 Hệ thống sàn nâng kỹ thuật 76

4.3.6 Hệ thống an ninh cho trung tâm dữ liệu 78

4.3.7 Không gian triển khai Trung tâm dữ liệu 80

4.3.8 Giải pháp cho hạ tầng Cáp mạng (cabling) 83

4.3.9 Hệ thống tủ phân phối 86

4.3.10 Hệ thống máng cáp phân phối 87

4.4 Giải pháp cho hệ thống máy chủ và lưu trữ 88

Trang 7

4.4.1 Hệ thống máy chủ 88

4.4.2 Hệ thống lưu trữ 91

KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 101

TÀI LIỆU THAM KHẢO 103

Trang 8

DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ, VIẾT TẮT

Kênh quang

Kênh quang thông qua giao thức IP

Tính sẵn sàng cao

Card kết nối SAN

Phần mềm quản lý đa đường

Mạng nội bộ

Đĩa logical trên SAN

Trung tâm dữ liệu chính

Công nghệ lưu trữ qua LAN RAID Redundant Array of Independent Disks

Công nghệ dãy đĩa dự phòng độc lập

Mạng lưu trữ SCSI Small Computer Systems Interface

Chuẩn giao tiếp máy chủ với thiết bị ngoại vi SNMP Simple Network Management Protocol

Trang 9

Giao thức quản lý mạng đơn giản

Mạng diện rộng ĐHBKHN Đại học Bách Khoa Hà nội

IDC Trung tâm dữ liệu Internet

TIA Telecommunications Industry Association

Hiệp hội công nghiệp viễn thông UPS Uninterruptible Power Supply

Hệ thống lưu điện dự phòng

Tủ phân phối điện

Hệ thống điều hoà không khí chính xác ILM Information Lifecycle Management

Quản lý lưu trữ theo vòng đời dữ liệu

Trang 10

DANH MỤC HÌNH VẼ

Hình 2.8 : Hợp nhất lưu trữ giúp hiệu quả hơn khi chia xẻ dung lượng 34

Hình 2.9 : Hợp nhất về mặt logical các hệ thống đĩa phân tán 35

Hình 2.10 : Sao lưu sử dụng giao thức TCP/IP 37

Hình 2.11 : Giải pháp SAN cho môi trường thương mại điện tử 40

Hình 2.12 : So sánh các mức lưu trữ on-line, near-line và off-line 43

Hình 2.13: Tầm quan trọng của dữ liệu thay đổi theo thời gian 44

Hình 2.14 : Mô hình chức năng của sản phẩm ảo hoá lưu trữ IBM SVC 47

Hình 3.1 Sơ đồ kết nối các khu vực chức năng trong một trung tâm dữ liệu 53

Hình 3.2 Bố trí khu vực chức năng trong một trung tâm dữ liệu 54

Hình 3.3: Sơ đồ bố trí hệ thống tủ Rack và phân phối các luồng không khí trong trung tâm dữ liệu 57

Hình 4.6 Mô hình phân phối nguồn điện trong Trung tâm dữ liệu 64

Hình 4.7 Hệ thống UPS Symmetra PX của hãng APC 65

Hình 4.8 Máy phát điện của hãng Kohler 65

Hình 4.9 Hình minh họa PDU 67

Hình 4.10 Hệ thống trống sét và tiếp mát cho hệ thống máy chủ 68

Hình 4.11 Hình minh họa hệ thống làm mát chính xác sử dụng trong trung tâm dữ liệu 71

Hình4.11 Hệ thống điều hòa hiệu năng cao 72

Hình 4.12 Các thiết bị chữa cháy Pyrogen 73

Trang 11

Hình 4.13 Hệ thống chữa cháy FM 200 74

Hình 4.14 Hình minh họa hệ thống chữa cháy Stat-X 75

Hình 4.15 Hình minh họa hệ thống sàn giả 76

Hình 4.16 Hình minh họa vật liệu sử dụng trong sàn giả 77

Hình 4.17 Hình minh họa hệ thống điều khiển truy nhập 78

Hình 4.18 Hình minh họa hệ thống camera an ninh 80

Hình 4.19 Sơ đồ mặt bằng bố trí Trung tâm dữ liệu 81

Hình 4.20 : Sơ đồ bố trí các khu vực chức năng của Trung tâm dữ liệu ĐHBK Hà nội 82

Hình 4.21 Hình minh họa hệ thống cáp cấu trúc 83

Hình 4.22 Mô hình bố trí các khu vực chức năng trong phòng networking 86

Hình 4.23 Hình minh họa hệ thống máng cáp trong trung tâm dữ liệu 87

Hình 4.24 Mô hình bố trí hệ thống máng cáp trong Trung tâm dữ liệu 88

Hình 4.25 so sánh một số chức năng của Server Rack và blade server 91

Hình 4.27: Mô hình kết nối Clustering 94

Hình 4.28: Mô hình kết nối đa đường 94

Hình 4.29: Tính năng chuyển lỗi đa đường 94

Hình 4.30: Mô hình kết nối clustering sử dụng HDLM 95

Hình 4.31: Tủ đĩa lưu trữ SAN 96

Hình 4.32: Kiến trúc của Hitachi AMS1000 97

Trang 12

M Ở ĐẦU

Công nghệ thông tin ngày nay đã trở thành một trong những yếu tố quan trọng hàng đầu của mỗi tổ chức, doanh nghiệp, cũng như học tập và nghiên cứu Việc ứng dụng công nghệ thông tin không những nâng cao chất lượng sản phẩm dịch

vụ, nâng cao sức mạnh cạnh tranh mà còn hỗ trợ đắc lực cho công tác quản trị điều hành hoạt động kinh doanh của doanh nghiệp theo hướng tập trung, hiệu quả và kịp thời

Cùng với sự phát triển nhanh chóng về quy mô của hạ tầng Công nghệ thông tin, các dịch vụ của hệ thống thông tin cũng đòi hỏi phải được nâng cao về mặt chất lượng Nhưng hiện nay, hạ tầng kỹ thuật của hệ thống thông tin được đầu tư chưa đảm bảo cho nhu cầu về chất lượng dịch vụ đặt ra Do đó, đã dẫn đến một số vấn đề bất cập xảy ra gây ảnh hưởng tới khả năng đáp ứng nhu cầu về dịch vụ của

hệ thống thông tin như:

• Các máy chủ dịch vụ nằm rải rác phân tán khắp nơi, khó kiểm soát

• Các máy chủ có cấu hình chưa đủ khả năng đáp ứng nhu cầu dịch vụ, hoặc cấu hình không đồng bộ, khó nâng cấp

• Không thống nhất về cơ sở dữ liệu

• Không đồng bộ trong việc lưu trữ dữ liệu

• Phòng máy chủ, mặc dù đã có UPS, chống sét đường nguồn, tiếp đất Nhưng vẫn chưa đạt chuẩn Vì vậy, vẫn có thể bị sự cố nguồn làm dừng dịch vụ

• Môi trường về nhiệt độ, độ ẩm cũng còn nhiều nguy cơ gây ra sự cố

• Hầu hết các phòng máy chủ hiện nay không được thiết kế phòng ngừa thảm họa

Với những bất cập của hạ tầng kỹ thuật hiện tại, cần phải xây dựng một hạ tầng

kỹ thuật mới, tiên tiến, có kế thừa hệ thống cũ Nhưng phải đảm bảo được những

Trang 13

yêu cầu về mặt dịch vụ ngày càng tăng cao Vì vậy, hạ tầng kỹ thuật cần phải đảm bảo các yêu cầu sau:

• Hệ thống có tính sẵn sàng và tin cậy cao

• Lưu trữ, xử lý hợp nhất dữ liệu

• Đảm bảo an toàn thông tin tối đa

• Hệ thống máy chủ có khả năng tính toán hiệu năng cao, đồng bộ, hợp nhất

• Hệ thống xây dựng theo dạng module có tính mở cao

• Đảm bảo về nguồn điện và chống sét, tiếp đất theo tiêu chuẩn

• Đảm bảo về môi trường làm việc theo chuẩn

• Có dự phòng tương lai và phòng ngừa thảm họa

Là cán bộ kỹ thuật đang công tác tại một đơn vị có chức năng quản trị Mạng Campus của một trường đại học, tôi ý thức rõ nhưng vấn đề và yêu cầu đặt

ra trong công tác quản trị và vận hành hệ thống mạng đang ngày một phát triển Vì

vậy, tôi quyết định chọn đề tài: “Nghiên cứu chuẩn hạ tầng Trung tâm dữ liệu

và giải pháp cho Trường Đại Học Bách Khoa Hà nội” với mục đích: lựa chọn,

tích hợp được một giải pháp Trung tâm dữ liệu tối ưu và phù hợp nhất có thể cho Trường Đại Học Bách Khoa Hà Nội (ĐHBK HN) và cũng là mô hình tham khảo cho các trường, các cơ quan tổ chức khác hiện nay

Với những yêu cầu trên, Tôi sẽ thực hiện nhũng nhiệm vụ trong luận văn như sau:

• Tìm hiểu các yêu cầu và xu hướng thiết kế Trung tâm dữ liệu

• Tìm hiểu về các công nghệ sử dụng và tiêu chuẩn TIA-942 trong một trung tâm dữ liệu

• Trên cơ sở lý thuyết và thực tiễn, đề xuất giải pháp xây dựng Trung

Trang 14

• Đánh giá giải pháp đưa ra

Nội dung cụ thể bao gồm :

Chương 1: Tổng quan về Trung tâm dữ liệu:

Trình bầy về lịch sử phát triển, ra đời và vai trò của Trung tâm dữ liệu Tìm hiểu về các xu hướng thiết kế và các thành phần của Trung tâm dữ liệu

Chương 2: Các hướng công nghệ nâng cao hiệu quả lưu trữ trong Trung tâm

dữ liệu:

Trình bầy về sự cần thiết phải xây dựng trung tâm dữ liệu thay thế cho hệ thống cũ Tìm hiểu về các giải pháp công nghệ lưu trữ đang được triển khai trong các trung tâm dữ liệu hiện nay Mặt khác, trong chương này cũng trình bầy về các nguyên tắc lưu trữ được dùng phổ biến

Chương 3: Nội dung tiêu chẩn TIA-942 quy định hạ tầng cần thiết cho Trung tâm dữ liệu:

Trình bầy bộ chuẩn TIA-942 qui định các tiêu chuẩn hạ tầng cần thiết cho một trung tâm dữ liệu:

- Không gian cần thiết và sơ đồ tổng thể của một trung tâm dữ liệu

- Hệ thống hạ tầng cable

- Độ tin cậy của trung tâm dữ liệu

- Các yếu tố môi trường

Chương 4: Giải pháp cho Trung tâm dữ liệu ĐHBK Hà Nội:

Khảo sát những điều kiện cụ thể của hạ tầng kỹ thuật hệ thống thông tin hiện tại của Trường Đại Học Bách Khoa Hà nội, thấy được những vấn đề cấp thiết hiện nay, từ đó đặt ra những yêu cầu cụ thể và đưa ra giải pháp xây dựng hạ tầng Trung tâm dữ liệu cho Trường Đại Học Bách Khoa Hà Nội

Trang 15

Kết luận và hướng phát triển: Trình bầy đánh giá kết quả đạt được và hướng

phát triển tiếp theo của đề tài

Trang 16

CHƯƠNG 1 : TỔNG QUAN VỀ TRUNG TÂM DỮ LIỆU

Trung tâm dữ liệu ngày nay có nguồn gốc xuất phát từ phòng máy tính lớn của thời kỳ đầu ngành công nghiệp máy tính Từ rất sớm hệ thống máy tính đã được thiết lập, để hoạt động và để duy trì nó cần yêu cầu một môi trường đặc biệt để nó làm việc Nhiều hệ thống cáp cần thiết để kết nối tất cả các thành phần, và các phương pháp để điều tiết, chẳng hạn như rack chuẩn để lắp thiết bị, và khay cáp (cài đặt trên không hoặc dưới sàn) Ngoài ra, các máy vi tính cũ cần rất nhiều năng lượng, và phải được làm mát bằng nước để tránh nóng quá mức, an ninh đã được chú trọng Các máy tính và thiết bị đắt tiền được trang bị cho các hệ thống này và

nó thường được dùng cho các mục đích quân sự

Trong quá trình phát triển vượt bậc của ngành công nghiệp máy tính, và đặc biệt là trong những năm 1980, máy vi tính bắt đầu được triển khai ở khắp mọi nơi Tuy nhiên khi hoạt động của các phòng máy tính này bắt đầu phát triển phức tạp Các công ty phát triển nhận thức được sự cần thiết để kiểm soát các nguồn lực CNTT Với nhu cầu của các khách hàng có nhu cầu tính toán máy chủ, trong những năm 1990 các máy chủ bắt đầu được đưa vào các khu vực của các phòng máy tính đặc biệt Tính sẵn có của các thiết bị mạng, kết hợp với các tiêu chuẩn mới cho cáp mạng, đã làm cho nó có thể sử dụng một thiết kế theo cấp bậc các máy chủ được đặt trong một căn phòng được thiết kế riêng trong công ty Việc sử dụng thuật ngữ “trung tâm dữ liệu”, áp dụng cho các phòng máy tính thiết kế đặc biệt, bắt đầu đạt được sự công nhận phổ biến khoảng thời gian này

Sự bùng nổ của các Trung tâm dữ liệu là khi các công ty nhận thấy sự cần thiết kết nối Internet nhanh và không gián đoạn hoạt động để triển khai các hệ thống và thiết lập một sự hiện diện trên Internet Để trang bị một hệ thống như vậy

là không khả thi cho nhiều công ty nhỏ hơn Nhiều công ty bắt đầu xây dựng các

Trang 17

cơ sở rất lớn, được gọi là trung tâm dữ liệu Internet (IDC), trong đó cung cấp cho các doanh nghiệp với một loạt các giải pháp cho các hệ thống triển khai và hoạt động Một loạt các tiêu chuẩn từ các tổ chức, nhóm công nhận chuyên nghiệp, chẳng hạn như Hiệp hội Công nghiệp viễn thông, chỉ định các yêu cầu về thiết kế trung tâm dữ liệu Hiện vẫn còn rất nhiều sự phát triển đang được thực hiện trong thực tiễn hoạt động, và cũng có các thiết kế thân thiện với môi trường của các trung tâm dữ liệu

Các trung tâm dữ liệu hiện nay là nơi tập trung nhiều thành phần tài nguyên mật độ cao (hardware, software ), làm chức năng lưu trữ, xử lý toàn bộ dữ liệu hệ thống với khả năng sẵn sàng và độ ổn định cao

Nơi tích hợp tất cả các công nghệ hàng đầu về mạng, hệ thống và phần mềm ứng dụng được sử dụng trong hệ thống

Mạng được thiết kế dành riêng đáp ứng yêu cầu cao về tốc độ truyền giữa các thiết bị, tính ổn định được coi trọng và vấn đề bảo mật cho hệ thống mạng được đặt lên hàng đầu Được cấu hình tối ưu và hỗ trợ khi một kết nối bị hỏng với một thiết bị thì thiết bị vẫn hoạt động bình thường với kết nối luôn ở tốc độ cao

Với hệ thống máy chủ có hiệu năng cực cao đáp ứng các ứng dụng chạy trên

nó với độ trễ nhỏ nhất, thời gian đáp ứng thấp nhất, hỗ trợ nhiều ứng dụng và cấu hình hoàn hảo giúp hệ thống chạy 24/7 Đáp ứng các ứng dụng khắt khe nhất Các phần mềm hỗ trợ sử dụng tối đa hiệu năng của phần cứng, giúp liên kết các máy chủ chạy song song tăng sức mạnh cho máy chủ và khả năng backup dữ liệu Khi có sự cố xảy ra chỉ trong một thời gian ngắn hệ thống có thể đi vào hoạt động như bình thường

Cuộc cách mạng Internet đang đóng vai trò quan trọng trong xã hội thông tin

Trang 18

trong việc cập nhật, ứng dụng và xử lý thông tin Đặt biệt đối với doanh nghiệp lại càng quan trọng hơn khi ứng dụng các phần mềm quản trị doanh nghiệp, thương mại điện tử, multimedia, chia sẻ dữ liệu dùng chung… do đó nhu cầu lưu trữ càng lớn, hình thành nên các trung tâm lưu trữ lớn và ngày càng phức tạp, tinh vi Từ đó thúc đẩy doanh nghiệp phải tính toán, tổ chức hệ thống lưu trữ của mình nhằm đáp ứng tối đa nhu cầu sử dụng cũng như giảm chi phí cài đặt, vận hành nhằm đem lại hiệu quả cao về mặt kinh tế lẫn sử dụng

Trung tâm lưu trữ dữ liệu trong doanh nghiệp chưa được quan tâm và đầu tư đúng mức, chưa tương xứng với sự phát triển không ngừng và mở rộng hoạt động kinh doanh của doanh nghiệp Chính vì sự thiếu quan tâm này mà trước đây doanh nghiệp phải đối mặt nhiều thách thức trong hoạt động kinh doanh Từ những vấn

đề trên, hiện nay các doanh nghiệp vừa và lớn đã nhìn nhận vai trò quan trọng của Trung tâm dữ liệu là ưu tiên hàng đầu, không thể thiếu, những lợi ích cũng như hiệu quả mà Trung tâm dữ liệu mang lại nhằm phục vụ nhu cầu kinh doanh rất to lớn, do đó việc chú trọng đầu tư vào Trung tâm dữ liệu là quyết định đúng đắn và mang tính bắt buộc, nơi được ví như là “trái tim” trong môi trường IT và kinh doanh của doanh nghiệp

Các trung tâm dữ liệu hiện đại cần phải được thiết kế tuân thủ các yêu cầu sau:

- Tính module hóa cao

- Khả năng mở rộng dễ dàng

- Triển khai các giải pháp mới tối ưu về nguồn và làm mát

- Tối ưu hóa TCO & ROI cho các Trung tâm dữ liệu lớn

- Khả năng hỗ trợ hợp nhất Server và thiết bị lưu trữ mật độ cao

- An ninh cần được đảm bảo ở mức cao nhất

Trang 19

Dựa vào các tiêu chuẩn quốc tế TIA-942 (TIA:Telecommunications

Industry Association - Hiệp hội công nghiệp viễn thông) về xây dựng, Trung

tâm dữ liệu tuân theo các tiêu chí sau:

 Ngoài việc cung cấp nguồn điện lưới cho trung tâm dữ liệu, để đảm bảo cho hệ thống hoạt động xuyên suốt không xảy ra sự cố về nguồn điện,

do đó phải cung cấp thêm nguồn điện dự phòng (UPS và máy phát điện dự phòng)

 Hệ thống điều hòa nhiệt độ phải được sử dụng loại máy lạnh chính xác vì môi trường của trung tâm dữ liệu đòi hỏi rất cao sự ổn định của nhiệt

độ nhằm đáp ứng độ mát nhất định cho máy móc, thiết bị hoạt động bên trong Trung tâm dữ liệu

 Trung tâm dữ liệu sẽ được cung cấp hệ thống chữa cháy dùng khí sạch cho máy chủ, mạng, phòng điều khiển trung tâm Tường và cửa có khả năng chịu nhiệt cao trong thời gian dài

 Hệ thống sàn nâng: sàn được thiết kế làm thông gió cho hệ thống điều hòa cung cấp cho thiết bị tin học đặt bên trên Sàn cũng được tận dùng

để đi dây cáp nguồn và cáp mạng

 Hệ thống an ninh (Access control và hệ thống Camera) cho trung tâm dữ liệu sẽ dùng đầu đọc thẻ hoặc sinh trắc học để tăng cường an ninh

Hệ thống Camera quan sát có thể dùng IP camera hoặc Analog camera để quan sát mọi hoạt động bên trong Trung tâm dữ liệu

 Trung tâm dữ liệu sẽ được cung cấp hệ thống chiếu sáng theo đúng tiêu chuẩn, cung cấp ánh sáng đầy đủ trong trường hợp khẩn cấp Nâng cao hiệu quả công việc có tính trực giác

 Giám sát môi trường theo dõi thường xuyên hoạt động của Trung

Trang 20

hưởng toàn bộ hệ thống Trung tâm dữ liệu bình thường và dữ liệu được bảo

vệ không bị mất

Thiết kế base trên diện tích không gian phòng:

Việc thiết kế này dẫn đến việc không chính xác trong tính toán công suất cung cấp năng lượng, làm mát cho các thiết bị Công suất cung cấp cho các thiết bị là ngang hàng nhau

Thiết kế mang tính cố định:

Việc đầu tư ngay từ ban đầu một lần duy nhất hệ thống năng lượng, làm mát cực lớn phục vụ cho các thiết bị hiện tại và tương lai Không có tính module để dễ dàng mở rộng, đầu tư theo nhu cầu Kết quả là gây ra sự lãng phí đầu tư và chi phí vận hành lớn

Quá nhiều nhà cung cấp khác nhau :

Các phần cứng mạng thường được mua từ nhiều nhà cung cấp khác nhau do có các tính năng riêng biệt chuyên sâu Tuy nhiên điều này có thể dẫn tới các vấn đề

về sự tương thích, làm cho hiệu suất không đạt cao nhất hoặc có thể gây lỗi hệ thống ở một số tình huống không biết trước được

Hệ thống làm lạnh thường thổi dưới sàn lên :

Việc khí lạnh được thổi lên từ dưới sàn giả thường không đáp ứng khả năng cung cấp làm mát cho các thiết bị hạn chế Không phù hợp với các thiết bị công nghệ cao sau này như Blade server, thiết bị Storage

Hệ thống cáp nguồn và cáp data thường được đi dưới sàn nâng :

Trang 21

Việc bố trí này dẫn đến khó khăn trong việc vận hành, nâng cấp Điều này cũng là nguyên nhân dẫn tới ngăn chặn luồng khí lạnh lên trên sàn để tới các thiết

bị IT nếu thiết kế không khéo

Từ các điểm hạn chế của thiết kế truyền thống nói trên, các hãng cung cấp giải pháp, thiết bị đều có xu hướng ngừng sử dụng và sản xuất các sản phẩm truyền thống, thay vào đó đẩy mạnh đưa ra các giải pháp, kèm theo các sản phẩm nhằm nâng cao chất lượng sử dụng, tối ưu hóa hệ thống và khả năng sẵn sàng cao

Các xu hướng thiết kế như sau :

Thay vì tính toán, thiết kế base trên không gian phòng thì ngày nay chủ yếu base theo tủ RACK Mục đích là sẽ xác định được công suất nguồn, làm mát chính xác tới từng thiết bị trên tủ Rack Do vậy với các tủ chứa các máy chủ, storage sẽ phân bổ công suất lớn hơn, trong khi các tủ về thiết bị mạng sẽ phân bổ công suất vừa phải Rất dễ dàng phân bổ công suất tùy theo nhu cầu thiết bị Điều này khác hẳn với cách truyền thống

Hệ thống làm mát: các thiết bị làm mát cũng được thiết kế theo dạng In-row, thiết bị làm mát được thiết kế theo dạng Rack, sẽ bố trí ngay bên cạnh các tủ thiết

bị máy chủ Cho phép cung cấp công suất lên tới hàng chục đến hàng trăm KW, đáp ứng tốt cho các tủ Rack mật độ công suất cao

Module: các thiết bị có khả năng mở rộng theo nhu cầu, dễ dàng phân bổ chi phí đầu tư Chính vì thiết kế theo module, nên dễ dàng thay thế, nâng cấp mà không làm gián đoạn hệ thống đang hoạt động Điều này trong thiết kế truyền thống khó có thể đạt được

Hệ thống cabling được thiết kế đi nổi trên các máng treo trần nhà hoặc hệ thống máng cáp trên nóc các tủ RACK thay vì đi dưới sàn truyền thống Lý do thứ

Trang 22

cabling rất đa dạng) Thứ 2, về mặt triển khai vận hành rất dễ dàng Cuối cùng là đảm bảo tuân thủ các tiêu chuẩn, trong đó cũng không làm ảnh hưởng tới luồng khí mát như cách bố trí cable truyền thống

Hệ thống nguồn điện: Được thiết kế theo các tier khác nhau, nâng cao khả năng

dự phòng, công suất lớn hơn và độ ổn định cao

Green DataCenter: nói đến một trung tâm dữ liệu xanh, tức là khả năng tiêu thụ của hệ thống là 100% và hạn chế tính dư thừa gây lãng phí trong sử dụng

1.5 Các thành ph ần của một trung tâm dữ liệu

 Hệ thống lưu điện UPS (Uninterruptible Power Supply)

 Máy phát điện

 Tủ phân phối điện PDU (Power Distribution Unit)

 Hệ thống điều hoà không khí chính xác PCU (Precision Cooling Unit)

 Hệ thống chống cháy (Fire Protection)

 Hệ thống giám sát ra vào cửa (Access Control)

Trang 23

CHƯƠNG 2 : CÁC CÔNG NGHỆ NÂNG CAO HIỆU QUẢ

LƯU TRỮ TRONG TRUNG TÂM DỮ LIỆU

Trong thời đại hiện nay, hoạt động và sự thành công trong hoạt động của hầu hết các doanh nghiệp/cơ quan/tổ chức (sau này gọi chung là doanh nghiệp), phụ

thuộc rất nhiều vào hạ tầng công nghệ thông tin của họ Xét trên khía cạnh IT, cốt

lõi cơ bản trong hoạt động của các doanh nghiệp là các quá trình lưu trữ, xử lý và trao đổi dữ liệu, thông tin Liên quan đến các quá trình này, và cũng là một trong

những thành phần quan trọng bậc nhất của cơ sở hạ tầng thông tin là hệ thống lưu trữ Khái niệm “hệ thống lưu trữ” chỉ đến tập hợp của tất cả các tài nguyên sử dụng cho mục đích lưu trữ dữ liệu của hệ thống, bao gồm:

• Các thiết bị lưu trữ, như ổ đĩa cứng trong của các máy chủ, các tủ đĩa ngoài, các thiết bị băng từ

• Các phần mềm quản lý, điều khiển hoặc cung cấp tính năng phụ trợ (như sao chép, sao lưu vv ) cho các thiết bị lưu trữ

• Các giao thức và phụ kiện cho kết nối và trao đổi dữ liệu giữa các thiết bị lưu trữ

Để hoạt động trên nền tảng IT của doanh nghiệp được thông suốt và hiệu quả,

hệ thống lưu trữ cần được thiết kế và vận hành với sự quan tâm cao, được đầu tư xứng đáng cả về giá trị kinh tế và về công nghệ kỹ thuật Tất cả các dữ liệu cần thiết cho quá trình hoạt động của doanh nghiệp phải được lưu trữ đầy đủ (yêu cầu

đủ về dung lượng), với độ an toàn và tính bảo mật cao, cho phép truy xuất với tốc

độ nhanh, được sử dụng và xử lý một cách hiệu quả và hợp lý (yêu cầu về hiệu năng và quản trị lưu trữ)

Trang 24

Đáp ứng những yêu cầu như trên, ngành công nghệ lưu trữ đang có một lộ trình phát triển nhanh chóng với nhiều bước tiến mới về công nghệ nhằm nâng cao giá trị và hiệu quả sử dụng của hệ thống lưu trữ Theo dõi tình hình nghiên cứu và triển khai thực tế, có thể thấy xu thế phát triển hiện nay của công nghệ lưu trữ đang tập trung vào các công nghệ như sau:

- Sử dụng mạng lưu trữ riêng biệt, tốc độ cao cho mục đích lưu trữ dữ liệu (SAN: Storage Area Network)

- Phân mức tầm quan trọng của dữ liệu, trên cơ sở đó dùng thiết bị và công nghệ lưu trữ phù hợp, giảm thiểu chi phí đầu tư và vận hành Nguyên lý lưu trữ phù hợp với tầm quan trọng của dữ liệu có thể được áp dụng là phân mức lưu trữ (Tiered-Storage)

- Quản lý lưu trữ theo vòng đời dữ liệu (ILM: Information Lifecycle Management)

- Tiến hành hợp nhất hệ thống lưu trữ theo phương pháp ảo hóa (Storage Virtualization), nâng cao hiệu quả sử dụng

Từ những năm đầu của thập kỷ 90, hầu hết các kiến trúc máy tính đều dựa trên

mô hình chủ/khách (client/server) Ngày nay, rất nhiều tổ chức với hàng triệu máy trạm, hàng nghìn máy chủ được cài đặt để cung cấp các dịch vụ tới người dùng Các máy chủ hiện tại, với tốc độ xử lý, khả năng lưu trữ và cấp phát lớn hơn rất nhiều lần so với các hệ máy mainframe của những năm 1990

Lưu trữ trong hầu hết các trường hợp được kết nối trực tiếp từ máy chủ tới thiết bị lưu trữ Các máy chủ được kết nối và chuyển đổi dữ liệu thông qua mạng cục bộ (LAN) và mạng diện rộng (WAN) Hình dưới đây mô tả kiến trúc client/server (Hình 1.1) Cùng với sự tăng trưởng của các tổ chức, dung lượng lưu trữ (từ vài chục cho tới hàng trăm GB) và tốc độ của bộ vi xử lý của các hệ thống

Trang 25

tăng theo từng năm Nhưng vấn đề gặp phải hiện nay là băng thông truyền giữa các hệ thống không thay đổi nhiều so với các năm trước đây Điều này đồng nghĩa với việc mặc dù mức chi phí đầu tư hàng năm là rất lớn, nhưng hiệu quả đạt được lại không cao

Với mô hình hiện tại, các máy chủ và các máy trạm thường được chọn và chỉ định theo từng mục đích sử dụng, các máy chủ sẽ phải chạy các hệ điều hành khác nhau (như Windows 2000/2003/2008, OS/400, UNIX, Linux, Sun Solaris, Novell Netware, VMS .) để đáp ứng với các yêu cầu của cơ sở dữ liệu (như DB2, Oracle, Informix, SQL ) Do vậy, trong một hệ thống mạng sẽ bao gồm rất nhiều kiểu file hệ thống và các định dạng dữ liệu khác nhau

Workstation

Storage CPU

Workstation

Storage CPU

Workstation

Storage CPU

Workstation

Storage Server

Workstation

Storage Client Workstation

Storage Client

Workstation

Storage Client

Kiến trúc client/Server

Hình 2.1 : Mô hình các h ệ thống phân tán sử dụng kiến trúc Client/Server

Quản lý nhiều phần cứng, phần mềm, nhiều nhà cung cấp thiết bị sẽ làm cho môi trường mạng trở nên phúc tạp và chi phí bảo trì cao Do vậy, việc kết hợp các phần mềm quản lý hệ thống của các nhà cung cấp sẽ đòi hỏi người quản trị phải có

Trang 26

nguyên, dữ liệu của nhiều hệ điều hành khác nhau Một nghiên cứu cho thấy chi phí phải bỏ ra để quản lý một hệ thống lưu trữ phân tán thường gấp khoảng 10 lần chi phí cần bỏ ra để quản lý một hệ thống lưu trữ tập trung Tổng chi phí này bao gồm việc quản lý sao lưu, phục hồi, các tài nguyên, hiệu suất và các kế hoạch phục hồi khi có thảm họa

Các thiết bị lưu trữ thường được tích hợp theo các hệ thống máy chủ (clusters) của từng hãng và rất khó khăn trong việc nâng cấp (giá thành tính trên đơn vị GB) Các tủ RAID hoặc các thư viện băng từ phải được kết nối trực tiếp tới một máy trạm hoặc máy chủ và thường không thể sử dụng được với các hệ thống máy chủ khác (hoặc sẽ không hiệu quả khi sử dụng các tài nguyên phần cứng) Trong trường hợp này, các tổ chức khi muốn nâng cấp về mặt dung lượng lưu trữ thường phải mua thêm các hệ thống cluster mới Như hình dưới đây mô tả

Khoảng trống

Đã sử dụng

Win 2k3

Win 2k8

SUN 1

SUN 2

AIX

Còn rất nhiều khoảng trống trên từng server

Hình 2 2 : Dung lượng đĩa bị lãng phí trên mỗi hệ thống mở

Trong một hệ thống lưu trữ, dung lượng lưu trữ chỉ là một phần nhỏ Ngoài ra, các hệ thống lưu trữ hiện tại sẽ rất khó khăn khi muốn đảm bảo rằng có một môi trường cân bằng, ổn định, đảm bảo hiệu suất cho các ứng dụng thương mại điện

tử

Trang 27

Dữ liệu lưu trữ trên một hệ thống không thể sẵn sàng cung cấp tài nguyên tới người dùng trong trường hợp hệ thống chính xảy ra sự cố Ngoại trừ trong trường hợp tạo một bản sao dữ liệu hoặc khôi phục dữ liệu từ các thư viện băng từ Việc sao chép một lượng lớn các dữ liệu tới thư viện băng từ hay các hệ thống máy chủ khác sẽ làm giảm hiệu suất của toàn bộ mạng (LAN/WAN), gây ra xung đột giũa các ứng dụng quan trọng Nhiều bản sao chép của cùng một cơ sở dữ liệu có thể gây ra sự không ổn định giữa các bản sao chép Dữ liệu phân chia trên nhiều hệ thống nhỏ rất khó có thể kết hợp để chia sẻ các ứng dụng trong một môi trường giao dịch lớn như thương mại điện tử (e-business), Enterprise Resource Planning (ERP), Data Warehouse và Business Intelligence (BI)

Sao lưu và phục hồi thông qua mạng LAN có thể bị ngắt quãng bởi sự quá tải của băng thông Thậm chí, hiện nay thông qua đường truyền Gigabit Ethernet, ta cũng mất gần 1 giờ để có thể sao lưu 40 GB dữ liệu Do vậy, thời gian sao lưu sẽ tăng rất nhiều đối với các hệ thống có dung lượng khoảng 300 GB cần sao lưu đầy

đủ Điều này khó có thể chấp nhận đối với các tổ chức đa quốc gia Đây là đặc trưng khó có thể khắc phục của mô hình client/server với giá thành cao, nhưng sử dụng không hiệu quả Mô hình này đã không thể phù hợp với các doanh nghiệp lớn Hình dưới đây mô tả chi tiết về việc sử dụng dữ liệu phân tán

Trang 28

Môi trường lưu trữ client/server phổ biến

Dữ liệu được lưu trữ tại mỗi server

Hình 2.3 : Mô hình dữ liệu phân tán

Giải pháp tốt nhất đối với các tổ chức hiện nay để có thể tối ưu được chi phí, hiệu quả hơn trong sử dụng là xây dựng một nền tảng vững chắc về lưu trữ Một trong những bước quan trọng đầu tiên là cần phải điều khiển được các tài nguyên

và thông qua đó có thể cải thiện được khả năng kết nối

Trước hết, ta hãy xem xét một số ưu điểm và nhược điểm của kiến trúc lưu trữ hiện nay

Chuẩn giao tiếp SCSI (Small Computer Systems Interface)

Hiện tại đang là chuẩn được sử dụng nhiều nhất để kết nối máy chủ tới các thiết bị ngoại vi (ổ đĩa cứng, băng từ, máy in ) trong môi trường client/server Như tên gọi, chuẩn SCSI chỉ được sử dụng cho PC và môi trường doanh nghiệp vừa và nhỏ

Chuẩn SCSI sử dụng kiến trúc mạng bus, sử dụng cable kết nối song song giữa máy chủ và thiết bị lưu trữ Các thiết bị SCSI thường có giá thành cao, cấu hình phức tạp và dễ xảy ra lỗi

Trang 29

Số lượng các thiết bị lưu trữ được gắn tới một thiết bị được xác định dựa theo tổng số ID trên một kênh truyền Chính vì giới hạn này, số lượng các thiết bị lưu trữ kết nối tới máy chủ là hữu hạn Dữ liệu cần truy cập sẽ bị mất trong trường hợp một kết nối có sự cố, điều này cũng đúng khi ta khởi tạo (reset) kênh truyền, toàn

bộ thiết bị SCSI trên kênh sẽ bị khởi tạo lại Điều này không phù hợp với các ứng dụng ngày nay yêu cầu thời gian trễ thấp

Dữ liệu được truyền trên các kênh SCSI được xác định dựa trên số các bit được truyền đồng thời trong một chu kỳ xung của kênh SCSI (đơn vị tính theo MHz), ta có thể nhận thấy, nếu giảm chu kỳ xung, có thể tăng được tốc độ truyền Nhưng khoảng cách vẫn là giới hạn không thể vượt qua trong chuẩn SCSI Với công nghệ hiện tại các kênh SCSI đang sử dụng đường truyền 64 bit

Phụ thuộc vào tốc độ truyền và chu kỳ xung nhịp, khoảng cách cực đại từ máy chủ đến các thiết bị lưu trữ từ khoảng 2m – 25m, đây là khoảng cách tối đa trên một kênh truyền với tất cả các thiết bị được gắn trên kênh SCSI

Hình dưới đây mô tả khoảng cách và tốc độ truyền tối đa trên các kênh truyền SCSI sử dụng các băng thông khác nhau

Trang 30

Giới hạn khoảng cách của SCSI

Hình 2.4 : Các giới hạn về khoảng cách của đường truyền SCSI

Thông thường, đối với kênh SCSI chỉ có một thiết bị có thể truyền dữ liệu tại một thời điểm SCSI sử dụng một giao thức để xác định và cấp phép cho thiết bị được phép truyền dữ liệu Giao thức này hoạt động trước và sau mỗi tiến trình truyền dữ liệu Điều này sẽ làm quá tải và không tận dụng được băng thông Trên thực tế, tốc độ truyền của một kênh SCSI thường chỉ bằng 50% tốc độ lý thuyết

Do cơ chế truyền dữ liệu song song, các kênh SCSI thường phải tốn nhiều tài nguyên của bộ nhớ và CPU để tái sắp xếp lại dữ liệu, làm giảm tốc độ xử lý của hệ thống

Ngoài ra, SCSI cũng sử dụng một giao thức để gửi lệnh và điều khiển các khối

dữ liệu truyền/nhận giữa máy chủ và thiết bị lưu trữ Các lệnh này được quản lý bởi máy chủ, nhằm đáp ứng tới các yêu cầu dữ liệu Ngày nay, nhờ sự phát triển

về phần cứng và phần mềm, các thiết bị SCSI để có thể có khả năng tự đảm nhận một số công việc nhưng giá thành cho các thiết bị này sẽ cao hơn

Trang 31

Từ những đánh giá trên, ta nhận thấy rằng các thiết bị SCSI thường bị giới hạn

về khoảng cách, tốc độ, tính sẵn sàng Do vậy, để đảm bảo hiệu suất tốt nhất cho các hệ thống máy chủ, ta cần có một kiến trúc hạ tầng mới cho các thiết bị lưu trữ

Các tổ chức lớn hiện nay đang hướng tới khả năng liên kết các hệ thống, các nhà cung cấp và người dùng tới một hệ thống lưu trữ tập trung Hệ thống này phải

có khả năng cho phép người dùng truy cập dữ liệu từ bất kỳ đâu trong tổ chức Có hai kiểu kiến trúc mạng lưu trữ hiện có và đang được sử dụng rộng rãi:

• NAS (Network attached storage)

• SAN (Storage Area Network)

2.3.1 NAS (Network attached storage)

Giải pháp lưu trữ sử dụng các mạng LAN hiện có, thông qua các giao thức như TCP/IP hoặc NetBIOS để truyền/nhận dữ liệu

Hình 2.5 : Lưu trữ trên mạng LAN

Trang 32

truy cập tới thiết bị thông qua các hệ thống files chuẩn NFS, CIFS

Các máy chủ có thể chia xẻ thiết bị NAS như là một thiết bị được sử dụng để sao lưu và phục hồi dữ liệu

Nhờ vậy, các thiết bị NAS có một vài ưu điểm như mở rộng khoảng cách, tạo một hệ thống files sử dụng chung giữa nhiều người dùng, tăng dung lượng lưu trữ của hệ thống Nhưng các thiết bị này vẫn sử dụng mạng LAN là phương tiện truyền thông, nên vẫn bị giới hạn về băng thông và sự quá tải của mạng TCP/IP

Do đó, NAS chỉ phù hợp với các tổ chức nhỏ, chỉ có yêu cầu về tăng dung lượng lưu trữ và chỉ cần có thêm một hệ thống như File Server

Giải pháp NAS có giá thành thấp, dễ cài đặt và tích hợp vào các mạng LAN hiện có Các thiết bị NAS hiện tại thường được sử dụng với hai mục đích chính:

 File servers

 Backup/archive servers

Các thiết bị NAS không phù hợp cho các cơ sở dữ liệu hoặc các ứng dụng đòi hỏi nhiều băng thông, hiệu suất cao vì vậy xu hướng hiện nay khi thiết kế trung tâm dữ liệu không sử dụng kiểu lưu trữ này

2.3.2 SAN (Storage Area Network)

SAN là một kiến trúc chuyên dụng, nhằm phục vụ cho các hệ thống máy chủ kết nối tới thiết bị lưu trữ với băng thông cao và không bị giới hạn về khoảng cách SAN cho dễ dàng tạo các kế nối tới thiết bị lưu trữ thông qua các thành phần như: Routers, gateways, hubs và switches SAN giúp loại trừ những giới hạn của những thiết bị lưu trữ truyền thống, cho phép một hoặc nhiều máy chủ chia xẻ một

hệ thống lưu trữ chung, bao gồm các đĩa cứng, băng từ, đĩa quang

Hình dưới đây mô tả một mạng SAN cơ bản

Trang 33

Network & LANs

Win SUN Linux AIX UNIX

Storage Tape

Storage Area Network

Hình2.6 : Mô hình m ạng SAN cơ bản

Một mạng SAN khác với các mạng LAN truyền thống vì nó được xây dựng để phục vụ cho việc truyền/nhận dữ liệu (không truyền/nhận các lệnh truyền thông) Các mạng SAN thường được xây dựng dựa trên các cổng giao tiếp kênh quang Các kênh quang cung cấp một băng thông ổn định với hiệu suất cao trên một khoảng cách xa, khả năng tạo các đường kết nối dự phòng và nạp cân bằng nhằm đảm bảo tính sẵn sàng cao cho hệ thống

Nhờ đó, SAN loại bỏ các tắc nghẽn thường có trên mạng LAN, tạo một kết nối tốc độ cao giữa máy chủ và thiết bị lưu trữ Có ba kiểu truyền dữ liệu chính được sử dụng trong SAN:

 Máy chủ tới thiết bị lưu trữ: Đây là đặc trưng chính của SAN Ưu điểm chính của mạng SAN là cho phép một thiết bị lưu trữ có thể được truy cập đồng thời bởi nhiều máy chủ

 Máy chủ tới máy chủ: Tạo đường truyền thông tốc độ cao giữa các

hệ thống máy chủ

 Thiết bị lưu trữ tới thiết bị lưu trữ: Dữ liệu từ các tủ đĩa có thể được

Trang 34

từ mà không đòi hỏi tài nguyên của máy chủ

2.3.2.1 Kênh quang (Fibre Channel)

Một chuẩn mở, được sử dụng cho các kết nối yêu cầu I/O cao, thiết bị phần cứng sử dụng các diode (LED) và kỹ thuật laser để truyền dữ liệu với tốc độ cao trên một khoảng cách xa Các kênh quang có thể sử dụng cáp quang cho khoảng cách xa hoặc sử dụng cáp đồng khi khoảng cách gần và cần tối ưu về chi phí Nhờ vào tốc độ và chất lượng ổn định của kênh quang, cho phép máy chủ nhìn thiết bị lưu trữ như là các tài nguyên cục bộ của hệ thống Bởi vì kỹ thuật quang có khả năng hỗ trợ nhiều giao thức và các thiết bị, ta có thể quản lý hệ thống như trên mạng LAN

Cũng như các công nghệ mạng khác, thông tin sẽ được đóng thành các gói (packet) hoặc các khung (frame) và dữ liệu sẽ được truyền tuần tự trên mạng Nhưng không giống như các kỹ thuật khác, kiến trúc kênh quang cho phép tạo kết nối sử dụng thiết bị phần cứng để đạt hiệu suất tốt nhất Tốc độ hiện thời của các

mạng cáp quang thường là 100MB/s (có thể đạt 200MB/s – 400MB/s khi kết hợp nhiều đường truyền)

Đối với mô hình sử dụng kênh quang, thông tin được gửi trực tiếp từ thiết bị phát đến thiết bị thu, không giống như kỹ thuật Ethernet dữ liệu sẽ có thể cần phải định tuyến (routing) từ nguồn tới đích Có ba mô hình mạng truyền thông chuẩn được sử dụng trên kênh quang

 Point to point (FC-P2P): Một kết nối hai chiều (bi-directional) giữa hai node, với băng thông đạt 100MB/s trên mỗi hướng Đây là topo đơn giản nhất nhưng cũng giới hạn nhất

 Arbitrated loop (FC-AL): Mô hình kết nối đơn hướng (uni-directional), tương tự như kỹ thuật được sử dụng cho các mạng TokenRing, hỗ trợ tối đa 126 node Mỗi node sẽ gửi dữ liệu đến các node còn lại cho đến khi tìm tới đích Các

Trang 35

node sẽ chia sẻ chung một đường kết nối 100MB/s

Kỹ thuật này ngày nay đã không được sử dụng vì băng thông sẽ bị ảnh hưởng rất lớn khi có nhiều node kết nối vào mạng Ngày nay thường được sử dụng để kết nối các hệ thống lưu trữ nhỏ trước khi kết nối tới hệ thống lớn (thường không quá hai máy chủ với một vài thiết bị lưu trữ ngoại vi)

 Switched fabric (FC-SW): Thuật ngữ Fabric một kiến trúc chuyển mạch thông minh, được sử dụng để phân phối dữ liệu từ một nguồn tới bất kỳ đích nào trong mạng Các SAN switch thế hệ mới cho phép kết nối 224 các node với nhau, với băng thông 100MB/s cho mỗi đường Mỗi một kết nối nhận được băng thông tối đa cho cổng kết nối của mình (200MB/s)

Các switch fabric chịu trách nhiệm cho việc chuyển mạch thông tin Các SAN switch thường có độ phức tạp hơn nhiều so với các FC switch bởi chúng được quản lý bởi phần mềm, có các hệ điều hành và các tiện ích được xây dựng sẵn bên trong switch Switch fabric là nền tảng cơ sở cho một mạng SAN

Các mô hình mạng có thể được kết hợp với nhau nhằm tạo nên một mô hình mạng tổng thể có thể đáp ứng được các yêu cầu về độ ổn định, khoảng cách và giá thành

Các kênh quang cũng sử dụng cơ chế truyền nối tiếp tương tự như các kỹ thuật mạng khác nhưng với băng thông 100MB (1Gbps hay 1bit/0.94 nanoseconds) Chính nhờ cơ chế truyền nối tiếp, giúp loại bỏ hoàn toàn việc phải sắp xếp lại dữ liệu như trên kênh truyền SCSI

Trang 36

Truyền nối tiếp Truyền song song

Hình 2 7 : Phương thức truyền dữ liệu song song và nối tiếp

Phương pháp truyền nối tiếp cho phép dây cable và các đầu kết nối đơn giản hơn, nhờ đó thông tin có thể được định tuyến và chuyển mạch Ngày nay, các kênh quang có khoảng cách từ 10km – 120km nhờ sự hỗ trợ của các bộ lặp (repeater) Cũng giống như mạng LAN sử dụng các đường truyền tốc độ cao (leased line, frame relay) liên kết với nhau tạo thành mạng WAN, ta có thể liên kết các mạng SAN với nhau để tạo thành một mạng SAN rộng

Chuẩn kênh quang rất mềm dẻo, cho phép hỗ trợ nhiều giao thức bao gồm:

 Các lệnh và các giao thức I/O : SCSI-3 Fibre Channel Protocol, (viết tắt là FCP, một trong những giao thức đang được sử dụng rộng rãi hiện nay), ESCON, FICON, SSA, và HIPPI

 Các giao thức truyền dữ liệu trên mạng Ethernet: TCP/IP hoặc Net BIOS Mặc dù có khả năng truyền dẫn nhiều giao thức, nhưng trên thực tế các kênh quang hiện thời thường chỉ sử dụng một giao thức, giúp kênh quang có thể phân phối dữ liệu với tốc độ cao nhất Từ những nhận định trên, ta thấy rằng chuẩn kênh quang là sự kết hợp những đặc điểm tốt nhất của các công nghệ khác để tạo ra một môi trường mạng lý tưởng:

Trang 37

 Cho phép truyền dữ liệu với khoảng cách xa và hiệu suất cao nhờ các thiết

bị phần cứng và một giao thức truyền thông đơn giản

 Phương pháp truyền dữ liệu nối tiếp

 Các đầu kết nối cable đơn giản, giảm tối đa khả năng lỗi

 Truyền dữ liệu ổn định với khả năng xác nhận và phục hồi lỗi trên đường truyền

 Dữ liệu được đóng gói trước khi truyền (thuật ngữ trong kênh quang gọi là các frames)

 Cho phép truyền nhiều kiểu thông tin khác nhau trên đường truyền (như dữ liệu, âm thanh, hình ảnh, phim)

 Có khả năng kết nối các thiết bị đang sử dụng chuẩn SCSI thông qua giao thức FCP

 Nếu so sánh với các kênh truyền SCSI, các kênh quang cho phép kết nối một số lượng cực lớn các thiết bị vào trong một mạng (hơn 16 triệu cổng kết nối)

Ngày nay, nhờ vào sự phát triển của thương mại điện tử, đã tạo nên những bước đột phá cho ngành công nghệ thông tin Các giải pháp được xây dựng trên SAN bao gồm một số khả năng chính sau:

• K ết hợp lưu trữ và chia sẻ các tài nguyên:

Các máy chủ kết nối tới thiết bị lưu trữ với khoảng cách xa, cho phép loại bỏ các thiết bị lưu trữ cục bộ SAN cho phép kết hợp các thiết bị lưu trữ, tận dụng tối

đa các tài nguyên, nhờ đó giúp làm giảm chi phí cho thiết bị và dễ dàng trong công tác quản lý Ta có thể chia thành hai phần chính sau:

Trang 38

• K ết hợp lưu trữ tại mức vật lý

Kết hợp tất cả các dữ liệu vào trong một hệ thống lưu trữ lớn Hệ thống lưu trữ này có thể chia xẻ cho nhiều máy chủ, cấp phát dung lượng đĩa cho từng máy Ngoài ra, hệ thống còn có khả năng sao chép, mirroring và tái tạo dữ liệu Hình dưới đây mô tả về hệ thống kết hợp lưu trữ vật lý

Lưu trữ hợp nhất

Hình 2.8 : Hợp nhất lưu trữ giúp hiệu quả hơn khi chia sẻ dung lượng

Dung lượng đĩa có thể được cấp phát và thu hồi khi cần thiết, giúp ngăn ngừa việc dư thừa và lãng phí các tài nguyên Một khả năng nổi bật khác là hỗ trợ việc cấp phát động các tài nguyên tới từng máy chủ

• K ết hợp lưu trữ tại mức logical

Dữ liệu từ các thiết bị lưu trữ khác nhau có thể được kết hợp để tạo ra một hệ thống lưu trữ tập trung mà không bị giới hạn về khoảng cách Các thiết bị có thể được kết hợp thành từng nhóm lưu trữ, phục vụ cho từng mục đích và đối tượng người dùng

Hình dưới đây mô tả khả năng kết hợp các thiết bị tại mức logical

Trang 39

Cùng một bản dữ liệu cũng có thể được chia sẻ cùng một lúc cho nhiều hệ thống máy chủ khác nhau, thuật ngữ gọi là “true data sharing” Trong môi trường SAN, nhờ sự hỗ trợ của các phần mềm lưu trữ, các máy chủ có thể dễ dàng truy cập đến một cơ sở dữ liệu dùng chung

Điều này là không thể thực hiện được nếu ta sử dụng các hệ thống cluster bởi

vì trên các hệ điều hành khác nhau, ta sẽ có các hệ thống files, các định dạng dữ liệu, cấu trúc mã hoá khác nhau Nhưng khi ta sử dụng các tủ đĩa lưu trữ SAN, cấu trúc dữ liệu trên tủ cho phép các hệ điều hành có khả năng truy cập đồng thời Giúp làm giảm việc phải có nhiều bản sao chép của cùng một cơ sở sở dữ liệu cho mỗi hệ điều hành, giảm giá thành đầu tư cho các hệ thống cluster mới

• H ỗ trợ khả năng mở rộng khi hệ thống thông tin tăng trưởng

Trang 40

đặt các ứng dụng và cơ sở dữ liệu như:

tư, nâng cấp các hệ thống máy chủ mới nhằm tăng dung lượng lưu trữ

Sử dụng mạng SAN, với các hệ thống lưu trữ tập trung , kết nối tới máy chủ thông qua các đường cáp quang, cho phép dễ dàng tăng dung lượng lưu trữ mà không cần đầu tư thêm máy chủ Nhờ sự độc lập của hệ thống lưu trữ với máy chủ, các giao dịch kinh doanh sẽ không bị ngắt quãng khi hệ thống lưu trữ được nâng cấp

• C ải thiện thời gian/tốc độ khi sao lưu và phục hồi dữ liệu

Với dung lượng lưu trữ tăng gấp đôi sau mỗi năm, các thao tác sao lưu và phục hồi dữ liệu sẽ rất khó khăn và phức tạp nếu vẫn sử dụng các kênh SCSI và môi trường mạng LAN Hiện tại các hệ thống sao lưu thường sử dụng hai phương pháp chính để sao lưu và phục hồi dữ liệu là:

 Sao lưu dữ liệu trực tiếp với các ổ băng từ được kết nối với máy chủ

 Sao lưu dữ liệu thông qua mạng

SAN sử dụng hai phương pháp sao lưu mới giúp làm giảm băng thông và tăng hiệu suất cho các tiến trình sao lưu

Sao lưu thông qua một máy chủ sao lưu quản lý tập trung

Cung cấp cho mỗi máy chủ một ổ băng từ sẽ làm tăng giá thành cho một hệ

Ngày đăng: 12/02/2021, 11:26

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
1. Jon Tate, Fabiano Lucchese, Richard Moore, “Introduction to Storage Area Networks”, IBM Redbooks, July 2006 Sách, tạp chí
Tiêu đề: Introduction to Storage Area Networks
2. Marc Farley, "Building Storage Networks" McGraw-Hill, May 2001 Sách, tạp chí
Tiêu đề: Building Storage Networks
3. John R. Vacca, Michael Erbschloe, "The Essential Guide to Storage Area Networks" Prentice Hall, January 2002 Sách, tạp chí
Tiêu đề: The Essential Guide to Storage Area Networks
4. “TrueCopy Extended Distance Software User’s Guide”, Hitachi Data Systems Corporation, June 2007 Sách, tạp chí
Tiêu đề: TrueCopy Extended Distance Software User’s Guide
5. TIA Standard “Telecommunications Infrastructure standard for Data Centers” ANSI/TIA -942 -2005 Sách, tạp chí
Tiêu đề: Telecommunications Infrastructure standard for Data Centers

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w