Tóm tắt kết quả tiếng Việt và tiếng Anh Hệ thống máy chủ ảo được xây dựng trên nền của hệ thống các máy chủ vật lý phân tán trên bình diện toàn cầu và kết nối với nhau thông qua hệ thố
Trang 1BỘ CÔNG THƯƠNG ĐẠI HỌC CÔNG NGHIỆP THÀNH PHỐ HỒ CHÍ MINH
BÁO CÁO TỔNG KẾT ĐỀ TÀI KHOA HỌC
KẾT QUẢ THỰC HIỆN ĐỀ TÀI NGHIÊN CỨU KHOA HỌCCẤP TRƯỜNG
Tên đề tài: Xây dựng hệ thống đám mây lai (Private) với mã nguồn mở Open stack
Mã số đề tài: 182.CNTT02
Chủ nhiệm đề tài: TS.Đoàn Văn Thắng
Đơn vị thực hiện: Khoa Công nghệ Thông tin
Trang 2
PHẦN I THÔNG TIN CHUNG
I Thông tin tổng quát
1.1 Tên đề tài: Xây dựng hệ thống đám mây lai (private) với mã nguồn mở Open
stack
1.2 Mã số: 182.CNTT02
1.3 Danh sách chủ trì, thành viên tham gia thực hiện đề tài
TT Họ và tên
(học hàm, học vị) Đơn vị công tác Vai trò thực hiện đề tài
1 TS Đoàn Văn Thắng Khoa CNTT, ĐH
1.6 Những thay đổi so với thuyết minh ban đầu (nếu có): không
1.7 Tổng kinh phí được phê duyệt của đề tài: ………….triệu đồng
II Kết quả nghiên cứu
1 Đặt vấn đề
Cung cấp tài nguyên điện toán đám mây là chủ đề nghiên cứu rất được quan tâm trong thời gần đây Một chính sách cung cấp tài nguyên hiệu quả mang lại hiệu quả kinh tế rất lớn cho các doanh nghiệp và các tổ chức mong muốn xây dựng hạ tầng công nghệ thông tin trong bối cảnh công nghệ phát triển như vũ bão và quá trình hội nhập công nghệ 4.0 Có thể thấy rằng tại các trường đại học nhu cầu sử dụng tài
Trang 3cứu giải quyết các bài toán đòi hỏi máy chủ ảo là rất cấp thiết Tuy nhiên, vấn đề ở đây nhu cầu này phụ thuộc vào số lượng khóa học, cũng như lưu lượng sinh viên Khảo sát ở một trường đại học lớn nhu cầu sử dụng trong các phòng thí nghiệm là một vài giờ trong tuần đối với sinh viên Còn phía giảng viên cần các cụm máy tính khoảng vài lần trong một tuần Vì thế nhu cầu xây dựng hạ tầng vật lý phục vụ cho nghiên cứu rất khó khăn và tốn nhiều chi phí Xuất phát từ những vấn đề thực tế đó tôi thấy rằng việc đề xuất đề tài nghiên cứu “Xây dựng hệ thống máy chủ ảo Open Stack” phục vụ nghiên cứu khoa học tại trường Đại học Công Nghiệp là hết sức cần thiết và có ý nghĩa khoa học Trên thế giới hiện nay các dịch vụ điện toán đám mây được cung cấp bởi rất nhiều công ty lớn như Amazon, Google, Microsoft, Bên cạnh
đó rất nhiều mã nguồn mở để triển khai các dịch vụ điện toán đám mây, trong phạm
vi nghiên cứu của đề tài chúng tôi đề xuất phần mềm mã nguồn mở Open stack Liên quan đến nội dung nghiên cứu này trước đây nhóm đã công bố bài báo với tiêu đề “Deadlock avoidance for Resource Allocation Model V VM-out-of-N PM” Tuy nhiên, bài báo này chỉ xây dựng mô hình chưa hiện thực một cách thực tế Từ
đó, dựa trên những nghiên cứu nhóm hiện thực cung cấp tài nghiên máy chủ ảo Open stack
3 Phương pháp nghiên cứu
- Khảo sát, phân tích và thiết kế mô hình hệ thống
- Thực nghiệm
4 Tổng kết về kết quả nghiên cứu
- Đề tài đã công bố 4 bài báo trong quá trình nghiên cứu
- Đề tài đã xây dựng thực nghiệm cung cấp tài nguyên cho hệ thống máy chủ ảo
Trang 45 Đánh giá các kết quả đã đạt được và kết luận
- Đề tài đã hoàn tất các nội dung đã đề ra ban đầu như trong thuyết minh đề tài
Ngoài ra, đề tài có số lượng bài báo xuất bản nhiều hơn so với đăng ký 2 bài
6 Tóm tắt kết quả (tiếng Việt và tiếng Anh)
Hệ thống máy chủ ảo được xây dựng trên nền của hệ thống các máy chủ vật lý phân tán trên bình diện toàn cầu và kết nối với nhau thông qua hệ thống viễn thông
có vai trò ngày càng quan trọng trong việc vận hành, cung cấp và khai thác tài nguyên
ảo hóa Để đảm bảo việc cung cấp tài nguyên này một cách chính xác, kịp thời, tránh tình trạng chồng chéo, xung đột, bế tắc và thiếu thốn vô hạn cho các tiến trình có nhu cầu tài nguyên, đặc biệt tài nguyên ở xa, nhất thiết, phải nghiên cứu và đề xuất các giải pháp đủ mạnh, tin cậy làm nền tảng cơ sở cho hệ điều khiển bên trong các đám mây Trong đề tài này, chúng tôi nghiên cứu thuật toán loại trừ lẫn nhau theo hướng tiếp cận Token nhằm tìm ra những giải pháp cung cấp tài nguyên phân tán hữu hiệu trong đó nhấn mạnh các giải pháp loại trừ lẫn nhau và đề ra các biện pháp tránh được các vấn đề thiếu thốn tài nguyên
In the content of the thesis, we provide Open Stack virtual server solution The solution concerns the readiness criteria, because it affects the cost of preparing the infrastructure Virtualization solutions based on Open Stack have great potential to meet the needs of users in the context of complex and sophisticated intelligent computing systems
Security issues, the ability to adjust resources can positively impact each user’s needs, the solution to ensure quality standards, ensure sufficient resources, storage space, support policies Use when demand increases or decreases Standalone independence also improves on open resource standards, based on physical server resources
We have also conducted experiments in distributed environments, some peerto-peer distributed applications with the ability of data centers to change Based on empirical evaluation criteria, we propose to bring some positive results.When observing a comparative assessment between the ability to create a VM as required, or reject a request to create a VM as the other VMs can not be suspended, or stop the CPU in the datacenter
Trang 5Through this research, we found that adopting OpenStack based virtual server solutions delivers optimal performance for the distributed resources of specially adapted virtual machine systems Provide virtual servers for hightech applications in intelligent farming
III Sản phẩm đề tài, công bố và kết quả đào tạo
3.1 Kết quả nghiên cứu ( sản phẩm dạng 1,2,3)
TT Tên sản phẩm
Yêu cầu khoa học hoặc/và chỉ tiêu
kinh tế - kỹ thuật Đăng ký Đạt được
Ghi chú:
- Các ấn phẩm khoa học (bài báo, báo cáo KH, sách chuyên khảo…) chỉ được chấp nhận nếu có ghi nhận địa chỉ và cảm ơn trường ĐH Công Nghiệp Tp HCM đã cấp kính phí thực hiện nghiên cứu theo đúng quy định
- Các ấn phẩm ( bản photo) đính kèm trong phần phụ lục minh chứng ở cuối báo cáo (đối với ấn phẩm là sách, giáo trình cần có bản photo trang bìa, trang chính và trang cuối kèm thông tin quyết định và số hiệu xuất bản)
3.2 Kết quả đào tạo
TT Họ và tên
Thời gian thực hiện đề tài
Trang 6IV Tình hình sử dụng kinh phí
T
T Nội dung chi
Kinh phí được duyệt
(triệu đồng)
Kinh phí thực hiện
(triệu đồng)
Ghi chú
A Chi phí trực tiếp
1 Thuê khoán chuyên môn
2 Nguyên, nhiên vật liệu, cây con
V Kiến nghị ( về phát triển các kết quả nghiên cứu của đề tài)
Thông qua kết quả đạt được, nhóm nghiên cứu đã chỉ ra rằng khi tăng các yêu cầu của người sử dụng đề xuất yêu cầu tài nguyên phân tán Với phương pháp đề xuất của nhóm nghiên cứu đã làm tăng lên khả năng đáp ứng của các máy chủ vật lí và đã giải quyết được khả năng tránh bế tắc đồng thời vẫn giữ được hiệu quả nhất định Điều này, đã giữ khả năng cân bằng giữa các của các máy chủ vật lí đạt được độ nhạy tối ưu Với kết quả đạt được của đề tài thông qua các kết quả thực nghiệm cũng như các công trình đã công báo, có thể nhận thấy đề tài đã vượt xa chỉ tiêu của các yêu cầu từ lúc xây dựng đề cương Cuối cùng với thời gian và giải pháp triển khai trên các máy tính cấu hình còn hạn chế nên đã không đánh giá hết được những trường hợp
có thể phát sinh ảnh hưởng tới việc sử dụng máy ảo, đặc biệt là các chi phí phát sinh cho các đường truyền viễn thông có thể ảnh hưởng xấu đến hiệu năng hoạt động Vì vậy, trong các hướng nghiên cứu tiếp theo chúng tôi sẽ đánh giá tác động của các đường truyền ảnh hướng tới khả năng cung cấp tài nguyên
VI Phụ lục ( liệt kê minh chứng các sản phẩm nêu ở Phần III)
1 Đoàn Văn Thắng, Nguyễn Hà Huy Cường, Võ Quang Hoàng Khang Giải Pháp
Kỹ Thuật Trên Cơ Sở Loại Trừ Tương Hỗ Hệ Thống Máy Chủ Ảo Tạp chí Khoa học
và Công nghệ IUH (nhận đăng), 2019
Trang 72 Ha Huy Cuong Nguyen, Van Thang Doan Avoid Deadlock Resource
Allocation (ADRA) Model V VM-out-of-N PM International Journal of Innovative
Technology and Interdisciplinary Sciences, Volume 2, Issue 1, pp 98-107, 2019
DOI: https://doi.org/10.15157/IJITIS.2019.2.1.98-107
3 Hong Minh Nguyen, Van Thang Doan, Dac-Nhuong Le, Ha Huy Cuong
Nguyen, and Xuan Huy Nguyen Open stack: resources allocation For distributed
virtual machine Peer -to – peer Proceedings The 7th International Conference on
Frontiers of Intelligent Computing: Theory and Applications (FICTA 2018)
(Accepted)
4 Nguyễn Hà Huy Cường, Hồ Hữu Linh, Nguyễn Văn Khương, Đoàn Văn Thắng
và Đoàn Trung Sơn Giải pháp kỹ thuật điện toán đám mây đáp ứng các ứng dụng
trong mô hình nông nghiệp thông minh Kỷ yếu hội thảo Công nghệ thông tin và
Truyền thông (ICT2018), pp 133-137
Tp HCM, ngày tháng năm
Chủ nhiệm đề tài Phòng QLKH&HTQT Khoa Công nghệ thông tin
Trưởng khoa (Họ tên, chữ ký)
Trang 8PHẦN II
BÁO CÁO CHI TIẾT ĐỀ TÀI NGHIÊN CỨU KHOA HỌC
Trang 9PHẦN III PHỤ LỤC ĐÍNH KÈM
1 Hợp đồng thực hiện đề tài nghiên cứu khoa học
2 Thuyết minh đề tài đã được phê duyệt
3 Quyết định nghiệm thu
4 Hồ sơ nghiệm thu (biên bản họp, phiếu đánh giá, bảng tổng hợp điểm, bản giải trình, phiếu phản biện)
5 Sản phẩm nghiên cứu (bài báo, bản vẽ, mô hình )
Trang 11M ỤC LỤC
MỞ ĐẦU 3
CHƯƠNG 1 TỔNG QUAN HỆ THỐNG MÁY CHỦ ẢO 6
1.1 Hệ thống máy chủ ảo với những đặc trưng cơ bản 6
1.1.1 Khái niệm về hệ thống máy chủ ảo 6
1.1.2 Đám mây Private 8
1.1.2.3 Mở rộng của Private cloud 9
1.1.2.4 Lưu trữ đám mây riêng (Private cloud hosting) 10
1.1.2.5 Lợi ích của Private cloud 10
1.1.2.6 Hạn chế của Private cloud 11
1.1.3 Các chiến lược cung cấp tài nguyên 11
1.2 Giải pháp kỹ thuật cung cấp tài nguyên thông tin trong hệ thống máy chủ ảo của Điện toán Đám mây 19
CHƯƠNG 2 MÔ HÌNH CUNG CẤP TÀI NGUYÊN M VM-OUT-OF-N PM 21
2.1 Mô hình hóa tài nguyên điện toán 21
2.1.1 Mô hình tài nguyên 21
2.1.2 Hợp đồng 22
2.2 Mô hình cung cấp tài nguyên P – OUT – OF – Q 25
2.3 Mô hình cung cấp tài nguyên tối ưu M VM - OUT - OF - N PM 28
CHƯƠNG 3 THỰC NGHIỆM CUNG CẤP TÀI NGUYÊN PHÂN TÁN CHO HỆ THỐNG MÁY CHỦ ẢO TRÊN MÔI TRƯỜNG OPEN STACK 31
3.1 Tổng quan Open Stack 32
3.2 Giải pháp kỹ thuật cho hệ thống máy chủ ảo trong môi trường mã nguồn mở Open Stack 34
3.2.1 Đề xuất thuật toán phân phối máy chủ ảo 34
3.2.2 Thuật toán phân phối tham lam 34
3.2.3 Thuật toán đề xuất trong môi trường phân tán 35
3.2.4 Môi trường và phần mềm mô phỏng 36
3.2.6 Kết quả thu được phân tích đánh giá 45
3.2.6 Bàn luận về kết quả nghiên cứu 48
3.3 Phân tích và đánh giá giải pháp đề xuất 50
KẾT LUẬN VÀ KIẾN NGHỊ 52
TÀI LIỆU THAM KHẢO 53
DANH MỤC CÔNG TRÌNH 55
Trang 12DANH MỤC HÌNH VẼ
Hình 1.1 Cấu trúc tổng quát hệ thống máy chủ ảo 8
Hình 1.2 Mô hình private cloud 9
Hình 1.3 Lợi ích đám mây riêng 10
Hình 1.4 Mô hình 5 lớp trong kiến trúc điện toán đám mây 12
Hình 1.5 Mô hình đa server đa tầng, lồng nhau 19
Hình 2.1 Mô hình cung cấp tài nguyên M VM – out – of – N PM 28
Hình 2.2 Đồ thị WFG khi khởi tạo thuật toán và đồ thị WFG sau khi được rút gọn khi sử dụng thuật toán 31
Hình 3.1 Mô hình Open stack 32
Hình 3.2 Đăng nhập vào hệ thống đám mây Private với Open Stack 37
Hình 3.3 Hệ thống đám mây Private với Open Stack với một số dịch vụ image là các hệ điều hành được tải lên 38
Hình 3.4 Tổng quan về hệ thống đám mây Private với Open Stack 38
Hình 3.5 Hệ thống đám mây Private với Open Stack với Usage Summary 39
Hình 3.6 Hệ thống đám mây Private với Open Stack với Instances 39
Hình 3.7 Hệ thống đám mây Private với Open Stack với Key Pair 40
Hình 3.8 Hệ thống đám mây Private với Open Stack với Server Groups 40
Hình 3.9 Hệ thống đám mây Private với Open Stack với Volume Backups 41
Hình 3.10 Hệ thống đám mây Private với Open Stack với Networks 41
Hình 3 11 Hệ thống đám mây Private với Open Stack với Security Groups 42
Hình 3.12 Hệ thống đám mây Private với Open Stack với Floating IPs 42
Hình 3.13 Hệ thống đám mây Private với Open Stack với Trunks 43
Hình 3.14 Hệ thống đám mây Private với Open Stack với Host Aggregates 43
Hình 3.15 Hệ thống đám mây Private với Open Stack với Flavors 44
Hình 3.16 Hệ thống đám mây Private với Open Stack với khả năng của CPU 44
Hình 3.17 Đồ thị thể hiện khả năng của CPU với từng hợp đồng với thuật toán tham lam 46 Hình 3.18 Biểu đồ thời gian trung bình suy giảm sau 10 lần thử nghiệm thời gian thực hiện trong 180 phút 47
Hình 3.19 Đồ thị thời gian hoàn thành hợp đồng với khả năng từng CPU cho trước ở môi trường phân tán có kết hợp thuật toán phát hiện bế tắc trong cung cấp tài nguyên tạo máy chủ ảo 48
Trang 13M Ở ĐẦU
1 Tính cấp thiết của đề tài
Cung cấp tài nguyên điện toán đám mây là chủ đề nghiên cứu rất được quan tâm trong thời gần đây Một chính sách cung cấp tài nguyên hiệu quả mang lại hiệu quả kinh tế rất lớn cho các doanh nghiệp và các tổ chức mong muốn xây dựng hạ tầng công nghệ thông tin trong bối cảnh công nghệ phát triển như vũ bão và quá trình hội nhập công nghệ 4.0 Có thể thấy rằng tại các trường đại học nhu cầu sử dụng tài nguyên tính toán của các nhà khoa học, cũng như nhu cầu của các sinh viên nghiên cứu giải quyết các bài toán đòi hỏi máy chủ ảo là rất cấp thiết Tuy nhiên, vấn đề ở đây nhu cầu này phụ thuộc vào số lượng khóa học, cũng như lưu lượng sinh viên Khảo sát ở một trường đại học lớn nhu cầu sử dụng trong các phòng thí nghiệm là một vài giờ trong tuần đối với sinh viên Còn phía giảng viên cần các cụm máy tính khoảng vài lần trong một tuần Vì thế nhu cầu xây dựng hạ tầng vật lý phục vụ cho nghiên cứu rất khó khăn và tốn nhiều chi phí Xuất phát từ những vấn đề thực tế đó tôi thấy rằng việc đề xuất đề tài nghiên cứu “Xây dựng hệ thống máy chủ ảo Open Stack” phục vụ nghiên cứu khoa học tại trường Đại học Công Nghiệp là hết sức cần thiết và có ý nghĩa khoa học Trên thế giới hiện nay các dịch vụ điện toán đám mây được cung cấp bởi rất nhiều công ty lớn như Amazon, Google, Microsoft, Bên cạnh
đó rất nhiều mã nguồn mở để triển khai các dịch vụ điện toán đám mây, trong phạm
vi nghiên cứu của đề tài chúng tôi đề xuất phần mềm mã nguồn mở Open stack Liên quan đến nội dung nghiên cứu này trước đây nhóm đã công bố bài báo với tiêu đề “Deadlock avoidance for Resource Allocation Model V VM-out-of-N PM” Tuy nhiên, bài báo này chỉ xây dựng mô hình chưa hiện thực một cách thực tế Từ
đó, dựa trên những nghiên cứu nhóm hiện thực cung cấp tài nghiên máy chủ ảo Open stack
2 M ục tiêu, đối tượng, phạm vi nghiên cứu
Trang 14- Tạo môi trường thuận lợi trong quá trình học tập tiếp cận công nghệ máy chủ ảo cho sinh viên
Đối tượng nghiên cứu:Mã nguồn mở Open stack
Phạm vi nghiên cứu: Lớp hạ tầng như là dịch vụ IaaS
3 Phương pháp nghiên cứu, kết cấu của công trình nghiên cứu
Nhiệm vụ nghiên cứu
- Tìm hiểu các mô hình Điện Toán Đám Mây hiện có
- Tìm hiểu các phần mềm mã nguồn mở hỗ trợ xây dựng máy chủ ảo: Open stack, Open Stack, Vmware Vsphere
- Xây dựng bài giảng điện tử cho một số học phần theo nhu cầu từ các Khoa
- Triển khai trên các máy chủ thật
Phương pháp nghiên cứu
- Khảo sát, phân tích và thiết kế mô hình hệ thống
- Thực nghiệm
Cấu trúc của công trình nghiên cứu
Chương 1 Tổng quan hệ thống máy chủ ảo
Trong chương 1, báo cáo đã nêu các khái niệm cơ bản về hệ thống máy chủ ảo, đưa ra các mô hình dịch vụ cũng như các đặc trưng cơ bản của máy chủ ảo
Chương 2 Mô hình cung cấp tài nguyên v vm-out-of-n pm
Trong chương 2, báo cáo đã trình bày vấn đề về mô hình hoá trong cung cấp tài
nguyên điện toán đám mây Đưa ra mô hình cung cấp tài nguyên v vm-out-of-n pm
từ mô hình cung cấp xây dựng các vấn đề về tính toán tối ưu hiệu quả trong cung cấp tài nguyên Từ mô hình và công thức tính, báo cáo đã đề xuất các giải pháp, đó là các thuật toán được áp dụng trong xây dựng hệ thống đám mây riêng Có thể thấy về mặt
lý thuyết giải pháp chia sẻ tài nguyên ảo hoá từ máy chủ vật lí là khá mới mẻ và hoàn toàn mang lại hiệu quả kinh tế cao, thân thiện môi trường Đặc biệt trong các trường Đại học máy chủ ảo chia sẻ mang đến cho các giảng viên nghiên cứu và triển khai hiệu quả các bài toán lớn phù hợp với bối cảnh của cuộc cách mạng công nghệ 4.0 đang diễn ra hiện nay
Chương 3 Thực nghiệm cung cấp tài nguyên phân tán cho hệ thống máy chủ ảo trên
môi trường Open stack
Trang 15Trong chương 3 báo cáo trình bày về khái niệm về mã nguồn mở Open stack Ngoài ra, đưa ra các mô hình, giao diện của hệ thống đám mây riêng đã được triển khai trên môi trường Open stack
4 K ết quả đạt được của đề tài
Báo cáo đã trình bày về những vấn đề cơ bản trong nghiên cứu xây dựng và triển khai mô hình máy chủ ảo đó Vấn đề được nghiên cứu triển khai ứng dụng tại lớp cơ
sở hạ tầng như một dịch vụ Báo cáo đã đưa ra các mô hình cài đặt hệ thống đám mây riêng Báo cáo được hoàn thiện cả phần lý thuyết và ứng dụng Mô hình đám mây riêng phục vụ nghiên cứu khoa học và triển khai các cụm tính toán được xây dựng trên môi trường mã nguồn mở Open stack Báo cáo được hoàn thiện dựa trên 2 bài báo được đăng ở tạp chí trong nước và quốc tế có chỉ số ISSN và 02 bài được công
bố ở hội nghị trong nước và quốc tế Bài được đăng ở Hội nghị quốc tế được Index Scopus và ISI
Trang 16CHƯƠNG 1 TỔNG QUAN HỆ THỐNG MÁY CHỦ ẢO
1.1 H ệ thống máy chủ ảo với những đặc trưng cơ bản
1.1.1 Khái ni ệm về hệ thống máy chủ ảo
Hệ thống tính toán phân tán đã có sự thay đổi từ mô hình máy tính lớn đến mô hình máy khách - chủ Ngày nay, người sử dụng khai thác các ứng dụng của điện toán với tài nguyên tính toán hoặc dữ liệu được đặt trong môi trường đám mây Dịch vụ
hạ tầng (IaaS) trong điện toán đám mây sẽ cung cấp tài nguyên máy chủ ảo, được thiết lập dựa trên các trung tâm dữ liệu (DC) Trung tâm dữ liệu được xây dựng từ một hay nhiều máy chủ vật lý phân tán Khi đó, mạng viễn thông giữ vai trò phương tiện trao đổi thông tin, là phương tiện chia sẻ tài nguyên, là môi trường để các chương trình truy cập dữ liệu từ xa và thông tin thông báo Nhiệm vụ của mạng viễn thông là truyền thông tin nhanh, chính xác, có chất lượng Xu hướng hiện nay xây dựng lớp dịch vụ hạ tầng có tính năng vượt trội và khả năng mở rộng linh hoạt, khả năng phục hồi an ninh và tránh tắc nghẽn mạng Phương pháp cung cấp tài nguyên sử dụng công nghệ ảo hóa, cho phép tập hợp và khai thác các nguồn tài nguyên vật lí một cách linh hoạt
Máy chủ ảo, ngày càng trở nên phổ biến kể từ khi VMware GSX Server ra mắt Các máy chủ ảo được thiết lập thông qua lớp hạ tầng dịch vụ, dưới sự điều khiển của
Hypervisor Hypervisor là phần mềm chịu trách nhiệm chạy nhiều máy ảo, thực hiện việc liên lạc trực tiếp với nền tảng phần cứng vật lí phía dưới, quản lý và cung cấp tài nguyên cho các máy ảo chạy các hệ điều hành khác nhau nằm trên nó Đối với các máy chủ ảo, được cung cấp tài nguyên từ máy chủ vật lí các thành phần tài nguyên
ảo này phụ thuộc vào nhu cầu của người sử dụng Máy chủ ảo hoạt động hoàn toàn giống như một máy chủ vật lí truyền thống, trong đó người sử dụng được toàn quyền quản trị máy chủ ảo với quyền quản trị cao nhất, đảm bảo tính bảo mật cao Có thể dùng máy chủ ảo để thiết lập máy chủ Web, máy chủ Mail cũng như các máy chủ ứng dụng khác và có thể cài đặt riêng theo nhu cầu cũng như dễ dàng chia sẽ dữ liệu, truyền dữ liệu Các nhà cung cấp dịch vụ Internet Service Provider (ISP) sẽ cung cấp dịch vụ máy chủ ảo, quản lí không gian lưu trữ, duy trì hoạt động, tạo thêm hoặc loại
bỏ bớt khách hàng khi sử dụng một máy chủ ảo, công ty hay cá nhân có thể quản lý các thư mục tập tin riêng của họ Người sử dụng có thể bổ sung tên miền, không cần
Trang 17thông qua nhà cung cấp dịch vụ (ISP), cũng như quản lý các bản ghi, phân tích thống
kê và duy trì hoạt động, thay đổi mật khẩu Ngoài ra, người sử dụng máy chủ ảo không cần quản lý các khía cạnh phần cứng của một máy chủ, tuy họ phải chi trả phí thuê dịch vụ và phí đường truyền Internet
Hệ thống máy chủ ảo trong môi trường Điện toán Đám mây ra đời dựa trên nền tảng của các hệ thống tính toán như: tính toán phân tán, tính toán song song và tính toán lưới Ngoài cơ chế chia sẻ tài nguyên như hệ thống phân tán, máy chủ ảo cho phép đảm bảo độ bảo mật cho các máy chủ vật lí, tách biệt với các vùng ảo hóa khác nhau, chạy hệ điều hành riêng và hoạt động độc lập Hệ thống tính toán này như là một sự kết hợp của công nghệ máy tính với dịch vụ phát triển trong môi trường truyền thông Tập các máy chủ ảo có thể chạy trên một hoặc nhiều máy chủ vật lí, trên cơ sở chương trình hypervisor cung cấp chương trình dịch vụ chạy máy chủ ảo Có thể nói cho đến hiện tại các nhà cung cấp dịch vụ của VMware hay Microsoft Virtual Server
đã cung cấp giải pháp tin cậy và thông minh trong quản lý tài nguyên điện toán đám mây
Về cơ bản, Điện toán Đám mây được chia ra thành năm lớp riêng biệt, có tác động qua lại lẫn nhau:
- Lớp máy chủ vật lý bao gồm: phần cứng, phần mềm và phần hypervisor, được thiết kế và xây dựng đặc biệt để cung cấp các dịch vụ của đám mây
- Lớp hạ tầng dịch vụ cung cấp hạ tầng máy tính, trong môi trường nền ảo hóa
- Lớp nền tảng, cung cấp nền tảng cho điện toán và các giải pháp của dịch vụ, chi phối đến cấu trúc lớp hạ tầng dịch vụ của “đám mây” và là điểm tựa cho lớp ứng dụng, cho phép các ứng dụng hoạt động trên nền tảng đó
- Lớp ứng dụng, làm nhiệm vụ phân phối phần mềm như một dịch vụ thông qua Internet
- Lớp khách hàng, thông qua trình duyệt web khách hàng có thể truy cập, sử dụng các ứng dụng và dịch vụ điện toán đám mây
Trang 18Hình 1.1 Cấu trúc tổng quát hệ thống máy chủ ảo
1 1.2.1 Định nghĩa Private cloud
Private cloud được định nghĩa là các dịch vụ được cung cấp qua Internet hoặc mạng nội bộ riêng với người dùng trong mạng nội bộ đó thay vì công khai Private cloud cũng có thể được gọi là đám mây nội bộ Trong đó, Private cloud cung cấp cho doanh nghiệp nhiều lợi ích tương tự như Public cloud - bao gồm các đặc tính self-service, khả năng mở rộng và giãn nở linh hoạt – những có thêm sự kiểm soát và hỗ trợ tùy chỉnh từ các tài nguyên chuyên dụng trên cơ sở hạ tầng máy tính được lưu trữ tại chỗ
Ngoài ra, Private cloud cũng cung cấp mức độ bảo mật và riêng tư cao hơn nhờ vào hệ thống tường lửa và lưu trữ nội bộ để đảm bảo dữ liệu nhạy cảm và các hoạt động của công ty không bị truy cập bởi các nhà cung cấp bên thứ ba
Trang 191.1.2.2 Mô hình Private cloud
Hình 1.2 Mô hình private cloud
Có hai loại hình dịch vụ đám mây được cung cấp trong mô hình Private cloud
1 Iaas - Infrastructure as a service: Mô hình thứ nhất được áp dụng là mô hình
cơ sở hạ tầng như một dịch vụ (IaaS) Mô hình Private cloud này cho phép các công
ty sử dụng các tài nguyên cơ sở hạ tầng như máy móc, mạng và kho lưu trữ như một dịch vụ Các nhà cung cấp dịch vụ cung cấp một máy chủ và kho lưu trữ ảo, cũng như các API cho phép người dùng tải công việc lên máy ảo (VM) Người dùng đươc cung cấp các dung lượng lưu trữ và có thể bắt đầu, ngừng, truy cập hay cấu hình máy
ảo (VM) và bộ nhớ theo mong muốn của bản thân
2 PaaS - Platform as a service: Mô hình nền tảng như một dịch vụ (PaaS) cho phép các công ty cung cấp mọi thứ từ các ứng dụng đám mây đơn giản cho đến các ứng dụng doanh nghiệp phức tạp, tinh vi PaaS thường được sử dụng để phát triển
các phần mềm
1.1.2.3 M ở rộng của Private cloud
Các đám mây riêng cũng có thể được kết hợp với các đám mây công cộng để tạo
ra một đám mây lai (Hybrid cloud), cho phép doanh nghiệp tận dụng triệt để lợi thế của công nghệ đám mây nhằm giải phóng thêm không gian và mở rộng dịch vụ điện toán cho đám mây công cộng khi xuất hiện nhu cầu
Trong đó, doanh nghiệp có thể diều hành các công việc quan trọng hoặc các ứng dụng nhạy cảm trên đám mây riêng và sử dụng đám mây công cộng để xử lý khối lượng công việc đồ sộ hoặc các nhu cầu tăng đột biến
Trang 201.1.2.4 Lưu trữ đám mây riêng (Private cloud hosting)
Có hai phương pháp lưu trữ đám mây riêng: Lưu trữ nội bộ hoặc tại trung tâm dữ liệu (DC) của nhà cung cấp.Hầu hết các doanh nghiệp sẽ lựa chọn hình thức thứ hai
vì nó hiệu quả về chi phí hơn và sẽ không yêu cầu bạn phải dành ra một đội CNTT toàn thời gian chỉ để quản lý máy chủ của bạn
Thông thường mạng máy chủ cho lưu trữ đám mây riêng sẽ không rộng lớn như mạng máy chủ công cộng Điều này đặc biệt đúng nếu bạn đang sử dụng mạng đám mây riêng của mình trong nội bộ Một mạng lưu trữ đám mây riêng thông thường sẽ hoạt động theo cụm Bạn sẽ có nhiều máy chủ khác nhau cùng chạy các phiên bản website cùng một lúc và các tài nguyên có thể được lấy ra từ nhiều nguồn khác nhau khi cần
1.1.2.5 L ợi ích của Private cloud
Có nhiều lợi ích khi triển khai dịch vụ đám mây dưới dạng mô hình đám mây riêng
Hình 1.3 Lợi ích đám mây riêng
1 Tính bảo mật và riêng tư cao: Các hoạt động trên đám mây riêng không có sẵn hay không dùng để pubilc công cộng và các tài nguyên được chia sẻ từ các cụm tài nguyên riêng biệt Do vậy, hệ thống Private cloud thường đảm bảo tính bảo mật và riêng tư cao
Trang 212 Kiểm soát nhiều hơn: Private cloud có nhiều quyền kiểm soát hơn đối với tài nguyên và phần cứng của nó so với Public cloud vì nó chỉ được truy cập trong một tổ chức mà thôi
3 Hiệu quả về chi phí và nguồn lực: Các tài nguyên đám mây riêng không hiệu
quả về chi phí như tài nguyên trong các đám mây công cộng nhưng lại cho hiệu quả cao hơn Điều đó có nghĩa là người dùng Private cloud có thể đạt được lợi ích tối ưu hơn so với Public cloud với mức chi phí trên thực tế có thể không phải cao hơn quá nhiều
1.1.2.6 H ạn chế của Private cloud
Dưới đây là một vài hạn chế của việc sử dụng mô hình đám mây riêng:
1 Giới hạn khu vực hoạt động: Đám mây riêng chỉ có thể truy cập cục bộ và có thể khó để nâng mức triển khai lên toàn cầu Chi phí mua phần cứng mới để đáp ứng nhu cầu cho hệ thống private cloud là một giao dịch khá tốn kém
2 Khả năng mở rộng hạn chế: Private cloud có thể được "co giãn" chỉ trong phạm
vi dung lượng của các tài nguyên lưu trữ nội bộ
3 Kỹ năng bổ trợ: Để duy trì hệ thống private cloud, doanh nghiệp cần nhân sự
có chuyên môn cao
1.1.3 Các chi ến lược cung cấp tài nguyên
Cung cấp tài nguyên được đánh giá là một trong những vấn đề rất quan trọng trong nghiên cứu triển khai, khảo sát, phân tích thiết kế và xây dựng hệ thống điều hành và các hệ tính toán phân tán
Ban đầu, các nhà chuyên môn tập trung nghiên cứu các giải pháp cho vấn đề cung cấp tài nguyên, dựa trên đó các hệ thống máy tính mainframe chính thức sử dụng để chia sẻ tài nguyên cho nhiều người sử dụng Phương pháp cấp phát tài nguyên trong
hệ điều hành và hệ thống tính toán phân tán là một trong những vấn đề thực tế, kinh điển nhất trong khoa học máy tính, với rất nhiều nghiên cứu, nhằm đưa ra giải pháp tối ưu nhất
Trang 22Hình 1.4 Mô hình 5 lớp trong kiến trúc điện toán đám mây
1.1.3 1 Phương pháp dựa trên máy ảo (VM-based)
Máy ảo được xem là phương tiện thích hợp trong việc quản lý cung cấp tài nguyên
do khả năng cấp phát tài nguyên cứng, tài nguyên mềm và tiện ích sử dụng Trong kiến trúc cung cấp tài nguyên dựa trên máy ảo (VM-based), tất cả các tài nguyên phần cứng được gộp chung lại thành lớp hạ tầng dịch vụ, để cung cấp và chia sẻ tài nguyên
Vì vậy, người sử dụng (trong thưcó nhu cầu sử dụng các ứng dụng ảo hóa) có thể truy cập vào lớp (IaaS) để yêu cầu các tài nguyên, đáp ứng các cấp độ dịch vụ ứng dụng
Cơ chế quản lý tài nguyên trong kiến trúc (VM-based) có đặc tính đa ngõ vào và đa ngõ ra (Multiple-input and Multiple- output (MIMO)), trong đó có 3 mức điều khiển: điều khiển bộ vi xử lý (CPU), điều khiển bộ nhớ (RAM) và điều khiển thiết bị vào ra (I/O) Mục đích là điều tiết việc sử dụng các nguồn tài nguyên ảo hóa, sao cho các ứng dụng đạt được mục tiêu cấp độ dịch vụ Service Level Objective (SLO) bằng cách
sử dụng cơ chế điều khiển đầu vào cho các VM yêu cầu tài nguyên bộ vi xử lý (CPU),
bộ nhớ (RAM) và thiết bị vào ra (I/O)
Tác giả Walsh và đồng sự [48] đề xuất một kiến trúc hai lớp sử dụng các chức năng tiện ích, thông qua trong bối cảnh cung cấp tài nguyên tự động và tự trị Nó bao gồm hai hoạt động: tác tử (agent) thực hiện tính toán tại các nút cục bộ và sau đó gửi thông điệp tới các nút trong toàn hệ để tiến hành việc nắm thông tin và lấy quyền điều khiển toàn bộ hệ thống Trách nhiệm của các tác tử cục bộ là tính toán lượng tài nguyên, xác định khối lượng công việc và phạm vi của các nguồn tài nguyên hiện có
Trang 23Công việc điều khiển toàn hệ thống đòi hỏi phải chính xác cấu hình gần tối ưu các nguồn tài nguyên, dựa trên các thông tin có được thông qua các tính toán cục bộ Nghiên cứu của [1] [48] dựa trên kiến trúc tính toán phân tán, với kết quả thực nghiệm cung cấp tài nguyên tại trung tâm dữ liệu, đã thể hiện được đầy đủ chức năng tiện ích
và cung cấp bộ số liệu tin cậy, cùng các yếu tố phục vụ cho việc tính toán tối ưu khai thác các tài nguyên trong môi trường không thuần nhất Dựa trên các chức năng tiện ích từ các bộ chương trình quản lý ứng dụng [48], các dữ liệu thực nghiệm đã chứng minh tính hiệu quả và phù hợp thực tế Kết quả thực nghiệm được thực hiện trên cụm máy chủ ảo Linux Đây là một framework nghiên cứu tối ưu trong hệ thống tự trị tính toán phân tán [48]
Trong [4], đề xuất giải pháp dùng máy ảo (VM-based) quản lý theo kiểu thích nghi các nguồn tài nguyên được ảo hóa trong điện toán đám mây Kiến trúc dựa trên máy ảo cho phép cung cấp thông tin tài nguyên trừu tượng giữa các ứng dụng khác nhau, chạy trong hệ thống tài nguyên ảo và cung cấp tài nguyên tự động cho các ứng dụng Các ứng dụng được cung cấp tài nguyên dựa trên yêu cầu tiết kiệm và tối ưu
để đạt được Mục tiêu Cấp độ Dịch vụ Service Level Objective (SLO) Vấn đề quan trọng đặt ra là khi sử dụng tiếp cận dựa trên máy ảo, làm thế nào cung cấp tài nguyên cho các ứng dụng và đáp ứng yêu cầu tối ưu thời gian phục vụ dựa trên khối lượng công việc
Yazir và cộng sự [53] sử dụng bộ điều khiển thích nghi để điều chỉnh tự động việc
sử dụng tài nguyên ảo hóa, nhằm đạt được mức độ hài lòng dịch vụ ứng dụng trong môi trường điện toán đám mây Phân tích và đánh giá về mô hình điều khiển được đề xuất bởi [53] cho thấy các mô hình điều khiển này có thể cung cấp nguồn tài nguyên một cách hợp lý, đáp ứng được yêu cầu tài nguyên, thay đổi tùy theo các ứng dụng khác nhau trên các máy ảo trong hệ thống tài nguyên ảo, đảm bảo đạt được(SLO) Yazir đề xuất thuật toán cung cấp tài nguyên thích nghi cho hệ thống điện toán đám mây với chính sách dành quyền ưu tiên cho tác vụ đăng ký trước [53], dựa trên thông tin cập nhật nhu cầu công việc thực tế Thuật toán lập lịch theo danh sách thích nghi (List Scheduling Algorithm(LSA)) và thuật toán lập lịch thích nghi (Min-Min Adaptive Min-Min Scheduling (MMSA)) có thể sử dụng để lập lịch công việc cung cấp tài nguyên tĩnh cho các tác vụ Các thủ tục thích nghi trực tuyến được sử dụng
Trang 24nhằm cung cấp tài nguyên tĩnh có tính đến tính liên tục của tần suất
Việc cung cấp tài nguyên tự động dựa trên nền tảng phân tán máy chủ ảo hỗ trợ nhiều tiêu chí quyết định trong điện toán đám mây được trình bày trong các nghiên cứu [48] [53] Nghiên cứu của tác giả Yazir [53] có hai đóng góp quan trọng: Thứ nhất, cấu trúc quản lý tài nguyên phân tán gắn với các tác vụ độc lập Thứ hai, sử
dụng phương pháp Promethee, phương thức hỗ trợ dựa trên các tiêu chí đưa ra trước Dựa vào các tiêu chí này, nút tác tử (Node Agent (NA)) thực hiện cấu hình các máy
ảo thông qua kiểm tra phân tích các tiêu chí quyết định Cách tiếp cận này được cho
là khả thi, phù hợp với các trung tâm dữ liệu lớn, mang lại hiệu quả, tin cậy hơn so với phương pháp nghiên cứu khác trong hệ tập trung
Nút tác tử (NA) trong chu kỳ hoạt động thông qua các tác vụ trong 3 bước như sau: Bước 1 Cấp phát các máy ảo Virtual Machine (VM) trong máy vật lý Physical Machine (PM) phù hợp, kiểm tra các máy vật lý (PM) có đủ khả năng chạy máy ảo
VM và sau đó, giao máy ảo VM cho máy vật lý (PM)
Bước 2 Giám sát máy ảo (VM) sử dụng tài nguyên được cung cấp bởi các máy vật lý (PM)
Bước 3 Điều phối máy ảo (VM) Nếu ở máy vật lý cục bộ không đủ khả năng cung cấp, máy ảo VM sẽ di chuyển sang một máy vật lý PM khác trong cùng hệ thống
và tiến trình lặp lại, quay về bước 2
Trong [9], đưa ra cơ chế cung cấp tài nguyên ở lớp ứng dụng, thay vì ánh xạ các tài nguyên vật lý như nguồn tài nguyên ảo, nhằm cung phát tài nguyên tốt nhất trong môi trường điện toán đám mây Qiang đề xuất lược đồ cung cấp tài nguyên đa chiều
tự động và giải pháp giảm trách nhiệm cho nút tác tử (NA) để giúp cho người sử
dụng Mô hình cung cấp tài nguyên này áp dụng thuật toán Two-Stage để giải quyết các vấn đề hạn chế trong tính toán [9]
Các nghiên cứu [8] [9] [48] [53] xem tài nguyên và tiến trình làm việc theo kiểu một chiều và không sử dụng nguồn dữ liệu thực sự trong đám mây nhằm nâng cao tiện ích các nguồn tài nguyên ở trung tâm dữ liệu Trong [9], đề xuất thuật toán định tuyến phân tán đa chiều (Multicast Distributed Routing Algorithm (MDRA)), nhằm giải quyết vấn đề đa chiều trong cung cấp tài nguyên Phân tích các kết quả thử nghiệm cho thấy, thuật toán đề xuất MDRA cho phép tiết kiệm tài nguyên và tăng
Trang 25cường sử dụng tài nguyên cũng như chức năng các nút làm việc trung tâm Ngoài ra, các thuật toán đề xuất liên quan đến nút làm việc trung tâm còn cho phép tiết kiệm năng lượng, khi các nhu cầu của người sử dụng ngày càng tăng lên
Trong [42], đưa ra nhận định các nhà cung cấp điện toán đám mây vẫn chưa đảm bảo thời gian đáp ứng một cách thỏa đáng cho các ứng dụng Web, được lưu trữ trên đám mây, do mô hình mạng hiện tại có nhiều thay đổi, không thể dự đoán trước Một vấn đề khác nữa là cấu trúc đa lớp trong các ứng dụng Web rất phức tạp, vì thế luôn luôn tạo ra các điều kiện phức tạp và các vướng mắc, cần được giải quyết một cách
tự động, nên không thể đáp ứng được các yêu cầu, tuy là có thể giảm thiểu tắc nghẽn với điều kiện đưa thêm vào nhiều máy ảo trên đám mây Theo hướng nghiên cứu này, [8] tập trung chủ yếu vào việc kích hoạt đám mây, nhằm cung cấp nhiều lớp ứng dụng đảm bảo thời gian đáp ứng tối đa và giảm thiểu sử dụng tài nguyên Các thử nghiệm dựa trên đám mây Eucalyptus đã minh chứng việc phát hiện tắc nghẽn tự động và tăng độ phân giải cho ứng dụng web nhiều lớp lưu trữ trên đám mây sẽ giúp làm tăng khả năng Thỏa thuận Cấp độ dịch vụ (Service Level Agreement (SLA)), đồng thời đảm bảo thời gian đáp ứng
Trong [4], Mark Stillwell và cộng sự công bố nghiên cứu cung cấp dịch vụ hạ tầng dựa trên hệ thống điện toán đám mây mã nguồn mở, đề xuất một thuật toán lập lịch tối ưu trong cung cấp tài nguyên Ngoài ra, các tác giả cũng xem xét khả năng phân công các máy ảo một cách linh hoạt, cho phép sử dụng tối đa các nguồn tài nguyên vật lý Để đạt được điều này, họ đã đề xuất thuật toán, dựa trên cải tiến của thuật toán
di truyền, thực hiện chính sách lập lịch tự động Thuật toán di truyền tương tác Interactive Genetic Algorithm (IGA) cải tiến sử dụng các gen ngắn nhất và lựa chọn giải pháp cung cấp tối ưu hay gần tối ưu cho các yêu cầu tài nguyên máy ảo Các kết quả nghiên cứu mô phỏng cho thấy rằng chính sách lập lịch tự động tốt hơn so với kỹ thuật cung cấp hạ tầng tài nguyên đám mây Eucalyptus, Open nebula Về mặt thời gian thuật toán cải tiến (IGA) nhanh hơn gấp đôi so với thuật toán lập lịch di truyền Genetic Algorithm (GA) và mức độ linh động của các nguồn tài nguyên cao hơn so với dịch vụ hạ tầng đám mây mã nguồn mở [4]
Theo [7] [8], tỷ lệ khách hàng có nhu cầu cung cấp tài nguyên theo yêu cầu (service -on -demand) khá đáng kể Công nghệ ảo hóa cho phép thu lợi nhuận từ mô
Trang 26hình dịch vụ điện toán đám mây Công nghệ ảo hóa cho phép cung cấp tài nguyên một cách tự động từ các trung tâm dữ liệu, đáp ứng nhu cầu ứng dụng và hỗ trợ tính toán “ xanh” Để cải thiện, trong [7] sử dụng khái niệm độ lệch (skewness) đo sự tăng lên hoặc giảm xuống nhu cầu sử dụng tài nguyên đa chiều trên máy chủ Bằng cách giảm độ lệch, có thể kết hợp các công việc khác nhau và cải thiện hiệu suất tổng thể của tài nguyên máy chủ Tác giả [8] cũng đề xuất phát triển một hệ thống ngăn chặn tình trạng quá tải công việc một cách hiệu quả, tiết kiệm năng lượng sử dụng
Mô phỏng điều khiển và thử nghiệm minh chứng rằng thuật toán trong [7] đã cải thiện hiệu suất đáng kể
Nhằm nâng cao khả năng đáp ứng trong tương tranh cung cấp tài nguyên giữa nhiều người sử dụng trong môi trường điện toán đám mây, dựa trên ảo hóa các trung tâm dữ liệu quản lý tài nguyên Zhen Xiao và cộng sự [6] đã đề xuất mô hình chính sách cân bằng tải với cơ chế ưu tiên quản lý tài nguyên thông minh Xem rằng các hệ thống cung cấp tài nguyên vật lý hiện có là tài nguyên lõi và tiến hành quản lý các nguồn tài nguyên để cung cấp cho người sử dụng một cách hiệu quả thông qua chiến lược cạnh tranh Trong [6] sử dụng chiến lược xử lý tương tranh, dựa trên mức độ ưu tiên được gán một cách tự động cho các nguồn tài nguyên nhằm đạt được điều kiện cân bằng tải của các trung tâm dữ liệu
Tuy tiếp cận cung cấp tài nguyên dựa trên máy ảo có những lợi thế song vẫn nảy sinh những khó khăn, liên quan đến chi phí sử dụng bao gồm:
- Chi phí xác lập ảnh đĩa máy ảo
- Chi phí lưu vết phần mềm, phục hồi, di dời
1.1.3.2 Phương pháp dựa trên cụm máy ảo (Virtual cluster - based)
Trong thực tiễn khai thác, cụm máy ảo trong dịch vụ hạ tầng được áp dụng khá phổ biến Nền tảng Nimbus cho phép khả năng triển khai cụm máy ảo theo phương thức “one-click” đối với các cấu hình mạng và phần mềm khác nhau, mà không cần phải gắn ảnh đĩa máy ảo một cách thủ công mỗi khi triển khai một trạm mới
Việc sử dụng cụm máy ảo trong phương pháp cung cấp tài nguyên cũng là một kỹ thuật chính tại các trung tâm tính toán hiệu năng cao, chiếm hơn 80% các máy siêu tính toán có tốc độ nhanh nhất hiện nay, thiết theo các cụm Trung tâm xử lý và lưu trữ dữ liệu quy mô lớn chính là những hệ thống cụm máy ảo có tỉ lệ tiết kiệm chi phí
Trang 27phần cứng, điện năng, hệ thống làm mát và nhân viên ở mức cao Đây có thể xem là động lực mạnh mẽ trong việc sử dụng cụm máy ảo trong các ứng dụng quy mô lớn, với số lượng người sử dụng ngày càng tăng
Yêu cầu chia sẻ nguồn tài nguyên tương tranh giữa các ứng dụng, cũng thường gặp trong các hệ điều hành, hệ thống chia sẻ tài nguyên thời gian thực Hệ thống chia
sẻ thời gian thực đòi hỏi phải cấp phát tài nguyên cho các nhu cầu tương tranh một cách nhanh chóng Tuy nhiên đối với các hệ thống này thường không có thông tin về tổng khối lượng công việc dự kiến và thời gian dự kiến của tiến trình đang thực thi Điều này khác nhiều so với trong cụm máy ảo, khi các thực thể trong cụm máy ảo có nhu cầu chia sẻ tài nguyên trong thời gian vật lý không đồng đều nhau, thực tế người dùng chỉ cần sử dụng một phần trong cụm máy ảo tại một khoảng thời gian nhất định, theo nhu cầu riêng Môi trường tính toán hiệu năng cao truyền thống, cách tiếp cận phổ biến là sử dụng cơ chế “ lập lịch hàng loạt", cho phép các công việc trong hàng đợi được độc quyền truy cập đến tập hợp con nào đó trong hạ tầng tài nguyên trong khoảng thời gian xác định Trong dịch vụ lưu trữ đám mây và môi trường điện toán đám mây, tiếp cận này cho phép người sử dụng thuê tài nguyên ảo thay đổi theo nhu cầu Tuy nhiên có thể chia sẻ tài nguyên theo nhu cầu công việc tương tranh trở nên rất khó khăn, do các công việc có nhu cầu tài nguyên theo cách khác nhau (về số lượng các tài nguyên và thời gian cần sử dụng) Do vậy, hệ thống không thể đáp ứng đồng thời tất cả các công việc Vấn đề quan trọng là đưa ra được các phương pháp cung cấp tài nguyên, đáp ứng được tập con điều kiện tiên quyết yêu cầu về các nguồn tài nguyên được cung cấp (ví dụ, 10 nút vật lý, 20 cụm máy ảo) cho các công việc Quan trọng hơn nữa, trường hợp lập lịch hàng loạt, các tập con tài nguyên phải đảm bảo không được thay đổi trong suốt quá trình thực thi ứng dụng Đây là một yêu cầu
kỹ thuật rất chặt, tuy rằng hầu hết các ứng dụng không bao giờ sử dụng hết tất cả các nguồn tài nguyên được cung cấp trong các lần thuê Vì vậy, sẽ hữu ích hơn khi dựa vào cơ chế cho phép tăng khả năng cung cấp tài nguyên cho các ứng dụng theo dạng on-the-fly (loại bỏ và thêm vào nhiều cụm máy ảo trong quá trình thực thi) Trong thực tế, người sử dụng trong các ứng dụng thường không có nhu cầu thay đổi, không
có khả năng tự điều chỉnh, thiết lập lại các nhu cầu tài nguyên hạ tầng của họ, nên việc sử dụng mềm dẻo, hợp lý và tự động khó khả thi trong các ứng dụng thực tế
Trang 28Việc lập lịch cung cấp tài nguyên hàng loạt khó có thể thực hiện cơ chế tự động tăng hoặc giảm tài nguyên được cung cấp
Khi ứng dụng chỉ sử dụng 80% khả năng của vùng thuê trong cụm máy ảo, 20% của vùng sẽ bị dư thừa lãng phí Cách cấp phát tài nguyên này sẽ dẫn tới thiếu nguồn tài nguyên, làm cho các ứng dụng khác có thể bị từ chối truy cập tài nguyên, hoặc bị trì hoãn, mặc dù các tài nguyên ở cụm máy ảo vẫn không được sử dụng hết bởi các ứng dụng hiện đang thực thi Vấn đề nghiên cứu các giải pháp cung cấp tài nguyên tối ưu được giới chuyên môn quan tâm giải quyết nhằm tối ưu hóa hàm mục tiêu Tuy nhiên, bài toán tối ưu hàm mục tiêu cung cấp tài nguyên thường rất khó, trong một số trường hợp có thể chỉ ra là bài toán NP- khó, nên trong thực tế hầu như không thể đạt được tối ưu hàm mục tiêu
Trong [4] [2], tác giả Henri Casanova và đồng sự đã có một số đóng góp đáng chú
ý, đưa ra mô hình yêu cầu tài nguyên AND/OR và vấn đề di cư một cách linh hoạt của các máy ảo đối với các máy chủ vật lý phân tán Cách tiếp cận cho phép xử lý các công việc song song với một mô hình thuần nhất Tuy nhiên, phương pháp nghiên cứu này còn nhiều vấn đề cần phải nghiên cứu tiếp, đó là chi phí thời gian và phối hợp thực hiện trong nền tảng song song Một vấn đề khác là sử dụng bộ nhớ hiệu quả
do trong thực tế các ứng dụng trong cụm máy ảo thường sử dụng bộ nhớ với dung lượng rất lớn Do đó, dẫn đến chi phí sử dụng không gian lưu trữ bộ nhớ ngoài và bộ nhớ trong Trong cung cấp tài nguyên, đòi hỏi phải có sự linh hoạt trong yêu cầu tài nguyên Tuy nhiên, vấn đề linh hoạt không được thực hiện thành công trong các hệ thống cung cấp tài nguyên theo mô hình AND/OR
Trong nghiên cứu về phương pháp cung cấp tài nguyên dựa trên cụm, nhóm tác giả [45] cho rằng hai hạn chế của phương pháp cung cấp tài nguyên hiện nay thường liên quan đến vấn đề nâng cao hiệu quả và tối ưu hàm mục tiêu Điều này có thể được giải quyết đồng thời thông qua việc cung cấp tài nguyên phân đoạn và tự động kích hoạt máy ảo (VM) [45] Các ứng dụng máy ảo đang chạy theo nhu cầu tài nguyên của người sử dụng và cung cấp các tài nguyên tại các cụm tính toán có thể được cấu hình
tự động, bằng cách sử dụng hợp lý nguồn tài nguyên theo mô hình yêu cầu tài nguyên AND/OR và di chuyển VM đến các máy chủ vật lý khác phù hợp Hơn nữa, sự tiến
bộ vượt bật của công nghệ ảo hóa VM gần đây đã làm cho chi phí giảm xuống đáng
Trang 29kể Vì vậy, nó có thể sử dụng công nghệ ảo hóa này để cung cấp tài nguyên cho người
sử dụng, các nhà nghiên cứu cần quan tâm tới tối ưu sử dụng tài nguyên có ích, tăng hiệu suất và tiết kiệm năng lượng, cân bằng được tải trọng
Những đóng góp của tác giả Henri Casanova và đồng sự [45]:
- Thiết kế một giải pháp về cung cấp tài nguyên tổng quát dựa trên một số giả định
về nền tảng, khối lượng công việc và các công nghệ VM -based
- Khái quát lại một số vấn đề phức tạp trong cung cấp tài nguyên và đề xuất các thuật toán để giải quyết nó
- Đánh giá được các thuật toán đề xuất trong môi trường mô phỏng thực nghiệm Thuật toán này được minh chứng là nhanh và hiệu quả cung cấp tài nguyên so với các thuật toán trước đây
1.2 Gi ải pháp kỹ thuật cung cấp tài nguyên thông tin trong hệ thống máy chủ
ảo của Điện toán Đám mây
Trong những năm gần đây, mô hình đa Server với tư cách là mô hình cơ sở cho hàng loạt các công nghệ lớn như Điện toán Đám mây (Cloud Computing), tính toán lưới (Grid Computing), trong môi trường TCP/IP được các nhà chuyên môn quan tâm nghiên cứu và công bố kết quả trong các tài liệu [74]
Hình 1.5 Mô hình đa server đa tầng, lồng nhau
Ở đây, n Servers đa cấp theo kiểu phân tầng, lồng nhau được mắc nối nhờ hệ
thống viễn thông hình thành nên một cấu trúc đa Servers lôgic Cấu trúc này cho phép đáp ứng nhu cầu hiện đại và làm tăng khả năng, nâng cao hiệu suất khai thác ứng
dụng cho toàn hệ
Trang 30Trong công nghệ Điện toán Đám mây, hệ đa Servers với vai trò quan trọng trong việc hình thành hệ thống máy chủ ảo, cơ sở không thể thiếu được cho các hệ điều khiển và các hệ khai thác - ứng dụng như Google AppEngine, Azure [74]
Hệ gốc trong cấu trúc Điện toán Đám mây là một mạng máy tính nơi mà chuyển đổi trao đổi thông tin với những nơi khác bằng cách gửi thông điệp Một trạm bao
gồm các công việc như sau: điện toán, phương tiện lưu trữ, giao diện người sử dụng
và mạng truyền thông Động lực chính thúc đẩy sử dụng hệ gốc là khả năng chia sẻ tài nguyên – tiến trình có thể yêu cầu và khôi phục lại tài nguyên tại một nơi không
biết trước; tiến trình có thể yêu cầu tài nguyên trong những vùng điều khiển khác nhau
Đối với tài nguyên thông tin bao gồm hệ thống các chương trình và số liệu, một yêu cầu quan trọng mang tính chất sống còn của hệ là phải đảm bảo sự gắn kết (Coherence of Data) của dữ liệu trong hệ nhiều máy chủ
Vấn đề gắn bó dữ liệu trong các hệ thống phân tán và gắn bó dữ liệu trong
những ứng dụng trực tuyến trên Internet đã trở thành một lĩnh vực thu hút nhiều sự quan tâm của các nhà nghiên cứu lý thuyết lẫn các nhà sản xuất phần mềm nhằm tìm
ra các giải pháp hữu hiệu đảm bảo tính gắn bó thông tin trong các cơ sở dữ liệu truy
cập ngẫu nhiên với số lượng truy cập lớn [5]
Bài toán đảm bảo gắn bó dữ liệu trong các hệ thống thông tin lớn, đa truy cập, được triển khai trên hệ thống gồm nhiều Server kết nối với nhau qua đường truyền
viễn thông, trên mỗi Server được cài các chương trình quản lý và các cơ sở dữ liệu
của hệ thống Việc truy cập tài nguyên đảm bảo gắn bó dữ liệu trong môi trường phân tán và những ứng dụng trực tuyến trên Internet trong điều kiện lý tưởng không có bất
kỳ sự cố nào đã được áp dụng và mang lại những hiệu quả kinh tế nhất định Tuy nhiên, trong tiến trình triển khai và vận hành vấn đề gắn bó dữ liệu trong các cơ sở
dữ liệu khi hệ thống bị sự cố đang đặt ra như là vấn đề quan trọng và có ý nghĩa sống còn trong việc phát triển toàn hệ nói chung
Trang 31
CHƯƠNG 2 MÔ HÌNH CUNG CẤP TÀI NGUYÊN M
VM-OUT-OF-N PM
2.1 Mô hình hóa tài nguyên điện toán
Một khái niệm cung cấp tài nguyên cơ bản nhất trong thời gian gần đây là hợp đồng Hợp đồng là một sự thỏa thuận giữa nhà cung cấp tài nguyên và người thuê tài nguyên tuân theo các đặc tả từ phía người dùng Mặc dù khái niệm cho thuê đã được
sử dụng trong các hệ thống máy tính, đặc biệt là trong các hệ thống mạng máy tính, nhưng vẫn không có một định nghĩa thống nhất nào về “hợp đồng”
Do đó, trong mục này chúng tôi sẽ cung cấp một định nghĩa mang tính khoa học
hơn về một hợp đồng dựa vào tài liệu tham khảo của một số tác giả [2,10] Vì những tài nguyên được sử dụng trong hướng nghiên cứu của chúng tôi là tài nguyên điện toán, nên chúng tôi sẽ bắt đầu bằng cách định nghĩa tài nguyên nào được cho thuê và
sẽ cung cấp mô hình tài nguyên chính thức và các bước tiếp theo, sẽ định nghĩa những
loại hợp đồng và điều lệ của hợp đồng
2.1.1 Mô hình tài nguyên
Tập hợp các máy tính vật lý khả dụng, trong một site gọi là P Mỗi máy đơn 𝑥𝑥 ∈
P có một tập hợp tài nguyên và thuộc tính đặc trưng: resources và attributes Các tài nguyên của một máy đơn có thể được cấp phát cho 1 hoặc một vài hợp đồng Tập hợp các loại tài nguyên trong một site được gọi là tập TR (ví dụ: TR = {cpu, ram, disk,
…}) Một số lượng xác định tài nguyên ký hiệu bằng r sẽ có các trường sau:
- type[r] ∈ TR: kiểu tài nguyên
- n[r] ∈ 𝑵𝑵 : là giá trị số lượng các trường hợp (instance) của tài nguyên Một số tài nguyên có thể xuất hiện nhiều lần trong một máy đơn, ví dụ một máy đơn chỉ có
1 bộ như nhưng có thể có nhiều CPU Thay vì mô hình mỗi CPU là 1 tài nguyên riêng
biệt, ta coi như đó là một tài nguyên duy nhất với nhiều trường hợp
- Số lượng tài nguyên trong mỗi trường hợp, q1[r], q2[r], …, qn[r] Mỗi số lượng
là một số nguyên dương Khi n[r] = 1, số lượng được ký hiệu là q[r]
Trang 32Tập hợp các loại đặc tính trong một site được gọi là TA (ví dụ, TA={arch,vmm,
…}) Miền xác định của một thuộc tính kiểu Ta được định nghĩa là Dom(ta) (ví dụ, Dom(arch) = {x86, x64, x32, …}) Một thuộc tính có những trường sau đây:
- type[a] ∈ TA, kiểu của thuộc tính
- value[a] ∈ Dom(type[a]), giá trị của thuộc tính
Tập hợp tất cả tài nguyên khả dụng gọi là R, tập hợp các thuộc tính gọi là A
Mỗi máy đơn 𝑥𝑥 ∈ P được định nghĩa với những trường sau đây:
- res[𝑥𝑥] ∁ R, tập hợp các tài nguyên thuộc máy đơn 𝑥𝑥 Không thể có nhiều hơn một tài nguyên cùng lại trên một máy đơn ( ∀𝑞𝑞 ∈ 𝑟𝑟𝑟𝑟𝑟𝑟[𝑥𝑥], ∀𝑟𝑟 ∈𝑟𝑟𝑟𝑟𝑟𝑟[𝑥𝑥] 𝑞𝑞 ≠ 𝑟𝑟 → 𝑡𝑡𝑡𝑡𝑡𝑡𝑟𝑟[𝑞𝑞] ≠ 𝑡𝑡𝑡𝑡𝑡𝑡𝑟𝑟[𝑟𝑟])
- attr[𝑥𝑥] ∁ A, tập hợp các thuộc tính của máy đơn x Tương tự, không thể có nhiều hơn một thuộc tính cùng loại trên cùng một máy đơn ( ∀𝑞𝑞 ∈𝑎𝑎𝑡𝑡𝑡𝑡[𝑥𝑥], ∀𝑟𝑟 ∈ 𝑎𝑎𝑡𝑡𝑡𝑡[𝑥𝑥] 𝑞𝑞 ≠ 𝑟𝑟 → 𝑡𝑡𝑡𝑡𝑡𝑡𝑟𝑟[𝑞𝑞] ≠ 𝑡𝑡𝑡𝑡𝑡𝑡𝑟𝑟[𝑟𝑟])
Chúng ta giả thiết rằng một site có các tài nguyên đồng bộ, mỗi máy đơn có p CPU, m MB bộ nhớ, d MB bộ nhớ ngoài, bi MB/s và bo MB/s băng thông mạng vào
và ra Site này được định nghĩa như sau:
- TR={proc, mem, disk, net-in, net-out}
- Agreement (Sự thỏa thuận): là một sự dàn xếp giữa các bên dựa theo lợi ích
của mỗi bên Trong ngữ cảnh đề tài này, chỉ có hai bên được nhắc tới – nhà
Trang 33cung cấp tài nguyên và khách hàng sử dụng tài nguyên, - và lợi ích là sự truy
cập vào tài nguyên điện toán
- Terms (Điều lệ): Sự đặc tả tài nguyên do nhà cung cấp cấp cho khách hàng
Những điều lệ đặc tả hợp đồng dùng trong đề tài này sẽ được trình bày sau
- Negotiable agreement (Sự thỏa thuận được thương lượng): Là một tập các điều lệ mà khách hàng phải đề xuất trước tiên cho nhà cung cấp tài nguyên
Lần lượt, nhà cung cấp có thể chấp nhận, từ chối hoặc gởi lại một tập các điều lệ thay thế sẵn sàng chấp nhận cho phía khách hàng Nếu nhà cung cấp tài nguyên chấp nhận các điều lệ ở trên do khách hàng đề ra hoặc nếu như khách hàng chấp nhận các điều lệ thay thế từ phía nhà cung cấp thì sự thỏa thuận được lập ra
- Renegotiable agreement (Sự thỏa thuận có thể thương lượng): Là một sự
thỏa thuận gồm các điều lệ mà khi được cả hai bên khách hàng và nhà cung
cấp chấp thuận, phía người dùng vẫn có thể yêu cầu những điều lệ thay thế
mà không cần tạo ra một sự thỏa thuận mới Nhà cung cấp tài nguyên có thể
chấp nhận hoặc từ chối các điều lệ mới đó
Điều lệ hợp đồng bao gồm những tài nguyên phần cứng do nhà cung cấp yêu cầu khách hàng như số CPUs, bộ nhớ và băng thông mạng; một môi trường phần mềm
yêu cầu trên tài nguyên được thuê; và thời gian khả dụng tức là khi tài nguyên phần
cứng và phần mềm yêu cầu phải sẵn sàng Các điều lệ của hợp đồng l được đặc tả
thông qua các trường sau:
- nodes[𝑙𝑙], một tập các máy đơn được yêu cầu bởi người dùng Tương tự như các máy đơn trong P, mỗi máy đơn 𝑥𝑥 ∈ nodes[𝑙𝑙] có các trường sau:
- res[𝑥𝑥] 𝐶𝐶 R, tập hợp các tài nguyên thuộc máy đơn 𝑥𝑥 Không thể có nhiều hơn
một tài nguyên cùng loại trên một máy đơn (⋂𝑟𝑟∈𝑟𝑟𝑟𝑟𝑟𝑟[𝑥𝑥]𝑡𝑡𝑡𝑡𝑡𝑡𝑟𝑟[𝑟𝑟]= ∅)
- attr[𝑥𝑥] 𝐶𝐶 A, tập hợp các thuộc tính của máy đơn 𝑥𝑥 Tương tự, không thể có nhiều hơn một thuộc tính cùng loại trên cùng một máy đơn (⋂𝑎𝑎∈𝑎𝑎𝑎𝑎𝑎𝑎𝑟𝑟[𝑥𝑥]𝑡𝑡𝑡𝑡𝑡𝑡𝑟𝑟[𝑎𝑎]= ∅)
- reqstart[𝑙𝑙], thời gian bắt đầu Trường này có thể là một thời điểm cụ thể t, xác định rằng tài nguyên phải được sẵn sàng trước thời điểm t, hoặc có thể là một
Trang 34giá trị không xác định, nghĩa là nhà cung cấp tài nguyên có thể thiết lập thời gian bắt đầu bất kỳ
- reqduration[𝑙𝑙] ∈ ℕ, khoảng thời gian chạy của yêu cầu thuê tài nguyên, tính
- user[𝑙𝑙], người sử dụng tài nguyên
- preemtible[𝑙𝑙] ∈ {true, false}, xác định tài nguyên được thuê có thể bị tạm chiếm hay không Khi một hợp đồng bị tạm chiếm, các tài nguyên đã được
cấp phát trước đó sẽ bị giải phóng cho một hợp đồng khác và được cấp phát
lại sau đó, giữ nguyên trạng thái ban đầu
- software[𝑙𝑙], môi trường phần mềm Trong đề tài này, môi trường phần mềm được đặc tả dưới dạng một tập tin với toàn bộ nội dung trong một đĩa, hoặc
là ảnh đĩa Một ảnh đĩa img có trường size[img] lưu trữ số byte của tập tin Trong trường hợp khách hàng có nhu cầu nâng cao khả năng dự trữ điện toán nhưng môi trường phần mềm chưa bít được thì trường này có thể để ở trạng thái chưa xác định khi hợp đồng yêu cầu
Những khái niệm đã được trình bày ở trên đã thể hiện các thông số về phần cứng,
phần mềm và tính khả dụng của một hợp đồng Một khách hàng muốn yêu cầu thuê tài nguyên phải đặc tả tất cả các giá trị này cho nhà cung cấp Tuy nhiên, một hợp
đồng l còn có những trường phụ thêm khác chứa thông tin cần thiết cho trình lập lịch
- state[l]: trạng thái của hợp đồng
- submisssion[l]: thời điểm khách hàng đưa ra yêu cầu
- actual_start[l]: thời điểm hợp đồng bắt đầu được xử lý
- eslapsed_duration[l]: khoảng thời gian tính bằng giây mà hợp đồng được
xử lý Thông số này thể hiện tổng thời gian khả dụng của tài nguyên
- end[l]: thời gian kết thúc hợp đồng
- Dựa trên những điều khoản hợp đồng đưa ra bởi khách hàng, nhà cung cấp
sẽ tiến hành xác định tài nguyên ở máy P tương ứng Một hợp đồng có thể
Trang 35bao gồm nhiều tài nguyên được cấp phát ở những thời điểm khác nhau
Thông số cấp phát tài nguyên của hợp đồng allocations[l] gồm có nhiều lần cấp phát nhỏ alloc với các thông số sau:
- start[alloc]: thời điểm bắt đầu cấp phát
- end[alloc]: thời điểm kết thúc cấp phát
- res[alloc] : tập tài nguyên (x, r1, r2, …) với x ϵ P và r i ϵ R, biểu diễn những
tài nguyên có mặt trong 1 lần cấp phát
Không giống như các trạng thái của tiến trình trong hệ điều hành Trước khi một
hợp đồng được đệ trình lên nhà cung cấp tài nguyên, nó ở trạng thái New Sau khi đã
đệ trình, hợp đồng sẽ nhận 1 trong hai trạng thái: Pending (nếu được chấp nhận, nhà
cung cấp tài nguyên đồng ý với mọi điều khoản của hợp đồng) hoặc (Rejected) nếu
bị từ chối Ở trạng thái Pending, hợp đồng sẽ chờ để được lập lịch và bước vào trạng thái Scheduled Khi tài nguyên của hợp đồng được đáp ứng cho người dùng, hợp đồng chuyển sang trạng thái Active Trước đó, có thể một hợp đồng sẽ phải đứng chờ ở
trạng thái Preparing nếu trình lập lịch phải mất thời gian chuẩn bị tài nguyên cho nó
Nếu tài nguyên của hợp đồng bị tạm chiếm để nhường cho hợp đồng khác, hợp đồng
sẽ ở trạng thái Suspending trong quá trình bị ngưng và toàn bộ thông tin của nó sẽ
được lưu lại Một hợp đồng trong quá trình bị tạm treo có thể được di chuyển qua một
máy khác để tiếp tục chạy (trạng thái Migrating) Trước khi trở về trạng thái Active,
trình lập lịch sẽ chuyển hợp đồng về trạng thái Resuming để đợi các thao tác cấp phát
lại tài nguyên Trạng thái Done là trạng thái cuối cùng trong vòng đời của một hợp
đồng, khi nó đã được hoàn thành
2.2 Mô hình cung c ấp tài nguyên P – OUT – OF – Q
Tính toán ảo hóa được tạo ra từ các trung tâm dữ liệu cho phép người sử dụng truy cập và triển khai các ứng dụng ở bất kỳ vị trí nào Tuy nhiên, với một chi phí cạnh tranh thì nó vẫn đảm bảo được chất lượng yêu cầu của dịch vụ (QoS) Những yêu cầu này có thể khác nhau vì phụ thuộc vào các ứng dụng của người dùng Nhiều ứng dụng đang nổi lên như lưu trữ web, phương tiện xử lý dữ liệu thời gian thực, mạng xã hội Ví dụ trong các ứng dụng web, các bản sao nhiều dịch vụ, chẳng hạn như công cụ tìm kiếm web xâm nhập vào các trung tâm dữ liệu khác nhau trên toàn
Trang 36thế giới để đối phó với tỷ lệ ngày một tăng lên của các yêu cầu dịch vụ từ người sử dụng
Trung tâm dữ liệu thường được cài đặt với hàng trăm máy chủ vật lý Với tài nguyên vật lý của máy chủ chủ yếu là: đĩa lưu trữ, bộ nhớ, CPU…Ngoài ra còn có các nguồn tài nguyên khác cũng có thể được xem xét như các ứng dụng, các gói phần
mềm và cơ sở dữ liệu, hệ điều hành Việc tạo lập các chính sách, lập lịch các nhu cầu
dựa vào các hợp đồng của người sử dụng phụ thuộc rất nhiều vào khả năng CPU, ỗ đĩa lưu trữ, RAM của server vật lý Trong thực tế, tùy thuộc vào các loại hợp đồng thuê tài nguyên từ phía người sử dụng, hợp đồng chạy nền không có thời hạn, hợp đồng chạy nền có thời hạn, hợp đồng đặt chỗ, hợp đồng tức thời Ngoài ra một số nhóm còn áp dụng giải pháp dùng máy ảo để tạo cụm máy chủ ảo tại đỉnh cơ sở hạ
tầng hiện hành Tuy nhiên cụm máy chủ ảo cũng chỉ là một ứng dụng của tài nguyên
mà người dùng có thể tác động đến máy ảo.Trong lĩnh vực lưu trữ của các máy chủ, các trung tâm dữ liệu gồm những tài nguyên ảo đã trở thành sự lựa chọn phổ biến
thời gian gần đây
Tại các trung tâm dữ liệu, các máy chủ ảo được tạo ra và bị cô lập sau khi trừu tượng hóa các máy chủ vật lý để cho phép triển khai dịch vụ ảo hóa Tuy nhiên, khả năng khắc phục vấn đề thiếu thốn tài nguyên và giảm độ trễ cho phép trên nền đám mây và khả năng cải thiện hiệu suất mạng, các máy chủ ảo được yêu cầu của các nhóm người sử dụng phải được tạo ra ở trung tâm dữ liệu thích hợp Nhiều người cũng đồng tình với quan điểm sự chậm trễ trong các mạng có thể gây ra dao động dòng chảy và trong trường hợp xấu nhất, nó sẽ gây ra sự mất ổn định của mạng trong
thời gian sắp tới Hiện nay, trong bối cảnh của chúng ta về điện toán đám mây, độ trễ
giảm thiểu đã được điều tra bởi các dự án của Google Ví dụ trong nghiên cứu của hãng Google đã nghiên cứu các giao thức SPDY thay thế cố gắng để giảm độ trễ của các trạm cung cấp tài nguyên
Vì vậy, việc lựa chọn các trung tâm dữ liệu thuận tiện sẽ tạo ra tất cả các máy chủ
ảo cần thiết hoặc trong các điều khoản khác bố trí các máy chủ ảo cho các trung tâm
dữ liệu thích hợp Chính vì thế, nó đã tạo thành một thách thức lớn trong điện toán đám mây Tùy thuộc vào ứng dụng, phân tán các máy chủ ảo dựa trên một tiêu chí tối
Trang 37ưu hóa để làm yếu tố quyết định như Round-Trip-Times (RTTs) giữa người dùng và các trung tâm dữ liệu hoặc khối lượng công việc yêu cầu trong các máy chủ ảo
Một mặt, RTT không chỉ phụ thuộc vào khoảng cách vật lý từ phía người dùng
với trung tâm dữ liệu mà còn phụ thuộc vào sự bố trí hợp lý các liên kết ảo và sử dụng
hiệu quả các thuật toán dẫn đường Thời gian trễ trọn vòng RTTs (delay) có thể được ước tính bằng cách sử dụng cơ sở dữ liệu định vị IP hoặc thông qua các phép đo
mạng Mặt khác, khối lượng công việc được yêu cầu tương ứng ở đây để chia sẻ các nguồn tài nguyên vật lý xác định như là một số lõi xử lý hoặc một số lệnh trong một giây dành cho người sử dụng để chạy các ứng dụng của nó trên một máy chủ ảo Chúng ta cũng có thể dựa trên yêu cầu tài nguyên có thể phân thành nhiều loại mô hình cung cấp tài nguyên như các mô hình Single-Resource, mô hình AND, mô hình
OR, mô hình P out-of Q Trong mô hình Pi – out – of Qi, tiến trình yêu cầu Pi tài nguyên trong Qi chúng ta phải đặt trước để thực hiện điều này Một tiến trình yêu cầu tài nguyên thực hiện như một vị trí liên quan đến các nguồn tài nguyên yêu cầu và thuộc tính logic như trong mô hình AND và OR Đối với mô hình AND và OR có thể xem là trường hợp đặc biệt của P out – of Q, vì thế mô hình P out – of Q cũng được
gọi là mô hình tổng quát nhất Các mô hình yêu cầu tổng quát dạng này là khá phổ
biến trong nhiều lĩnh vực bao gồm cả quản lý tài nguyên phân tán, hệ điều hành, các
tiến trình giao tiếp tuần tự Phát hiện bế tắc trong mô hình tổng quát còn được gọi là
bế tắc tổng quát Điều kiện để phát hiện được khi có sự tồn tại của chu kỳ hoặc nút
thắt trong đồ thị WFG là không đủ để xác định một bế tắc trong mô hình tổng quát,
vì thế rất khó khăn để phát hiện cũng như giải quyết hơn so với mô hình AND và OR
Do đó, hầu như rất ít nhà nghiên cứu đề xuất thuật toán phát hiện và thuật toán giải quyết theo dạng bế tắc tổng quát Các thuật toán đã được đề xuất trong công báo ở tài
liệu tham khảo họ đã sử dụng các kỹ thuật phân cụm khuếch tán trong đó một tiến trình được gọi là khởi tạo gửi thông báo và một tiến trình thu thập các báo cáo trả lời [27, 28] Tiến trình khởi tạo dừng thực hiện một khi tất cả các tiến trình trong các
cạnh thiết lập của đồ thị đã trở thành nhàn rỗi và đang đợi các tiến trình khác Sau đó,
nó quyết định sự tồn tại của bế tắc dựa trên các thông tin trong báo cáo trả lời Các thuật toán phát hiện bế tắc tổng quát được nhóm lại thành hai loại cụ thể: tập trung
và phân tán các thuật toán phát hiện dựa trên sự tồn tại của WFG Trong đó, các thuật
Trang 38toán tập trung, tiến trình khởi tạo tập hợp các thông tin lại để xác định sự tồn tại của
bế tắc, trong khi thuật toán phân tán thông tin được lan truyền trên nhiều trạm
2.3 Mô hình cung cấp tài nguyên tối ưu M VM - OUT - OF - N PM
Dựa trên mô hình cung cấp tài nguyên phân tán P-out-of-Q [27, 28], chúng tôi đề
xuất mô hình cung cấp tài nguyên cho các máy chủ ảo từ các máy chủ vật lý phân tán
M VM – out – of – N PM Hình 6 mô hình cung c ấp tài nguyên M VM – out – of –
N PM
Hình 2.1 Mô hình cung cấp tài nguyên M VM – out – of – N PM
Trong hình 6 ký hiệu VM là máy ảo, PM là máy vật lý, M là số lượng số nguyên
máy ảo được cung cấp từ N là số lượng máy chủ vật lý phân tán Tài nguyên của máy
vật lý cung cấp cho máy ảo bao gồm: CPU; RAM; HDD được phân chia logic cho các máy ảo VM sử dụng Thông qua môi trường truyền thông bằng cách gửi các thông
điệp yêu cầu, thông điệp đáp ứng yêu cầu Cung cấp tài nguyên được xác định theo công thức như sau:
E là tổng số tài nguyên của CPU, CPU
A là số tài nguyên chưa được
∑∑ là tài nguyên CPU đang bị n tiến trình khác chiếm giữ (đã được
c ấp phát) Từ công thức (1) ta có thể thấy rằng tài nguyên của N máy vật lý phân tán
được biểu diễn theo công thức như sau:
Trang 39N: số lượng các máy chủ vật lý phân tán
CijCPU: là tài nguyên CPU đang bị n tiến trình khác chiếm giữ
E: tổng các nguồn tài nguyên CPU từ các máy chủ vật lý phân tán
Bây giờ chúng tiến hành xây dựng hàm tối ưu trong cung cấp tài nguyên cho mô
hình M VM – out – of – N PM Hàm m ục tiêu F t xác định chất lượng đáp ứng yêu
cầu, tương ứng với độ ưu tiên tĩnh của các yêu cầu tài nguyên tạo máy ảo
1
(3)
M it
it t
t
M N
đề xuất thuật toán ngăn chặn bế tắc sử dụng hai pha giao dịch dựa trên đồ thị tranh
chấp WFG, đồ thị này được biểu diễn thông qua các tiến trình yêu cầu tài nguyên và
tiến trình cấp phát tài nguyên trong hệ thống các máy chủ vật lý phân tán Thuật toán được trình bày ở mục 4, ý tưởng của thuật toán là ngăn sự hình thành chu trình trong
đồ thị tranh chấp, nếu không phát hiện hình thành chu trình, thì tiến hành gửi các thông điệp phản hồi cho các tiến trình yêu cầu, luôn cập nhật lại tài nguyên tại các
trạm để phát hiện các trạm nào có khả năng đáp ứng được yêu cầu tại thời điểm t Ngoài ra, gửi các thông điệp thu hồi tài nguyên cho các tiến trình đã được cấp phát khi hết nhu cầu sử dụng Với giải pháp đề xuất đã thỏa được các ràng buộc của hàm
mục tiêu, đưa đến hàm mục tiêu được tối ưu
Trang 40Các tiến trình phân tán phụ thuộc lẫn nhau được mô tả như một đồ thị có hướng được
biết đến như đồ thị Wait – For - Graph (WFG) [27,28] Trong đồ thị WFG này, một nút đại diện cho một tiến trình và cạnh đại diện cho mối quan hệ Wait – For giữa các
tiến trình Các thuật toán phát hiện bế tắc tổng quát được nhóm lại thành hai loại cụ
thể: tập trung và phân tán các thuật toán phát hiện dựa trên sự tồn tại của WFG Trong
đó, các thuật toán tập trung, tiến trình khởi tạo tập hợp các thông tin lại để xác định
sự tồn tại của bế tắc, trong khi thuật toán phân tán thông tin được lan truyền trên nhiều
trạm
Thuật toán Kshemkalyani-Singhal [27, 28] được dùng để phát hiện bế tắc trong
mô hình P-out-of-Q dựa trên phương pháp tiếp cận phát hiện trạng thái chung Thuật toán Kshemkalyani-Singhal [27, 28] chia thành các phare giao dịch, trong đó bao
gồm một tiến trình quét thông điệp ra bên ngoài từ một quá trình khởi tạo và một pha trong tiến trình quét các thông điệp vào trong tiến trình khởi tạo Trong đồ thị WFG luôn tồn tại sự đối lập trong đó tất cả các thông báo được gửi theo hướng của các cạnh WFG (quét ra ngoài) hoặc tất cả các thông báo được gửi ngược lại với hướng của các
cạnh WFG (quét vào trong) Trong pha quét ra ngoài, các thuật toán ghi lại hình ảnh
của một đồ thị WFG phân tán Trong pha quét vào trong, các đồ thị WFG phân tán được ghi lại là một đồ thị WFG đã được cắt giảm để xác định xem node khởi tạo bị
bế tắc Cả hai pha quét ra ngoài và vào trong được thực hiện đồng thời trong thuật toán Sự phức tạp đã xảy ra vì hai pha quét có thể chồng chéo lên nhau trong cùng
một thời gian của tiến trình, nghĩa là đồ thị WFG giảm tại một tiến trình có thể bắt đầu trước khi đồ thị WFG được tiến trình ghi lại hoàn toàn Thuật toán có độ phức
tạp của các thông điệp gửi là 4e - 2n + 2l và độ trễ thời gian là 2d, trong đó e là số
cạnh, n số nút, l số nút lá, và d đường kính của đồ thị WFG
Ví dụ: Trong hình 7 ở dưới nút A sẽ gửi ra thông điệp FLOOD đến các nút B và
C Khi nút C nhận được FLOOD từ nút A, nó sẽ gửi FLOOD đến các nút D, E, và F
Nếu node hành động để được Active khi nhận được một thông báo FLOOD, nó bắt đầu giảm trở vào bên trong cạnh Wait-For bằng cách gửi trả lại một thông báo ECHO vào nó Ví dụ, trong hình 7, nút H trả về một ECHO tới nút D để đáp ứng với FLOOD
từ nó Ví dụ, nút F trong hình 7 bắt đầu giảm sau khi nhận được một FLOOD từ C ngay cả trước khi nó đã nhận được FLOOD từ D và E Lưu ý rằng khi một nút nhận