1. Trang chủ
  2. » Luận Văn - Báo Cáo

Bài toán workflow scheduling trong môi trƣờng điện toán đám mây

16 360 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Bài toán workflow scheduling trong môi trường điện toán đám mây
Tác giả Kiều Tuấn Dũng
Người hướng dẫn TS. Phạm Ngọc Hùng
Trường học Trường Đại học Công nghệ
Chuyên ngành Công nghệ phần mềm
Thể loại Luận văn
Năm xuất bản 2012
Thành phố Hà Nội
Định dạng
Số trang 16
Dung lượng 461,64 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Bài toán workflow scheduling trong môi trƣờng điện toán đám mây

Trang 1

Bài toán workflow scheduling trong môi trường

điện toán đám mây

Kiều Tuấn Dũng

Trường Đại học Công nghệ Chuyên ngành: Công nghệ phần mềm; Mã số: 60 48 10 Cán bộ hướng dẫn khoa học: TS Phạm Ngọc Hùng

Năm bảo vệ: 2012

Abstract Tổng quan về điện toán đám mây, các khái niệm và sự cần thiết của việc thực thi

workflow trong môi trường điện toán đám mây Trình bày các khái niệm về phương pháp tối

ưu bày đàn PSO và cách xây dựng giải thuật PSO để giải quyết các bài toán tối ưu Giải thuật lập lịch sử Heuristic dựa tối ưu bầy đàn đề xuất: bài toán lập lịch ứng dụng luồng công việc;

xử lý các dữ liệu bài toán dùng giải thuật PSO; giải thuật Heuristic dựa PSO Cài đặt, quá trình tiến hành và bảng số liệu thử nghiệm cùng với những phân tích Đưa ra kết quả đã đạt được và nêu những dự định nghiên cứu tiếp theo

Keywords: Công nghệ phầm mềm; Bài toán; Điện toán đám mây

Content

TÓM TẮT

Đối với các công ty hay doanh nghiệp, việc quản lý dữ liệu và xử lý các bài toán sao cho hiệu quả là một trong những bài toán ưu tiên hàng đầu Muốn vậy các doanh nghiệp phải đầu tư tính toán rất nhiều loại chi phí khác nhau như: phần cứng, phần mềm, mạng, chi phí bảo trì, sửa chữa, nâng cấp, quản lý, kiểm soát bảo mật … Mô hình điện toán đám mây (Cloud Computing) đáp ứng được các yêu cầu đặt ra và đang được các công ty, doanh nghiệp hướng đến Sử dụng mô hình này, các công ty, doanh nghiệp chỉ cần trả phí cho những ứng dụng luồng công việc (workflow) mà họ dùng (loại công việc đòi hỏi nhiều công đoạn xử lý theo trình tự định trước) mà không cần đầu tư nhiều vào cơ sở hạ tầng, cũng như quan tâm nhiều đến công nghệ Tuy nhiên, nhiều vấn đề của hệ thống

xử lý đám mây xuất hiện như: làm sao để sử dụng một cách hiệu quả những tài nguyên phân tán hiện có, giảm thiểu chi phí tính toán và truyền thông … Từ đó bài toán lập lịch cho các ứng dụng workflow được đặt ra và đó là nội dung hướng tới của đề tài

Luận văn này sẽ tập trung vào biểu diễn một giải thuật heuristic dựa vào giải thuật tối ưu bầy đàn (Particle Swarm Optimization – PSO) để lập lịch các ứng dụng cho các tài nguyên đám mây mà

Trang 2

ứng dụng luồng công việc trên môi trường mô phỏng CloudSim bằng cách thay đổi chi phí tính toán

và truyền thông

Luận văn đã so sánh chi phí tiết kiệm khi sử dụng giải thuật PSO với hai giải thuật Random và RoundRobin đã có Kết quả luận văn đã chỉ ra rằng PSO đạt được tiết kiệm chi phí rất hiệu quả so với Random và RoundRobin

Bằng cách thử nghiệm trên môi trường mô phỏng CloudSim và kiểm chứng được hiệu quả của giải thuật PSO trong vấn đề tiết kiệm chi phí hiệu quả khi thực thi các ứng dụng workflow trong môi trường điện toán đám mây, luận văn hi vọng sẽ đem lại một kết quả có ý nghĩa trong thực tiễn,

là hướng nghiên cứu trong các ứng dụng thực tế để xử lý hiệu quả bài toán tiết kiệm chi phí trong các doanh nghiệp

I GIỚITHIỆU

Mô hình hợp tác ở nhiều thử nghiệm khoa học trong nhiều lĩnh vực như sinh học cấu trúc, vật

lý năng lượng cao, khoa học thần kinh liên quan đến việc sử dụng các nguồn dữ liệu phân tán Kết quả, việc phân tích các tập dữ liệu này được biểu diễn và cấu trúc hóa như là các luồng công việc (workflow) khoa học Những luồng công việc khoa học này thường cần phải xử lý lượng dữ liệu rất lớn và các hoạt động tính toán chuyên sâu, Hệ thống quản lý luồng công việc khoa học được sử dụng để quản lý những thử nghiệm khoa học này bằng cách che giấu các chi tiết khi thực thi luồng công việc trên các tài nguyên phân tán được cung cấp bởi các nhà cung cấp dịch vụ đám mây Điện toán đám mây (cloud computing) là một mô hình mới cho tính toán phân tán mà cung cấp

hạ tầng, nền tảng và phần mềm (các ứng dụng) như là các dịch vụ Các dịch vụ này được tạo sẵn như là các dịch vụ thuê bao (trả phí cho những gì mình sử dụng) dành cho các khách hàng Điện toán đám mây giúp cung cấp linh hoạt nhiều tài nguyên tính toán cho các ứng dụng của khách hàng

ở vị trí xác định (US ở amazon là một ví dụ 1

) dựa trên các yêu cầu của họ Cũng như vậy, các ứng dụng có thể lựa chọn vị trí lưu trữ để lưu trữ các dữ liệu (Amazon S3 2) ở các vị trí toàn cầu Để đạt được hiệu quả tính toán và chi phí hiệu quả lập lịch công việc (task) và dữ liệu của ứng dụng trong môi trường điện toán đám mây, bộ lập lịch phải có các chính sách lập lịch khác nhau thay đổi theo hàm mục tiêu: tối thiểu tổng thời gian thực thi, tối thiểu tổng chi phí thực thi, cân bằng tải trên tài nguyên được sử dụng khi gặp ràng buộc deadline của ứng dụng, v.v Luận văn này tập trung vào nghiên cứu tối thiểu tổng chi phí thực thi của ứng dụng trên các tài nguyên được cung cấp bởi các nhà cung cấp dịch vụ đám mây, như Amazon và GoGrid 3

Luận văn đạt được điều này bằng cách

sử dụng một phương pháp meta-heuristic được gọi là tối ưu bầy đàn (Particle Swarm Optimization – PSO)

1 http://aws.amazon.com

2 http://aws.amazon.com/s3/

3 http://www.gogrid.com

Trang 3

PSO là một kỹ thuật tìm kiếm tối ưu toàn cục bộ tự thích nghi được giới thiệu bởi Kennedy và Eberhart [4] Giải thuật tương tự các giải thuật dựa vào quần thể khác như giải thuật di truyền nhưng nó không có sự tổ hợp lại của các tác nhân trong quẩn thể Thay vào đó, nó dựa trên ứng xử

xã hội của các cá thể Trong mỗi thế hệ, mỗi cá thể tự điều chỉnh quỹ đạo dựa trên vị trí tốt nhất của

nó (local best) và vị trí của cá thể tốt nhất (global best) trong cả quần thể Khái niệm này làm tăng tính tự nhiên của các cá thể và nhanh chóng đạt tới giá trị tối ưu toàn cục với giải pháp tốt nhất PSO trở nên phổ biến, phát triển và trở thành hướng nghiên cứu rộng rãi trong nhiều ứng dụng trong những năm gần đây bởi tính đơn giản mà hiệu quả của nó với chi phí thấp Một số ứng dụng

đã sử dụng PSO: vấn đề điều khiển phản ứng điện áp (reactive voltage control problem), khai phá

dữ liệu, kỹ thuật hóa học, nhận dạng mẫu, và kỹ thuật môi trường PSO cũng được ứng dụng để giải quyết các vấn đề NP-Hard như lập lịch và phân bổ công việc

Đóng góp của luận văn này là:

 Luận văn đã xây dựng một mô hình phân bổ công việc (task) – tài nguyên (resource) (phân

bổ các công việc cho các tài nguyên tính toán xử lý) để tổi thiểu toàn bộ chi phí thực thi

 Luận văn đã thiết kế một giải thuật heuristic sử dụng PSO để giải quyết vấn đề phân bổ công việc – tài nguyên dựa trên mô hình đề xuất

Phần còn lại của luận văn được cấu trúc như sau: chương 2 trình bày tổng quan về điện toán đám mây, các khái niệm và sự cần thiết của việc thực thi workflow trong môi trường điện toán đám mây Chương 3 sẽ đi nghiên cứu các khái niệm và chi tiết về giải thuật PSO, các vấn đề xây dựng giải thuật PSO để giải quyết bài toán tổng quan Vấn đề của bài toán lập lịch luồng công việc sẽ được trình bày ở chương 4 Đồng thời, chương 4 sẽ trình bày phương pháp giải quyết bài toán bằng giải thuật PSO và một thiết kế giải thuật heuristic sử dụng PSO để giải quyết vấn đề phân bổ công việc – tài nguyên dựa trên mô hình đã đề xuất Chương 5 sẽ trình bày cài đặt bài toán, kết quả bài toán

Và cuối cùng, chương 6 sẽ tổng kết lại luận văn và hướng nghiên cứu tiếp theo

Trang 4

II LẬPLỊCHWORKFLOWTRONGMÔITRƯỜNGĐIỆNTOÁNĐÁMMÂY

1 Tổng quan về điện toán đám mây

Từ năm 2015 sẽ có khoảng 15 tỉ thiết bị kết nối đến internet và hầu hết đó là những thiết bị thông minh ví dụ như note book, netbook, điện thoại thông minh, ô tô thông minh và thậm chí là cả những chiếc ti vi thông minh tất cả chúng đều kết nối đến internet vì thế chúng ta cần phải có một giải pháp sao cho linh hoạt để đáp ứng được những dịch vụ cho hàng loạt những thiết bị - Đó là điện toán đám mây

Theo dự báo của Intel thì giá trị thị trường dịch vụ của điện toán đám mây có thể đạt tới con số

43 tỉ đô la Mỹ vào năm 2012 và khẳng định trong vòng 3 năm tới dịch vụ điện toán đám mây có thể đạt tới mức tăng trưởng gộp hằng năm là 27% một con số cực kỳ ấn tượng cao gấp năm lần so với dịch vụ truyền thống khác trong lĩnh vực IT

IBM là doanh nghiệp tiên phong trong khai trương trung tâm điện toán đám mây đầu tiên ở Việt Nam vào tháng 9 năm 2008 với khách hàng đầu tiên là Công ty cổ phần công nghệ và truyền thông Việt Nam Còn Microsoft trong tháng 5 vừa qua đã chính thức ký kết biên bản ghi nhớ với tập đoàn FPT nhằm thúc đẩy Điện toán đám mây tại Việt Nam

Sự phát triển của Điện toán đám mây được sơ đồ hóa theo như Hình 2.1 dưới đây: mở đầu là công nghệ Clustering xuất phát từ nhu cầu đảm bảo hoạt động cho máy chủ và hệ thống mạng, clustering cho phép sử dụng nhiều máy chủ kết hợp với nhau tạo một cụm (cluster) có độ tin cậy cao (giảm thiểu khả năng rủi ro), có khả năng chịu đựng và chấp nhận các sai sót Grid Computing, một hệ thống phân tán được bố trí song song, tận dụng mọi nguồn tài nguyên độc lập và rải rác về mặt địa lý, gần giống như Clustering, ra đời để giải quyết các bài toán lớn không giới hạn về mặt không gian địa lý và nền tảng hệ điều hành Theo sau đó lại là nhu cầu tính toán cao với mục đích tiết kiệm phi phí, tính toán theo nhu cầu (utility computing) Người sử dụng chỉ phải trả chi phí cho những gì mà họ sử dụng giống như trả tiền theo hóa đơn điện, nước hàng tháng Tôi thuê sử dụng máy chủ trong 1h và tôi sẽ trả phí cho 1h mà tôi đã sử dụng của anh Nhu cầu thuê phần cứng và trả tiền cho những gì mình sử dụng đã chuyển tiếp sang mô hình đi thuê phần mềm có trả phí Tôi cũng không cần phải đầu tư nhiều phần mềm, khi nào tôi cần sử dụng, tôi sẽ thuê của anh và trả phí theo dịch vụ mà anh đưa ra Và cuối cùng, điện toán đám mây là tổng hợp toàn bộ các nhu cầu, tiện ích

và các dịch vụ mà các mô hình trước đem lại Tất cả các tài nguyên (phần cứng, phần mềm) đều được sử dụng như là một dịch vụ, sẵn sàng đáp ứng mọi lúc, mọi nơi với chi phí hợp lý

Trang 5

Sự phát triển của công nghệ tính toán và hình thành Điện toán đám mây

Hình 2 1: Sự phát triển của cloud computing từ clustering

Tính toán phân cụm

(Clustering)

Tính toán hiệu năng cao

Máy tính trao đổi qua các

giao thức

Điện toán lưới (Grid Computing)

Các phân cụm độc lập liên kết với nhau

Tính toán song song cho các bài toán lớn

Điện toán theo nhu cầu (Utility Computing)

Cung cấp các tài nguyên tính toán như là dịch vụ có đo lường mức độ sử dụng

Phần mềm như là dịch vụ

(SaaS)

Thuê các ứng dụng như là dịch vụ thông qua mạng Internet

Điện toán đám mây (Cloud Computing)

Trang 6

Ý tưởng nền tảng của Điện toán đám mây đã phát triển từ khá lâu trên thế giới nhưng cho đến gần đây cùng với sự bùng nổ của Internet và công nghệ mạng cũng như nhu cầu của thị trường các tên tuổi lớn trên thế giới mới bắt đầu đưa những ý tưởng trở thành những ứng dụng thật tại thị trường Việt Nam

2 Workflow (Luồng công việc)

Định nghĩa luồng công việc (workflow): Theo Ravneet [13], một luồng công việc hay một quy trình

nghiệp vụ (bussiness process) là thứ tự các bước, tác vụ, sự kiện hoặc tương tác làm nên một quy trình

để thực hiện một công việc nào đó

Lợi ích của việc thực thi luồng công việc trong môi trường Điện toán đám mây: Theo Ravneet

[13], đưa luồng công việc vào thực thi trong môi trường điện toán đám mây cho phép sử dụng các dịch

vụ đám mây khác nhau Lợi ích chính của việc này chính là khả năng mở rộng ứng dụng Không giống như môi trường lưới, môi trường điện toán đám mây cho phép mở rộng các tài nguyên đám mây theo thời gian thực để đáp ứng nhu cầu thực thi Khả năng co giãn của đám mây cho phép mở rộng quy mô linh hoạt khi có nhu cầu lớn hơn hoặc giảm đi khi nhu cầu thấp Điều này cho phép hệ thống quản lý luồng công việc đáp ứng được nhu cầu về chất lượng dịch vụ theo yêu cầu của ứng dụng Mô hình lấy người dùng làm trung tâm trong môi trường điện toán đám mây làm tăng tính thân thiện và thỏa mãn yêu cầu của người dùng Mô hình kinh doanh "trả cho những gì bạn đã sử dụng" làm giảm các chi phí thực thi luồng công việc Cụ thể, lợi ích của việc thực thi trong môi trường điện toán đám mây bao

gồm: Ảo tưởng về một nguồn tài nguyên vô hạn (Illusion of infinite resources): người dùng có thể đưa

ra yêu cầu tài nguyên cần thiết cho ứng dụng ở bất cứ thời điểm nào; Tài nguyên đi thuê (Lease): người sử dụng trực tiếp xác định nguồn tài nguyên cần thuê một cách hợp lý để lập lịch cho các tính toán của họ Mô hình này là lý tưởng vì nó làm giảm chi phí lập lịch; Tính co giãn (Elasticly): cho phép người dùng có thể thuê được và phân bổ tài nguyên theo nhu cầu Hệ thống workflow dễ dàng

phát triển hoặc thu nhỏ nguồn tài nguyên theo thời gian

Thách thức của việc thực thi luồng công việc trong môi trường Điện toán đám mây: Theo

Ravneet [13], những thách thức gặp phải khi thực thi luồng công việc trong môi trường Điện toán

đám mây bao gồm:

Chi phí: trong thực tế, một số dịch vụ điện toán đám mây là miễn phí, nhưng một số dịch vụ thì

không Điều này đồng nghĩa với việc người sử dụng sẽ phải tiền cho những gì mà họ sử dụng Do vậy, chi phí trở thành một mối quan tâm lớn của các ứng dụng workflow Nếu đưa ra cả hai thuộc tính về thời gian và chi phí, người sử dụng sẽ phải đưa ra ngay quyết định là trả nhiều chi phí hơn để giảm thời gian thực hiện hoặc tiết kiệm chi phí bằng cách cho phép kéo dài thời gian thực thi lâu hơn miễn

là thời hạn cuối cùng để thực hiện công việc vẫn có thể được đáp ứng

Thỏa thuận cấp độ dịch vụ: với hầu hết các dịch vụ điện toán đám mây đến từ các tổ chức thương

mại lớn, các thỏa thuận cấp độ dịch vụ trở thành một mối quan tâm quan trọng cho cả nhà cung cấp

Trang 7

dịch vụ và khách hàng Do cạnh tranh trong cung cấp dịch vụ đang nổi lên, các nhà cung cấp phải đảm bảo: chất lượng dịch vụ (QoS) tốt cho khách hàng và các điều khoản phải rõ ràng cho việc bồi thường trong trường hợp vi phạm

Khối lượng dữ liệu: tùy thuộc vào dịch vụ được cung cấp, khối lượng dữ liệu cần thiết được vận

chuyển qua dịch vụ

Nền tảng hỗ trợ: tùy thuộc vào dịch vụ, nền tảng hỗ trợ yêu cầu của các dịch vụ ứng dụng đám mây

cũng có thể là một nhân tố hạn chế Ngoài vấn đề trên, có thể có những thách thức khác như vấn đề an ninh, tuân thủ các quy định và minh bạch dữ liệu

Sự cần thiết của việc thực thi workflow trong môi trường Điện toán đám mây: Chúng ta đã thấy

được những lợi ích khi thực thi luồng công việc [13] trong môi trường điện toán đám mây ở trên Hơn nữa, các ứng dụng luồng công việc thường yêu cầu một môi trường thực thi phức tạp bao gồm: hệ điều hành cụ thể, các thư viện, cấu trúc tệp tin hệ thống, nhiều chương trình ứng dụng và các tệp tin cấu hình Môi trường này thường khó có thể tạo trên các tài nguyên lưới Ngoài ra, mỗi một vị trí lưới đều

có cấu hình khác nhau, vì vậy các kết quả thường phải nỗ lực thêm thời gian để chuyển tới các vị trí mới Máy ảo cho phép phát triển các ứng dụng tạo ra đầy đủ các tùy biến, cấu hình các môi trường

thực thi đặc biệt cho các ứng dụng của họ

III PHƯƠNGPHÁPTỐIƯUBẦYĐÀN(PSO)

Giải thuật tối ưu hóa bầy đàn (Particle Swarm Optimization – PSO) lấy ý tưởng từ cách đàn chim

tìm thức ăn, nguồn nước Theo giả thuyết của bài toán, các cá thể ban đầu được dựng lên trong không gian đó Mỗi cá thể có một vận tốc ban đầu, và giữa các cá thể cũng có kênh liên lạc Các cá thể sau đó

di chuyển trong không gian lời giải, mỗi cá thể sẽ được đánh giá bằng một hay nhiều tiêu chuẩn thích nghi, dần dần các cá thể này sẽ di chuyển về phía những cá thể tốt hơn trong phạm vi của chúng

Quần thể ban đầu gồm n cá thể (mỗi cá thể là một lời giải cho bài toán, nhưng chưa tối ưu) Mỗi cá thể thứ i trong quần thể được biểu diễn bởi một vector xi m chiều (giá trị m tùy thuộc vào mỗi bài toán khác nhau và cách xử lý khác nhau), và một vector vận tốc vi m chiều với i = 1,…,n Hàm mục tiêu của bài toán là f: Rm →R

Mô tả thuật toán chi tiết như sau:

B1: Khởi tạo quần thể với việc khởi tạo vector vị trí xi và vector vận tốc vi cho cá thể thứ i, i = 1, , n

(cho mỗi cá thể P i trong quần thể P(n))

B2: Khởi tạo các thông tin ban đầu về vị trí tốt nhất của các cá thể và cả quần thể

pbesti = xi (khởi tạo vị trí tốt nhất của cá thể thứ i bằng vị trí được khởi tạo hiện tại)

gbest = min (f(xi)), i = 1, n (khởi tạo vị trí tốt nhất của cả quần thể bằng vị trí nhỏ nhất

trong tất cả các vị trí của tất cả các cá thể được khởi tạo)

Trang 8

B3: Bước lặp với điều kiện lặp xác định trước (sau một số lần lặp cho trước hoặc sau một số lần lặp

mà không thu được kết quả tốt hơn)

for 1<= i <= n (với mỗi cá thể)

vik+1 = w.vik + c1.rand1.(pbesti – xik) + c2.rand2.(gbest – xik) (cập nhật lại chuyển

động ở thế hệ tiếp theo theo chuyển động tốt nhất hiện tại của chính cá thể và theo chuyển động của cá thể tốt nhất trọng quần thể)

xik+1= xik + vik+1(cập nhật lại vị trí theo vị trí hiện tại và theo hướng chuyển động

mới nhất)

if f(xi) < f (pbesti) then pbesti = xi (cập nhật lại vị trí tốt nhất của mỗi cá thể bằng việc so sánh

với vị trí hiện tại)

if f(xi) < f (gbest) then gbest = xi (cập nhật lại ví trí tốt nhất của quần thể bằng việc so sánh

với cá thể tốt nhất hiện tại)

Kiểm tra điều kiện kết thúc bước lặp, nếu thỏa mãn chuyển sang B4, còn không tiếp tục B3

B4: Kết thúc, trả về giá trị tốt nhất gbest

Ý nghĩa các tham số: w là hằng số quán tính; c1 và c2 là hệ số gia tốc, hằng số mô tả có bao nhiêu cá thể hướng về vị trí tốt, đặc trưng cho kinh nghiệm và tính xã hội; rand1 và rand2 là hai vector ngẫu nhiên, lấy giá trị trong đoạn [0,1], nó được sinh ra tại mỗi bước lặp; pbesti là vị trí tốt nhất cho đến thời điểm hiện tại của cá thể thứ i trong quần thể; gbest là vị trí tốt nhất của cả quần thể tại thời điểm hiện tại

IV GIẢI THUẬTLẬPLỊCHHEURISTICDỰAGIẢITHUẬTTỐIƯUBẦYĐÀNĐỀXUẤT

Đặc tả vấn đề lập lịch hỗ trợ ứng dụng luồng công việc

Bên dưới hình 4.1, một luồng công việc với 5 công việc: T1, T2, T3, T4 và T5, mỗi công việc đều có dữ liệu đầu vào và dữ liệu đầu ra: f.in, f.out, f12, f13, f14, f25, f35, f45 Luồng công việc được chia làm ba cấp

độ khác nhau trong đó: cấp độ 1 bao gồm công việc T1 cung cấp dữ liệu đầu vào cho các công việc T2,

T3, T4 Cấp độ 2 bao gồm các công việc: T2, T3, T4 chờ nhận dữ liệu từ T1 để xử lý và nó sẽ cung cấp

dữ liệu cho T5 ở cấp độ 3 Ở cấp độ 3, công việc T5 phải chờ đợi dữ liệu của T2, T3, T4 để xử lý và sau khi T5 xử lý xong thì luồng công việc được thực thi xong

Trang 9

Hình 4 1: Một workflow ví dụ

Theo Pandey [5], giả thiết chúng ta chỉ xét các ứng dụng thuộc dạng workflow (dữ liệu luồng) trong đó các tác vụ (task) không độc lập mà liên kết với nhau theo một đồ thị G = (V,E) thuộc dạng đồ thị DAG (Directed Acyclic Graph) trong đó:

1: V= tập các task = {T1, T2 Tn}

2: E = tập các cạnh biểu diễn mỗi liên hệ về dữ liệu giữa các task = {f j,k}trong đó cạnh fjk cho biết dữ liệu sinh ra bởi task Tj (đầu ra của Tj) sẽ là đầu vào của task Tk

3: Tập các storage site (máy trạm lưu trữ - làm nhiệm vụ kho chứa) S = {S1, Si}

4: Tập các compute site (máy trạm tính toán - làm nhiệm vụ tính toán, xử lý) S = {PC1, PCj}

5: Chi phí để PCj xử lý xong task Tk được cho trước, chính là ma trận TP trong Bảng 4.1

6: Biết cost of unit data access dij = giá cước dành cho máy trạm i khi truy cập một đơn vị dữ liệu đặt trên máy trạm j , giá này do các nhà cung cấp dịch vụ qui định, chính là Ma trận PP trong Bảng 4.2

Ở đây bắt đầu xuất hiện từ resource i, được hiểu là máy trạm i Giả thiết dij = dji, dij+djk >= djk

7: Mỗi task xuất ra output là một khối data và nó được dùng làm input cho task con Kích thước của những khối data đó được gọi là trọng số cạnh (edge-weight) ek1,k2 trong đó task k1 và k2 là cặp Cha-Con, tức là k1 sinh ra output file, file này được task k2 dùng làm input Dữ liệu mô tả trong bảng DS – Bảng 4.3

Bảng 4 1: Chi phí thực thi của mỗi T i trên các PC j [5]

TP[5x3]=

Trang 10

T3 1.13 1.11 1.11

của Amazon EC2 cho các tài nguyên trong phạm vi 1.1$ - 1.28$/giờ

Bảng 4 2: Chi phí truyền thông giữa các PC j [5]

PP[3x3]=

PP[i,j]=chi phí truyền thông giữa hai PC i và PC j (giá trị theo đơn vị $/MB/giây)

Bảng 4 3: Kích thước input/output của Task i

DST2,T3,T4[2x2]=

totaldata

DST5[2x2]=

totaldata

Input = dữ liệu đầu vào, output = dữ liệu đầu ra của các công việc (đơn vị: MB)

Bài toán có thể phát biểu như sau:

“Tìm phương án ánh xạ (mapping) M sao cho giá trị cost lớn nhất trong số các PC là nhỏ nhất”

k kj j

C ( ) , M(k) j ( 4 1)

 

k

k k k M k M j

C

2 , 1 ) 2 ( ), 1 (

) ( , M(k1) j,M(k2) j (4 2)

j tx j exe j

C ( )  ( )  ( ) (4 3)

) ) ( max(

)

Cost

, jP (4 4)

)), (

MinimizeM (4 5)

Giải thích ký hiệu:

C exe (M) j: là tổng cost mà máy PCj phải trả theo sự phân phối của phương án mapping M Nó bằng tổng các trọng số đỉnh (node-weight) , tức là chi phí thực thi của task k trên tài nguyên tính toán j (PCj), đại lượng trong ma trận TP trong bảng 4.1

C tx (M) j: là tổng chi phí truy cập (access cost, bao gồm transfer cost- phí truyền thông) giữa các task thực hiện bởi PCj và những task khác, là cha hoặc con của những task kể trên Gọi PC được M

Ngày đăng: 24/09/2013, 08:17

HÌNH ẢNH LIÊN QUAN

Hình 2. 1: Sự phát triển của cloud computing từ clustering. - Bài toán workflow scheduling trong môi trƣờng  điện toán đám mây
Hình 2. 1: Sự phát triển của cloud computing từ clustering (Trang 5)
Hình 4. 1: Một workflow ví dụ. - Bài toán workflow scheduling trong môi trƣờng  điện toán đám mây
Hình 4. 1: Một workflow ví dụ (Trang 9)
Bảng 4. 1: Chi phí thực thi của mỗi T i  trên các PC j  [5] - Bài toán workflow scheduling trong môi trƣờng  điện toán đám mây
Bảng 4. 1: Chi phí thực thi của mỗi T i trên các PC j [5] (Trang 9)
Bảng 4. 2: Chi phí truyền thông giữa các PC j  [5] - Bài toán workflow scheduling trong môi trƣờng  điện toán đám mây
Bảng 4. 2: Chi phí truyền thông giữa các PC j [5] (Trang 10)
Hình 5. 2: Biểu đồ so sánh kết quả thực nghiệm workflow sau 30 lần chạy - Bài toán workflow scheduling trong môi trƣờng  điện toán đám mây
Hình 5. 2: Biểu đồ so sánh kết quả thực nghiệm workflow sau 30 lần chạy (Trang 13)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w