Tài liệu XÂY DỰNG CÔNG CỤ ĐỆ TRÌNH CÔNG VIỆC CÓ NGỮ NGHĨA CHO CONDOR ppt

XÂY DỰNG CÔNG CỤ ĐỆ TRÌNH CÔNG VIỆC CÓ NGỮ NGHĨA CHO CONDOR Building a Semantic-based Job Submission Tool for Condor Lê Ngọc Sơn, Đinh Tuấn Việt, Tạ Tuấn Anh, Đỗ Đức Thành, Nguyễn Thanh

Trang 1

XÂY DỰNG CÔNG CỤ ĐỆ TRÌNH CÔNG VIỆC CÓ NGỮ NGHĨA

CHO CONDOR Building a Semantic-based Job Submission Tool for Condor

Lê Ngọc Sơn, Đinh Tuấn Việt, Tạ Tuấn Anh, Đỗ Đức Thành, Nguyễn Thanh Thủy

Tóm tắt

Sự phát triển của môi trường tính toán thông lượng cao đã góp phần giải quyết một số bài toán cỡ lớn mà nếu không có khả năng tính toán của môi trường này thì gần như không giải quyết được Tuy nhiên, ở thời điểm hiện nay, phần mềm trung gian hỗ trợ môi trường vẫn có những hạn chế làm cho người dùng khó khai thác sức mạnh của chúng Một trong

số đó là việc đệ trình công việc Quá trình so khớp yêu cầu của người dùng và khả năng cung cấp của tài nguyên của hầu hết các bộ phần mềm trung gian hiện nay (kể cả Condor) chủ yếu vẫn dựa trên cơ chế so khớp chính xác Bài báo trình bày một cách tiếp cận theo hướng ngữ nghĩa để làm mềm dẻo quá trình so khớp này bằng việc ứng dụng các công nghệ của Web ngữ nghĩa Ý tưởng này sau đó được ứng dụng để xây dựng bộ công cụ đệ trình công việc mới bổ sung thêm tính năng cho quá trình đệ trình công việc trong Condor

Từ khóa: Semantic Grid, Condor, Ontology

Abstract

The development of High Throughput Computing environments helps solve several large-scale problems, which without these environments’ capability are hardly solved At present, there are however shortcomings in the middleware supporting these environments that prevents users from effectively exploiting the environments’ power One of these is job submission The matchmaking between user requirement and resource capability of almost all middleware suites (including Condor) is exact matchmaking This paper adopt a semantic approach in order to make the submission phase more flexible The idea is then realized in a new job submission tool which adds new features to the submission process in Condor

Keywords: Semantic Grid, Condor, Ontology

Trang 2

1 ĐẶT VẤN ĐỀ

Ngày nay cùng với sự phát triển như vũ bão

của khoa học kỹ thuật, công nghệ, đã xuất

hiện ngày càng nhiều bài toán đòi hỏi sức

mạnh tính toán mà một máy tính riêng lẻ

không thể đảm nhiệm Ngoài ra các bài toán

này đòi hỏi một khoảng thời gian lớn để

thực thi, thời gian tính toán có thể lên đến

hàng tháng, hàng năm Xuất phát từ nhu cầu

đó, các kỹ thuật tính toán song song, tính

toán phân tán đã được đề xuất, và tính toán

thông lượng cao (High Throughput

Computing - HTC [1]) trở thành một công

nghệ hứa hẹn giải quyết vấn đề này

Các hệ thống tính toán thông lượng cao

lớn mạnh ngày càng được xây dựng và phát

triển Tuy nhiên tính đơn giản về ngữ nghĩa

của các hệ thống này đã dẫn đến một số hạn

chế Điều này khiến cho người dùng phải

đương đầu với một lượng lớn thông tin

chuyên sâu về hệ thống cũng như xuất hiện

nhiều thông tin dư thừa so với mục đích sử

dụng Tính chất đơn giản của các bộ đệ trình

công việc trong các hệ thống tính toán thông

lượng cao trước đây đã tạo rất nhiều khó

khăn trong việc tìm kiếm trích rút và bảo trì

thông tin Do đó chúng chỉ hỗ trợ người

dùng ở một mức giới hạn nào đó trong việc

truy xuất và xử lý thông tin Kết quả tất yếu

là những người dùng phải gánh trên vai

trách nhiệm không những truy cập và xử lý

thông tin mà còn rút trích và thông dịch mọi

thông tin

Condor [2] là một phần mềm trung gian

có tác dụng hỗ trợ hoạt động của môi trường

tính toán thông lượng cao Các cơ chế của

Condor hiện tại là đủ đáp ứng yêu cầu vận

hành của môi trường tính toán thông lượng

cao, tuy nhiên nó đòi hỏi người dùng phải có

hiểu biết về hệ thống và phải liệt kê chi tiết

các thông tin về tài nguyên trong đặc tả yêu

cầu Vấn đề tìm kiếm hiện nay trong quá

trình xác định tài nguyên phù hợp của

Condor sử dụng công nghệ tìm kiếm theo từ

khóa (key word) Ngoài ra phương tiện tìm

kiếm này không hiểu được mối liên hệ giữa

các từ khóa với nhau Nếu tích hợp được tri thức cho các từ khóa này tạo thành ý nghĩa

và ngữ cảnh, thì việc tìm kiếm sẽ dựa trên khái niệm (concept), chứ không phải theo từ khóa

Để hiểu rõ ý này, ta lấy ví dụ một nhóm máy tính có cài hệ điều hành IRIX và Linux Theo cách thông thường, khi người dùng muốn công việc được thực hiện trên các máy tương thích với Unix, họ cần chỉ rõ hệ điều hành hoặc là IRIX hoặc là Linux Tuy nhiên trong trường hợp người dùng không biết rõ tài nguyên của hệ thống đang sử dụng là Linux hoặc IRIX mà có nhu cầu thực thi công việc theo với những tài nguyên tương thích với 2 loại trên, người dùng đệ trình công việc với yêu cầu tài nguyên là Unix thì Condor sẽ không xác định được chính xác tài nguyên do cơ chế tìm kiếm của Condor là

cơ chế tìm kiếm theo từ khóa Kết quả là công việc không được thực thi, nếu muốn thực thi thì người dùng có thể phải đệ trình công việc nhiều lần với mỗi lần là lựa chọn một hệ điều hành thuộc họ Unix

Việc sử dụng công nghệ Web ngữ nghĩa trong tình huống này sẽ giúp che dấu được

đi tài nguyên của hệ thống, và giúp cho việc tìm kiếm linh hoạt, dựa trên khái niệm Khi

đó người dùng chỉ cần thiết yêu cầu thực thi công việc trên hệ điều hành Unix, thành phần suy diễn sẽ tìm ra các phần tử có mối quan hệ tương thích như Linux, IRIX, Solaris …

Cách tiếp cận này xét về tốc độ là chậm hơn so với cách làm truyền thống, tuy nhiên

nó lại mềm dẻo và có khả năng mở rộng cao hơn Hơn nữa, trên thực tế, các ứng dụng chạy trên môi trường tính toán thông lượng cao phần lớn tốn rất nhiều thời gian để hoàn tất Do vậy thời gian suy diễn là tương đối nhỏ so với tổng thời gian chạy Chính vì điều này, việc xây dựng thêm các thành phần mô tả về ngữ nghĩa để trợ giúp việc đệ trình công việc là chấp nhận được, ít nhất là trong môi trường tính toán thông lượng cao

Hệ thống được xây dựng trên ý tưởng tiến hành thu thập thông tin và ngữ nghĩa

Trang 3

hóa về các thành phần của các máy trạm

trong hệ thống tính toán thông lượng cao Ý

tưởng ngữ nghĩa hóa tài nguyên cho phép

chúng ta mở rộng các nguồn tài nguyên

thành một môi trường mới với tập các mối

quan hệ mới giữa các nguồn dữ liệu và tạo

ra mối liên hệ ngữ cảnh Các thông tin yêu

cầu để đệ trình công việc cũng được phân

tích, xử lý theo hướng ngữ nghĩa hóa Thành

phần suy diễn sẽ làm nhiệm vụ xác định tài

nguyên phù hợp với yêu cầu Sau quá trình

lựa chọn tài nguyên phù hợp trên công việc

sẽ được đệ trình lên hệ thống để thực thi

Nhằm giúp cho người đọc có được cái

nhìn từ tổng quát đến chi tiết cấu trúc của

bài báo bao gồm những phần sau: mục 2

trình bày các giải pháp trên thế giới có liên

quan; mục 3 trình bày kiến trúc tổng thể và

các thành phần của hệ thống; mục 4 đưa ra

các cài đặt thử nghiệm; mục 5 đánh giá kết

quả đạt được và đề xuất hướng phát triển

tiếp theo

2 CÁC GIẢI PHÁP CÓ LIÊN QUAN

Đệ trình công việc gồm có đặc tả yêu cầu tài

nguyên, phát hiện tài nguyên và lựa chọn tài

nguyên Các cơ chế này là cần thiết để đảm

bảo cho hoạt động của hệ thống Tuy nhiên

phần lớn các phần mềm trung gian hiện nay,

có cả Condor đều dựa trên khớp chính xác

yêu cầu Đó là các bên có liên quan thống

nhất về tên thuộc tính và dải giá trị tương

ứng của chúng Cách làm này tương đối đơn

giản, tuy nhiên rất không mềm dẻo, đặc biệt

khi có một tài nguyên với cấu hình mới xuất

hiện trong hệ thống

Hiện tại cũng đã có một số hướng ứng

dụng các công nghệ web ngữ nghĩa vào

trong các môi trường tính toán Trong [3],

các tác giả đã đề xuất đưa thêm một tầng tri

thức vào kiến trúc của bộ môi giới Gridbus

[4], nhờ vậy bộ môi giới có thể phát hiện tài

nguyên nhờ cơ chế suy diễn Thành phần

ngữ nghĩa trong tầng tri thức tạo mô tả ngữ

nghĩa cho tài nguyên nhờ vào một ontology

template Thông tin về tài nguyên không

phải do tầng này tự phát hiện mà nhờ vào hệ

thống giám sát và phát hiện tài nguyên (MDS) của Globus Toolkit

Trong [5], các tác giả còn đề xuất kết hợp việc chọn tài nguyên phần cứng và phần mềm để trợ giúp cho việc lập lịch

Trong [6], các tác giả đề xuất một dịch

vụ matchmaker dựa trên ontology hỗ trợ việc phát hiện và mô tả tài nguyên động Trong đó, yêu cầu của người dùng được biểu diễn bằng ontology của yêu cầu và nó phải được dịch sang mô tả ontology

Bài báo [7] giải quyết vấn đề mô tả tài nguyên để môi giới tài nguyên cho một số

hệ phần mềm trung gian cho lưới, trong đó

có Unicore

Trong [8], các tác giả đã thiết kế và xây dựng thử phần mềm lựa chọn tài nguyên dựa trên ontology khai thác ontology, các tri thức nền tảng và các luật để giải quyết vấn đề khớp tài nguyên trên lưới Cơ sở dữ liệu suy diễn mà họ sử dụng là TRIPLE/XSB

Trong [9], các tác giả đưa ra một cơ chế cho phép đặc tả các dịch vụ Web, đủ cho một ứng dụng client xác định tất cả các dịch

vụ để thực hiện một công việc nào đó Cơ chế của họ sử dụng OWL1 để mô tả các dịch

vụ Web Ngoài ra, điều đáng chú ý nhất là

họ đã sử dụng các công nghệ cơ sở dữ liệu quan hệ để lưu trữ các thể hiện của các lớp

3 KIẾN TRÚC CỦA HỆ THỐNG 3.1 Kiến trúc phân tầng của hệ thống

Cũng giống như kiến trúc của một lưới thông thường, hệ thống được xây dựng có kiến trúc phân tầng Tầng dưới cùng bao gồm các dịch vụ cơ bản, tầng trên là các dịch vụ mức cao được xây dựng từ dịch vụ mức thấp Sở dĩ ta lựa chọn kiến trúc phân tầng bởi những ưu điểm sau của nó:

1 Web Ontology Language,

http://www.w3.org/TR/owl-ref/

Trang 4

• Cung cấp khả năng hoạt động tốt

trên môi trường không đồng nhất

• Người sử dụng đầu cuối trở nên

trong suốt với dữ liệu của hệ thống

• Người phát triển ứng dụng chỉ cần

biết các API là có thể lập trình dễ

dàng

• Hỗ trợ một số lượng lớn các ứng

dụng trên lưới

• Khả năng phát triển, nâng cấp dịch

vụ độc lập với xây dựng ứng dụng

Trên cở sở đó, kiến trúc của hệ thống

bao gồm ba tầng: tầng nền, tầng tri thức và

tầng ứng dụng (Hình 1)

Hình 1 Kiến trúc và thành phần của hệ thống

Tầng nền (Fabric Layer)

Tầng nền có nhiệm vụ thu thập thông tin về

tài nguyên của hệ thống cũng như cung cấp

cơ chế lập lịch Phụ thuộc vào loại tài

nguyên của hệ thống cần xây dựng mà

chúng ta có thể chọn các nhà cung cấp khác

nhau như Condor hay là PBS Trong ứng

dụng này ta lựa chọn Condor vì khả năng

phù hợp với tính toán thông lượng cao

Tầng tri thức (Knowledge Layer)

Tầng tri thức làm nhiệm vụ chuyển đổi

thông tin về tài nguyên thu thập được từ tầng

nền thành các đặc tả tri thức, sau đó lưu các

đặc tả này vào trong một cơ sở tri thức

Ngoài ra tầng tri thức còn phụ trách việc sinh ra những mô tả tài nguyên hợp với đặc

tả của Condor Điều này đảm bảo rằng công việc có thể thực hiện một cách chính xác

Tầng ứng dụng (Application Layer)

Đây là tầng trên cùng trong kiến trúc của hệ thống Về nguyên tắc người dùng có thể tương tác với hệ thống thông qua tầng ứng dụng một cách trong suốt mà không nhận biết được sự có mặt của các tầng khác Tầng ứng dụng bao gồm giao diện giữa người và

hệ thống bên dưới, nó nhận yêu cầu từ người

sử dụng và đưa đến tầng tri thức cũng như hiện thị kết quả về trạng thái của công việc cho người dùng

Trong ứng dụng này, tầng ứng dụng bao gồm một công cụ đệ trình công việc giúp ích cho người dùng dễ dàng đệ trình công việc với yêu cầu linh hoạt

3.2 Các thành phần của hệ thống

Trên cơ sở của kiến trúc phân tầng, ta sẽ đi chi tiết xem xét chức năng và nhiệm vụ các thành phần của hệ thống

Thành phần đệ trình công việc (Job Submission Tool)

Thành phần này là giao diện bao gồm việc lựa chọn các thông tin về tên tệp thực thi, kiểu công việc, các tham số, các yêu cầu sẽ được đưa cho tầng tri thức để phát hiện tài nguyên phù hợp nhất.Nó cũng cho phép lựa chọn các kiểu công việc có thể thực hiện

Thành phần sinh câu truy vấn ngữ nghĩa (Query Generator)

Vai trò của thành phần này là chuyển đổi yêu cầu tài nguyên của người dùng thành câu truy vấn tương ứng Câu truy vấn trong trường hợp này thực chất là một đặc tả lớp của ontology

Thành phần phát hiện tài nguyên (Resource Discoverer)

Trang 5

Như ta đã biết Condor quản lý và thu thập

thông tin các loại tài nguyên thông qua bộ

thu thập Condor Collector, đồng thời cũng

cung cấp giao diện WebService cho phép

khai thác các thông tin này Thành phần này

thu thập thông qua các dịch vụ trên tiếp nhận

thông tin dưới định dạng ClassAd2 sau đó

chuyển chúng sang dạng Ontology Một

trong những vấn đề thường xảy ra khi thu

thập dữ liệu là sự không đầy đủ cũng như

khác nhau về khuôn dạng nên chúng cần

phải được quy đổi và đưa ra một kiểu thống

nhất cho quá trình phân tích dựa theo các

thuộc tính của ClassAd Quá trình sàng lọc

và loại bỏ những yếu tố dư thừa có thể rất

phức tạp nếu dữ liệu vào được lấy từ nhiều

nguồn không đồng nhất và phải tính đến quá

trình biến đổi theo định dạng chung Tiếp

theo các thông tin này sẽ được lưu trữ ở

trong một cơ sở tri thức

Trong môi trường tính toán thông lượng

cao, một loại tài nguyên có thể được thêm

vào hay ra môi trường ở bất kỳ thời điểm

nào Cơ chế thu thập thông tin của Condor là

sau một khoảng thời gian nhất định sẽ cập

nhật lại thông tin của các các máy trạm Vì

vậy một trong những nhiệm vụ của thành

phần này là tự động cập nhật lại kho tri thức

Nó sẽ kiểm tra thường xuyên trạng thái của

tài nguyên, xác định được sự thay đổi và cập

nhật lại thông tin về tài nguyên

Thành phần mô tả công việc (Job

Description Generator)

Các thông tin được lựa chọn sau từ thành

phần mô tả tài nguyên được chuyển sang

dạng ClassAd, cùng với thông tin đầu vào về

tên tệp, tham số làm thông tin đệ trình công

việc lên Condor Schedd

4 CÀI ĐẶT CHƯƠNG TRÌNH

2 Classified Advertisements,

http://www.cs.wisc.edu/condor/classad/

4.1 Ontology mẫu

Ontology mẫu trong ứng dụng này mô tả các tài nguyên có trong môi trường thông qua các khái niệm và các thuộc tính Chúng là phương tiện để mô tả mọi tài nguyên có trong môi trường

Đối với cơ sở tri thức, ontology mẫu đóng vai trò giống như vai trò của lược đồ

cơ sở dữ liệu đối với cơ sở dữ liệu Ontology mẫu có tác dụng hỗ trợ cập nhật tự động cơ

sở tri thức về tài nguyên

Ontology mẫu được tạo và cập nhật bởi con người, sử dụng Protégé do chưa có một

cơ chế tự động để cập nhật nó

Khi đã có ontology mẫu, mỗi tài nguyên được mô tả bằng một thể hiện và lưu ở trong

cơ sở tri thức

4.2 Giải pháp lưu trữ cơ sở tri thức

Đặc tính của tài nguyên trong môi trường tính toán thông lượng cao là số lượng lớn và tính động cao Số lượng tài nguyên trong môi trường này có thể lên tới cỡ hàng nghìn Tính động của môi trường thể hiện ở chỗ các tài nguyên này không cố định mà có thể vào

ra môi trường hay tính sẵn sàng thay đổi liên tục Chính vì điều này, ta cần phải có một phương pháp quản lý cơ sở tri thức cho phù hợp

Cách lưu trữ thông thường nhất là lưu toàn bộ cơ sở tri thức vào một tệp owl sau

đó lợi dụng khả năng của máy suy diễn làm việc trên tệp này Cách này tuy đơn giản nhưng hạn chế là bộ nhớ của máy suy diễn

là có hạn, và có khả năng không quản lý được cơ sở tri thức lớn Hơn nữa, khi có các tình huống tương tranh hay truy cập đồng thời, cách làm này có thể dẫn đến hỏng cơ

sở tri thức Nói cách khác, giải pháp này chỉ thích hợp cho số lượng cá thể nhỏ và không thay đổi nhiều

Ứng dụng này áp dụng cách tiếp cận khác trong việc lưu trữ cơ sở tri thức, đó là lưu các thể hiện vào trong cơ sở dữ liệu quan

hệ Theo cách này, chúng ta vừa lợi dụng được khả năng lưu trữ của cơ sở dữ liệu

Trang 6

cũng như chống các tình huống tương tranh

của chúng

Trong ứng dụng này, ngôn ngữ biểu

diễn tri thức cũng như câu truy vấn được

viết ở dạng AOWL do ngôn ngữ này tương

đương với OWL, nhưng nó súc tích và dễ

đọc hơn với con người, do vậy thuận tiện

cho việc lưu trữ cũng như dò lỗi khi phát

sinh

Ví dụ để mô tả một tài nguyên có RAM

= 1024MB, ta có biểu diễn AOWL sau:

intersectionOf(

<http://hpcc.hut.edu.vn/semgrid#LinuxHost>

restriction(

<http://hpcc.hut.edu.vn/semgrid#hasRAM>

value("1024"^^<http://www.w3.org/2001/XMLSchema

#integer>)

)

Biểu diễn AOWL này là tương đương với

dạng biểu diễn OWL:

<?xml version="1.0"?>

<rdf:RDF

xmlns="http://hpcc.hut.edu.vn/semgrid#"

xml:base="http://hpcc.hut.edu.vn/semgrid">

<hasRAM

rdf:datatype="http://www.w3.org/2001/XMLSchema#

int">1024</hasRAM>

</LinuxHost>

</rdf:RDF>

4.3 Về vấn đề suy diễn

Trong ứng dụng này, quá trình suy diễn thay

thế quá trình so khớp chính xác, nhờ đó, yêu

cầu của người sử dụng trở nên mềm dẻo

hơn

Ví dụ:

• Resource là tập các tài nguyên tính

toán OperatingSystem là tập các hệ

điều hành

• Unix là tập các hệ điều hành tương

thích với Unix

• Unix, Solaris, Linux là các phần tử

của lớp Unix

• UnixHost và LinuxHost là các phần

tử của lớp Resource

• Thuộc tính hasUnixOS là thuộc tính

mô tả mối quan hệ giữa các phần tử

thuộc lớp Resource lớp Unix

Hình 2 Taxonomy khi chưa suy diễn

Hình 3 Taxonomy sau khi suy diễn

Khi chưa suy diễn (Hình 2), ta thấy hai nút LinuxHost và UnixHost là đồng cấp Tuy nhiên sau khi suy diễn (Hình 3), nút LinuxHost được phân loại là một nút UnixHost Khi người dùng đưa công việc đến một nút UnixHost, công việc sẽ được đưa đến một nút LinuxHost nếu có

Do suy diễn trên một số lượng cá thể lớn là rất tốn kém, do vậy, giả thiết của ứng dụng là các cá thể không có liên hệ với nhau Điều này phù hợp với thực tế của môi trường tính toán thông lượng cao hiện nay Với giả thiết này, suy diễn trên các cá thể được quy về suy diễn trên các khái niệm kết hợp với các phép truy vấn cơ sở dữ liệu

Trang 7

Mà suy diễn trên các khái niệm thông

thường có chi phí nhỏ hơn nhiều [10]

Các thành phần ở tầng tri thức được cài

đặt ở dạng dịch vụ Web để giúp cho nhiều

ứng dụng khác nhau có thể khai thác tính

năng của chúng Theo đó, ứng dụng đệ trình

công việc có thể coi đơn thuần là một ví dụ

về việc khai thác khả năng của dịch vụ web

này

4.4 Quá trình thu thập thông tin và đệ

trình công việc qua dịch vụ web

Birdbath 3 là một dự án mở phát triển cung

cấp giao diện dịch vụ web cho các dịch vụ

của Condor (Hình 4) Trong các tiến trình

ngầm của Condor, hai dịch vụ là Collector

và Scheduler cung cấp đầy đủ các tính năng

cần thiết cho ứng dụng của đối tác thứ ba

cũng như các cổng thông tin (portal) để liên

lạc với Condor thông qua mô hình ủy nhiệm

công việc Với hai dịch vụ này thì những

ứng dụng bên ngoài có thể truy cập

Collector để xác định kiểu và tài nguyên sẵn

có trong tập máy, sau đó đệ trình công việc

lên thông qua giao diện của bộ Scheduler

Hình 4 Dịch vụ Web của Condor

Quá trình đệ trình công việc bao gồm

các thao tác sau:

• Tạo mới giao tác

3http://www.cs.wisc.edu/condor/birdbath/

• Tạo mới một mã công việc

• Xác định các tệp sẽ truyền

• Tạo mô tả công việc

• Đệ trình công việc

• Xác nhận giao tác Đối với hệ thống tính toán thông lượng cao thì việc đòi hỏi về xác nhận hay giấy ủy quyền đuợc đơn giản hóa hơn rất nhiều so với các hệ thống tính toán khác Với phần mềm Condor thì ta chỉ cần chỉ ra tên của người dùng thực thi tài nguyên

4.5 Hoạt động của chương trình

Thiết lập các thông số:

Để cấu hình cho dịch vụ Web của bộ đệ trình công việc, chúng ta có thể thực hiện thông qua giao diện như Hình 5

Hình 5 Giao diện cấu hình

Người dùng trước hết đưa vào địa chỉ dịch

vụ Web sau đó nhấn Initialize để lấy các thông số từ dịch vụ web Các thông số người dùng thay đổi được gồm:

• URI của dịch vụ Collector và Scheduler của nút trung tâm

• URI của tệp chứa ontology mẫu

• URI của máy suy diễn (Chú ý máy suy diễn phải cài đặt giao diện DIG)

Trang 8

• Namespace của các khái niệm định

nghĩa trong Ontology mẫu

• Các thông số truy cập cơ sở dữ liệu:

tên cơ sở dữ liệu, tên người dùng,

mật khẩu

Sau khi đã thiết lập, người dùng nhấn

Set Config để thiết lập thông số hoặc Store

Config để thiết lập và lưu lại thông số ra tệp

Đệ trình công việc:

Quá trình đệ trình công việc được thực hiện

thông qua giao diện đệ trình công việc (Hình

6) Trong đó, người dùng cần chỉ định địa

chỉ của dịch vụ web đệ trình công việc sau

đó nhấn Initialize để tạo phiên làm việc Cây

ngữ nghĩa được dịch vụ Web sinh ra và gửi

lại cho ứng dụng Người dùng có thể chọn

trên cây bằng cách nhấn các nút chọn bên

phải Cách bố trí này đảm bảo chúng ta dễ

dàng bổ sung các tiêu chí khác vào cây ngữ

nghĩa

Hình 6 Giao diện đệ trình công việc

Người dùng có thể chỉ định các tiêu chí

khác của ClassAd trong ô Other Criteria

Sau khi chọn loại công việc, dòng lệnh, các

tham số của lệnh, người dùng ấn nút Submit

để đệ trình công việc và ấn View Job Status

để xem trạng thái công việc thực hiện

5 ĐÁNH GIÁ KẾT QUẢ VÀ HƯỚNG

PHÁT TRIỂN

Bài báo này đã trình bày hướng tiếp cận ngữ nghĩa hóa tài nguyên của hệ thống tính toán thông lượng cao trên cơ sở đó xây dựng công cụ đệ trình công việc có ngữ nghĩa Bài báo cũng mô tả cách biểu diễn ontology trong miền ứng dụng về tài nguyên hệ thống

và việc sử dụng ontology này trong quá trình trao đổi, tương tác giữa các thành phần của

hệ thống

Dù những kết quả thử nghiệm chỉ mới thực thi trên phạm vi nhỏ hẹp trên hệ thống Condor nhưng mô hình xây dựng bài toán có thể áp dụng cho các hệ thống tính toán thông lượng cao khác Các ontology mẫu được xây dựng cũng cho phép dễ dàng tổng hợp, phát triển và sử dụng lại để tích hợp thông tin

LỜI CẢM ƠN

Chúng tôi chân thành cảm ơn Trung tâm tính toán hiệu năng cao trường Đại học Bách Khoa Hà Nội đã tạo điều kiện vật chất, kỹ thuật trong quá trình thực hiện đề tài này

TÀI LIỆU THAM KHẢO

[1] M Livny, J Basney, R Raman and T Tannenbaum: “Mechanisms for High Throughput Computing”, SPEEDUP Journal, Vol 11, No 1, June 1997

[2] T Tannenbaum, D Wright, K Miller and M Livny: “Condor - A Distributed Job Scheduler”', in Thomas Sterling, editor, Beowulf Cluster Computing with Linux, The MIT Press, 2002 ISBN: 0-262-69274-0

[3] T.S Somasundaram, R.A Balachandar, V Kandasamy, R Buyya, R Raman, N Mohanram and S Varun: “Semantic-based Grid Resource Discovery and its Integration with the Grid Service Broker,” ADCOM 2006

[4] R Raman, M Livny and M Solomon: “Resource Management through Multilateral Matchmaking'”, HPDC9 2000

[5] A.C.T Vidal, and S.T Kofuji: Semantics-Based Grid Resource Management, 2007

[6] A Harth, S Decker Y He H Tangmunarunkit and

C Kesselman}: “A semantic matchmaker service

on the Grid”, WWW 2004

[7] J Brooke, D Fellows, K L Garwood and C A Goble: “Semantic Matching of Grid Resource Descriptions” EAGC 2004

[8] H Tangmunarunkit, S Decker and C.Kesselman:

“Ontology-Based Resource Matching in the Grid - The Grid Meets the Semantic Web”, ISWC 2003

Trang 9

[9] O Caprotti, M Dewar and D Turi: Mathematical

service matching using Description Logic and

OWL MKM 2004

KS Thành đang theo học Tiến sỹ tại Department of Computer Science, Wayne State University, USA Hiện tại KS.Thành đang quan tâm tới các lĩnh vực như: Data Intensive Computing, Cloud Computing, Fault Tolerance

[10] F Baader, D Calvanese, D L McGuinness, D

Nardi and P F Patel-Schneider: “The description

logic handbook: theory, implementation, and

applications”, Cambridge University Press, 2003

ISBN: 0-521-78176-0 E-mail: thanh@wayne.edu

Trang web cá nhân: http://is.hut.vn/~thanhdd

Về các tác giả-

Kỹ sư Lê Ngọc Sơn tốt nghiệp

đại học Bách khoa Hà nội ngành Công nghệ thông tin năm

2008 Từ năm 2006 – 2008 Ks Sơn làm cộng tác viên tại Trung tâm tính toán hiệu năng cao – Trường ĐHBKHN Các vấn đề quan tâm của KS Sơn bao gồm trí tuệ nhân tạo, logic mô tả, web ngữ nghĩa, tính toán hiệu năng cao

PGS TS Nguyễn Thanh Thuỷ

Sinh ngày 14 tháng 8 năm

1960, tại Thường Tín, Hà Tây

Tốt nghiệp Đại học Bách Khoa Hà Nội, 1982 chuyên ngành Toán máy tính

Bảo vệ luận án Tiến sỹ chuyên ngành Tin học năm

1987 tại ĐHBK Hà Nội E-mail: lns.gmt@gmail.com

Được phong hàm PGS năm 2001 Hiện đang là Viện

trưởng Viện Đào Tạo Sau Đại Học, Giám đốc Trung

tâm Tính Toán Hiệu Năng Cao, Đại Học Bách Khoa

Hà Nội

Kỹ sư Đinh Tuấn Việt tốt

nghiệp đại học Bách khoa Hà nội năm 2008 KS Việt hiện đang công tác tại công ty Oracle Việt Nam KS Việt đang nghiên cứu các vấn đề về

lý thuyết CSDL, các hệ truy vấn thông tin, tính toán hiệu năng cao

Hướng nghiên cứu chính: Suy diễn, Học máy, Trí tuệ

tính toán, Tính toán hiệu năng cao, Tính toán lưới

Email: thuynt@it-hut.edu.vn

Kỹ sư Đỗ Đức Thành tốt

nghiệp Đại học Bách Khoa Hà Nội chuyên ngành Hệ thống Thông tin năm 2006 KS

Thành là Giảng viên bộ môn

Hệ thống Thông tin, khoa Công nghệ Thông tin, Đại học Bách Khoa Hà Nội

E-mail: dinhtuanviet@gmail.com

Tiêu đề	Xây dựng công cụ đệ trình công việc có ngữ nghĩa cho Condor
Tác giả	Lê Ngọc Sơn, Đinh Tuấn Việt, Tạ Tuấn Anh, Đỗ Đức Thành, Nguyễn Thanh Thủy
Thể loại	Bài báo khoa học

Định dạng
Số trang	9
Dung lượng	491,92 KB