1. Trang chủ
  2. » Công Nghệ Thông Tin

Các Phương pháp Lập luận và Tích hợp Ontology Mờ

160 98 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 160
Dung lượng 17,5 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Ontotlogy là một bộ tứ được xác định bởi các thành phần như sau [19]: O = C, I, R, Z, trong đó  C là tập hợp các khái niệmconcepts;  I là tập hợp các thực thể instances;  R là tập hợp

Trang 3

-Tích hợp Ontology Mờ

Trương Hải Bằng Trường Đại học Công nghệ Thông tin, Đại học quốc gia TP.HCM

bangth@uit.edu.vn

Tóm tắt Ontology có vai trò quan trọng trong việc tổ chức và quản lý tri thức

ở các lĩnh vực nghiên cứu và ứng dụng khác nhau Tri thức Ontology đã thu hút

sự quan tâm nghiên cứu của các nhà khoa học trên thế giới Tuy nhiên, khái niệm ontology truyền thống còn thiếu khả năng biểu diễn các thông tin mờ trong lĩnh vực tri thức không chắc chắn Mặt khác bài toán lập luận và tích hợp các ontology mờ hiện vẫn còn là vấn đề đang có nhiều trao đổi và nghiên cứu

về cả lý thuyết lẫn ứng dụng Bài báo đề xuất một mô hình về ontology mờ nhằm hướng đến giải quyết bài toán tích hợp ontology mờ dựa trên lý thuyết đồng thuận trong quá trình giải quyết mâu thuẫn giữa các ontology mờ và một

số kết quả nghiên cứu gần đây

1 Giới thiệu

Ontology đóng vai trò thiết yếu trong quá trình trao đổi tri thức giữa các hệ thống thông tin phân tán Để thực hiện điều này một cách hiệu quả, các ontology phân tán cần phải được tích hợp lại Tuy nhiên tích hợp ontology là quá trình rất phức tạp, vì tính chất đa dạng về cấu trúc của nó Do vậy tích hợp ontology là bài toán được nhiều nhà nghiên cứu quan tâm theo các hướng tiếp cận khác nhau [13] Với mục tiêu tích hợp ontology, định nghĩa sau đây được sử dụng Ontotlogy là một bộ tứ được xác định bởi các thành phần như sau [19]:

O = (C, I, R, Z), trong đó

 C là tập hợp các khái niệm(concepts);

 I là tập hợp các thực thể (instances);

 R là tập hợp các quan hệ hai ngôi được định nghĩa trên C;

 Z là tập hợp các luật biểu diễn ràng buộc toàn vẹn hoặc các mối quan hệ giữa các thực thể và các khái niệm không thể hiện được bởi những quan

hệ trong bộ R

Ontology dựa trên logic mô tả truyền thống, không đủ khả năng để mô tả thông tin

mờ, không thể đại diện đầy đủ và xử lý tri thức không chắc chắn, thông tin không chính xác trong các miền ứng dụng khác nhau Năm 2006, Straccia [25] dựa vào nền tảng của logic mô tả và lý thuyết tập mờ của Zadeh [26] đã đưa ra logic mô tả mờ (Fuzzy Description Logic) nhằm phục vụ cho việc xử lý tri thức không chắc chắn trên Web ngữ nghĩa Từ đó việc nghiên cứu và phát triển logic mô tả mờ như là một cơ sở cho việc biểu diễn tri thức và lập luận được đặt ra Trong các nghiên cứu của mình, Calegari và Ciucci [23], [24] đã đề cập đến các phương pháp tích hợp logic mô tả mờ

Transactions of the UIT Doctoral Workshop, Vol 1, pp.1-14, 2012.

Trang 4

vào ontology truyền thống để mở rộng ontology phù hợp hơn cho việc giải quyết các vấn đề suy luận không chắc chắn và các vấn đề cần thiết để xây dựng một ontology

mờ cho Web ngữ nghĩa

Sự khác biệt giữa ontology và ontology mờ là cho phép phân biệt ở các mức độ khác nhau về sự mô tả các khái niệm và quan hệ giữa chúng trong thế giới thực Các nghiên cứu về ontology mờ có thể phân thành hai nhóm công trình Nhóm thứ nhất bao gồm các phương pháp tiếp cận dựa trên logic, cụ thể là logic mô tả mờ [16], [20] Nhóm thứ hai sử dụng tiếp cận không-logic [14] Nhóm này đề xuất một mô hình ontology mờ trong đó một mô tả khái niệm được mờ hóa mức độ của giá trị các thuộc tính bằng cách sử dụng một hàm thành viên mờ [27]-[29] Trong nhóm này Blanco [15] đề xuất một mô hình ontology linh hoạt cho phép lưu trữ thông tin mờ trong cơ

sở dữ liệu Đề xuất này cho phép người dùng quản lý thông tin không chính xác Trong phần tiếp theo, chúng tôi trình bày các nghiên cứu liên quan đến các phương pháp lập luận và tích hợp tri thức ontology mờ Trong phần 3 trình bày các vấn đề cơ bản liên quan phương pháp lập luận và tích hợp ontology mờ Phần 4 đề xuất phương pháp sử dụng lý thuyết đồng thuận để tích hợp ontology mờ và một số kết quả đã được nhóm tác giả công bố gần đây [31]-[34] Cuối cùng là các nghiên cứu trong thời gian tiếp theo

2 Các Công trình Liên quan

Các công trình mới nhất về tích hợp ontology từ năm 2009 đến nay đã được trình bày[1]-[12] Các nghiên cứu tập trung đề cập vấn đề tích hợp ontology theo các phương pháp khác nhau về so khớp, ánh xạ và trộn ontology tùy thuộc vào ứng dụng

cụ thể chủ yếu liên quan đến web ngữ nghĩa, truy vấn thông tin Các phương pháp tiếp cận để tích hợp ontology được trình bày không thể hiện các tiêu chí một cách rõ ràng cho quá trình tích hợp, các thuật toán tích hợp chỉ liên quan đến các nghiên cứu

và ứng dụng thực tế cho một vấn đề cụ thể

Hiện nay có rất nhiều định nghĩa về tích hợp ontology trong đó định nghĩa được nhiều nghiên cứu tham khảo [19] được phát biểu như sau: Cho n ontologies O1, ,On ta cần xác định một ontology O* tốt nhất đại diện cho cho các ontology O1, ,On Để thực hiện được điều này tùy thuộc vào ứng dụng và mục tiêu nghiên cứu, cần tiến hành những kỹ thuật sau:

Trang 5

So khớp ontology: là tìm sự tương ứng của các khái niệm và quan hệ giữa các

ontology Quá trình này được sử dụng khi chúng ta cần giao tiếp trao đổi giữa hai hệ thống hoặc muốn sử dụng thông tin của hệ thống thứ hai này cho người dùng của hệ thống thứ nhất Được sử dụng trong nhiều công việc khác như trộn ontology, trả lời truy vấn, dịch dữ liệu, hoặc duyệt web ngữ nghĩa [1], [3], [4], [8], [10]

Ánh xạ ontology: biểu diễn một sự tương ứng giữa các các khái niệm và quan hệ

hai ontology là quá trình một chiều, chuyển các khái niệm và quan hệ từ một ontology này sang một ontology khác Định nghĩa này phù hợp với định nghĩa ánh xạ trong toán học, là sự tương ứng của các khái niệm và quan hệ của ontology nguồn và ontology đích [6], [7], [9], [12]

Trộn ontology: là quá trình tạo ra một ontology mới từ các ontology khác Được

sử dụng khi cần tích hợp một số hệ thống để tạo ra một hệ thống mới [5], [11], [21], [22]

Xung đột ontology: trong quá trình tích hợp ontology thông thường cần phải giải

quyết sự xung đột (không thống nhất) giữa các thực thể, khái niệm và quan hệ giữa các ontology [16], [17], [19], [21], [22], [30]-[34]

3 Các Khái niệm Liên quan

3.1 Định nghĩa Ontology Mờ

Cho (A,V) là một thế giới thực, trong đó A là tập hữu hạn các thuộc tính, V miền giá trị của A, , V a là miền giá trị của thuộc tính a Ontology mờ được định

nghĩa như sau [30], [32], [34]: Fuzzy ontology = (C, R, Z), trong đó

C là tập hữu hạn các khái niệm Một khái niệm của ontology mờ được định

nghĩa là một bộ tứ: (c, Ac, Vc, fc), với c là tên duy nhất của khái niệm, Ac 

A là tập các thuộc tính mô tả khái niệm, Vc  V là miền giá trị của thuộc tính: ⋃ và fc là hàm thành viên mờ: fc: Ac[0,1] biểu diễn mức thuộc tính mô tả khái niệm c Bộ (Ac, Vc, fc) được gọi là cấu trúc mờ của c

R là tập các quan hệ mờ giữa các khái niệm, R = {R1, R2,…, Rm }, R i  C C (0,1], i = 1, 2, ,m Một quan hệ là một tập bao gồm một cặp khái niệm và

giá trị mờ biểu diễn mức độ quan hệ giữa chúng Mối quan hệ Ri giữa hai

khái niệm trong ontology chỉ được biểu diễn bằng một giá trị mờ duy nhất, nghĩa là nếu (c, c, v)  Ri và (c, c, v  )  Ri thì v = v

Z là tập hợp các tiên đề, có thể được hiểu là ràng buộc toàn vẹn hoặc mối

quan hệ giữa các khái niệm và là tập hợp các hạn chế hay điều kiện (cần và

đủ) để xác định các khái niệm trong C

Trang 6

 Những mâu thuẫn thường xuất hiện giữa các ontology như thế nào?

Các phương pháp xác định mức độ đồng dạng giữa các ontology

Các phương pháp xác định mức độ đồng dạng giữa các ontology bao gồm các kỹ thuật cơ bản như sau:

 Kỹ thuật dựa trên chuỗi;

 Kỹ thuật dựa trên ngôn ngữ;

 Kỹ thuật dựa trên cấu trúc;

 Kỹ thuật dựa trên ngữ nghĩa

Một cách tiếp cận đơn giản để liên kết hai ontology là mỗi khái niệm thuộc ontology này phải so khớp với tất cả các khái niệm ở ontology khác nhằm đưa ra quyết định có hay không một cặp khái niệm đồng dạng với nhau Thuật toán này có

độ phức tạp O(n2), trong đó n là số lượng các khái niệm trong mỗi ontology Để khắc phục hạn chế này trong phép toán so khớp ontology mờ chúng tôi đề xuất thuật toán dựa trên khái niệm những phần chung tiềm năng viết tắt là PCP (potentially common parts) có độ phức tạp tính toán O(nlog(n)) [34]

Một số khái niệm:

Khoảng cách PCP Giả sử P1 = c1, c2, , cn và P’2 = c’1, c’2, , c’n là tập các khái niệm của các PCP thuộc hai ontologies tương ứng O1 và O2. Khoảng cách nhỏ nhất cho một cặp khái niệm tương ứng theo tiếp cận PCP sẽ được định nghĩa như sau:

D0(P1,P2) = ∑ ∑ (1) Với K={cjP2|d(ci,cj)threshold, ciP1}, trong đó:

Độ quan trọng của khái niệm : CI(c) = AI(c) + RI(c)+ bias (2)

Độ quan trọng của thuộc tính : AI(c) = ∑ (3)

Độ quan trọng của quan hệ : RI(c) = ∑ (4)

 Dk+1-D0>threshold (vượt một ngưỡng cho trước)

 E(P1, P2) là trọng số tăng bởi sự so khớp lại P1 và P2

Quy tắc tính sự tương đương theo tiếp cận PCP:

Quy tắc 1: Tính sự tương đương của cặp khái niệm có cả 2 đường được đánh dấu trong bảng Nếu được so khớp, loại khỏi bảng, tính lại D0và cập nhật Dk+1

Quy tắc 2: Nếu chỉ một trong 2 đường được đánh dấu, chúng ta tính độ tương đương cho cặp khái niệm theo khoảng cách nhỏ nhất Nếu được so khớp loại khỏi dòng hoặc cột tương ứng, cập nhật lại bảng , tính lại D0, Dk+1

Quy tắc 3: Nếu Dk+1 - D0 > Threshold hoặc tất cả các cặp khái niệm được so khớp

Ý tưởng thuật toán:

Bắt đầu từ một cặp khái niệm được so khớp duyệt các khái niệm theo mối quan hệ hoặc các trong kiến trúc ontology theo một mức cụ thể để xác định được phần chung tiềm năng ban đầu Quá trình này lan truyền đến cặp khái niệm lân cận và kết quả là một tập hợp của sự sắp xếp giữa các khái niệm trong tập hợp kết nối ngữ nghĩa của hai đồ thị gọi là phân đoạn Để so sánh sự giống nhau giữa các cặp khái niệm của các

Trang 7

ontology láng giềng quá trình này lặp đi lặp lại cho đến khi thuật toán thỏa mãn "hoặc

là tất cả các khái niệm thu thập được liên kết tìm thấy, hoặc không có cặp liên kết mới "

Thuật toán PCP:

input: Hai ontologyO1 và O2, hai Medoids, và một mức DepthLevel

output: Tập các khái niệm so khớp C* = ⋃ , Ci O1 hoặc O2;

For mỗi cặp Medoidsor hoặc C* do

Nếu là medoids hoặc Similarity ≥ Threshold * then

RealMatch = , i=1 n; j=1 m

CommonPart 1 =⋃ ; CommonPart 2 = ⋃ ;

Tính CI CommonPart 1 và CommonPart theo công thức (2,3,4);

For với mỗi C1CommonPart 1, C2CommonPart 2 do

Table <= Distance (C1k, C2h);

End for

Tính D 0;

D k = D 0;

while thỏa quy tắc(3): D k – D 0<= Threshold do

Medoids  Xác định cặp khái niệm so khớp theo quy tắc (1) và (2)

Loại bỏ các khái niệm tương đương ra khỏi Medoids từ C*;

Các phương pháp giải quyết mâu thuẫn giữa các ontology

Tích hợp ontology là một trường hợp đặc biệt của quá trình tích hợp tri thức, quá trình tích hợp cần thỏa mãn các tiêu chí sau:

Bảo toàn thông tin: Dữ liệu của Ontology nguồn phải ở trong kết quả tích

hợp

Giải quyết mâu thuẫn: Tất cả các xung đột xuất hiện trong các yếu tố thành

phần sau khi được tích hợp phải được giải quyết

Bảo toàn cấu trúc: Các kiểu cấu trúc của kết quả tích hợp phải giống cấu

trúc của các yếu tố thành phần ban đầu

Có ba mức mâu thuẫn ontology:

Mâu thuẫn ở mức thực thể: cùng thực thể của các ontology khác nhau có mô

tả mâu thuẫn với nhau

Mâu thuẫn ở mức khái niệm: cùng khái niệm giống nhau nhưng có cấu trúc

khác nhau trong các ontology khác nhau

Mâu thuẫn ở mức quan hệ: có mâu thuẫn về quan hệ giữa hai khái niệm

trong các ontology khác nhau

Trang 8

Hình 1 Các mức mâu thuẫn ontology [19]

3.3 Lý thuyết Đồng thuận

Giới thiệu

Phương pháp đồng thuận rất hữu ích trong việc giải quyết các xung đột hay mâu thuẫn tri thức trong thế giới thực đặc biệt liên quan đến vấn đề tích hợp tri thức ontology Phương pháp đồng thuận là một cách tiếp cận hiệu quả trong quá trình giải quyết xung đột tri thức nói chung và ontology nói riêng

Xét bài toán đồng thuận như sau: Cho một tập hợp của các đối tượng trong vũ trụ, cần phải xác định một đối tượng tốt nhất đại diện cho các đối tượng này Mục tiêu của vấn đề giải quyết xung đột là xác định được lời giải thích hợp cho bài toán đặt ra

Có hai trường hợp xảy ra trong quá trình này:

i Các giải pháp thích hợp độc lập với ý kiến của các người tham gia xung đột Ví

dụ cho trường hợp này là việc tính GDP hàng năm của một quốc gia được tạo ra bởi các chuyên gia tài chính khác nhau Vấn đề xác định GDP được chính xác khi kết thúc năm, giá trị này là độc lập của dự báo đã cho Trường hợp này được gọi là xung đột độc lập

ii Giải pháp phụ thuộc vào ý kiến của những người tham gia cuộc xung đột, gọi là xung đột phụ thuộc Ví dụ cho trường hợp này là quá trình bỏ phiếu trong các cuộc bầu cử

Các khái niệm cơ bản

Cho U là một tập hợp hữu hạn của các đối tượng đại diện cho ý kiến tiềm năng cho các đối tượng xung đột

Định nghĩa 1 (Hàm khoảng cách)

Trang 9

Cho tập U chúng ta định nghĩa hàm khoảng cách d như sau: thỏa các điều kiện:

Không âm

Phản xạ nếu

Đối xứng

Định nghĩa 2 (Profile) Profile X = {ri ∈TUPLE(Ti): Ti ⊆A for i = 1, 2, , n}, A là

tập các thuộc tính, TUPLE(T) là tập hợp các bộ kiểu Ti

Định nghĩa 3 (xung đột Profile)

U: là tập hữu hạn biểu diễn các đối tượng cho sự xung đột

: là tất cả cá tập con k-phần tử của U for k là số tự nhiên), Ký

hiệu U) =⋃ ∏ , Π(U) là tập hợp của tất cả các tập con khác rỗng của U,

khi đó mỗi phần tử của (U) được gọi là một xung đột Profile

Ví dụ: Trong các profile sau, mức độ xung đột (conflict) tăng dần:

X = {Yes, No, Neutral}, X’ = {Yes, Yes, No}, X” = {Yes, Yes, Neutral}

Định nghĩa 4 (Sự đồng thuận)

Cho U, d được cho trong định nghĩa 1

Cho Ánh xạ C:   Với mỗi conflict profile X P(U), tập C(X) được gọi

là sự đồng thuận của X, và một phần tử của C(X) được gọi là một đồng thuận của profile X

Bài toán tích hợp tri thức phát biểu như sau: cho một tập các profile

X = {ri TUPLE(Ti): Ti ⊆ A for i = 1, 2, , n}, cần xác định một bộ r* là đại diện tốt nhất cho các bộ r1, rn Bộ r* được gọi là tích hợp của các profile

Các tiêu chí đề lựa chọn phương pháp đồng thuận

Có nhiều tiêu chuẩn liên quan đến bài toán xác định sự đồng thuận [19], hai tiêu chuẩn quan trọng thường được sử dụng trong bài toán tích hợp tri thức là:

 Tính tối ưu O1: [Kemeny, 1959]:

Nếu và chỉ nếu (x C(X))  (d(x, X) = d(y,x)),  X P(U)

(tổng khoảng cách từ một đồng thuận đến các phần tử của profile P(U) là nhỏ nhất)

 Tính tối ưu O2:

Nếu và chỉ nếu (xC(X))  (d2(x, X)= d2(y,X)), X P(U)

(tổng bình phương khoảng cách từ một đồng thuận đến các phần tử của profile P(U)

là nhỏ nhất)

Tóm lại, lược đồ của phương pháp đồng thuận bao gồm các bước như sau:

 Xác định tập các phiên bản tiềm năng của dữ liệu

 Định nghĩa hàm đo khoảng cách giữa các phiên bản

 Chọn tiêu chí lựa chọn phương pháp đồng thuận

 Thực hiện thuật toán để lựa chọn phương pháp đồng thuận

Trang 10

Một tập các giải pháp đưa ra bởi những thành viên xung đột (xác định phương pháp

giải quyết phù hợp)

Giải pháp phụ thuộc vào các giải

pháp của thành phần tham gia

xung đột

Giải pháp độc lập với các giải pháp của thành phần tham gia

xung đột

Sự đồng thuận phải là thể hiện tốt

nhất của các giải pháp đã cho

Sự đồng thuận cần phản ánh các giải pháp được cung cấp và là một thỏa hiện chấp nhận được với các thành viên bất đồng

chọn tiêu chuẩn O2 cho lựa chọn

đồng thuận

Chọn tiêu chuẩn O1 cho lựa chọn

đồng thuận

Hình 2 Sơ đồ sử dụng của các chức năng đồng thuận [19]

4 Một số Kết quả Nghiên cứu: Tích hợp Ontology Mờ Dựa trên

Lý thuyết Đồng thuận

4.1 Tích hợp Ontology Mờ Mức Khái niệm

Cho hai ontology mờ O1 và O2 , khái niệm c thuộc O1 là concepts (c, Ac1,Vc1, f1) và thuộc O2 là (c, Ac2, Vc2 , f2) Ta nói rằng sự mâu thuẫn khái niệm xảy ra nếu Ac1≠ Ac2

hoặc Vc1≠ Vc2 hoặc f1 ≠f2

Bài toán 1:

Cho tập cấu trúc mờ của các khái niệm X = {(A i

, V i , f i )| (A i , V i , f i) cấu trúc mờ của khái niệm c trong ontology Oi, i=1,…,n}, Cần xác định bộ ba: c* = (A*, V*, f*) là biểu diễn tốt nhất thỏa tiêu chuẩn O2 của lý thuyết đồng thuận cho các cấu trúc trên

Thuật toán 1 Tích hợp mức khái niệm

Input: cho cấu trúc mờ của khái niệm c trong n ontology

X = {(Ai, Vi,fi): (Ai, Vi, fi) là cấu trúc mờ của khái niệm c trong n ontology Oi’

Trang 11

END

Chứng minh: Theo Định lý 8.1 [19] như sau:

Cho profile X = {x(i) = vector x=(x1,x2, ,xm) thỏa tiêu chuẩn đồng thuận O2 khi và chỉ khi: xj= ∑ , j = 1,2, ,m

4.2 Tích hợp Ontology Mờ Mức Quan hệ

Cho hai ontology mờ O1 và O2 cO1, c’  O2 chúng ta nói rằng sự mâu thuẫn mức quan hệ xảy ra nếu Ri1(c,c’)  Ri2(c,c’), i {1,…,m}

Xét trường hợp sau: trong bảng 1, cho hai ontology O1 và O2 có các quan hệ R1,

R2, R3 và các khái niệm a,b,c, các mâu thuẫn mức quan hệ xảy ra trong ví dụ này là:

Thuật toán 2: Tích hợp mức quan hệ

Input: Cho tập các quan hệ giữa 2 khái niệm c và c’ trong n ontologies X={R ij (c,c’): j

Trang 12

số vi của quan hệ <c,c> trong sẽ là bao nhiêu

Chứng minh: Tương tự thuật toán 2

4.3 Mô hình Đa Thuộc tính và Đa Giá trị cho Bài toán Tích hợp Ontology Mờ ở Mức Thực thể

Cho A là tập các thuộc tính của một ontology Mỗi thuộc tính a A có miền giá Va,

V a được gọi là tập các giá trị cơ bản (elementary values) Một giá của thuộc tính a là

Trang 13

một tập con của Va Tập được gọi là siêu miền (super domain) của thuộc tính a giả sử có tập B là tập con của A: B ⊆ A, lấy Vb = ⋃ và = ⋃

Định nghĩa: Một thực thể mờ của khái niệm c được mô tả bởi các thuộc tính của tập

Ac có các giá trị thuộc tập (X = Ac) là một căp (i, v), với i là định danh của thực thể, v là giá trị của thực thể là một bộ có kiểu Ac được biểu diễn là một hàm như sau v: A , v(a) ,a Ac

Cho hai ontology O1 và O2 , khái niệm c thuộc O1 là khái niệm (c, Ac1,Vc1, f1) và c’ thuộc O2 là (c’, Ac2, Vc2 , f2) Cho (i, v) (O1,c) và (i, v) (O2,c) Ta nói rằng sự mâu thuẫn thực thể xảy ra nếu v(a)  v(a), aAc Ac

Bài toán 4:

Cho tập hợp các thực thể X = {(i, v1),…, (i, vn)}, với vi Ai  A, vi: Ai  Vi i =

1,…, n và Vi = ⋃ , cần xác định (i, v) tốt nhất trong tập X thỏa tiêu chuẩn O1 của lý thuyết đồng thuận

Ví dụ về mâu thuẫn giữa các thực thể của các ontology về thời tiết

Bảng 2 Thông tin thời tiết được thu thập từ sáu trạm khí tượng (tương ứng với sáu ontology) Thực thể

Trong bảng 1 ta thấy các thực thể có thể có các giá trị thuộc tính khác nhau, xảy ra mâu thuẫn

Thuật toán 4:

Input: tập các mô tả của các thực thể: X = {r i TUPLE(Ti ): T i  A, i = 1, 2, , n}

và hàm khoảng cách d a cho các thuộc tính a  A,

d a là hàm được xác định như sau d a: [0,1]

Output: bộ t* T*  A là đại diện tốt nhật được tích hợp từ các bộ của X

Procedure:

BEGIN

1 A =⋃ ;

2 For each a  A xác định một tập X a = {t ia : t i  X for i = 1, 2,…, n};

3 For each a  A sử dụng hàm khoảng cách d a xác định một giá trị v a  Va sao cho

Trang 14

5 Kết luận và Hướng Phát triển

Bài báo trình bày một số khái niệm cơ bản của tích hợp ontology, đề xuất một mô hình ontology mờ cho bài toán tích hợp ontology mờ Một đóng góp quan trọng của nghiên cứu là sử dụng cách tiếp cận dựa trên lý thuyết đồng thuận cho các phương pháp lập luận & tích hợp trên Cơ sở tri thức không chắc chắn Ontology Mờ

Các công việc trong tương lai liên quan đến thử nghiệm các thuật toán tích hợp và thực hiện thử nghiệm trên dữ liệu ontology mờ thời tiết được cài đặt dựa trên các ontology thời tiết đã có

Tài liệu tham khảo

1 Md Hanif Seddiqui, Masaki Aono,, An efficient and scalable algorithm for segmented alignment of ontologies of arbitrary size, Web Semantics: Science, Services and Agents

on the World Wide Web, (Elsevier 2009) 344–3567

2 Deryle Lonsdale a, David W Embley a, Yihong Ding a, Li Xub, Martin Hepp, 2010], Reusing ontologies and language components for ontology generation, Data & Knowledge Engineering Journal (2010) 318–330

3 Watson Wei Khong Chua, Jung-jae Kim, BOAT: Automatic alignment of biomedical ontologies using term informativeness and candidate selection, Journal of Biomedical Informatics 45 (2012) 337–349

4 Jürgen Bock a, Jan Hettenhausen, Discrete particle swarm optimisation for ontology alignment, Information Sciences (2012) 152–173

5 Asad Masood Khattak, Zeeshan Pervez, Khalid Latif, Sungyoung, Knowledge accumulation through automatic merging of ontologies, Knowledge-Based Systems (2012)

6 Adolfo Guzmán-Arenas, Alma-Delia Cuevas Time efficient reconciliation of mappings in dynamic web ontologies, Expert Systems with Applications (2010) 1991–2005

7 Ming Mao, Yefei Peng, Michael Spring, An adaptive ontology mapping approach with neural network based constraint satisfaction, Web Semantics: Science, Services and Agents on the World Wide Web (2010) 14–25

8 Hacene Belhadef, A new bidirectional method for ontologies matching, Procedia Engineering (2011) 558 – 564

9 Mohamed Bakillah, A Fuzzy Logic Semantic Mapping Approach for Fuzzy Geospatial Ontologies, The Fifth International Conference on Advances in Semantic Processing,

Trang 15

14 Abulaish, M., Dey, A.: A Fuzzy Ontology Generation Framework for Handling Uncertainties and Non-uniformity in Domain Knowledge Description In: Proceedings of the International Conference on Computing: Theory and Applications, pp 287–293 IEEE (2007)

15 Blanco, I.J., Vila, M.A., Martinez-Cruz, C.: The Use of Ontologies for Representing Database Schemas of Fuzzy Information International Journal of Intelligent Systems 23(4), 419–445 (2008)

16 Duong, T.H., Nguyen, N.T., Jo, G.S.: A Method for Integrating Multiple Ontologies.Cybernetics and Systems 40(2), 123–145 (2009)

17 Fernadez-Breis, J.T., Martinez-Bejar, R.: A Cooperative Framework for Integrating Ontologies Int J Human-Computer Studies 56, 665–720 (2002)

18 Lu, J., Li, Y., Zhou, B., Kang, D., Zhang, Y.: Distributed Reasoning with Fuzzy Description

19 Nguyen, N.T.: Advanced methods for inconsistent knowledge management Springer, London (2008)

20 Nguyen, N.T.: Inconsistency of Knowledge and Collective Intelligence Cybernetics and Systems 39(6), 542–562 (2008)

21 Noy, N.F., Musen, M.A.: SMART: Automated Support for Ontology Merging and Alignment.In: Proc of the 12th Workshop on Knowledge Acquisition, Modelling and Management (KAW 1999), Banff, Canada, pp 1–20 (1999)

22 Pinto, H.S., Martins, J.P.: A Methodology for Ontology Integration In: Proceedings of the First International Conference on Knowledge Capture, pp 131–138 ACM Press (2001)

23 Calegari, S., Ciucci, D.: Fuzzy Ontology, Fuzzy Description Logics and Fuzzy-OWL In: Proceedings of WILF 2007 Volume 4578 of LNCS (2007) In printing

24 Calegari, S., Ciucci, D.: Fuzzy Ontology and Fuzzy-OWL in the KAON Project In: FUZZIEEE 2007 IEEE International Conference on Fuzzy Systems (2007)

25 Straccia U., A Fuzzy Description Logic for the semantic Web, Proc in Capturing Intelligence: Fuzzy logic and the semantic Web, Elie Sanchez ed., Elsevier, 2006

26 Zadeh, L A Fuzzy sets.Information and control, Elsevier, 1965, pp 338-358

27 Thanh Tho Quan, Siu Cheung Hui and Tru Hoang Cao.: Automatic fuzzy ontology generation for semantic Web, Knowledge and Data Engineering Journals IEEE,Volume: 18, Issue: 6, pp: 842 - 856 , Product Type: Journals & Magazines, 2006

28 Silvia, Calegari and Elie Sanchez.: A Fuzzy Ontology-Approach to improve Semantic Information Retrieval Proceedings of the Third ISWCWorkshop on Uncertainty Reasoning for the Semantic Web - URSW'07, 2007

29 Hua Mao Gu.: Educational Game for Middle & Primary School Students- EGMPSS Proceedings of the 18th Conference of International Maritime Lecturers’ Association,

2008

30 Hai Bang Truong, Ngoc Thanh Nguyen: A Multi-attribute and Multi-valued Model for Fuzzy Ontology Integrationon Instance Level ACIIDS The 4nd Asian Conference on Intelligent Information and Database Systems, Springer Verlag in a volume LNAI, 2012: 187-197

31 Trong Hai Duong, Hai Bang Truong, Ngoc Thanh Nguyen: Local Neighbor Enrichment for Ontology Integration ACIIDS The 4nd Asian Conference on Intelligent Information and Database Systems, Springer Verlag in a volume LNAI, 2012: 156-166

Trang 16

32 Hai Bang Truong, Ngoc Thanh Nguyen, Phi Khu Nguyen: Fuzzy Ontology Building and Integration for Fuzzy Inference Systems in Weather Forecast Domain ACIIDS-2011 The 3nd Asian Conference on Intelligent Information and Database Systems, Springer Verlag

in a volume LNAI, in Daegu city, Korea: 517-527

33 Hai Bang Truong, Ngoc Thanh Nguyen: A framework of an effective fuzzy ontology alignment technique International Conference on Systems, Man and Cybernetics, Anchorage, Alaska, USA, IEEE 2011, ISBN 978-1-4577-0652-3: 931-935

34 Ngoc Thanh Nguyen, Hai Bang Truong: A Consensus-Based Method for Fuzzy Ontology Integration The Second International Conference on Computational Collective Intelligenc, Springer Verlag in a volume LNAI, ICCCI10, Kaohsiung city, Taiwan: 480-

489

Trang 17

Dựa trên Bản thể học

Đặng Kiên Cường Trường Đại học Nông Lâm TpHCM dkcuong@hcmuaf.edu.vn

Tóm tắt Trong Khoa học Máy tính và Trí tuệ Nhân tạo, Bản thể học được vận dụng

trong việc chia sẻ và nỗ lực tái sử dụng Kiến thức, cho kỹ thuật hiệu quả (phân phối, hợp tác) của các hệ thống dựa trên tri thức Bản thể học đã sớm bước vào lĩnh vực quản lý tri thức (Knowledge Management-KM): Chia sẻ và tái sử dụng tri thức của cá nhân, nhóm, và tri thức tổ chức là một trong các mục tiêu trung tâm trong nhiều dự án quản lý tri thức Bài viết tập hợp các nghiên cứu trong hai lĩnh vực: mô hình người dùng trong các hệ thống quản lý tri thức và khai thác bản thể học cho các mục đích ngữ nghĩa tri thức đại diện Chúng tôi đưa ra một cái nhìn tổng quan về mô hình người dùng để từ đó xây dựng mô hình hệ thống trợ giúp học tập thích nghi dựa trên bản thể học

Từ khoá: Bản thể học, quản lý tri thức, hệ thống hỗ trợ, hệ thống thích nghi, hệ thống

thông minh

1 Giới thiệu

Năm 2004 Lee và cộng sự [1] đã công bố nghiên cứu mang tính thống kê trên 385 bài báo thuộc các tạp chí khoa học nhằm giới thiệu sự phân bố của các chủ đề nghiên cứu, các phương pháp nghiên cứu, các tác giả được trích dẫn nhiều nhất, danh mục sách và giáo trình được tham khảo nhiều nhất Kết quả nghiên cứu cho thấy đa số các công trình nghiên cứu triển khai xoay quanh hai chủ đề chính: xây dựng bài giảng và cung cấp các tiện ích hỗ trợ như khai thác tài nguyên, đánh giá kết quả học tập, tính cộng tác của người học, vv Tiện ích cung cấp trong các hệ thống đào tạo thông minh hay các hệ thống đa truyền thông thích nghi (Adaptive Hypermedia Systems –AHS) được xây dựng dựa trên các mô hình đặc trưng của người dùng (user profile) để hỗ trợ khai thác thông tin cùng với tài nguyên học tập phù hợp với từng cá nhân người học Nhìn chung các nghiên cứu hiện nay chủ yếu nhắm vào các chức năng hỗ trợ xây dựng bài giảng, diễn đàn thảo luận giữa người học mang tính tự phát và thiếu tính tổ chức

Trên thế giới hiện nay, đào tạo điện tử đã trở nên thông dụng và hầu hết các tổ chức đào tạo đều có sự trợ giúp của đào tạo điện tử [2] Phạm vi ảnh hưởng của đào tạo điện tử đã lan rộng ra rất nhiều lĩnh vực Trong học tập theo xu hướng Xây dựng khóa học theo nhu cầu người học [4,5] thể hiện rõ ràng khi chúng được gọi là các thiết kế "hướng tới học viên" hay "tập trung vào sinh viên" Điều này không chỉ là tập trung vào nhiều phong cách học tập khác nhau của học viên mà là chính học viên có thể quyết định và quản lý được quá trình học tập của mình Trong một số quy trình hướng dẫn sử dụng bằng tay hoặc bán tự

Transactions of the UIT Doctoral Workshop, Vol 1, pp 15-24, 2012.

Trang 18

động hiện có, người và máy không thể hiểu nhau Công nghệ Bản thể học hoặc công nghệ Web ngữ nghĩa là một giải pháp tốt [8,9]

Xuất phát từ quan điểm của cố vấn học tập, những người thường xuyên tư vấn, giải đáp hoặc giới thiệu cho sinh viên những vấn đề thắc mắc liên quan đến học tập và nghiên cứu Nếu trợ giảng hoặc người hướng dẫn hiểu rõ về năng lực của sinh viên, hiểu rõ về điểm yếu

và điểm mạnh của từng sinh viên (thông qua hồ sơ sinh viên – student profile) thì việc gợi ý cho sinh viên có thể chính xác hơn Điều này thật sự khó khăn trong môi trường giáo dục, khi một cố vấn học tập có quá nhiều sinh viên (đặc biệt ở Việt Nam), cơ hội để mỗi sinh viên gặp gỡ riêng với cố vấn học tập là không nhiều, không tính đến trở ngại trong việc giao tiếp giữa Thầy và Trò (sinh viên khó diễn đạt, hoặc khó tiếp cận với cố vấn học tập) [6] Hơn nữa, mỗi cố vấn học tập cũng có những giới hạn, khó khăn trong việc tư vấn sinh viên với những câu hỏi ngoài phạm vi mà họ hiểu

Với sự xuất hiện mạnh mẽ của Web ngữ nghĩa, Bản thể học (Ontology) ngày càng được

đề cập, sử dụng nhiều, không chỉ trong lĩnh vực Web ngữ nghĩa mà còn trong nhiều lĩnh vực khác cần có nguồn thông tin giàu ngữ nghĩa do Ontology đem lại, phục vụ cho nhu cầu thực hiện các suy diễn và các thuật toán một cách tốt hơn Bản thể học được sử dụng để: Người và máy có thể hiểu, chia sẻ thông tin và làm việc với nhau; Kích hoạt tính năng tái

sử dụng kiến thức miền Các lĩnh vực ứng dụng của Bản thể học: Xử lý ngôn ngữ tự nhiên;

Hệ thống thông tin thông minh; Open Data Semantic Web-Liên Kết; Semantic Web mantic Search, vv

Se-Bài báo được tổ chức như sau, Phần 2 giới thiệu một vài nghiên cứu có liên quan đến hệ thống hỗ trợ người học và các nghiên cứu về Ontology liên quan đến người học Phần 3 giới thiệu một số khái niệm, và cách tiếp cận hệ thống hỗ trợ Phần 4 đưa ra một số kết quả

dự kiến đạt được cũng như triển vọng trong tương lai

2 Công trình Liên quan

Hiện nay đã có rất nhiều nghiên cứu liên quan đến các hệ thống hỗ trợ, hệ thống tư vấn, hệ thống học thích nghi, hệ thống phục vụ đào tạo trực tuyến, vv Phân tích xu thế phát triển, tập trung ở hai khía cạnh: phát triển các hệ thống quản trị nội dung học và phát triển các hệ thống quản trị học, đào tạo liên quan đến điện tử sẽ theo ba xu hướng [5,25]:

i) Xây dựng khóa học điện tử hoàn chỉnh: Phát triển về mặt hệ thống, xây dựng LMS (Learning Management System - Hệ thống quản trị học tập) để phát triển mô hình đào tạo dựa trên công nghệ web toàn diện, từ đó tạo ra các khóa học trực tuyến hoàn chỉnh, độc lập để tăng thêm hiệu quả cho những LMS này, nội dung các bài giảng phải dễ hiểu, dễ truyền đạt, sử dụng đa phương tiện để tăng chất lượng đào tạo

ii) Xây dựng khóa học theo chuẩn: Phát triển về mặt nội dung, nâng cấp các chuẩn nội dung, hướng tới một chuẩn phù hợp với yêu cầu chung của đào tạo điện tử thế giới

và mang đầy đủ các đặc tính thỏa mãn yêu cầu của thời đại đó là khả năng sử dụng lại, tính tương thích, tính khả chuyển, tính thích nghi, vv Một chuẩn nội dung đầy đủ các hiệu quả sẽ là động lực phát triển đào tạo điện tử theo bề rộng bằng cách phân phối nội dung học trên toàn thế giới qua mạng Internet Đây cũng là tiền đề để tạo ra trung tâm phân phối tri thức chung cho tất cả LMS, LCMS (Learning Content Management Sys-tem - Hệ thống quản trị nội dung học) Đến lúc đó chi phí con người phải trả cho giáo dục và đào tạo sẽ giảm tối đa mà chất lượng, hiệu quả lại tăng rõ rệt

Trang 19

iii) Xây dựng khóa học theo nhu cầu người học: Phát triển về nội dung, cộng đồng đào tạo điện tử thế giới đang xây dựng một mô hình chuẩn để sắp xếp và điều hướng nội dung học hiệu quả, tạo khóa học động phù hợp với đặc trưng của từng học viên Trong quá trình phát triển các chuẩn nội dung, các tổ chức cũng đề xuất ra mô hình điều hướng và sắp xếp Trong tương lai, khi các chuẩn nội dung phát triển đến giai đoạn ổn định và thích nghi, mô hình sắp xếp và điều hướng nội dung sẽ được chuẩn hóa và tích hợp vào chuẩn nội dung Hiện nay, chuẩn SCORM (Shareable Content Ob-ject Reference Model- Chuẩn mô tả đối tượng nội dung có thể chia sẻ được) cũng đang chỉnh sửa và nâng cấp để đáp ứng yêu cầu này, nhưng khả năng điều hướng trong SCORM vẫn chưa linh hoạt và chưa thực sự hiệu quả

Ở Việt Nam, các nghiên cứu trong 10 năm gần đây, tập trung vào việc phát triển nội dung học tập trên nền tảng đào tạo điện tử

Nhìn chung, sự phát triển đào tạo điện tử tại Việt Nam đang trong giai đoạn khởi đầu Các vấn đề lớn gặp phải ở đây là việc xây dựng các qui chuẩn trong đào tạo điện tử, xây dựng cơ sở hạ tầng công nghệ thông tin, các chính sách áp dụng đào tạo điện tử trong hoạt động giáo dục đào tạo

Đại học Quốc gia Hà Nội cũng đã và đang nghiên cứu và triển khai dự án "Đầu tư xây dựng hạ tầng kỹ thuật CNTT, phát triển công nghệ phần mềm, đổi mới phương pháp giảng dạy và học tập, xây dựng mô hình đại học điện tử"

Trung tâm Tin học thuộc Bộ Giáo dục và Đào tạo, với sự hợp tác của Công ty Packard VN, đã xây dựng cổng đào tạo trực tuyến đầu tiên và chính thức hoạt động tại địa chỉ http://el.edu.net.vn vào sáng 1/1/2005 Cổng đào tạo trực tuyến này cung cấp các hiểu biết cơ bản về đào tạo điện tử, cùng các lời khuyên có giá trị về việc nghiên cứu và triển khai đào tạo điện tử

Hewlett-Cho đến nay, nhiều trường đại học trong cả nước đã triển khai phần mềm đào tạo điện tử

sử dụng công nghệ mã nguồn mở Theo thống kê trên trang web chính thức của Moodle tại địa chỉ http://www.moodle.org, hiện có 154 đơn vị đã sử dụng hệ thống này

Trường Đại học Công nghệ, Đại học quốc gia Hà Nội đã phát triển hệ thống đào tạo điện

tử để trợ giúp cho việc dạy và học Sinh viên có thể truy cập website môn học để lấy thông tin học tập theo tài khoản cá nhân Hệ thống đào tạo điện tử này cho đến nay đã trợ giúp đắc lực cho thầy và trò Trường Đại học Công nghệ, nhưng vẫn chưa thực sự linh hoạt cũng như chưa tận dụng hết các khả năng của đào tạo điện tử

ĐH Tự nhiên, ĐH Quốc gia TPHCM đã triển khai Dự án sản xuất thử nghiệm cấp trọng điểm, năm 2008 “Mô hình đặc trưng người dùng phục vụ đào tạo trực tuyến” (User Profile E-learning)

Cao Tuấn Dũng và cộng sự đã tìm hiểu việc “Xây dựng một cổng thông tin y tế cộng đồng dựa trên Ontology” [10]

Theo nghiên cứu về hướng phát triển và sử dụng Internet và Web (Hình 1-2), Web được phát triển theo bốn giai đoạn chính: (1) Web 1.0 thực hiện kết nối thông tin, (2) Web 2.0 kết nối người và người, (3) Web 3.0 kết nối tri thức, và (4) Web 4.0 kết nối mang tính thông minh; trong tương lai gần và xa hơn (đến năm 2030), nhu cầu chính của việc sử dụng Internet và Web liên quan đến các dịch vụ theo hướng tích hợp và có sự trợ giúp thông minh

Phần tiếp theo của bài báo, chúng tôi trình bày một cái nhìn tổng quan của các mô hình người sử dụng, mô hình thích nghi và Hệ thống hỗ trợ thông minh

Trang 20

Hình 1 Xu hướng sử dụng Web (Nguồn: Nova Spivack and Radar Networks)[4]

Hình 2 Trạng thái nghiên cứu sử dụng của Web ngữ nghĩa (Nguồn: Courtesy of Mills Davis,

Pro-ject10X; source: Nova Spivack, Radar Networks and John Breslin, DERI)[4]

3 Cách Tiếp cận

3.1 Mô hình Người Sử dụng, Mô hình Thích nghi, Hệ thống Hỗ trợ Thông minh

Sergey Sosnovsky [8] đã tổng kết lịch sử phát triển của mô hình người sử dụng với bốn giai đoạn cùng với đặc trưng chính của mỗi giai đoạn, trong đó những năm 2000 sẽ theo xu hướng mới với hai sáng kiến chính trong phát triển Web – Mạng Xã hội (Web 2.0) [11] và Web Ngữ nghĩa ảnh hưởng đến sự phát triển của công nghệ mô hình người sử dụng trên Web đồng thời bị ảnh hưởng do sự phát triển của các thiết bị điện thoại di động và công nghệ không

Học tập là một trong những lĩnh vực quan trọng nhất trên thế giới để thúc đẩy sáng tạo ý tưởng về giáo dục và nghiên cứu Trong đó, việc xây dựng kế hoạch học tập thật sự là vấn

đề quan trọng Đặc biệt, hoạt động dạy và học trên mạng ngày càng trở nên phổ biến do ứng dụng rộng rãi những thành tựu của công nghệ thông tin, đặc biệt khi có sự phát triển của công nghệ Internet Gần đây, việc tự học, chuẩn bị kiến thức qua mạng đã trở thành

Trang 21

một nhu cầu của người học nhằm tiếp thu kiến thức hiệu quả, rút ngắn thời gian, không gian học tập cũng như để đạt được kiến thức mong muốn phù hợp với bản thân

Để đáp ứng nhu cầu đó, các hệ thống đào tạo điện tử (E-learning) được phát triển và triển khai ứng dụng rộng rãi Sự phát triển của E-learning làm nảy sinh nhiều vấn đề cần được nghiên cứu và giải quyết Trong đó, vấn đề làm thế nào để tạo được những khóa học E-learning hiệu quả, xây dựng được những chương trình học phù hợp đáp ứng được nhu cầu của người học đang được nhiều nhà khoa học quan tâm nghiên cứu

Hình 3 Mô hình phủ kiến thức cho sinh viên [6]

Mô hình phủ [6] (Hình 3) được sử dụng phổ biến trong việc thể hiện các miền kiến thức thành các môđun theo chủ đề hay khái niệm cụ thể, để có thể định lượng mức độ hiểu biết các khái niệm của người học một cách độc lập

Theo Stuart E Middleton [12], Hồ sơ người học thường dựa trên tri thức hoặc hành vi [24] Mô hình hồ sơ người học là một hướng nghiên cứu được quan tâm nhiều trong thời gian gần đây Chúng tôi sử dụng hướng tiếp cận Bản thể học để biểu diễn mô hình hồ sơ người học Hướng tiếp cận này thay vì sử dụng các phương pháp biểu diễn tri thức khác như: Sử dụng bộ ba giá trị (Đối tượng - Thuộc tính - Giá trị), Khung, Logic mờ, Mạng ngữ nghĩa bởi ngoài việc cung cấp bộ từ vựng chung về miền tri thức, bản thể học còn cung cấp mối quan hệ giữa mô tả ràng buộc giữa các từ vựng, kết hợp được các phương pháp biểu diễn tri thức khác nhau để biểu diễn đối tượng, ràng buộc, quan trọng hơn Bản thể học là một công nghệ mô tả tri thức ngữ nghĩa một cách hình thức, có thể chia sẻ trên Web, máy

có thể hiểu và xử lý tự động Các vấn đề cần xác định đề biểu diễn mô hình nội dung dựa trên bản thể học gồm có: Xác định các lớp và các đối tượng, các thuộc tính và mối quan hệ giữa chúng Các yếu tố này được trình bày trong phần kiến trúc của mô hình hình hồ sơ người học trong Hình 4

Trong Hình 4, hình elíp thể hiện các khái niệm, hình chữ nhật thể hiện nhiệm vụ, mũi tên liền nét biểu diễn mối quan hệ tiên quyết, mũi tên đứt nét biểu diễn mối quan hệ thành

phần Thông qua quan hệ giữa các khái niệm, nhiệm vụ, trên cơ sở đánh giá khái niệm Ci

hệ thống đưa ra mức độ của khái niệm C; đề hoàn thành một chủ đề T thì phải hoàn thành các nhiệm vụ T j

1

, T j 2 , …T j

m (ví dụ trong học tập, để hoàn thành một môn học thì phải có các

môn tiên quyết, các môn học tự chọn)

Một hệ thống hỗ trợ cố vấn học tập thông minh có quan hệ mật thiết với sự thích nghi của người học (Hình 5) tham gia trong hệ thống học tập Những thông tin hay kiến thức về một khái niệm nào đó trong một môn học sẽ được phân chia thành nhiều phần và mỗi phần

sẽ được liên kết với một điều kiện cụ thể về trình độ của người học Sau đó, tùy theo trình

độ được thể hiện trong hồ sơ của từng cá nhân mà hệ thống sẽ áp dụng những luật thích

Trang 22

nghi tương ứng nhằm cung cấp những phần nội dung thông tin hay kiến thức về khái niệm cùng với cách trình bày một cách phù hợp nhất [13,14]

Hình 4 Mô hình hồ sơ người học [21]

Hình 5 Mô hình thích nghi [13]

Hệ thống trợ giảng thông minh - Intelligent Tutoring System (ITS) là một hệ thống cung cấp hướng dẫn sửa đổi hoặc trả lời trực tiếp cho sinh viên [19] Khi thực hiện một tác vụ, ITS trả lời sinh viên mà không cần sự can thiệp của con người ITS có thể đóng vai trò quan trọng trong nhiều lĩnh vực khác nhau Đặc biệt là hệ thống chuyên gia xây dựng để tái tạo các đặc điểm của một người giáo viên ITS bao gồm bốn hệ thống (module) con Chẳng hạn như: các module giao diện, các module chuyên gia, module sinh viên, và module trợ giảng như thể hiện trong Hình 6

Các module giao diện hỗ trợ sinh viên tương tác với hệ thống, thường thông qua một giao diện người dùng đồ họa Các module chuyên gia minh họa kiến thức trong các chủ đề trọng tâm được ITS giảng dạy Module còn chỉ định một đại diện chuyên gia kiểm soát một loại kiến thức của đối tượng Các module sinh viên điều khiển mô tả sự hiểu biết hoặc các hoạt động của sinh viên, đồng thời cũng lưu giữ những đặc điểm “quan niệm sai lầm” và những “khoảng trống” trong kiến thức sinh viên Các module trợ giảng nắm giữ những kiến thức sinh viên yêu cầu Module này có hành động “chữa bệnh”, ví dụ như đưa ra phản hồi hoặc khắc phục giảng dạy Để đạt được điều này, nó đòi hỏi kiến thức về những gì một người giáo viên sẽ làm trong những điều kiện như thế

C9

C8 C4

C7

Trang 23

Hình 6 Kiến trúc chung của hệ thống ITS [15]

3.2 Cơ sở Tri thức Sử dụng Bản thể học

Trong bối cảnh về hướng phát triển và sử dụng Internet và Web, cũng như sự phát triển các

mô hình người sử dụng, và đặc biệt là hiện nay các trường ĐH ở Việt Nam đã chuẩn bị để chuyển sang hoàn toàn theo học chế tín chỉ, nghiên cứu có thể giải quyết hai vấn đề: (1) Lưu trữ hồ sơ của người học, phân loại người học để tăng hiệu quả việc lựa chọn nội dung học tập cho từng người học và (2) Cung cấp các mảng kiến thức theo nhiều lĩnh vực khác nhau (giống như các hệ chuyên gia) Hệ thống đề xuất có thể đóng vai trò của giáo viên trợ giảng để có thể cung cấp cho người học nhiều gợi ý chính xác hơn dựa trên luồng hồ sơ người học mà hệ thống cung cấp Hơn thế nữa, sinh viên có thể giao tiếp với hệ thống “trợ giảng” này bất cứ khi nào và ở đâu mà họ muốn vì đây là hệ thống sử dụng trên Internet

Hệ thống này còn là một công cụ giúp cho cố vấn học tập giám sát sinh viên cũng như giảm bớt gánh nặng cho cố vấn học tập trong việc trả lời các câu hỏi của sinh viên [21]

Khi đã có các miền tri thức của người học, phân loại người học, chương trình học, cần phải tích hợp các tri thức thành một miền tri thức tích hợp để sử dụng (Hình 6) [22,24] Kiến trúc mô hình người sử dụng dựa trên bản thể học dựa trên một định nghĩa rõ ràng cung cấp bởi người dùng thông qua trình soạn thảo hồ sơ người dùng và một phần duy trì bởi các dịch vụ thông minh (Hình 7) Các dịch vụ thông minh có hai vai trò chính trong hệ thống: (1) Cập nhật và duy trì các mô hình người sử dụng trên cơ sở dữ liệu sử dụng thông qua việc áp dụng một số chẩn đoán, (2) Cung cấp các dịch vụ cá nhân dựa trên các đặc tính của người sử dụng (ví dụ như quan điểm cá nhân được tạo ra và trình bày cho người sử dụng)

Kiến trúc của hệ thống mô hình người sử dụng dựa trên bản thể học tích hợp ba bản thể học khác nhau:

 User Ontology cấu trúc đặc điểm khác nhau của người sử dụng và mối quan hệ người dùng

 Domain Ontology định nghĩa miền, các khái niệm ứng dụng cụ thể và mối quan hệ giữa chúng

 Log Ontology định nghĩa ngữ nghĩa của người dùng tương tác với hệ thống

Kỹ thuật Ontology cho mô hình người sử dụng, theo Sergey Sosnovsky [5], thể hiện mối quan hệ giữa các công nghệ tương ứng từ các lĩnh vực của người sử dụng mô hình hóa và

Trang 24

Web-bản thể học Mô hình đã nghiên cứu về việc ánh xạ các loại dữ liệu phân biệt, tuy nhiên chưa giải quyết được vấn đề sắp xếp trong các hệ thống khác nhau

Hình 7 Lược đồ tổng quan của tích hợp tri thức [4]

Hình 8 Hệ thống mô hình người sử dụng dựa trên Ontology [17]

4 Kết luận

Chúng tôi đã giới thiệu một vài nghiên cứu có liên quan đến các hệ thống hỗ trợ người học

và các nghiên cứu về Ontology liên quan đến người học, đồng thời giới thiệu một số khái niệm, và cách tiếp cận Để từ đó xác định hướng nghiên cứu và kết quả dự kiến đạt được trong tương lai

Nghiên cứu được thực hiện liên quan tới các lĩnh vực: Lý thuyết đồ thị, Mạng xác suất Bayes, Lọc Kalman, Máy học, Trí tuệ nhân tạo, và Ontology để biểu diễn mô hình đặc

Trang 25

trưng người học, mô hình nội dung khóa học, mô hình hỗ trợ và cơ chế thích nghi tạo các chương trình học theo nhu cầu người học Các nghiên cứu về qui trình phân tích, thiết kế, xây dựng hệ thống phần mềm hướng đối tượng sẽ được sử dụng trong hệ thống hỗ trợ học tập thích nghi Các công cụ, kỹ thuật trong triển khai ứng dụng trên nền Web trong xây dựng mô hình hệ thống và triển khai thử nghiệm

Chúng tôi dự kiến sẽ đạt được một số kết quả về mặt lý thuyết (nghiên cứu, xây dựng

mô hình) và công nghệ (mô hình, qui trình) dựa trên việc khảo nghiệm đánh giá trên 300 sinh viên theo học chuyên ngành liên quan đến công nghệ thông tin, một chương trình học tập trong lĩnh vực công nghệ thông tin và 10 cố vấn học tập

Tài liệu Tham khảo

1 Lee Y., Driscoll M.P, Nelson D.W: The Past, Present and Future of Research in Distance tion: Result of a Content Analysis In: The American Journal of Distance Education, Vol 18(4) (2004)

Educa-2 Brooks C., Greer J.: Combining ITS and eLearning Technologies: Opportunities and Challenges In: The 8th International Conference on Intelligent Tutoring Systems, TAIWAN (2006)

3 Beck, J., Stern, M., & Haugsjaa, E.: Applications of AI in education ACM Crossroads,3 (1),

8 Sergey Sosnovsky: Ontological Technologies for User Modeling Ph D thesis, School of mation Sciences, University of Pittsburgh, US

Infor-9 Ngoc Thanh Nguyen, Jason J Jung, Trong Hai Duong: Complexity Analysis of Ontology gration Methodologies:a Comparative Study In: Journal of Universal Computer Science, vol 15,

Inte-no 4, 877-897, (2009)

10 Cao Tuấn Dũng, Lê Tấn Hùng, Tạ Tuấn Anh, Đăng Văn Chuyết, Nguyễn Hoàng Phương: Xây dựng một cổng thông tin y tế cộng đồng dựa trên Ontology Hội nghị ứng dụng công nghệ thông tin ngành y tế lần thứ 5 (2009)

11 Duong Trong Hai, Nguyen Ngoc Thanh, Jo Geun Sik: A HYBRID METHOD FOR INTEGRATING MULTIPLE ONTOLOGIES Cybernetics and Systems, 40: 2, 123 — 145, (2009)

12 Stuart E Middleton, David De Roure, and Nigel R Shadbolt: Ontology-Based Recommender Systems IT Innovation Centre, University of Southampton, Southampton SO16 7NP, UK

13 Alfred Kobsa: Generic User Modeling Systems The Adaptive Web, LNCS 4321, pp 136 – 154,

2007 Springer-Verlag Berlin Heidelberg (2007)

14 Safdar Ali Soomro, Abdul Ghafoor Memon, Safeeullah Soomro: Pre-Generation of Student Module in Intelligent Tutoring System In: Journal of Information & Communication Technology Vol 5, No 1, 12-21(Spring 2011)

15 C.J.Butz, S.Hua, R.B.Maguire, Bits: a Bayesian Intelligent Tutoring System For Computer gramming Department of Computer Science, University of Regina, SK, Canada

Trang 26

Pro-16 Heum Park, Aesun Yoon, Hyuk-Chul Kwon: Task Model and Task Ontology for Intelligent Tourist Information Service In: International Journal of u- and e- Service, Science and Technol-ogy Vol 5, No 2 (June, 2012)

17 Liana Razmerita, Albert Angehrn and Alexander Maedche: Ontology-based User Modeling for Knowledge Management Systems In: Research for this paper was partially financed by the EU in the IST-2000-28293 project Ontologging

18 Anton Andrejko, Michal Barla and Maria Bielikova: Ontology-based User Modeling for based Information Systems Slovak university of Technology in Bratislava, Slovakia

Web-19 Safdar Ali Soomro, Abdul Ghafoor Memon, Safeeullah Soomro: Pre-Generation of Student Module in Intelligent Tutoring System In: Journal of Information & Communication Technology Vol 5, No 1,12-21(Spring 2011)

20 Kyungsun Kim, Kyounguk Lee: Real-time Job-Aids and Tutoring System (REJAT), tion of Integrated knowledge based open e-learning framework In: Real Time Job-Aids and col-lective intelligence based tutoring system: Project No 10031886

Implementa-21 Harati, M.N Ahmadabadi, and B.N Araabi: Knowledge evaluation for credit assignment among independent q-learners IEEE, Syst vol 1, No 1, pp55-67 (Sept 2007)

22 Amir-massoud Farahmand Interaction of Culture-Based Learning and Cooperative Co-evolution and its Application to Automatic Behavior-Based System Design, EE Vol 14 No 1 (Feb 2010)

23 Dragan Gaˇsevi Nima Kaviani, and Milan Milanovi´: Ontologies and Software Engineering Handbook on Ontologies, International Handbooks on Information Systems Springer-Verlag Ber-lin Heidelberg (2009)

24 M Yarandi, A R Tawil, H Jahankhani: Ontologies for Personalised Adaptive Learning vances in Computing & Technology 2012, London: University of East London

Ad-25 Tich Phuoc Tran, Thi Thanh Sang Nguyen, Kien Cuong Dang, Xiaoying Kong: An Efficient Web-Page Recommender System using Frequent Pattern Discovery and Dynamic Markov Mod-els In: International Journal of Web Application Volume 3 Number 1 (March 2011)

Trang 27

Mai Tiến DũngTrường Đại học Công nghệ thông tin, Đại học Quốc Gia TP.HCM

dungmt@uit.edu.vn

Tóm tắt Truy xuất video là một trong những hướng nghiên cứu mới

và có nhiều thách thức Trong bài viết này, chúng tôi xin trình bày nhữngkhảo sát của chúng tôi về các nghiên cứu liên quan đến truy xuất videodựa trên khái niệm và định hướng nghiên cứu mà chúng tôi dự định thựchiện trong đề tài

Từ khóa tìm kiếm video, truy xuất video, đa đặc trưng, multimodalfeatures, concept-based video retrieval, semantic concept

Nhờ sự phát triển của công nghệ số, con người đã tạo ra một khối lượng dữ liệu

đa phương tiện rất lớn, liên tục gia tăng về số lượng, đa dạng cả về nội dung,hình thức và định dạng lưu trữ Trong đó dữ liệu video được xem như một dữliệu đa phương tiện phức tạp vì chúng bao gồm các dữ liệu khác như văn bản,

âm thanh, hình ảnh, Trong những năm gần đây, việc tạo ra các tập tin videocàng ngày càng dễ hơn, mọi người đều có thể dùng thiết bị di động hoặc máyquay kĩ thuật số để ghi hình mà không cần phải sử dụng các phần mềm hay cácthiết bị chuyên nghiệp như trước đây, đồng thời có thể chia sẻ với bạn bè thôngqua các trang web chia sẻ dữ liệu trực tuyến

Chẳng hạn theo thống kê1tại thời điểm 01/2012 trung hình trong một phút

có hơn 136,000 ảnh được upload lên trang web chia sẻ hình ảnh flicker, có 138MB

dữ liệu các loại được upload lên facebook, và có hơn 360 giờ video được uploadlên youtube, Tuy nhiên, để có thể sử dụng và khai thác hiệu quả khối lượng

dữ liệu khổng lồ này đòi hỏi phải có những phương pháp tổ chức lưu trữ, lậpchỉ mục và truy xuất thật sự hiệu quả về nhiều mặt: tài nguyên sử dụng, tốc độthực thi và đặc biệt là khả năng đáp ứng yêu cầu của người dùng

Theo Jain et al [14], video được tạo ra nhằm mục đích giải trí, thông tin,truyền thông, hoặc phân tích dữ liệu, điều đó cũng có nghĩa là video được tạo

ra đáp ứng cho nhiều loại đối tượng người dùng khác nhau: một khách hàngxem các quảng cáo để chọn mua sản phẩm, người yêu thích bóng đá có thể xemlại cảnh ghi bàn của cầu thủ trong một trận đấu, người yêu thích phim ảnh cóxem các đoạn giới thiệu phim, Hiện nay các website thương mại như Youtube1

http://thesocialskinny.com/100-social-media-statistics-for-2012/

Transactions of the UIT Doctoral Workshop, Vol 1, pp 25-35, 2012.

Trang 28

2, Vimeo3, Dailymotion4, blip.tv5 có khả năng đáp ứng tốt các nhu cầu trên

và cho phép người dùng có thể xem toàn bộ hay xem lướt qua nội dung của tậptin video được lưu trữ trong hệ thống Tuy nhiên, do có quá nhiều dữ liệu nênngười dùng mong muốn truy xuất những đoạn video có chứa nội dung phù hợpvới yêu cầu Chẳng hạn người dùng đang tìm hiểu thông tin về diễn viên A nênmuốn tìm những đoạn video có chứa diễn viên A, hoặc người dùng muốn xemcác đoạn video có chim cánh cụt, Đây là một trong những bài toán khó đangđược cộng đồng nghiên cứu quan tâm, những kết quả bước đầu cần được tiếptục nghiên cứu và cải tiến Trong định hướng nghiên cứu, chúng tôi sẽ tập trungvào bài toán xác định các khái niệm có trong video để làm cơ sở cho việc truyxuất video

2.1 Khái niệm trong Video

Quá trình nhận thức của con người về nội dung video là một quá trình tác độnglẫn nhau giữa các khái niệm mà người đó nhận thức được, vì thế khi muốn truyxuất video, người dùng thường mô tả các nội dung cần tìm qua các từ khóa liênquan Do đó, các hệ thống truy xuất video phải có khả năng nhận diện được cáckhái niệm có trong video, tổ chức lưu trữ và lập chỉ mục chúng sao cho ngườidùng có thể truy xuất các đoạn video thông qua các khái niệm ngữ nghĩa được

mô tả như những từ khóa tìm kiếm

Bài toán quan trọng nhất ở đây chính là làm thế nào xác định và gán cáckhái niệm cho tất cả các đối tượng, sự vật, hiện tượng, xuất hiện trong video

Có nhiều phương pháp đã được đưa ra, về cơ bản có thể chia thành haiphương pháp: thủ công và tự động

– Do người dùng thực hiện, chẳng hạn trong các trang YouTube, Flickr, book, các khái niệm được gán bởi nhiều người qua các hình thức như cácchú thích, các trò chơi nhận diện và gán khái niệm cho đối tượng [1, 2] haycông cụ cho phép người dùng gán nhãn [20], Vì có nhiều người cùng thamgia nên có thể dẫn đến sự nhập nhằng giữa các khái niệm được xác định,các khái niệm thường mang tính cá nhân, và có thể không đầy đủ,

Trang 29

Tuy nhiên, với khối lượng dữ liệu lớn và không ngừng gia tăng, việc thựchiện thủ công là không khả thi, các khái niệm được gán không thể phản ánh hếtcác nội dung trong video làm cho việc truy xuất các đoạn video sẽ không hiệuquả [22].

Phương pháp Tự động

Mục đích của phương pháp này là tự động xác định và gán các khái niệm cótrong video thông qua các bộ mô tả (descriptors) Trong các hệ thống tìm kiếmtrên video hiện nay như Youtube, Video, Baidu, Blinkx, để trả về các videokết quả dựa trên các khái niệm do người dùng nhập vào dưới dạng văn bản.Các bộ mô tả chủ yếu dựa vào tên file video, các thông tin mô tả về video khingười dùng upload lên hệ thống, các văn bản trong tài liệu có nhúng video vào(surrounding text), social tags, văn bản chú thích trong video (closed captions),hay sử dụng kĩ thuật nhận dạng tiếng nói để chuyển âm thanh thành văn bản(speech transcript), các metadata trong tập tin video, Tuy nhiên, người dùngthường upload tập tin video lên hệ thống và chia sẻ video thông qua địa chỉ liênkết của video đó, vì thế họ rất ít khi mô tả nội dung của video khi upload; ngoài

ra, tên file của video thường không mô tả về video, có nhiều nguyên nhân nhưngchủ yếu do người dùng upload trực tiếp các file được ghi hình bằng các máy

kỹ thuật số hay điện thoại di động Việc sử dụng văn bản chú thích có nhữngthành công đáng kể [3] nhưng hạn chế lớn nhất khi các văn bản chú thích khôngliên quan đến nội dung video (chẳng hạn các dòng quảng cáo hay các dòng tinngắn) Các hệ thống truy xuất video dựa trên văn bản được rút trích từ cácphần mềm nhận dạng tiếng nói đặc biệt hiệu quả trên dữ liệu tin tức, phỏngvấn, bài thuyết trình, nhưng trường hợp tiếng nói trong video không sử dụngngôn ngữ Tiếng Anh như Trung quốc, Arap, là một thách thức và kết quả tìmkiếm thường có độ chính xác không cao

Dữ liệu video là một dữ liệu đa phương tiện phức tạp và mang yếu tố giácquan (ảnh, âm thanh, video), nên cần thiết phải áp dụng các kĩ thuật xử lý ảnh,

âm thanh và thị giác máy tính để xác định sự hiện diện các khái niệm trongvideo Thông thường người ta chia video thành hai dòng dữ liệu là dòng âmthanh (audio stream) và dòng hình ảnh (visual stream) Vì thế ngoài việc rúttrích các thông tin từ dòng âm thanh, thì các thông tin từ việc xử lý hình ảnhrất quan trọng Vì thế một số lượng lớn các nghiên cứu đặt vai trò quan trọngcủa nội dung hình ảnh (visual content) lên hành đầu chứ không phải văn bảnhay các đặc trưng khác được rút trích từ dòng âm thanh

Việc phân tích xác định nội dung của dữ liệu hình ảnh có một lịch sử lâuđời [19], xuất phát từ những năm 1960s Với một vài thành công bước đầu, cácnhà nghiên cứu trong những năm 1970s cho rằng bài toán hiểu nội dung dữ liệuhình ảnh sẽ sớm được giải quyết hoàn toàn Tuy nhiên, đến những năm 1980sngười ta cho rằng những dự đoán này quá lạc quan Trong những năm 1990s,truy xuất ảnh dựa trên nội dung là một trong những hướng nghiên cứu mới vànhận được nhiều sự quan tâm của các nhóm nghiên cứu trên thế giới, mục tiêu

là phát triển các phương pháp tìm kiếm ảnh trong tập dữ liệu lớn dựa trên nộidung

Trang 30

Đầu những năm 2000s, nghiên cứu trong lĩnh vực truy xuất dựa trên nộidung đã có một sự chuyển đổi từ ảnh sang video [8] [4] [5] [32] [34] Đặc điểmchung của những phương pháp này là dựa trên các đặc trưng mức thấp như màusắc, cấu trúc vân, hình dáng và không gian - thời gian Hầu hết những hệ thốngdựa trên truy vấn theo mẫu (query-by-example), người sử dụng sẽ vẽ phác thảohay cung cấp ảnh mẫu cần truy vấn, chỉ những ảnh có sẵn trong hệ thống và cómột sự khác nhau không đáng kể so với ảnh truy vấn được chọn làm kết quả.Nếu ảnh chưa có trong hệ thống thì các phương pháp truy vấn ảnh dựa trên nộidung sẽ không hiệu quả Ngoài ra, để diễn đạt nội dung cần tìm dựa trên cácđặc trưng mức thấp là rất khó khăn đối với người dùng, trong một số trườnghợp người dùng không nhớ chính xác nội dung cần tìm Vì thế nhu cầu cấp thiếtphải phát triển các hệ thống cho phép người dùng nhập vào các văn bản mô tả

về nội dung cần tìm và hệ thống trả sẽ về kết quả tương ứng, nói cách khác,người dùng mong muốn tìm kiếm dựa trên sự tương đồng về ngữ nghĩa giữanhững từ khóa nhập vào với các đặc trưng mức thấp mà máy tính lưu trữ và

có thể xử lý được Đây là một bài toán khó và có nhiều thách thức Có hai khókhăn lớn nhất:

– Có sự khác biệt khá lớn giữa những đặc trưng mức thấp mà máy tính rúttrích từ video với những khái niệm mức cao mà con người hiểu về video đó,

sự khác biệt này được gọi là sự khác biệt về ngữ nghĩa (semantic gap) [23].Chẳng hạn trong hình 1, con người có thể nhìn và hiểu bức ảnh hình chimcánh cụt nhưng với máy tính thì chúng chỉ là những bit 0 và 1

(a) Đặc trưng máy tính hiểu (b) Nội dung người dùng hiểu

Hình 1 Hình ảnh minh họa sự khác biệt về ngữ nghĩa

– Một trong những nguyên nhân gây ra sự khác biệt về ngữ nghĩa đó là cùngmột đoạn video nhưng những người khác nhau có thể có những cách hiểukhác nhau, đặc biệt là các video về cảm xúc hay tình cảm [9] Thông thườngnhững video có nhiều cách hiểu khác nhau hay có thể hiểu theo sự chủquan của từng người ít được xem xét Tuy nhiên, để xác định các khái niệmmang tính khách quan có hiện diện trong video hay không là một bài toán

Trang 31

khó, chẳng hạn chúng ta muốn xác định tòa nhà có trong video hay không.Một trong những khó khăn chính đó là cùng một khái niệm nhưng có nhiềuthể hiện khác nhau: góc nhìn khác nhau, điều kiện ánh sáng hay tỉ lệ khácnhau, sự khác biệt này được gọi là sự khác biệt về giác quan (sensorygap) Chẳng hạn trong hình 2, cùng một tòa tháp nhưng hai hình khác biệtnhau do góc nhìn khác nhau.

(a) Góc nhìn 1 (b) Góc nhìn 2Hình 2 Minh họa sự khác biệt về giác quan của cùng một khái niệm [27]

Tóm lại, có hai bài toán mà chúng ta cần giải quyết:

– Xác định sự hiện diện của các khái niệm mang tính khách quan ci có trongcác đoạn videosi hay không

– Xác định khái niệmci trong những điều kiện khác biệt về giác quan.2.2 Những Nghiên cứu Liên quan đến Khái niệm trong VideoXác định các khái niệm ngữ nghĩa trong video là một trong những hướng nghiêncứu mới, nhiều thách thức trong lĩnh vực truy xuất video Cho đến thời điểmhiện nay, theo tìm hiểu của chúng tôi thì chưa có một hệ thống nào có thể xácđịnh được tất cả các khái niệm có trong thế giới thực, các hội thảo hàng đầutrong lĩnh vực này thường cho trước danh sách các khái niệm và tập dữ liệuhuấn luyện có liên quan Mục tiêu đặt ra cho các nhóm nghiên cứu là xác địnhcác khái niệm có hiện diện trong tập kiểm tra Chẳng hạn: trong TRECVID

20126, số khái niệm cần xác định là 500; imageclef20127sử dụng 94 khái niệm;PASCAL-VOC 20128 sử dụng 20 khái niệm

Trang 32

Một số công trình nghiên cứu ban đầu dựa trên các luật được xây dựng bằngtay để nhận diện các khái niệm riêng lẻ [30, 31, 36] Tuy nhiên, khi kích thước dữliệu tăng, số lượng khái niệm cần xác định lớn hơn thì những phương pháp nàykhông khả thi vì cần quá nhiều luật Khi đó chúng ta cần phải có các phươngpháp ở mức tổng quát hơn, cho phép xác định được nhiều khái niệm và có thể

áp dụng trên tập dữ liệu lớn Để giải bài toàn này, thông thường ta áp dụngcác phương pháp máy học để xác định mối liên quan giữa các đặc trưng mứcthấp với các khái niệm ngữ nghĩa ở mức cao [17, 24, 28, 29] Ta có thể tổng quátthành bài toán như sau: cho trước một vector đặc trưngxi biểu diễn đặc trưngcho một đoạn video, mục tiêu là dùngxi để xác định khái niệmci có hiện diệntrong đoạn video đó hay không Có nhiều phương pháp rút trích đặc trưngxi

và nhiều phương pháp máy học được áp dụng để xác định mối quan hệ giữaxi

vàci

Chọn Đặc trưng

Các đặc trưng được xây dựng phải hướng đến mục tiêu giảm khoảng cách khácbiệt về nghữ nghĩa và có thể nhận diện được khái niệm trong điều kiện có sựkhác biệt về giác quan Do video là một dữ liệu phức tạp, chúng có thể chứavăn bản, âm thanh, hình ảnh, nhưng sự khác biệt giữa video với các loại dữliệu khác đó là video gồm một dãy hình liên tục theo thời gian để tạo sự chuyểnđộng, vì thế, so với các đặc trưng khác (văn bản, âm thanh, ), các đặc trưngliên quan đến hình ảnh được quan tâm hơn cả

Khó khăn liên quan đến đặc trưng hình ảnh là chúng phải được mô hìnhhóa sao cho có thể xác định chính xác các khái niệm trong các môi trường khácnhau, nghĩa là chúng có thể làm giảm khoảng cách khác biệt về ngữ nghĩa trongnhững điều kiện giác quan khác nhau (chẳng hạn ánh sáng thay đổi, góc hìnhkhác nhau, tỉ lệ khác nhau, ) Vì thế chúng ta cần phải kết hợp nhiều đặctrưng với nhau Sau đây chúng tôi sẽ trình bày một số đặc trưng được sử dụngcủa các nhóm nghiên cứu đã có nhiều kết quả cao trong các hội thảo liên quanđến lĩnh vực truy xuất video

– Nhóm nghiên cứu của Tokyo Institute of Technology, đạt kết quả cao nhấttrong TRECVID 2011, họ sử dụng 5 loại đặc trưng về hình ảnh và 1 loại đặctrưng âm thanh: SIFT features with Harris-Affine detector, SIFT featureswith Hessian-Affine detector, SIFT and hue histogram with dense sampling,HOG with dense sampling, HOG from temporal subtraction images, MFCCaudio features Vector đặc trưng gồm 6 loại đặc trưng trên được gọi làGaussian mixture model (GMM) supervectors và các đặc trưng được rúttrích bằng cách áp dụng tree-structured GMMs [11, 12]

– Nhóm nghiên cứu của University of Amsterdam(UvA)9, sử dụng bộ mô tảdựa trên màu sắc (color descriptors)bằng cách áp dụng đặc trưng SIFT chocác hệ màu khác nhau [21]

9

http://www.ceessnoek.info

Trang 33

– Nhóm nghiên cứu Vireo10 sử dụng hai đặc trưng toàn cục grid-based colormoments (CM), grid-based wavelet texture (WT) và hai đặc trưng cục bộ:SIFT-DoG, SIFT-HA; phương pháp máy học là SVM.

– Nhóm nghiên cứu của Carnegie Mellon University11 , sử dụng 5 đặc trưngSIFT-HL (Harris-Laplace), CSIFT (Color SIFT)-HL, SIFT-DS, CSIFT-DS,

và MoSIFT Phương pháp máy học được áp dụng là Sequential BoostingSVM

Chúng ta có thể thấy, đặc trưng SIFT và các biến thể của nó đóng vai trò rấtquan trọng trong việc xác định các khái niệm Ngoài ra, trong các nhóm đặctrưng trên thì đặc trưng liên quan đến âm thanh chiếm một tỉ lệ rất nhỏ so vớicác đặc trưng liên quan đến hình ảnh

Phương pháp Máy học

Do khối lượng dữ liệu video rất lớn, có nhiều khái niệm cần xác định, vì thếsau khi biểu diễn các đoạn video bằng vector đặc trưng, chúng ta sử dụng cácphương pháp máy học để xác định mối liên quan giữa các khái niệm và vector đặctrưng Phương pháp máy học thường được sử dụng là học giám sát (supervisedlearning) dựa trên tập mẫu chứa các khái niệm cho trước

Có hai thách thức mà các phương pháp học phải đối mặt, đó là trường hợp

số vec-tor đặc trưng quá nhiều có thể gây nhiễu và trường hợp có nhiều tham

số được dùng trong mô hình (over-fitting) [13] Nói cách khác, cần phải xử lýtrường hợp mất cân bằng giữa các mẫu dương so với mẫu âm và trường hợp dữliệu bị nhiễu hoặc lỗi Để đáp ứng các yêu cầu trên, phương pháp SVM là phùhợp hơn cả Việc chọn hàm nhân (kernel) và tham số C để cân bằng giữa lỗihuấn luyện và độ phức tạp của mô hình ảnh hưởng đáng kể đến kết quả [16, 29].Hàm nhân thường được chọn dựa trên hàm Gaussian RBF hoặc χ2 Để khắcphục hiện tượng over-fitting, các tham số được đánh giá dựa trên phương phápđánh giá chéo (cross-validation)

Kết hợp Đặc trưng

Như chúng ta biết, trong một đoạn video có thể biểu diễn bằng nhiều đặc trưngkhác nhau dựa trên các mô hình khác nhau, vì thế việc chỉ sử dụng một mô hình(unimodal) hay nhiều mô hình (multimodal) cần được xem xét

– Trong phương pháp sử dụng một mô hình, có nhiều phương pháp xác địnhcác đặc trưng dựa vào hình ảnh (màu sắc, cấu trúc vân, hình dạng, ) hoặccác biến thể của chúng, phạm vi rút trích đặc trưng có thể áp dụng trongcác vùng khác nhau như toàn cục, cục bộ hay ở mức các điểm keypoints[15, 25, 33, 35] Tuy nhiên, sử dụng cùng một mô hình có thể không phù hợpcho tất cả các khái niệm khác nhau, vì thế ta thường kết hợp nhiều mô hình

10http://vireo.cs.cityu.edu.hk/

11

http://www.lti.cs.cmu.edu/

Trang 34

– Trong phương pháp dựa trên nhiều mô hình, các đặc trưng được rút trích

từ nhiều kênh khác nhau như âm thanh, hình ảnh [28]

Sau khi các đặc trưng được rút trích, chúng được kết hợp thành một vector đặctrưng mô tả cho video Mặc dù ưu điểm của việc kết hợp này giúp ta tiết kiệmchi phí cho quá trình học, tuy nhiên, chúng ta cần quan tâm đến một số yếu tốnhư số thành phần của vector sẽ gia tăng, mức độ liên quan với các khái niệmcủa các đặc trưng khác nhau, số chiều và miền giá trị của các đặc trưng khácnhau, và thứ tự kết hợp các đặc trưng,

Mặc dù đây là một trong những hướng mới trong truy xuất video, nhưngdựa trên một số kết quả được công bố trong [18, 26] và một số công trình nghiêncứu có liên quan [6, 27] thì những kết quả này cần được cải tiến nâng cao hơn

Trong thời gian qua, chúng tôi có thực hiện 2 đề tài khoa học cấp ĐHQG khôngtrọng điểm và công bố hai bài báo:

– Một bài tại hội thảo ICCCI 2012, đã được chấp nhận, tên bài báo “Captiontext and keyframe similarity based video retrieval system” Trong bài báonày chúng tôi trình bày về kết quả xây dựng một hệ thống truy vấn videodựa trên việc rút trích các phụ đề và so sánh độ tương tự giữa ảnh truy vấnvới ảnh chính trong các đoạn video Đây chỉ là một công trình sơ khởi, làmnền tảng để phát triển các phương pháp khác trong hệ thống

– Một kết quả khác liên quan đến việc thực hiện so sánh các bộ mô tả đặc trưng

về hình dáng của ảnh được chúng tôi công bố tại hội thảo ITEDU@2010 (“Acomparative study of shape discriptors in content based image retrieval”).Trong đề tài này, chúng tôi dự định tập trung nghiên cứu các nội dung sau:– Sử dụng phương pháp đa mô hình, kết hợp nhiều đặc trưng dựa trên dữ liệuvăn bản, âm thanh và hình ảnh

– Đề xuất các biến thể của các đặc trưng để nâng cao hiệu quả xác định cáckhái niệm trong đoạn video

– Nghiên cứu các phương pháp máy học, sự kết hợp các đặc trưng và đề xuất

mô hình cải tiến khả năng nhận diện các khái niệm trong video

– Xây dựng một hệ thống áp dụng các phương pháp và mô hình được đề xuất

để đánh giá hiệu quả và cho phép người dùng truy xuất dữ liệu video dựatrên các khái niệm

Trong bài viết này, chúng tôi đã trình bày tổng quan về đề tài này, những nghiêncứu có liên quan và đặc biệt là định hướng nghiên cứu của chúng tôi Tuy nhiên,những định hướng này mang nhiều tính chủ quan và phiến diện Chúng tôi rấtmong nhận được sự đóng góp ý của quý độc giả để chúng tôi có thể hoàn thànhnghiên cứu của mình

Trang 35

Tài liệu tham khảo

1 Ahn, L.v.: Games with a purpose Computer 39(6), 92–94 (Jun 2006),http://dx.doi.org/10.1109/MC.2006.196

2 Ahn, L.v., Dabbish, L.: Designing games with a purpose Commun ACM 51(8),58–67 (Aug 2008), http://doi.acm.org/10.1145/1378704.1378719

3 Brown, M.G., Foote, J.T., Jones, G.J.F., Sparck Jones, K., Young, S.J.: Automaticcontent-based retrieval of broadcast news In: Proceedings of the third ACM in-ternational conference on Multimedia pp 35–43 MULTIMEDIA ’95, ACM, NewYork, NY, USA (1995), http://doi.acm.org/10.1145/217279.215080

4 Carson, C., Belongie, S., Greenspan, H., Malik, J.: Blobworld: Image mentation using expectation-maximization and its application to image query-ing IEEE Trans Pattern Anal Mach Intell 24(8), 1026–1038 (Aug 2002),http://dx.doi.org/10.1109/TPAMI.2002.1023800

seg-5 Chang, S.F., Chen, W., Meng, H.J., Sundaram, H., Zhong, D.: A fully tomated content-based video search engine supporting spatio-temporal queries.IEEE Trans Cir and Sys for Video Technol 8(5), 602–615 (Sep 1998),http://dx.doi.org/10.1109/76.718507

au-6 Chong-Wah Ngo, S A Zhu, W.Z.C.C.T.T.Y.L.P., Tan, H.K.: Vireo @ trecvid 2011:Instance search, semantic indexing, multimedia event detection and known-itemsearch (December 2011), nIST TRECVID Workshop (TRECVID’11), Gaithers-burg, USA,

7 Davis, M.: Editing out video editing IEEE MultiMedia 10(2), 54–64 (Mar 2003),http://dx.doi.org/10.1109/MMUL.2003.1195161

8 Del Bimbo, A., Pala, P.: Visual image retrieval by elastic matching of usersketches IEEE Trans Pattern Anal Mach Intell 19(2), 121–132 (Feb 1997),http://dx.doi.org/10.1109/34.574790

9 Hanjalic, A., Xu, L.Q.: Affective video content representation and modeling IEEETransactions on Multimedia 7(1), 143–154 (2005)

10 Huurnink, B., Hofmann, K., de Rijke, M.: Assessing concept selection for videoretrieval In: Proceedings of the 1st ACM international conference on Multimediainformation retrieval pp 459–466 MIR ’08, ACM, New York, NY, USA (2008),http://doi.acm.org/10.1145/1460096.1460170

11 Inoue, N., Saito, T., Shinoda, K., Furui, S.: High-level feature extraction using siftgmms and audio models In: Proceedings of the 2010 20th International Confer-ence on Pattern Recognition pp 3220–3223 ICPR ’10, IEEE Computer Society,Washington, DC, USA (2010), http://dx.doi.org/10.1109/ICPR.2010.787

12 Inoue, N., Shinoda, K.: A fast map adaptation technique for based video semantic indexing systems In: Proceedings of the 19th ACM interna-tional conference on Multimedia pp 1357–1360 MM ’11, ACM, New York, NY,USA (2011), http://doi.acm.org/10.1145/2072298.2072014

gmm-supervector-13 Jain, A.K., Duin, R.P.W., Mao, J.: Statistical pattern recognition: A view IEEE Trans Pattern Anal Mach Intell 22(1), 4–37 (Jan 2000),http://dx.doi.org/10.1109/34.824819

re-14 Jain, R., Hampapur, A.: Metadata in video databases SIGMOD Rec 23(4), 27–33(Dec 1994), http://doi.acm.org/10.1145/190627.190638

15 Jiang, Y.G., Yang, J., Ngo, C.W., Hauptmann, A.G.: Representations of based semantic concept detection: A comprehensive study IEEE Transactions onMultimedia 12, 42–53 (2010)

Trang 36

keypoint-16 Naphade, M.R.: On supervision and statistical learning for semantic media analysis J Vis Comun Image Represent 15(3), 348–369 (Sep 2004),http://dx.doi.org/10.1016/j.jvcir.2004.04.010

multi-17 Naphade, M.R., Huang, T.S.: A probabilistic framework for semantic video ing, filtering, and retrieval IEEE Transactions on Multimedia pp 141–151 (2001)

index-18 Quenot, G.: Trecvid 2011 semantic indexing task (2011), nlpir.nist.gov/projects/tvpubs/tv11.slides/tv11.sin.slides.pdf

http://www-19 Rosenfeld, A.: Picture processing by computer ACM Comput Surv 1(3), 147–176(Sep 1969), http://doi.acm.org/10.1145/356551.356554

20 Russell, B.C., Torralba, A., Murphy, K.P., Freeman, W.T.: Labelme: A databaseand web-based tool for image annotation Int J Comput Vision 77(1-3), 157–173(May 2008), http://dx.doi.org/10.1007/s11263-007-0090-8

21 van de Sande, K.E., Gevers, T., Snoek, C.G.: Evaluating color descriptors for ject and scene recognition IEEE Transactions on Pattern Analysis and MachineIntelligence 32(9), 1582–1596 (September 2010)

ob-22 Seinstra, F.J., Geusebroek, J.M., Koelma, D., Snoek, C.G.M., Worring, M., ders, A.W.M.: High-performance distributed image and video content analysis withparallel-horus IEEE Multimedia 14(4), 64–75 (October–December 2007)

Smeul-23 Smeulders, A.W.M., Worring, M., Santini, S., Gupta, A., Jain, R.: Content-basedimage retrieval at the end of the early years IEEE Trans Pattern Anal Mach.Intell 22(12), 1349–1380 (Dec 2000), http://dx.doi.org/10.1109/34.895972

24 Snoek, C.G.M., Gemert, J.C.V., Gevers, T., Huurnink, B., Koelma, D.C., Liempt,M.V., Rooij, O.D., Seinstra, F.J., Smeulders, A.W.M., Thean, A.H.C., Veenman,C.J., Worring, M.: The mediamill trecvid 2006 semantic video search engine In:

In Proceedings of the 4th TRECVID Workshop (2006)

25 Snoek, C.G.M., van de Sande, K.E.A., Li, X., Mazloom, M., Jiang, Y.G., Koelma,D.C., Smeulders, A.W.M.: The MediaMill TRECVID 2011 semantic video searchengine In: Proceedings of the 9th TRECVID Workshop Gaithersburg, USA (De-cember 2011)

26 Snoek, C.G.M., Smeulders, A.W.M.: Visual-concept search solved ? IEEE puter 43(6), 76–78 (June 2010)

Com-27 Snoek, C.G.M., Worring, M.: Concept-based video retrieval Found Trends Inf.Retr 2(4), 215–322 (Apr 2009), http://dx.doi.org/10.1561/1500000014

28 Snoek, C.G.M., Worring, M., van Gemert, J.C., Geusebroek, J.M., Smeulders,A.W.M.: The challenge problem for automated detection of 101 semantic concepts

in multimedia In: Proceedings of the 14th annual ACM international conference onMultimedia pp 421–430 MULTIMEDIA ’06, ACM, New York, NY, USA (2006),http://doi.acm.org/10.1145/1180639.1180727

29 Snoek, C.G.M., Worring, M., Geusebroek, J.M., Koelma, D.C., Seinstra, F.J.,Smeulders, A.W.M.: The semantic pathfinder: Using an authoring metaphor forgeneric multimedia indexing IEEE Transactions on Pattern Analysis and MachineIntelligence 28(10), 1678–1689 (October 2006)

30 Szummer, M., Picard, R.W.: Indoor-outdoor image classification In: Proceedings

of the 1998 International Workshop on Content-Based Access of Image and VideoDatabases (CAIVD ’98) pp 42–51 CAIVD ’98, IEEE Computer Society, Wash-ington, DC, USA (1998), http://dl.acm.org/citation.cfm?id=791220.791680

31 Vailaya, A., Jain, A., Zhang, H.J.: On image classification: City vs landscape In:Proceedings of the IEEE Workshop on Content - Based Access of Image and VideoLibraries pp 3–8 CBAIVL ’98, IEEE Computer Society, Washington, DC, USA(1998), http://dl.acm.org/citation.cfm?id=521772.791885

Trang 37

32 Wang, J.Z., Li, J., Wiederhold, G.: Simplicity: Semantics-sensitive integratedmatching for picture libraries IEEE Trans Pattern Anal Mach Intell 23(9), 947–

963 (Sep 2001), http://dx.doi.org/10.1109/34.955109

33 Wang, M., Hua, X.S., Yuan, X., Song, Y., Dai, L.R.: Optimizing multi-graph ing: towards a unified video annotation scheme In: Proceedings of the 15th inter-national conference on Multimedia pp 862–871 MULTIMEDIA ’07, ACM, NewYork, NY, USA (2007), http://doi.acm.org/10.1145/1291233.1291431

learn-34 Westerveld, T.H.W., de Vries, A.P.: Multimedia retrieval using multiple images In:Proceedings of the International Conference on Image and Video Retrieval (3) pp

344 – 352 Springer (July 2004), http://oai.cwi.nl/oai/asset/18058/18058A.pdf,received Best Paper Award,

35 Wilkins, P., Adamek, T., O’Connor, N.E., Smeaton, A.F.: Inexpensive fusion ods for enhancing feature detection Image Commun 22(7-8), 635–650 (Aug 2007),http://dx.doi.org/10.1016/j.image.2007.05.012

meth-36 Zhang, H., Tan, S.Y., Smoliar, S.W., Yihong, G.: Automatic parsingand indexing of news video Multimedia Syst 2(6), 256–266 (Jan 1995),http://dx.doi.org/10.1007/BF01225243

Trang 38

Trần Sơn Hải Khoa Công Nghệ Thông Tin, Đại học Sư Phạm, Tp Hồ Chí Minh, Việt Nam,

haits@hcmup.edu.vn

Tóm tắt Bài toán phân lớp ảnh đã và đang được nhiều nhà nghiên cứu quan

tâm và có nhiều phương pháp được đề xuất để giải quyết bài toán này với mục tiêu nâng cao hiệu quả phân lớp Một trong những cách tiếp cận phổ biến hiện nay cho bài toán này là phân lớp ảnh dựa trên đa đặc trưng ảnh Trước tiên, chiếu mẫu cần phân lớp về nhiều không gian biểu diễn khác nhau Trong giai đoạn này vấn đề đặt ra cần lựa chọn phép biến đổi ảnh thích hợp để trích chọn đặc trưng ảnh phù hợp với mục tiêu ứng dụng Sau đó, sử dụng các kỹ thuật tính toán thông minh đánh giá phân loại ảnh theo các không gian này về các lớp tương ứng Cuối cùng, hợp nhất các kết quả đánh giá để đưa ra kết luận Cách tiếp cận này phản ánh đầy đủ tính đa dạng của mẫu cần phân lớp Từ đó, đảm bảo nâng cao độ chính xác của hệ thống phân lớp

1 Giới thiệu

Cùng với sự phát triển của phần mềm và phần cứng khối lượng ảnh phát triển không ngừng và ngày càng lớn Một số lượng lớn các ảnh đang được sử dụng ở trong thư viện ảnh số và trên web Vì vậy nhu cầu gom nhóm và phân lớp ảnh là một nhu cầu tất yếu Phân lớp ảnh là lĩnh vực đòi hỏi sự nghiên cứu tổng hợp: nghiên cứu xử lý ảnh để rút trích các đặc trưng trong ảnh, áp dụng các tính toán toán học cao cấp, các công cụ trong cơ sở tri thức để phân loại ảnh về lớp tương ứng dựa trên các đặc trưng

đã rút trích Việc phân lớp ảnh chính xác có thể áp dụng vào nhiều ứng dụng thực tế,

ví dụ: áp dụng vào hệ thống phân lớp các biểu lộ cảm xúc (vui, buồn, giận, ngạc nhiên, hạnh phúc …) trên ảnh gương mặt để nâng cấp các hệ thống tương tác giữa người – máy

Để có thể áp dụng bài toán phân lớp ảnh vào các ứng dụng thực tế trong lĩnh vực

xử lý ảnh, không những đòi hỏi phải phân lớp với độ chính xác mà chi phí tính toán phải thấp Chính vì vậy mà đã có rất nhiều kết quả đã được công bố trong thời gian qua trên các tạp chí và hội nghị chuyên ngành có uy tín Các nghiên cứu nhằm đề xây dựng, phát triển, hay cải tiến các kỹ thuật tính toán toán học cao cấp nhằm nâng cao

độ chính xác của quá trình phân lớp, cũng như giảm độ phức tạp của thuật toán trong

cả quá trình huấn luyện lẫn phân lớp để có thể đáp ứng yêu cầu tốc độ ngày càng cao của người sử dụng

Bài toán phân lớp ảnh là lĩnh vực nghiên cứu được sự quan tâm của các nhà khoa học trong và ngoài nước, vì thế có nhiều hướng tiếp cận để giải quyết bài toán này Các hướng tiếp cận phổ biến hiện nay cho việc giải quyết bài toán phân lớp là: sử

Transactions of the UIT Doctoral Workshop, Vol 1, pp 36-44, 2012.

Trang 39

dụng K-NN và K-Mean với các độ đo khác nhau, Support Vector Machine (SVM) và mạng Nơron nhân tạo (ANN) …

Phương pháp phân lớp bằng K-NN và K-Mean rất phổ cập hiện nay thích hợp với lớp bài toán, trong đó không gian biểu diễn mẫu nhỏ Tuy nhiên, trong trường hợp không gian biểu diễn mẫu có kích thước lớn thì chi phí tính toán của hai phương pháp này cao

Phương pháp Support Vector Machine (SVM) áp dụng khá tốt cho các bài toán phân lớp mẫu ngay cả khi không gian biểu diễn mẫu lớn Với cách tiếp cận của phương pháp này, cần thiết phải xác định các siêu phẳng để phân lớp mẫu, và số lượng siêu phẳng cần xác định tăng tỷ lệ với số lượng lớp cần phân loại Điều này dẫn đến: thời gian tạo các siêu phẳng phân lớp thường cao trong trường hợp số lượng lớp lớn (tốn kém chi phí tính toán) Mặt khác, trường hợp mẫu cần phân loại không thuộc

L lớp cho trước, phương pháp SVM không xác định được (cụ thể, SVM sẽ phân loại mẫu đó về một trong L lớp cho trước dựa theo hệ số tính toán, điều này cho một kết quả phân lớp sai)

Một cách tiếp cận khác khá phổ biến hiện nay là dùng mạng Nơron nhân tạo cho bài toán phân lớp mẫu Với cách tiếp cận này một mạng Nơron nhân tạo sẽ được huấn luyện với tập mẫu để tìm ra bộ trọng số phục vụ cho quá trình phân lớp Cách tiếp cận này khắc phục được nhược điểm của SVM nhờ sử dụng hệ số ngưỡng trong quá trình phân loại mẫu Cụ thể, nếu mẫu cần phân loại không thuộc L lớp cho trước, mạng Nơron nhân tạo xác định được và thông báo kết quả đối tượng đó nằm ngoài cơ sở dữ liệu các lớp đã có

Với bài toán phân lớp ảnh, kích thước của ảnh lớn (không gian biểu diễn của ảnh lớn), do đó các phương pháp truyền thống K-NN, K-Mean là không thích hợp Hơn nữa, ảnh đầu vào của hệ thống phân lớp có thể thuộc hoặc không thuộc L lớp đối tượng cho trước Trong trường hợp ảnh đầu vào nằm ngoài L lớp cho trước, phương pháp SVM sẽ cho kết quả sai (tự động phân loại ảnh về lớp gần nhất) Trong trường hợp này sử dụng hệ số ngưỡng thích hợp của mạng Nơron, một ảnh không nằm trong

cơ sở dữ liệu sẽ không được phân loại về một lớp nào

Trong phạm vi nghiên cứu này, quá trình toán phân lớp ảnh sẽ chia ra làm 2 giai đoạn: (1) biểu diễn đặc trưng ảnh; (2) áp dụng công cụ cơ sở tri thức phân lớp ảnh Giai đoạn (1): Biểu diễn đặc trưng ảnh Một ảnh ban đầu sẽ được tách thành m ảnh con Mỗi ảnh con sẽ trích chọn ra một vector đặc trưng tương ứng bằng cách sử dụng các phép biến đổi trên ảnh như: Fourier, Wavelet [1,2], Hough [3], Principal Component Analysis (PCA) [4], Independent Component Analysis (ICA) [5], curvelet and ridgelet [6] Mỗi ảnh con sẽ trích chọn ra một vector đặc trưng tương ứng Các vector này đại diện cho ảnh ban đầu Như vậy, ảnh ban đầu sẽ được biểu diễn trong các không gian con tương ứng với m vector đặc trưng Các đặc trưng này cần được thể hiện trong mô hình biểu diễn đa đặc trưng của ảnh để không những phản ảnh các đặc điểm riêng lẻ của ảnh mà còn thể hiện mối tương quan giữa các đặc điểm này Trong giai đoạn này, nghiên cứu này sẽ áp dụng các phép biến đổi trên ảnh đã có

để rút trích đặc trưng và tập trung phát triển mô hình biểu diễn đa đặc trưng trên ảnh

Mô hình không chỉ thể hiện từng đặc điểm riêng lẻ của ảnh (biểu diễn bằng vector đặc trưng tương ứng như các cách biểu diễn đặc trưng ảnh truyền thống, mà còn thể hiện mối quan hệ giữa các đặc trưng với nhau trong ảnh

Trang 40

Hình 1 Giai đoạn biểu diễn đặc trưng ảnh

Hình 2 Biểu diễn đa đặc trưng ảnh

Giai đoạn (2): Áp dụng công cụ cơ sở tri thức phân lớp ảnh Áp dụng một công cụ

cơ sở tri thức phân loại ảnh về một lớp tương ứng theo từng tiêu chí trong mô hình biểu diễn đặc trưng của ảnh Sau đó, hợp nhất các kết quả phân lớp của từng công cụ

cơ sở tri thức riêng lẻ để đưa ra kết luận Việc biểu diễn ảnh theo nhiều tiêu chí khác nhau phản ánh đầy đủ tính đa dạng của ảnh cần phân lớp Từ đó, đảm bảo nâng cao

độ chính xác của hệ thống phân lớp

Trong giai đoạn phân lớp, ngoài các mô hình chỉ sử dụng một công cụ cơ sở tri thức duy nhất để phân lớp như Support Vector Machine (SVM), mạng Nơron, Adaboost, K-NN, Kmean với các độ đo khác nhau hay giải thuật di truyền…, một số nghiên cứu trong và ngoài nước gần đây đã đề xuất một số mô hình kết hợp các kỹ thuật tính toán thông minh nhằm kết hợp ưu điểm của nhiều kỹ thuật để mạng lại kết quả phân lớp chính xác hơn Một số mô hình lai kết hợp giữa mạng Nơron với các kỹ

Biểu diễn đặc trưng của ảnh

Trích chọn đặc trưng

Ảnh

Trích chọn và biểu diễn đặc trưng ảnh

Đặc trưng

V 1

Đặc trưng

V 2

Đặc trưng

V 3

Đặc trưng

V 4

Đặc trưng

V m

Ngày đăng: 05/11/2016, 13:05

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
1. Clara Bertolissi Maribel Fernandez: “Time and Location Based Services With Access Control”.(2008) Sách, tạp chí
Tiêu đề: Time and Location Based Services With Access Control
2. Daut Daman, Harihodin Selamat, Shafrv Rahim: “The Integration Of Spatial And Non- Spatial Data Model”. Faculty Science Computer and Information System, University of Technology Malaysia, 81310 Skudai, Johor.(2000) Sách, tạp chí
Tiêu đề: The Integration Of Spatial And Non-Spatial Data Model
3. Gjermund Hanssen: “Concurrency Control In Distributed Geographical Database Sys- tems”. Department of Mapping Sciences, Agricultural University of Norway.(2002) 4. Haibing Lu And Yingjiu Li: “Practical Inference Control For Data Cubes” (2008) Sách, tạp chí
Tiêu đề: Concurrency Control In Distributed Geographical Database Sys-tems”. Department of Mapping Sciences, Agricultural University of Norway.(2002) 4. Haibing Lu And Yingjiu Li: “Practical Inference Control For Data Cubes
5. Hong Zhu1 And Kevin Lü2: “Fine-Grained Access Control For Database Management Systems”. Database Management Systems.(2007) Sách, tạp chí
Tiêu đề: Fine-Grained Access Control For Database Management Systems
6. Hsing-Chung Chen: “A Generalized Temporal And Spatial Role-Based Access Control Model”.Department of Computer Science and Engineering, Asia University, IEEE Member Taichung County, Taiwan 41354(2010) Sách, tạp chí
Tiêu đề: A Generalized Temporal And Spatial Role-Based Access Control Model
7. Jan Herrmann: “Access Control In Spatial Data Infrastructures”. Technical University Munich(2010) Sách, tạp chí
Tiêu đề: Access Control In Spatial Data Infrastructures
9. Jie Shi, Hong Zhu: “A Fine-Grained Access Control Model For Relational Databases”. College of Computer Science and Technology, Huazhong University of Science and Tech- nology, Wuhan 430074, China(2010) Sách, tạp chí
Tiêu đề: A Fine-Grained Access Control Model For Relational Databases
10. Liliana Kasumi Sasaoka1, Claudia Bauzer Medeiros: “Access Control In Geographic Data- bases”.(2006) Sách, tạp chí
Tiêu đề: Access Control In Geographic Data-bases
11. Phuoc Tran Vinh, Tuyen Le Minh: “The Access Control Cube For A Geodatabase Of A Provincial Government Agency”.(2011) Sách, tạp chí
Tiêu đề: The Access Control Cube For A Geodatabase Of A Provincial Government Agency
12. Phuoc Tran Vinh, Tuyen Le Minh: “To Assign and Control the Right Accessing Geo- Database by Access Control Cube”.(2011) Sách, tạp chí
Tiêu đề: To Assign and Control the Right Accessing Geo-Database by Access Control Cube
13. Ravi S.Sandhu And Edward J.Coyne: “Role Base Acess Control Models” (1996) 14. Ravi S.Sandhu, Pierangela Samarati: “Access Control: Principles and Practice” (1994) 15. Roger E.Sanders: “Securing Data With Label-Based Access Control”. EMC Corpora-tion.(2008) Sách, tạp chí
Tiêu đề: Role Base Acess Control Models” (1996) 14. Ravi S.Sandhu, Pierangela Samarati: “Access Control: Principles and Practice” (1994) 15. Roger E.Sanders: “Securing Data With Label-Based Access Control
16. Sahadeb De, Caroline M. Eastman, Csilla Farkas: “Secure Access Control In A Multi-User Geodatabase”.(2001) Sách, tạp chí
Tiêu đề: Secure Access Control In A Multi-User Geodatabase
18. Vijayalakshmi Atluri, Soon Ae Chun : “An Authorization Model For Geospatial Da- ta”.(2004) Sách, tạp chí
Tiêu đề: An Authorization Model For Geospatial Da-ta
19. Vincent C. Hu , David F.Ferraiolo, Rick Kuhn: “Assessment of Access Control Sys- tems”.(2006) Sách, tạp chí
Tiêu đề: Assessment of Access Control Sys-tems
8. Jiayuan Lina, Yu Fanga, Bin Chena, Pengfei Wua, Analysis Of Access Control Mechan- isms For Spatial Database. Stitute of Remote Sensing and Geographic Information System, Peking University Beijing, P.R.China Khác

HÌNH ẢNH LIÊN QUAN

Hình 1. Các mức mâu thuẫn ontology [19] - Các Phương pháp Lập luận và Tích hợp Ontology Mờ
Hình 1. Các mức mâu thuẫn ontology [19] (Trang 8)
Hình 3. Multi-classifier Scheme with Low-Level Visual Feature  for Adult Image - Các Phương pháp Lập luận và Tích hợp Ontology Mờ
Hình 3. Multi-classifier Scheme with Low-Level Visual Feature for Adult Image (Trang 41)
Hình 4. Phân lớp ảnh với m vector đặc trưng - Các Phương pháp Lập luận và Tích hợp Ontology Mờ
Hình 4. Phân lớp ảnh với m vector đặc trưng (Trang 42)
Hình 4. Tính chất vừa phân cấp vừa tuần hoàn của thời gian - Các Phương pháp Lập luận và Tích hợp Ontology Mờ
Hình 4. Tính chất vừa phân cấp vừa tuần hoàn của thời gian (Trang 50)
Hình 12. Mối quan hệ giữa các thành phần của đối tượng không gian-thời gian - Các Phương pháp Lập luận và Tích hợp Ontology Mờ
Hình 12. Mối quan hệ giữa các thành phần của đối tượng không gian-thời gian (Trang 56)
Hình 1. Mô hình hoạt động của hệ đa tác tử [4] - Các Phương pháp Lập luận và Tích hợp Ontology Mờ
Hình 1. Mô hình hoạt động của hệ đa tác tử [4] (Trang 72)
Hình 2. Mô hình OSI và vị trí ngôn ngữ CO-ACL [3] - Các Phương pháp Lập luận và Tích hợp Ontology Mờ
Hình 2. Mô hình OSI và vị trí ngôn ngữ CO-ACL [3] (Trang 73)
Hình 1. Kiến trúc tổng quan của framework - Các Phương pháp Lập luận và Tích hợp Ontology Mờ
Hình 1. Kiến trúc tổng quan của framework (Trang 82)
Hình 1. Các thành phần của hệ thống tổng hợp tiếng nói - Các Phương pháp Lập luận và Tích hợp Ontology Mờ
Hình 1. Các thành phần của hệ thống tổng hợp tiếng nói (Trang 97)
Hình 2. Hệ thống tổng hợp tiếng nói và vai trò của mô hình ngôn điệu - Các Phương pháp Lập luận và Tích hợp Ontology Mờ
Hình 2. Hệ thống tổng hợp tiếng nói và vai trò của mô hình ngôn điệu (Trang 98)
Hình 3. Mô hình hệ thống tổng hợp tiếng nói dựa trên ghép nối - Các Phương pháp Lập luận và Tích hợp Ontology Mờ
Hình 3. Mô hình hệ thống tổng hợp tiếng nói dựa trên ghép nối (Trang 102)
Hình lai có lợi thế của cả hai phương pháp tiếp cận dựa trên quy tắc dựa và phương - Các Phương pháp Lập luận và Tích hợp Ontology Mờ
Hình lai có lợi thế của cả hai phương pháp tiếp cận dựa trên quy tắc dựa và phương (Trang 103)
Hình 1. Mô hình tìm kiếm thông tin tiếng Việt theo khái niệm - Các Phương pháp Lập luận và Tích hợp Ontology Mờ
Hình 1. Mô hình tìm kiếm thông tin tiếng Việt theo khái niệm (Trang 146)
Bảng 2. Độ chính xác của công cụ tìm kiếm từ khóa, tìm kiếm ngữ đoạn và tìm kiếm khái niệm - Các Phương pháp Lập luận và Tích hợp Ontology Mờ
Bảng 2. Độ chính xác của công cụ tìm kiếm từ khóa, tìm kiếm ngữ đoạn và tìm kiếm khái niệm (Trang 150)
Hình 1. Mô hình tổng quát hệ phần mềm thông minh - Các Phương pháp Lập luận và Tích hợp Ontology Mờ
Hình 1. Mô hình tổng quát hệ phần mềm thông minh (Trang 154)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w