Vì vậy, đề tài “Ứng dụng sematic web để xây dựng hệ thống tra cứu hiện vật tại Bảo tàng Đà Nẵng” đi sâu vào việc số hoá các dữ liệu của Bảo tàng sau đó xây dựng tri thức dựa trên tư liệ
Trang 1-
TRẦN KIM HOÀNG
ỨNG DỤNG SEMANTIC WEB ĐỂ XÂY DỰNG
HỆ THỐNGTRA CỨU HIỆN VẬT TẠI BẢO TÀNG ĐÀ NẴNG
Chuyên ngành: Khoa học máy tính
Trang 2LỜI CAM ĐOAN
Tôi xin cam đoan :
● Những nội dung trong luận văn này là do tôi thực hiện dưới sự hướng dẫn trực tiếp của PGS.TS Võ Trung Hùng
● Mọi tham khảo dùng trong luận văn đều được trích dẫn rõ ràng và trung thực tên tác giả, tên công trình, thời gian, địa điểm công bố
● Mọi sao chép không hợp lệ, vi phạm quy chế đào tạo, hay gian trá, tôi xin chịu hoàn toàn trách nhiệm
Tác giả
Trần Kim Hoàng
Trang 3MỤC LỤC
LỜI CAM ĐOAN……… I MỤC LỤC……… II CÁC CHỮ VIẾT TẮT……… VI DANH MỤC BẢNG BIỂU……… VII DANH MỤC HÌNH ẢNH………VIII
MỞ ĐẦU……….1
1 Lý do chọn đề tài……… 1
2 Mục đích nghiên cứu……… 2
3 Đối tượng và phạm vi nghiên cứu……… 2
4 Phương pháp nghiên cứu……….2
5 Ý nghĩa khoa học và thực tiễn của đề tài nghiên cứu……… 2
6 Cấu trúc của luận văn……… 3
CHƯƠNG 1: GIỚI THIỆU TỔNG QUAN……… 4
1.1 Web ngữ nghĩa……… 4
1.1.1 Những hạn chế của World Wide Web……… 4
1.1.2 Sự ra đời của Web ngữ nghĩa……… 4
1.1.3 Định nghĩa Web ngữ nghĩa……… 6
1.2 Kiến trúc Web ngữ nghĩa……… 9
1.2.1 Giới thiệu……… 9
1.2.2 Định nghĩa và vai trò của các tầng trong kiến trúc Web ngữ nghĩa…… 10
1.2.2.1 Tầng Unicode và URI (Uniform Resource Identifier)……… 10
1.2.2.2 Tầng XML……… 10
1.2.2.3 Tầng RDF và RDF Schemma……… 11
1.2.2.4 Tầng Ontology Vocabulary……… 11
1.2.2.5 Tầng Lô-gíc……… 11
1.2.2.6 Tầng Proof……… 11
1.2.2.7 Tầng Trust……… 12
1.3 Nội dung xây dụng Web ngữ nghĩa……… 12
1.3.1 XML và RDF trên Web……… 12
1.3.2 Các ngôn ngữ biểu diễn Ontology cho Web có ngữ nghĩa……… 12
1.3.3 Phát triển nâng cao Web ngữ nghĩa ………13
1.4 Ontology……….13
1.4.1 Khái niệm Ontology ……… 13
1.4.2 Mục đích xây dựng Ontology ……….14
1.4.3 Yêu cầu khi sử dụng Ontology ……… 15
1.4.4 Các thành phần Ontology ……… 16
Trang 41.4.5 Ngôn ngữ OWL ……… 17
1.4.6 Công cụ phát triển Ontology……… 18
1.5 Ứng dụng và triển vọng của Web ngữ nghĩa ……….19
1.5.1 Search Engine ……….19
1.5.2 Internet Agent ……….20
1.5.3 Push System ………21
1.5.4 Relationship ………21
1.6 Một số ứng dụng của Web ngữ nghĩa vào lĩnh vực bảo tàng trên thế giới ……21
1.6.1 Europeana ……… 21
1.6.2 CHIP (Cultural Heritage Information Personalization) ……… 22
1.6.3 Ama (Archive Mapper for Archaeology) ……… 23
1.6.4 E-Culture……….23
1.6.5 The Museum Finland Portal ……… 24
1.6.6 The Reach Project ……… 24
1.6.7 The Museum24 Project ……… 24
1.6.8 Cantabria Cultural Heritage Semantic Portal……… 25
1.6.9 CultureSampo Portal ……… 25
1.6.10 Cultura Italia Project (http://www.culturaitalia.it/)……… 25
1.6.11 Sisc Project ……… 25
CHƯƠNG 2: GIẢI PHÁP ĐỀ XUẤT………26
2.1 Bảo tàng Đà Nẵng ……… 26
2.1.1 Giới thiệu ………26
2.1.2 Ứng dụng CNTT tại Bảo tàng……….29
2.2 Giới thiệu bài toán ……… 31
2.2.1 Yêu cầu bài toán ……….31
2.2.2 Phân tích vấn đề ……… 31
2.3 Giải pháp ………33
2.3.1 Phác thảo kiến trúc t ng thể hệ thống ……….34
2.3.2 Giải quyết yêu cầu tìm kiếm ……… 34
2.3.3 Các chức năng cơ bản của ứng dụng ……… 36
2.3.4 Quy trình xây dựng Web ngữ nghĩa ……… 36
2.4 Các công cụ h trợ ……….39
2.4.1 Công cụ xây dựng ứng dụng Protégé……… 39
2.4.2 Bộ Visual Studio.Net ……… 41
2.4.3 Thư viện phát triển ứng dụng ……….42
2.4.3.1 SemWeb ……… 42
2.4.3.2 OwlDotNetApi ………42
2.5 Phân tích và thiết kế hệ thống ………42
2.5.1 Biểu đ Use Case ………42
Trang 52.5.2 Biểu đ lớp……… 45
2.5.3 Biểu đ hoạt động ……… 45
2.5.3.1 Đăng nhập, đăng xuất ……… 46
2.5.3.2 Cập nhật dữ liệu ………47
2.5.3.3 Xem thông tin hiện vật……… 48
2.5.3.4 Tìm kiếm hiện vật ……… 49
CHƯƠNG 3 : X Y DỰNG HỆ TH NG ……… 50
3.1 Mô hình kiến trúc t ng thể của hệ thống………50
3.2 Phát triển ứng dụng ……… 52
3.2.1 Qui trình phát triển ứng dụng ……….52
3.2.2 Xây dựng Ontology ………52
3.2.3 Xây dựng kết nối truy xuất dữ liệu t ontology sang giao diện web …… 56
3.2.3.1 Khai báo sử dụng thư viện OwlDotNetApi……… 56
3.2.3.1 Khai báo truy vấn thông tin……….57
3.2.4 Một số thuật toán được sử dụng để khai thác dữ liệu ……….57
3.2.4.1 Điền dữ liệu ………57
3.2.4.2 Duyệt theo ngữ nghĩa………57
3.2.4.3 Tìm kiếm cơ bản……….58
3.2.5 Xây dựng giao diện ……….58
3.2.5.1 Trang chính của hệ thống ………58
3.2.5.3 Hiển thị thông tin của một hiện vật ……… 59
3.2.5.4 Trang đăng nhập của quản trị hệ thống………60
3.2.5.5 Trang chính của quản trị hệ thống……….60
3.2.5.6 Trang Thêm mới hiện vật ……….61
3.3 Triển khai hệ thống ………61
3.4 Đánh giá kết quả của hệ thống ……… 62
ẾT LU N ……… 63
DANH MỤC TÀI LIỆU THAM HẢO ……… 65
Trang 6NG DỤNG SEMANTIC WEB ĐỂ X Y DỰNG HỆ TH NG TRA C U
HIỆN V T TẠI BẢO TÀNG ĐÀ NẴNG
Học viên: Trần Kim Hoàng Chuyên Ngành: Khoa học máy tính
Mã số: Khoá: 32 Trường Đại học Bách Khoa - ĐHĐN
Tóm tắt - Hiện nay ở một số quốc gia tiên tiến trên thế giới, công việc số hóa thông tin bảo
tàng để xây dựng bảo tàng điện tử được thực hiện cách đây hơn chục năm và trên thực tế, họ
đã xây dựng thành công một số mô hình “Bảo tàng điện tử” Tuy nhiên ở nước ta bảo tàng điện tử vẫn chưa được áp dụng rộng rãi Nghiên cứu này được đề xuất nhằm số hóa thông tin hiện vật của bảo tàng, cũng như đưa ra giải pháp để tìm kiếm thông tin hiện vật trong bảo tàng đây là một phần nhỏ nhằm góp phần xây dựng bảo tàng điện tử Bài báo cáo g m có tìm hiểu
lý thuyết t ng quan về công nghệ Semantic Web, khái niệm Semantic Web, các ngôn ngữ và công cụ xây dựng Số hoá cở sở dữ liệu hiện vật của bảo tàng T đó xây dựng website tìm kiếm thông tin hiện vật của bảo tàng
Từ khoá - Semantic Web, Website, bảo tàng, ontology, sparql, protégé
SEMATIC WEB APPLICATION TO BUIILD THE INSPECTION SYSTEM
ARTIFACTS IN THE MUSEUM DA NANG
Sumary - At present in some advanced countries in the world, the digitization of museum
information to build electronic museums has been done more than a decade ago and, in fact, they have successfully built some model "Electronic Museum" However, electronic museums have not yet been widely applied in Vietnam This research was proposed to digitize the museum's artifacts as well as to provide a way to find information about the museum's artifacts This is a small part of the museum's contribution to electronic museums The report includes an overview of the semantic Web semantic theory, Semantic Web concepts, languages and build tools Digitize the Museum's database of artifacts From there, the Museum's website will be searched for information
Keyword - Semantic Web, Website, museum, ontology, sparql, protégé.
Trang 7CÁC CHỮ VIẾT TẮT
CSDL Cơ sở dữ liệu
HTML HyperText Markup Language
HTTP HyperText Transfer Protocol
IRI Internationalized Resource Identifier ISO International Organization for Standards IWS Institute of Web Science
OIL Ontology Inference Layer
OWL Web Ontology Language
RDF Resource Description Framework
RDFS Resource Description Framework Schema SGML Standard Generalized Markup Language SWSE Semantic Web Search Engine
URI Semantic Web Search Engine
Trang 8DANH MỤC BẢNG BIỂU
Trang 9DANH MỤC HÌNH ẢNH
1.1 Sự hình thành và phát triển của Web ngữ nghĩa 5 1.2 Quá trình phát triển công nghệ Web trong tương lai 6
1.4 Sơ đ phát triển tính thông minh của dữ liệu 8 1.5 Kiến trúc Web ngữ nghĩa theo đề xuất của Tim
2.2 Trang giới thiệu về hiện vật của Bảo tàng Đà Nẵng 30
2.5 Mô tả suy luận ngang cấp trong Web Semantic 35 2.6 Mô tả suy luận ngược trong Web Semantic 35
2.10 Biểu đ hoạt động đăng nhập, đăng xuất 46
2.12 Biểu đ hoạt động xem thông tin hiện vật 48
3.1 Mô hình kiến trúc t ng thể của hệ thống 50 3.2 Quy trình truy xuất dữ liệu của tầng Search engine 51
Trang 11MỞ ĐẦU
1 Lý do chọn đề tài
Hiện nay, với sự phát triển của khoa học kĩ thuật và công nghệ ngành bảo tàng ngày càng phát triển, ngày càng nhiều hiện vật, tư liệu khảo c được tìm thấy Cùng với các hiện vật là kho thông tin và tư liệu kh ng l về các hiện vật được tìm thấy mà các nhà khoa học đã nghiên cứu và phát hiện ra
Bên cạnh đó, cùng với sự phát triển mạnh mẽ của công nghệ thông tin, ứng dụng của công nghệ thông tin trong lĩnh vực bảo tàng đang phát triển mạnh và tạo ra những thay đ i lớn trong công tác bảo tàng
Có rất nhiều cách tiếp cận khác nhau khi ứng dụng công nghệ thông tin trong lĩnh vực bảo tàng Ở một số quốc gia tiên tiến trên thế giới, công việc số hóa thông tin bảo tàng để xây dựng bảo tàng điện tử được thực hiện cách đây hơn chục năm, trên thực tế, họ đã xây dựng thành công một số mô hình bảo tàng điện tử Bảo tàng điện tử cho phép cung cấp dễ dàng và thuận lợi đến khách tham quan toàn bộ các hiện vật của bảo tàng cũng như toàn bộ giá trị phi vật thể tiềm ẩn trong nó Ở Việt Nam, trong vài năm gần đây, một số bảo tàng đã bắt đầu ứng dụng công nghệ thông tin trong hoạt động nghiệp vụ và bước đầu đã có những hiệu quả thực sự
Như chúng ta đã biết, hiện vật và các hoạt động liên quan đến hiện vật là vấn đề chính yếu của một bảo tàng Vì vậy, cơ sở của bảo tàng số hóa là việc ứng dụng khoa học, kĩ thuật thông tin điện tử vào tất cả những thông tin trong bảo tàng và mọi hoạt động nghiệp vụ của bảo tàng Các hiện vật trong bảo tàng, theo quan niệm truyền thống, là một bản gốc, nên khi được số hóa, sẽ tạo ra một bản thông tin mô phỏng lưu trữ trong bộ nhớ của máy tính, t đó đem đến nhiều thuận lợi trong phương thức khai thác thông tin Trên cơ sở số hóa, máy tính sẽ thay thế phần lớn các thao tác của cán
bộ bảo tàng trong mọi khâu quản lý, sử dụng hiện vật và tự động hóa các khâu này Tuy nhiên, các ứng dụng hiện nay vẫn d ng lại ở việc cung cấp thông tin chứ chưa cung cấp được những tri thức cần thiết nên đã có những khó khăn nhất định trong việc tìm hiểu, tra cứu
Vì vậy, đề tài “Ứng dụng sematic web để xây dựng hệ thống tra cứu hiện vật tại Bảo tàng Đà Nẵng” đi sâu vào việc số hoá các dữ liệu của Bảo tàng sau đó xây
dựng tri thức dựa trên tư liệu của các hiện vật đã được số hoá nhằm phục vụ cho việc tìm hiểu và tra cứu một cách dễ dàng hơn
Trang 122 Mục đích nghiên cứu
Đề tài hướng đến việc số hoá dữ liệu các hiện vật đang có của Bảo tàng, sau đó dựa trên cơ sở dữ liệu có được để xây dựng một ontology đầy đủ về các hiện vật của Bảo tàng T ontology v a xây dựng tiếp tục xây dựng hệ thống tìm kiếm hiện vật cho bảo tàng
3 Đối tượng và phạm vi nghiên cứu
Đối tượng nghiên cứu của đề tài là các vấn đề liên quan đến Semantic Web như phương pháp để xây dựng và lưu trữ dữ liệu trong Semantic Web và các công cụ dùng
để xây dựng Semantic Web
Phạm vi nghiên cứu của đề tài là các hiện vật của Bảo tàng Đà Nẵng Hiện nay Bảo tàng Đà Nẵng có khoảng hơn 3000 hiện vật được trưng bày Tuy nhiên trong đề tài này tôi chi t ng hợp thông tin của 600 hiện vật về lịch sử các thời kỳ chiến tranh, về điều kiện tự nhiên, về văn hoá của các dân tộc, về Đà Nẵng thời tiền sơ sử Ứng dụng tìm kiếm thông tin của hiện vật được xây dựng và kiểm thử ở phạm vi Bảo tàng Đà Nẵng
4 Phương pháp nghiên cứu
Về mặt lý thuyết tập trung nghiên cứu về các vấn đề liên quan đến sematic web
và việc xây dựng bảo tàng điện tử Tìm hiểu về số hoá dữ liệu liên quan đến bảo tàng Nghiên cứu về quá trình xây dựng một công cụ search engine
Phương pháp thực nghiệm tập trung vào việc số hoá dữ liệu và xây dựng kho dữ liệu các hiện vật của bảo tàng Xây dựng ontology các hiện vật của bảo tàng Xây dựng công cụ search engine, xây dựng website tìm kiếm hiện vật của bảo tàng, triển khai thực tế trên Internet
5 Ý nghĩa khoa học và thực tiễn của đề tài nghiên cứu
Về mặt khoa học đề tài đóng góp một công cụ tìm kiếm các hiện vật theo công nghệ sematic web dành riêng cho bảo tàng Phương pháp xây dựng ontology về các hiện vật của bảo tàng Số hoá được một phần dữ liệu về các hiện vật của bảo tàng
Về thực tiễn đề tài bước đầu mở ra hướng nghiên cứu để t ng bước xây dựng bảo tàng điện tử cho Bảo tàng Đà Nẵng Giúp bảo tàng t ng bước số hoá được dữ liệu về hiện vật hiện có
Trang 136 Cấu trúc của luận văn
Bố cục của luận văn g m có 3 chương như sau:
CHƯƠNG 1: GIỚI THIỆU TỔNG QUAN
Trong chương này của đề tài trình bày cơ sở lý thuyết về Sematic Web và một số ứng dụng thành công về bảo tàng trên thế giới có sử dụng công nghệ Sematic Web CHƯƠNG 2: GIẢI PHÁP ĐỀ XUẤT
Chương này giới thiệu về Bảo tàng Đà Nẵng và thực trạng ứng dụng công nghệ thông tin vào lĩnh vực bảo tàng của Bảo tàng Đà Nẵng Phân tích ưu điểm và nhược điểm của website bảo tàng hiện nay T đó, đề xuất xây dựng hệ thống tìm kiếm hiện vật hiệu quả hơn
Trang 14CHƯƠNG 1: GIỚI THIỆU TỔNG QUAN
Trong chương này giới thiệu các khái niệm t ng quan về Web ngữ nghĩa, các ngôn ngữ và công cụ xây dựng Web ngữ nghĩa tính đến thời điểm hiện nay Tìm hiểu kiến trúc Web ngữ nghĩa, ứng dụng và triển vọng của Web ngữ nghĩa trong tương lai
Đ ng thời trong chương này cũng tìm hiểu về một số ứng dụng của Web ngữ nghĩa vào lĩnh vực bảo tàng trên thế giới
1.1 Web ngữ nghĩa
1.1.1 Những hạn chế của World Wide Web
World Wide Web (gọi tắt là Web) được sáng lập bởi Tim Berners - Lee đã trở thành một kho tàng thông tin kh ng l của nhân loại và một môi trường chuyển tải thông tin không thể thiếu được trong thời đại công nghệ thông tin ngày nay và nó cũng chính là linh h n của Internet
Thông tin trên Internet thường được t chức dưới dạng siêu văn bản, chúng được tạo ra bằng ngôn ngữ đánh dấu siêu văn bản HTML Để tìm kiếm các trang Web nói riêng, các tài nguyên trên Internet nói chung và đảm bảo việc truy cập đến chúng người ta sử dụng hệ thống mạng toàn cầu WWW Hệ thống mạng toàn cầu WWW được cấu thành t các trang Web và được xây dựng trên giao thức truyền tin đặc biệt, gọi là giao thức truyền tin siêu văn bản HTTP
Hệ thống mạng toàn cầu WWW ngày càng trở nên rộng khắp thông qua một loạt các tiêu chuẩn được thiết lập rộng rãi và đảm bảo được các thành phần ở các mức độ khác nhau Giao thức TCP IP đảm bảo rằng chúng ta không phải lo lắng về việc chuyển t ng bit dữ liệu thông qua hệ thống mạng nữa Tương tự như vậy, HTTP và HTML đã cung cấp các cách tiêu biểu để có thể nhận thông tin và trình diễn các tài liệu siêu văn bản
Tuy nhiên, trên thực tế có một khối lượng kh ng l các tài nguyên trên Web, điều
đó đã đặt ra thách thức làm sao để khai thác thông tin trên Web một cách hiệu quả, mà
cụ thể là làm thế nào để máy tính có thể trợ giúp xử lý tự động được chúng Muốn vậy, web phải có khả năng mô tả các sự vật theo cách mà máy tính có thể “hiểu” được, có thể tích hợp dữ liệu, cũng như tái sử dụng dữ liệu thông qua các ứng dụng khác nhau
1.1.2 Sự ra đời của Web ngữ nghĩa
World Wide Web (WWW) chứa một thông tin kh ng l , được tạo ra t các t chức, cộng đ ng khác nhau trên khắp thế giới Nhờ vào WWW, kiến thức con người
đã tăng tiến một cách đáng kể Người ta ước tính, chỉ trong vòng vài chục năm, lượng kiến thức của nhân loại đã tăng gấp đôi Tính đơn giản và ph biến của WWW đã
Trang 15mang lại cho con người quá nhiều lợi ích Con người có thể trao đ i thông tin ở khắp mọi nơi
Tuy nhiên, các trang Web hiện nay hầu hết được sử dụng bởi con người, máy tính chỉ có nhiệm vụ gửi nhận dữ liệu và thể hiện thông tin dưới dạng mà chỉ có con người mới đọc hiểu được Người sử dụng phải làm nhiệm vụ tìm kiếm, suy luận, t ng hợp và trích rút thông tin mình cần Điều đó đã đặt ra thách thức là làm sao để khai thác thông tin trên Web hiệu quả hay nói cách khác là làm thế nào để máy tính có thể
xử lý tự động được chúng Muốn vậy thì Web phải có khả năng mô tả thông tin theo cách mà máy tính có thể hiểu được Để chúng ta dễ dàng có được một kết quả tìm kiếm chính xác, nhanh chóng và hiểu dần tới ngữ nghĩa vấn đề chúng ta mong muốn
Hình 1.1: S hình th nh v phát triển của eb ngữ nghĩa
Hình trên thể hiện sự kế th a và phát triển các thế hệ Web trong quá trình phát triển công nghệ Web T thế hệ Web đầu tiên là những trang HTML thủ công đến Web hiện tại – Web 2.0 đã dùng các liên kết URI, ngôn ngữ HTLM, XML và đã đạt được những thành tựu đáng kể trong việc tìm kiếm Tuy nhiên, ở thế hệ Web này thông tin được biểu diễn dưới dạng văn bản thô, chỉ có con người mới đọc và hiểu được thì việc tìm kiếm trong một lượng lớn thông tin ngày càng ít hiệu quả hơn Hơn nữa nhu cầu của người dùng không d ng lại ở đó mà còn đòi hỏi thông tin trên Web
Trang 16phải được định nghĩa rõ ràng sao cho con người và máy tính có thể làm việc với nhau một cách có hiệu quả hơn Web 3.0 - Web ngữ nghĩa ra đời nhằm đáp ứng những yêu cầu về xử lý và tìm kiếm thông tin, cho phép chúng ta xây dựng những CSDL phục vụ tìm kiếm chính xác
Hình 1.2: Quá trình phát triển công nghệ eb trong tương lai
1.1.3 Định nghĩa Web ngữ nghĩa
Web ngữ nghĩa được hình thành t ý tưởng của Tim Berners-Lee, người phát minh ra WWW, URI, HTTP và HTML Tim Berners-Lee đã định nghĩa: “The Semantic Web is an extension of the current Web in which information is given well- defined meaning, better enabling computers and people to work in cooperation” Web ngữ nghĩa là sự mở rộng của Web hiện tại mà trong đó thông tin được định nghĩa rõ ràng sao cho con người và máy tính có thể làm việc với nhau một cách hiệu quả hơn Theo định nghĩa của T chức World Wide Web, Web ngữ nghĩa được hiểu như sau:
Web ngữ nghĩa là một cách nhìn về cách thức t chức dữ liệu, đó là ý tưởng về việc dữ liệu trên Web được định nghĩa và liên kết theo một cách mà nó có thể được sử dụng bởi máy tính, với mục đích không chỉ cho việc hiển thị mà còn tự động hóa, tích hợp và sử dụng lại dữ liệu qua các ứng dụng khác nhau
Web ngữ nghĩa là một mạng lưới các thông tin được liên kết sao cho chúng có thể được xử lý dễ dàng bởi các máy tính ở phạm vi toàn cầu Nó được xem là cách mô
tả thông tin rất hiệu quả trên World Wide Web, và cũng được xem là một cơ sở dữ liệu
có khả năng liên kết toàn cầu W3C
Trang 17Tim Berners-Lee đã đưa ra hai vấn đề của Web ngữ nghĩa là tạo cho Web một môi trường cộng tác tốt hơn và máy có thể hiểu và xử lý tự động các thông tin trên Web
Hình 1.3: Một đề xuất nguồn gốc eb với CERN
Cái nhìn này rất phức tạp và phức tạp hơn nhiều so với việc lọc ra các trang HTML t các dịch vụ Web hiện tại Nhưng trong hình này, có các mối quan hệ giữa các thông tin như: includes , describes , rote , đây là các mối quan hệ giữa các tài nguyên mà trong Web hiện tại không có Các quan hệ này đưa vào Web ngữ nghĩa là cần thiết để máy có thể hiểu, xử lý thông tin tự động trên Web và được gọi là các siêu
dữ liệu Chúng được tạo nên bởi công nghệ RDF (Resource Description Framework)
Để có thể tạo ra Web có dữ liệu mà máy có thể xử lý được, trước hết phải thay đối mô hình trong cách chúng ta nghĩ về dữ liệu T trước đến nay, dữ liệu bị khoá ngay trong các ứng dụng độc quyền Dữ liệu được coi như thứ yếu để xử lý dữ liệu cụ thể là sự phụ thuộc giữa xử lý và dữ liệu Hay nói cách khác, phần mềm tốt thì hoàn toàn phụ thuộc vào dữ liệu tốt Với các hệ tính toán chuyên nghiệp thì ngay khi bắt đầu thực hiện, vấn đề dữ liệu là rất quan trọng, nó phải được xác minh và bảo vệ
Với Web, XML và xu thế Web ngữ nghĩa đang n i lên thì có sự thay đ i của sức mạnh đang di chuyển t các ứng dụng sang dữ liệu Vấn đề này cũng cho chúng ta mấu chốt để hiểu Web ngữ nghĩa Con đường để máy có thể xử lý dữ liệu chủ yếu là tạo ra dữ liệu thông minh hơn chứ không phải là các xử lý thông minh
Trang 18Sự phát triển liên tục của tính thông minh dữ liệu có bốn bậc quan trọng Bốn bậc này biểu diễn t dữ liệu có tính thông minh thấp nhất đến dữ liệu đã có thông tin đủ ngữ nghĩa để máy thực hiện suy luận về nó
Hình 1.4: Sơ đồ phát triển tính thông minh của dữ liệu
n bản và c s d iệu bậc này à ti n
Bậc đầu tiên, hầu hết dữ liệu ở bậc này được sở hữu độc quyền cho một ứng dụng Do vậy tính thông minh là nằm trong ứng dụng đó chứ không phải là trong dữ liệu
ài iệu v i mi n đ n
Ở bậc này, dữ liệu đạt được là ứng dụng độc lập với miền riêng Bây giờ, dữ liệu
đủ thông minh để có thể di chuyển giữa các ứng dụng trong một miền đơn
C c phân oại và tài iệu v i c c b t vựng h n h p
Trong bậc này, dữ liệu có thể được soạn t đa miền và được phân lớp chính xác theo một nguyên tắc phân loại có thứ bậc Thực tế, sự phân lớp đó có thể được sử dụng
để khám phá dữ liệu Các quan hệ đơn giản giữ các lớp có thể được sử dụng để quan
hệ và do vậy, ta có dữ liệu kết hợp Như vậy, dữ liệu bây giờ thông minh đủ để khám phá dễ dàng và được kết hợp một cách hợp lý với dữ liệu khác
C c nto ogy và c c uật ập uận
Trong mức này, dữ liệu mới có thể được suy ra t những dữ liệu đã có theo các luật lô-gíc Thực chất, dữ liệu bây giờ thông minh đủ để được mô tả với các quan hệ cụ thể và các dạng hình thức phức tạp Điều này cho phép kết hợp hoặc tái kết hợp dữ liệu nguyên thu nhiều hơn và sự phân tích về dữ liệu mịn hơn.Một ví dụ về sự phức tạp của dữ liệu là việc chuyển tự động tài liệu trong một miền này sang một tài liệu tương đương trong một miền khác Ở mức này, ta có thể soạn một định nghĩa mới trên Web ngữ nghĩa, máy có thể xử lý các tài liệu Web có dữ liệu thông minh Hơn nữa, ta có thể
Trang 19định nghĩa dữ liệu thông minh vì dữ liệu nó độc lập với ứng dụng, có thể soạn, phân lớp và lấy một phần của các hệ thông tin lớn hơn
Như vậy, việc xây dựng Web ngữ nghĩa chủ yếu tập trung xây dựng hệ thống Web có dữ liệu thông minh Dữ liệu thông minh ở đây không có nghĩa là gắn liền với trí tuệ nhân tạo, không phải là cho máy học hiểu các t ngữ của con người hay máy xử
lý được ngôn ngữ tự nhiên mà nó thông minh bởi việc t chức lựa chọn dữ liệu biểu diễn trong ngôn ngữ được cấu trúc để máy có thể hiểu
1.2 iến trúc Web ngữ nghĩa
1.2.1 Giới thiệu
Tim Berners Lee đã đề xuất mô hình kiến trúc Web ngữ nghĩa đầu tiên đây là mô hình kiến trúc g m các thần phần chính của Web ngữ nghĩa Mô hình kiến trúc của Web ngữ nghĩa được thay đ i theo t ng thời điểm nhất định cho thấy công nghệ Web ngữ nghĩa vẫn còn đang hoàn thiện và phát triển theo thời gian
Web ngữ nghĩa được xây dựng trên nền hệ thống web hiện tại Web ngữ nghĩa được coi là sự mở rộng của Web hiện tại có b sung thêm ngữ nghĩa vào dữ liệu trên web Hình 1.3 chỉ ra sơ đ kiến trúc của Web ngữ nghĩa
Hình 1.5: Kiến trúc eb ngữ nghĩa theo đề xuất của Tim Berners Lee
T sơ đ kiến trúc, ta thấy Web ngữ nghĩa có bảy tầng kiến trúc Trong đó, hệ thống Web hiện tại (World Wide Web) đang ở tầng thứ hai Tất cả các tầng của Web ngữ nghĩa được sử dụng để đảm bảo độ an toàn và giá trị thông tin trở nên tốt nhất
Trang 201.2.2 Định nghĩa và vai trò của các tầng trong kiến trúc Web ngữ nghĩa
ng nicode và niform esource dentifier
Unicode: là một bảng mã chuẩn chung có đủ các ký tự để thống nhất sự giao tiếp
trên tất cả các quốc gia, đáp ứng tính nhất quán toàn cầu của web
URI (Uniform Resource Identifier): là kí hiệu nhận dạng Web đơn giản Cụ
thể, nó là một xâu ngắn cho phép nhận dạng tài nguyên Web như: với các xâu bắt đầu với http: hoặc ftp: mà chúng ta thường thấy trên World Wide Web Bất kỳ một người nào cũng có thể tạo một URI, và sở hữu chúng và chúng là một công nghệ cơ sở
để xây dựng một hệ thống Web toàn cầu Hệ thống World Wide Web được xây dựng trên chúng và bất kỳ cái gì mà có một URI thì được coi là trên Web
URL (Uniform Resource Locator): là một dạng đặc biệt của URI, cụ thể nó là
một địa chỉ trên mạng
URIref (URI reference): Là một URI cùng với một phần nhận dạng tuỳ ý ở
cuối Ví dụ: Ta có một URIref: http: www.example.org Books Ontology bao g m một URI: http: www.example.org Books và một phần nhận dạng Ontology được cách nhau bởi kí hiệu
Theo như quy ước, namespace các không gian tên là những tài nguyên mà tạo ra các đa tài nguyên, thường là những URI được kết thúc bởi kí hiệu Ví dụ: http: www.example.org Books là một không gian tên Các tài nguyên không có URIref thì được gọi là các nút trắng Một nút trắng chỉ ra sự t n tại của tài nguyên không có sự
đề cập rõ ràng về tham chiếu URIref của tài nguyên
XML là một mở rộng của ngôn ngữ đánh dấu cho các các cấu trúc tài liệu bất kỳ, trái với HTML, là một loại ngôn ngữ đánh dấu chỉ dành cho các loại tài liệu siêu liên kết Một tài liệu XML bao g m một tập các thẻ đóng và thẻ mở được l ng vào nhau, ở
đó m i một thẻ có một cặp các thuộc tính và giá trị Phần cốt yếu của tài liệu XML là
bộ t vựng của các thẻ và sự kết hợp được cho phép thì không cố định, nhưng có thể được xác định thông qua m i ứng dụng XML
Trang 21Tuy nhiên, nó không cung cấp một giải pháp đầy đủ các yêu cầu của Web ngữ nghĩa XML chỉ có thể đại diện cho một số thuộc tính ngữ nghĩa thông qua cấu trúc cú pháp của nó
ng D và D chemma
RDF (Resource Description Framework): Khung mô tả tài nguyên - RDF
được W3C giới thiệu để cung cấp một cú pháp chuẩn để tạo, thay đ i và sử dụng các chú thích trong Web ngữ nghĩa Một mệnh đề RDF là một bộ ba có dạng: chủ đề, thuộc tính, đối tượng Trong đó, chủ đề là tài nguyên mà được mô tả bằng thuộc tính
và đối tượng Thuộc tính thể hiện mối quan hệ giữa chủ đề và đối tượng Còn đối tượng ở đây có thể là một tài nguyên hoặc một giá trị Ba thành phần trên trong RDF đều là các URI
RDFS (RDFschema): là một ngôn ngữ Ontology đơn giản của Web ngữ nghĩa,
được coi là một ngôn ngữ cơ sở của Web ngữ nghĩa RDFS là ngôn ngữ mô tả bộ t vựng trên các bộ ba RDF Nó cung cấp các công việc sau:
Định nghĩa các lớp tài nguyên
Định nghĩa các quan hệ giữa các lớp
Định nghĩa các loại thuộc tính mà các lớp trên có
Định nghĩa các mối quan hệ giữa các thuộc tính
ng nto ogy ocabu ary
Bộ t vựng ontology được xây dựng trên cơ sở tầng RDF và RDFS, cung cấp biểu diễn ngữ nghĩa mềm dẻo cho tài nguyên web và có khả năng h trợ lập luận Để xây dựng được các bộ t vựng này, người ta đã sử dụng các ngôn ngữ ontology để biểu diễn chúng như: RDFS, OIL, DAML, DAML+OIL, OWL, Các ngôn ngữ này cung cấp khả năng biểu diễn và h trợ lập luận khác nhau và chúng dựa trên nền tảng
là các ngôn ngữ logic mô tả tương ứng khác nhau
ng -g c
Việc biểu diễn các tài nguyên dưới dạng các bộ t vựng Ontology có mục đích là
để máy có thể lập luận được Mà cơ sở lập luận chủ yếu dựa vào lô-gíc Chính vì vậy
mà các Ontology được ánh xạ sang lô-gíc, cụ thể là lô-gíc mô tả để có thể h trợ lập luận Vì lô-gíc mô tả có biểu diễn ngữ nghĩa hình thức (Đặc trưng của lý thuyết mô hình) và cung cấp các dịch vụ lập luận, là cơ sở để h trợ máy có thể lập luận và hiểu tài nguyên
ng roof
Tầng này đưa ra các luật để suy luận Cụ thể t các thông tin đã có ta có thể suy
ra các thông tin mới Ví dụ: A là cha của B, A là em trai C thì khi đó ta có thông tin
Trang 22mới là C là bác của B Để có được các suy luận này thì cơ sở là FOL Logic) Hiện nay các nhà nghiên cứu đang xây dựng các ngôn ngữ luật cho nó như: SWRL, RuleML
ng rust
Đảm bảo tính tin cậy của các ứng dụng trên Web ngữ nghĩa Ví dụ: Một người bảo x là xanh, một người khác lại nói x không xanh, như thế Web ngữ nghĩa là không đáng tin cậy Câu trả lời ở đây được xem xét trong các ngữ cảnh M i ứng dụng trên Web ngữ nghĩa sẽ có một ngữ cảnh cụ thể, chính vì thế các mệnh đề trên có thể nằm trong các ngữ cảnh khác nhau khi đó ngữ nghĩa tương ứng khác nhau nên các mệnh đề
đó vẫn đúng, đáng tin cậy trong ngữ cảnh của nó Để có được sự chứng minh về độ tin cậy thì các lập luận được áp dụng là không đơn điệu và có các cơ chế kiểm tra chứng minh kết hợp với công nghệ chữ ký điện tử để xác nhận độ tin cậy Các ngôn ngữ chứng minh là ngôn ngữ cho ta chứng minh một mệnh đề là đúng hay sai
1.3 Nội dung xây dụng Web ngữ nghĩa
Để xây dựng hệ thống Web ngữ nghĩa thay thế cho World Wide Web hiện tại, các nhà nghiên cứu đang n lực và tập trung nghiên cứu với ba hướng chính sau:
Chuẩn hoá các ngôn ngữ biểu diễn dữ liệu (XML) và siêu dữ liệu (RDF) trên Web
Chuẩn hoá các ngôn ngữ biểu diễn Ontology cho Web có ngữ nghĩa
Phát triển nâng cao Web ngữ nghĩa (Semantic Web Advanced Development - SWAD)
1.3.1 XML và RDF trên Web
Như chúng ta đã biết, World Wide Web đã rất thành công bởi ngôn ngữ XML XML đã làm cho công nghệ Web phát triển mạnh mẽ như hiện nay Web ngữ nghĩa được phát triển trên nền Web hiện tại, trên nền XML, chúng ta có thể thấy rất rõ ngay trong sơ đ kiến trúc của Web ngữ nghĩa Web ngữ nghĩa được b sung các chú thích ngữ nghĩa cho các tài nguyên Web và W3C đã giới thiệu RDF là chuẩn cú pháp để tạo, thay đ i và sử dụng chú thích trong Web ngữ nghĩa Do vậy việc xây dựng ngôn ngữ chuẩn cho XML và RDF là thiết yếu để biểu diễn dữ liệu cho Web ngữ nghĩa Trong quá trình này, đã có một số cú pháp được đưa ra để biểu diễn RDF như: Notation 3 (hay N3), XML RDF hay đ thị các mệnh đề của RDF như đã trình bày ở trên Các cú pháp này h trợ biểu diễn dữ liệu cho máy có thể hiểu được
1.3.2 Các ngôn ngữ biểu diễn Ontology cho Web có ngữ nghĩa
Ontology đóng vai trò then chốt trong việc cung cấp tài nguyên có thể truy nhập
để xử lý tự động bằng cách cung cấp bộ t vựng cho việc đánh dấu ngữ nghĩa của Web ngữ nghĩa Để biểu diễn Ontology cho phát triển Web có ngữ nghĩa cần thiết đưa ra
Trang 23một ngôn ngữ chuẩn cho sự biểu diễn mềm dẻo, linh hoạt và đa dạng của tài nguyên Web
Trong quá trình chuẩn hoá ngôn ngữ biểu diễn Ontology, một số ngôn ngữ được
đề xuất với các khả năng biểu diễn tăng dần như: RDFS, DAML+OIL, OWL, và tiếp tục được mở rộng trong tương lai Các ngôn ngữ này có khả năng biểu diễn tăng dần nhưng tương ứng là khả năng quyết định giảm dần (Độ phức tạp tăng dần) Các ngôn ngữ biểu diễn Ontology được xây dựng phải cân bằng được khả năng biểu diễn
và độ phức tạp tính toán Các ngôn ngữ này được xây dựng trên nền các chuẩn XML, RDF và thường sử dụng cơ sở lô-gíc là lô-gíc mô tả để biểu diễn ngữ nghĩa và h trợ lập luận
1.3.3 Phát triển nâng cao Web ngữ nghĩa
Các công việc chuẩn hoá các ngôn ngữ biểu diễn dữ liệu XML, siêu dữ liệu RDF hay ngôn ngữ biểu diễn Ontology là các công việc nền tảng, cơ sở tạo ra chuẩn chung
cơ sở để phát triển hệ thống và các ứng dụng trên Web ngữ nghĩa Việc đưa các chuẩn
đó thành các thể hiện, các sản phẩm của hệ thống Web ngữ nghĩa là công việc của SWAD (Semantic Web Advanced Development) SWAD thực hiện nghiên cứu và đưa
ra các thể hiện của Web ngữ nghĩa trên công nghệ cơ sở và nó cũng b sung, hoàn thiện các công nghệ cơ sở này Nó chỉ ra các công nghệ Web ngữ nghĩa được sử dụng như thế nào Mục tiêu cụ thể của SWAD là sử dụng các công nghệ, k thuật và các công cụ hiện có của Web ngữ nghĩa để tạo ra các chương trình vượt xa hơn tầm hiện
có, phát triển các thể hiện thực tiễn và cung cấp các công cụ và các chuẩn mới cho Web ngữ nghĩa
Để phát triển SWAD hiện tại đã có một số dự án của các t chức thực hiện nghiên cứu và phát triển như: SWAD-Europe, SWAD-DAML, SWAD-Simile, SWAD- Oxygen Hiện tại, ở Việt Nam, một dự án cấp Nhà nước đang nghiên cứu thực hiện trích rút tự động thông tin t các trang Web về tin tức để xây dựng các Ontology cho lĩnh vực này nhằm tiếp nhận công nghệ Web ngữ nghĩa khi có hệ thống mạng mới này
1.4. Ontology
h i niệm nto ogy
Trong khoa học máy tính, một ontology là một mô hình dữ liệu biểu diễn một lĩnh vực và được sử dụng để suy luận về các đối tượng trong lĩnh vực đó và mối quan
hệ giữa chúng Ontology cung cấp một bộ t vựng chung bao g m các khái niệm, các thuộc tính quan trọng và các định nghĩa về các khái niệm và các thuộc tính này Ngoài
bộ t vựng, ontology còn cung cấp các ràng buộc, đôi khi các ràng buộc này được coi như các giả định cơ sở về ý nghĩa mong muốn của bộ t vựng, nó được sử dụng trong
Trang 24một miền mà có thể được giao tiếp giữa người và các hệ thống ứng dụng phân tán h n tạp khác
Các ontology được sử dụng như là một biểu mẫu trình bày tri thức về thế giới hay một phần của nó Các ontology thường miêu tả:
Cá thể Individuals : Các đối tượng cơ bản, nền tảng
Lớp Classes : Các tập hợp, hay kiểu của các đối tượng
Thuộc tính Properties : Thuộc tính, tính năng, đặc điểm, tính cách, hay các
thông số mà các đối tượng có và có thể đem ra chia sẻ
Quan hệ Relation : Các con đường mà các đối tượng có thể liên hệ tới một
đối tượng khác Bộ t vựng ontology được xây dựng trên cơ sở tầng RDF và RDFS, cung cấp khả năng biểu diễn ngữ nghĩa mềm dẻo cho tài nguyên Web và
có khả năng h trợ lập luận
ục đ ch xây dựng nto ogy
Ontology được xây dựng nhằm các mục đích sau:
Chia sẻ những hiểu biết chung về các khái niệm, cấu trúc thông tin giữa con người hoặc giữa các hệ thống phần mềm: Đây là một trong những mục tiêu ph biến trong việc phát triển Ontology, không những trong lĩnh vực Semantic Web
mà còn trong nhiều ngành, lĩnh vực khác Có thể hình dung Ontology giống như một cuốn t điển chuyên ngành, cung cấp, giải thích các thuật ngữ cho người sử dụng không có cùng chuyên môn khi được yêu cầu Không chỉ được
sử dụng bởi con người, Ontology còn hữu ích khi cần sự hợp tác giữa các hệ thống phần mềm
Tái sử dụng tri thức về một miền lĩnh vực đã được xây dựng t trước: Đây là một vấn đề quan trọng được nghiên cứu trong những năm gần đây Nó liên quan đến việc kết hợp hai hay nhiều Ontology thành một Ontology lớn và đầy
đủ hơn Vấn đề ở đây là tên các khái niệm được định nghĩa trong các Ontology này có thể giống nhau trong khi chúng được dùng để mô tả một sự vật hoàn toàn khác nhau Tuy nhiên cũng có thể có trường hợp ngược lại, khi tên các khái niệm khác nhau nhưng cùng mô tả một sự vật Ngoài ra, làm thế nào để b sung các quan hệ, thuộc tính có sẵn vào một hệ thống mới càng làm cho vấn đề trở nên phức tạp
Làm rõ ràng các giả định thuộc lĩnh vực chuyên ngành: Việc sử dụng một Ontology ở bên dưới thay vì dùng ngôn ngữ lập trình sẽ giúp dễ dàng thay đ i những giả định thuộc lĩnh vực chuyên ngành khi kiến thức về lĩnh vực này của chúng ta thay đ i Nếu những giả định này được viết bằng ngôn ngữ lập trình thì sẽ gây khó khăn đối với những người lập trình không chuyên
Tri thức độc lập với ngôn ngữ: Đây cũng là vấn đề liên quan đến lĩnh vực tái sử dụng tri thức đã nói ở trên, tuy nhiên bài toán đặt ra là làm thế nào để một hệ
Trang 25thống Ontology có thể được dùng bởi các ngôn ngữ của các quốc gia khác nhau
mà không phải xây dựng lại Giải pháp mà Ontology mang lại là cho phép tên các khái niệm và quan hệ trong Ontology chuẩn thường được xây dựng bằng tiếng Anh Điều này có thể sẽ phá v phần nào rào cản về mặt ngôn ngữ khi mà kết quả tìm kiếm sẽ không bó gọn trong t khóa và ngôn ngữ mà nó sử dụng Ngoài ra, Ontology có thể sẽ trở thành hướng đi mới cho một lĩnh vực đã quen thuộc là dịch tài liệu tự động Có thể nói như vậy, bởi ngữ nghĩa các t vựng trong văn bản sẽ được dịch chính xác hơn khi được ánh xạ vào đúng ngữ cảnh của nó
Tri thức trở nên nhất quán và tường minh: Các khái niệm khác nhau trong một hay nhiều lĩnh vực cụ thể có thể cùng tên và gây nhập nhằng về ngữ nghĩa, tuy nhiên khi được đưa vào một hệ thống Ontology thì tên m i khái niệm là duy nhất Một giải pháp cho vấn đề này là Ontology sẽ sử dụng các tham khảo URI làm định danh thật sự cho khái niệm trong khi vẫn sử dụng các nhãn gợi nhớ bên trên để thuận tiện cho người dùng
Hình 1.6: S cần thiết của Ontology trong quá trình chia sẻ tri thức
Yêu c u khi sử dụng nto ogy
Ngôn ngữ Ontology cho phép người sử dụng viết rõ ràng, các khái niệm hình thức của mô hình miền và phải đảm bảo những yêu cầu cơ bản sau:
Cấu trúc rõ ràng: Đây là điều kiện cần cho máy có thể xử lý thông tin
Ngữ nghĩa hình thức miêu tả ý nghĩa tri thức một cách chính xác: Ý nghĩa của ngữ nghĩa hình thức t n tại trong một thời gian dài trong miền toán lô-gíc Việc
sử dụng ngữ nghĩa hình thức cho phép con người suy diễn tri thức Với tri thức trong Ontology chúng ta có thể suy diễn về:
Thành viên của lớp: Nếu x là một thể hiện của lớp C và C là lớp con của lớp D thì chúng ta có x là thể hiện của lớp D
Trang 26 Các lớp tương đương: Nếu lớp A tương đương với lớp B và lớp B tương đương với lớp C, thì lớp A cũng tương đương với lớp C
Tính nhất quán: Giả sử chúng ta khai báo x là thể hiện của lớp A và A là lớp con của B∩C, A là lớp con của lớp D, Lớp B và lớp D không có quan hệ với nhau (disjoint) Thì chúng ta không nhất quán bởi vì A nên là r ng nhưng lại có thể hiện là x Đây là một dấu hiệu của một l i trong Ontology
Phân loại: Nếu chúng ta khai báo các cặp thuộc tính giá trị đã biết là điều kiện
đủ cho thành viên trong một lớp A, thì nếu một cá thể x thỏa mãn các điều kiện, chúng ta có thể kết luận x phải là một thể hiện của A
Ngữ nghĩa là điều kiện tiên quyết cho việc h trợ suy diễn: H trợ suy diễn rất quan trọng bởi vì nó cho phép kiểm tra tính nhất quán của Ontology và tri thức, kiểm tra các quan hệ th a giữa các lớp, tự động phân loại các thể hiện trong lớp
Ngữ nghĩa hình thức và h trợ suy diễn thường được cung cấp bởi việc ánh xạ một ngôn ngữ Ontology đến hình thức lô-gíc và sử dụng suy diễn tự động bởi các hình thức luôn t n tại OWL được ánh xạ lô-gíc miêu tả và sử dụng các suy diễn đang t n tại như FaCT và RACER Các lô-gíc mô tả là tập con của lô-gíc vị t nhằm h trợ suy diễn hiệu quả
C c thành ph n nto ogy
Ontology được sử dụng như là một biểu mẫu trình bày tri thức về thế giới hay một phần của nó Ontology thường miêu tả: Cá thể (Individuals), lớp (Classes), thuộc tính (Propertises) và quan hệ (Relation)
Bộ t vựng Ontology được xây dựng trên cơ sở tầng RDF và RDFS, cung cấp khả năng biểu diễn ngữ nghĩa mềm dẻo cho tài nguyên Web và có khả năng h trợ lập luận
Cá thể Individuals : Các cá thể là các thành phần cơ bản, nền tảng của một
ontology Các cá thể trong một ontology có thể bao g m các đối tượng cụ thể như con người, động vật, cái bàn… cũng như các cá thể tr u tượng như các thành viên hay các t Một ontology có thể không cần bất kỳ một cá thể nào, nhưng một trong những lý do chính của một ontology là để cung cấp một ngữ nghĩa của việc phân lớp các cá thể, mặc dù các cá thể này không thực sự là một
phần của ontology
Lớp Classes : Các lớp là các nhóm, tập hợp các đối tượng tr u tượng Chúng
có thể chứa các cá thể, các lớp khác, hay là sự phối hợp của cả hai
Các ontology biến đ i tuỳ thuộc vào cấu trúc và nội dung của nó: Một lớp có thể chứa các lớp con, có thể là một lớp t ng quan (chứa tất cả mọi thứ), có thể là lớp chỉ
Trang 27chứa những cá thể riêng lẻ, Một lớp có thể xếp gộp vào hoặc bị xếp gộp vào bởi các lớp khác Mối quan hệ xếp gộp này được sử dụng để tạo ra một cấu trúc có thứ bậc các lớp, thường là với một lớp thông dụng nhất kiểu Thing ở trên đỉnh và các lớp rất rõ ràng kiểu 2002, Ford ở phía dưới cùng
Thuộc tính Properties : Các đối tượng trong ontology có thể được mô tả
thông qua việc khai báo các thuộc tính của chúng M i một thuộc tính đều có tên và giá trị của thuộc tính đó Các thuộc tính được sử dụng để lưu trữ các thông tin mà đối tượng có thể có Giá trị của một thuộc tính có thể có các kiểu
dữ liệu phức tạp
Quan hệ Relation : Một trong những ứng dụng quan trọng của việc sử dụng
các thuộc tính là để mô tả mối liên hệ giữa các đối tượng trong ontology Một
mối quan hệ là một thuộc tính có giá trị là một đối tượng nào đó trong ontology
Một kiểu quan hệ quan trọng là kiểu quan hệ xếp gộp (subsumption) Kiểu quan
hệ này mô tả các đối tượng nào là các thành viên của các lớp nào của các đối tượng Hiện tại, việc kết hợp các ontology là một tiến trình được làm phần lớn là thủ công, do vậy rất tốn thời gian và đắt đỏ Việc sử dụng các ontology là cơ sở để cung cấp một định nghĩa thông dụng của các thuật ngữ cốt lõi có thể làm cho tiến trình này trở nên
dễ quản lý hơn Hiện đang có các nghiên cứu dựa trên các k thuật sản sinh để nối kết các ontology, tuy nhiên lĩnh vực này mới chỉ hiện hữu về mặt lý thuyết
Ng n ng W
OWL (The Web Ontology Language) là một ngôn ngữ gần như XML dùng để
mô tả các hệ cơ sở tri thức OWL là một ngôn ngữ đánh dấu dùng để xuất bản và chia
sẻ dữ liệu trên Internet thông qua những mô hình dữ liệu gọi là “Ontology” Ontology
mô tả một lĩnh vực (Domain) và diễn tả những đối tượng trong lĩnh vực đó cùng những mối quan hệ giữa các đối tượng này OWL là phần mở rộng về t vựng của RDF và được kế th a t ngôn ngữ DAML+OIL Web Ontology – Dự án được h trợ bởi W3C OWL biểu diễn ý nghĩa của các thuật ngữ trong các t vựng và mối liên hệ giữa các thuật ngữ này để đảm bảo phù hợp với quá trình xử lý bởi các phần mềm OWL được xem như là một k thuật trọng yếu để cài đặt cho Web ngữ nghĩa trong tương lai OWL được thiết kế đặc biệt để cung cấp một cách thức thông dụng trong việc xử lý nội dung thông tin của Web Ngôn ngữ này được kỳ vọng rằng sẽ cho phép các hệ thống máy tính có thể đọc được thay thế cho con người Vì OWL được viết bởi XML, các thông tin OWL có thể dễ dàng trao đ i giữa các kiểu hệ thống máy tính khác nhau, sử dụng các hệ điều hành và các ngôn ngữ ứng dụng khác nhau Mục đích chính của OWL là sẽ cung cấp các chuẩn để tạo ra một nền tảng để quản lý tài sản, tích hợp mức doanh nghiệp và để chia sẻ cũng như tái sử dụng dữ liệu trên Web
Trang 28OWL được phát triển bởi nó có nhiều tiện lợi để biểu diễn ý nghĩa và ngữ nghĩa hơn so với XML, RDF và RDFS và vì OWL ra đời sau các ngôn ngữ này, nó có khả năng biểu diễn các nội dung mà máy có thể biểu diễn được trên Web
Hiện nay có ba loại OWL: OWL Lite, OWL DL (Description Logic), và OWL Full
OWL Lite: H trợ cho những người dùng chủ yếu cần sự phân lớp theo thứ bậc
và các ràng buộc đơn giản Ví dụ: Trong khi nó h trợ các ràng buộc về tập hợp, nó chỉ cho phép tập hợp giá trị của 0 hay 1 Điều này cho phép cung cấp
các công cụ h trợ OWL Lite dễ dàng hơn so với các bản khác
OWL DL (OWL Description Logic): H trợ cho những người dùng cần sự
diễn cảm tối đa trong khi cần duy trì tính tính toán toàn vẹn (Tất cả các kết luận phải được đảm bảo để tính toán) và tính quyết định (Tất cả các tính toán sẽ kết thúc trong khoảng thời gian hạn chế) OWL DL bao g m tất cả các cấu trúc của ngôn ngữ OWL, nhưng chúng chỉ có thể được sử dụng với những hạn chế nào
đó Ví dụ: Trong khi một lớp có thể là một lớp con của rất nhiều lớp, một lớp không thể là một thể hiện của một lớp khác OWL DL cũng được chỉ định theo
sự tương ứng với lô-gíc mô tả, một lĩnh vực nghiên cứu trong lô-gíc đã tạo nên
sự thiết lập chính thức của OWL
OWL Full: Muốn đề cập tới những người dùng cần sự diễn cảm tối đa và sự tự
do của RDF mà không cần đảm bảo sự tính toán của các biểu thức Ví dụ: Trong OWL Full, một lớp có thể được xem xét đ ng thời như là một tập của các cá thể và như là một cá thể trong chính bản thân nó OWL Full cho phép một Ontology gia cố thêm ý nghĩa của các t vựng được định nghĩa trước (RDF
hoặc OWL)
Các phiên bản này tách biệt về các tiện ích khác nhau, OWL Lite là phiên bản dễ hiểu nhất và phức tạp nhất là OWL Full
Mối liên hệ giữa các ngôn ngữ con của OWL
Mọi Ontology hợp lệ dựa trên OWL Lite đều là Ontology hợp lệ trên OWL DL;
Mọi Ontology hợp lệ dựa trên OWL DL đều là Ontology hợp lệ trên OWL Full;
Mọi kết luận hợp lệ dựa trên OWL Lite đều là kết luận hợp lệ trên OWL DL;
Mọi kết luận hợp lệ dựa trên OWL DL đều là kết luận hợp lệ trên OWL Full
C ng cụ ph t triển nto ogy
Một số công cụ phát triển và hiệu chỉnh có giá trị trong việc làm giảm độ phức tạp và thời gian dùng cho nhiệm vụ xây dựng Ontology Các công cụ như Kaon, OileEd và Protégé cung cấp các giao diện nhằm giúp đ người sử dụng thực hiện các hoạt động chính yêu trong trong quá trình phát triển một Ontology
Trang 29Việc lựa chọn một công cụ hiệu chỉnh phù hợp nhất có nhiều khó khăn vì m i kiểu Ontology có các yêu cầu về kinh phí, thời gian, tài nguyên khác nhau Để giúp cho việc giải quyết vướng mắc này, Singh & Murshed (2005) đưa ra các tiêu chuẩn đánh giá công cụ tạo Ontology Tiêu chuẩn bao g m tính năng, khả năng sử dụng lại, lưu trữ dữ liệu, mức độ phức tạp, quan hệ, tính lâu bền, độ an toàn, độ chắc chắn, khả năng học, tính khả dụng, hiệu lực và tính rõ ràng Protégé và OntoEditFree được phát triển bởi Singh & Murshed sử dụng các tiêu chuẩn này
Một số công cụ hiệu chỉnh Ontology ph biến:
Bảng 1.1: Các công cụ phát triển Ontology
Trong số các công cụ đó Protégé, là công cụ được sử dụng rộng rãi và hiệu quả nhất hiện nay Nó cho phép người sử dụng định nghĩa và chỉnh sửa các lớp Ontology, các thuộc tính và quan hệ và các thể hiện sử dụng cấu trúc cây Các Ontology có thể được đưa ra theo các định dạng RDF(S), XML Schema Platform protégé cung cấp hai cách chính mô hình hóa Ontology thông qua Protégé - Frame và Protégé – OWL, ngoài ra có thể có nhiều plugin Chúng ta có thể quan sát một cách trực quan thông qua OWL Viz, nó cho phép quan sát Ontology dưới dạng đ họa và đưa file ảnh JPEG Ngoài ra còn h trợ truy vấn SPARQL
1.5 ng dụng và triển vọng của Web ngữ nghĩa
1.5.1 Search Engine
Vấn đề hiện nay là đa số các Search Engines hiện có đều thuộc loại Keyword Search Engine Cơ chế của chúng là định kì duyệt Web để phát hiện ra những sự thay
đ i, r i lập chỉ mục những thay đ i này Người sử dụng có thể tạo các câu truy vấn
g m các t khóa trên các chỉ mục đó để nhận về kết quả mong muốn Tuy nhiên, phương pháp này gặp hai vấn đề chính sau đây:
Trang 30 Một t khóa có thể có một hay nhiều ý nghĩa tùy theo t ng ngữ cảnh và Search Engine không thể hiện mối quan hệ giữa các t khóa với nhau
Các trang Web có cùng ý nghĩa với câu truy vấn của người sử dụng sẽ không
t n tại trong kết quả trả về
Khung làm việc để quản lý tri thức - Framework for Knowledge Management
Semantic Web là một hệ nền nhiều hứa hẹn cho việc phát triển các hệ thống quản
lý tri thức Tuy nhiên, vấn đề ở đây là làm thế nào biểu diễn tri thức ở dạng thức máy
có thể hiểu được, để tri thức cần thiết có thể được tìm thấy bởi các machine agent Chúng ta sử dụng giải pháp quản lý tri thức dựa trên định dạng tương thích RDF
để biểu diễn các luật và dựa trên một k thuật mới để chú giải các ngu n tri thức bằng cách sử dụng các câu điều kiện Giải pháp là dựa trên các công cụ Semantic Web đang
t n tại Điểm thuận lợi chính là sự thúc đẩy khả năng tìm kiếm tri thức với độ chính xác cao, cũng như khả năng truy cập cấu tạo các ngu n tri thức cần thiết cho việc giải quyết một vấn đề nào đó
Dạng thức này có thể được biểu diễn bằng cách dùng các statement If-Then, được thiết lập theo cách suy diễn (inference) và ủy quyền (trust) trên Semantic Web Các statement điều kiện có thể được dùng để lập chỉ mục nội dung các tài nguyên Web một cách nhiều ý nghĩa hơn so với liên kết các t khóa khái niệm hay metadata chung (các mối liên hệ) Điều này có thể sẽ hình thành các truy vấn dựa trên ngữ cảnh hơn, tăng cường độ chính xác trong tìm kiếm tri thức Ví dụ, trong vấn đề chỉ mục tài liệu, dù có hay không có tài liệu được chỉ mục bởi t khóa “aspirin” và “headache (đau đầu)”, cách aspirin trị headache hay aspirin gây ra headache đều có thể được giải quyết
dễ dàng bằng cách sử dụng các câu điều kiện định nghĩa trước
1.5.2 Internet Agent
Tiềm năng kế tiếp của Semantic Web có thể kể đến là ứng dụng vào các Internet agents Hiện nay, để hoàn thành công việc, các internet agents phải yêu cầu các trang Web, thu thập và xử lý chúng Thông thường công việc của agents là so sánh giá cả, tham gia đấu thầu, sắp xếp, và đăng kí công việc Ví dụ: để hoàn tất việc đăng kí một tour du lịch, ta phải có một agent đặt ch ở tour, một agent đăng kí vé máy bay, đặt phòng dựa trên các giá cả rẻ nhất Tuy nhiên, các công việc này đều phải làm sẵn trước đối với các trang Web cố định, do đó rất nguy hiểm nếu trang Web có sự thay đ i về cấu trúc Vì thế, agent cần phải hiểu được ngữ nghĩa của trang Web hơn là sự thể hiện của trang Web để hoạt động một cách tự động
Trang 311.5.3 Push System
Các hệ thống push system hiện nay sẽ phát sinh các thông tin t Web một cách thường xuyên đến các user dựa vào profile của họ Tuy nhiên, hiện nay thông tin mà user nhận được thường không phù hợp với yêu cầu của họ Do đó, cần phải tích hợp semantic để đánh giá chính xác hơn
T quan điểm về kiến trúc, Europeana có thể được định nghĩa một cách đúng nhất là một công cụ tìm kiếm và là một cơ sở dữ liệu Nó tải siêu dữ liệu được cung cấp bởi các nhà cung cấp, tập hợp dữ liệu lại vào cơ sở dữ liệu và sử dụng cơ sở dữ liệu để cho phép người dùng tìm kiếm các đối tượng di sản văn hoá hoặc tìm các liên kết tới các đối tượng đó Các phương pháp tìm kiếm và duyệt các đối tượng khác nhau được cung cấp bao g m một mẫu tìm kiếm đơn giản và nâng cao, tính chất tức thời, một bản đ tìm kiếm và một API tìm kiếm mở.Dữ liệu cũng được cung cấp dưới dạng Linked Open Data
Một số những hạn chế mà Europeana chưa làm được Nó không lưu trữ các đối tượng k thuật số thực tế mà chỉ có một đại diện thu nhỏ của các đối tượng được lưu trữ cục bộ Nó chưa lập được chỉ mục nội dung của các đối tượng đó mà chỉ là siêu dữ liệu
Vì thế, Europeana là một mạng lưới các tác nhân liên kết các đối tượng thay thế cho việc phát hiện và sử dụng đối tượng theo ngữ nghĩa đó là, bởi vì các đối tượng ban đầu và các biểu diễn k thuật được đặt tại các trang web của nhà cung cấp nội dung Đối với khả năng tương tác chính của dữ liệu được cung cấp, một mô hình dữ liệu mới (EDM) đã được đưa ra EDM không chỉ h trợ toàn bộ sự phong phú về siêu
dữ liệu của nhà cung cấp nội dung mà còn cho phép làm giàu dữ liệu t một loạt các
Trang 32ngu n của bên thứ ba Ví dụ một đối tượng số t Nhà cung cấp A có thể được làm giàu theo ngữ cảnh bằng siêu dữ liệu t Nhà cung cấp B Nó cũng có thể được làm phong phú thêm bằng cách b sung dữ liệu t các tập tin cho phép được giử bởi nhà cung cấp
C và một t điển lớn dựa trên web được cung cấp bởi Nhà xuất bản D EDM h trợ sự phong phú của liên kết này, trong khi hiển thị rõ ngu n gốc của tất cả các dữ liệu liên kết đến các đối tượng số Siêu dữ liệu nội dung của Europeana sử dụng tất cả các công nghệ Sematic Web T RDF như là một mô hình đại diện, Dublin Core cho mô tả siêu
dữ liệu mô tả và t điển tên miền cấp cao của SKOS, CIDOC-CRM, ABC HARMONY và DOLCE Theo quan điểm của chúng tôi, ngoài lợi ích hiển nhiên của
dự án Europeana, đó là liên minh văn hoá của các nước châu Âu, một 'lợi nhuận' khác của Europeana là nó đã phát triển được một cộng đ ng đã đ ng ý các công ước về ngữ nghĩa và cấu trúc Mô tả dữ liệu
1.6.2 CHIP (Cultural Heritage Information Personalization)
CHIP (http://chip-project.org index.html) là dự án nhằm mục đích minh họa cách
mà Semantic Web kết hợp với các công nghệ cá nhân hoá có thể được triển khai để tăng cường khả năng truy cập vào bộ sưu tập bảo tàng k thuật số Công việc này là sự cộng tác giữa Đại học K thuật Eindhoven, Rijksmuseum Amsterdam và Viện Telematica.Sự hợp tác này đã tạo nên Art Recommender: Một hệ thống giới thiệu dựa trên nội dung, đề xuất các khái niệm nghệ thuật dựa trên xếp hạng của người dùng về tác phẩm nghệ thuật Ví dụ: nếu người dùng đưa ra đánh giá cao cho tác phẩm Night watch , cô ấy sẽ nhận được đề nghị đánh giá t người sáng tác của nó là Rembrandt
Dự án được cung cấp siêu dữ liệu t cơ sở dữ liệu ARIA của Rijksmuseum, chứa hình ảnh và mô tả siêu dữ liệu và kết hợp với Iconclass và ba t điển của Getty (AAT, TGN
và ULAN) để đề xuất một loạt các khái niệm thông qua các quan hệ ngữ nghĩa khác nhau
Tuy nhiên, đối với hệ thống recomender, không phải tất cả các mục liên quan đều hữu ích hoặc thú vị cho người dùng Người sử dụng có thể thấy một bản thuyêt minh của hệ thống sau khi đăng nhập vào trang của dự án
Một thử nghiệm về độ chính xác ngữ nghĩa và tính thú vị của dự án đã chỉ ra rằng mọi người không phải lúc nào cũng quan tâm đến các mối quan hệ ngữ nghĩa được giới thiệu đến họ, đặc biệt là các địa điểm địa lý Ngược lại, các t vựng với thông tin chỉ rõ về cuộc sống và công việc của các nghệ s như AAT và ULAN được đưa ra mối quan hệ về ngữ nghĩa chính xác và thú vị hơn
Trang 33Hình 1.7: Data Providers of Chip
1.6.3 Ama (Archive Mapper for Archaeology)
Dự án ΑΜΑ là một n lực để quản lý vấn đề hoàn thành bộ sưu tập văn hoá mà CIDOC-CRM sử dụng Công cụ web AMA cho phép người dùng nhập các mô hình dữ liệu XML của kho lưu trữ khảo c hiện tại của họ và ánh xạ qua sơ đ ontology CIDOC-CRM, tạo ra các mối quan hệ trực tiếp với các lớp CIDOC Công cụ này cũng cho phép định nghĩa các mối quan hệ đơn giản và phức tạp giữa các yếu tố đã được ánh xạ để làm phong phú ý nghĩa ngữ nghĩa của chúng Mục tiêu của nó là lập bản đ các tiêu chuẩn khác nhau cho CIDOC-CRM Do đó, các công cụ của dự án cung cấp một bản đ dữ liệu mạnh mẽ cho một mẫu tương thích CIDOC-CRM Các công cụ AMA đã được sử dụng để phát triển Arrigo VII Mausoleum, một ứng dụng đa phương tiện cho Bảo tàng Cathedral of Pisa Ứng dụng tái tạo lại lịch sử và hình thức t chức tang lễ của Hoàng đế Henry VII của Luxemburg, người đã được chôn cất tại Pisa Các công trình tái tạo lại các tượng đài, văn bản, các định dạng khác nhau được kết hợp thành công theo các công nghệ Web ngữ nghĩa, nhằm tạo ra cơ sở dữ liệu về tượng đài
k niệm
1.6.4 E-Culture
E-culture là một dự án liên quan đến bộ sưu tập của Bảo tàng Tropen, Rijksmuseum Leiden, Archive.com, Rijksmuseum Amsterdam, Bibliopolis Kiến trúc này hoàn toàn dựa trên các chuẩn web mở, cụ thể là XML, SVG, RDF / OWL và SPARQL (ngôn ngữ truy vấn cho RDF) Một giả thuyết cơ bản trong công việc này là việc sử dụng kiến thức nền tảng rõ ràng dưới hình thức các bản thể luận t vựng thesauri đặc biệt hữu ích cho việc thu thập thông tin trong các lĩnh vực giàu tri thức E-
Trang 34culture bắt đầu với mục đích chứng minh rằng một tìm kiếm thông qua nhiều bộ sưu tập sử dụng công nghệ ngữ nghĩa có thể đạt được với ngân sách tương đối thấp Cách tiếp cận bao g m 3 yếu tố cơ bản:
Các cấu trúc để truy xuất, làm giàu và sắp xếp siêu dữ liệu về các bộ sưu tập và
t vựng
Cấu trúc tìm kiếm ngữ nghĩa thông qua đ thị RDF
Cấu trúc cho phép người dùng thêm siêu dữ liệu hoặc nội dung
Các điều kiện thiết yếu để thực hiện dự án là như sau:
Sử dụng các ontologies và t vựng đã có sẵn (các t vựng GETTY và t vựng WordNet đã được sử dụng)
Một số điều chỉnh được cho phép trong quá trình sắp xếp t vựng
Sử dụng siêu dữ liệu sẵn có của nhiều ngu n sưu tập văn hoá
Dự án đã thu thập siêu dữ liệu của 200.000 vật thể
1.6.5 The Museum Finland Portal
C ng thông tin này chứa 4.000 hiện vật văn hoá t bộ sưu tập ba bảo tàng, m i trong số đó sử dụng các lược đ cơ sở dữ liệu khác nhau Hệ thống dựa trên bảy bản RDF (S) ontologies bao g m 10.000 lớp và cá nhân Thật không may, Portal sử dụng ngôn ngữ Phần Lan và chỉ có một hướng dẫn bằng tiếng Anh
1.6.6 The Reach Project
Đây là một dự án cấp quốc gia của Hy Lạp nhằm mục đích cung cấp cho ngưởi
sử dụng truy cập vào các bộ sưu tập di sản văn hoá phân tán không đ ng nhất qua c ng thông tin Dự án sử dụng các công nghệ Semantic Web như ontology cơ bản để thể hiện các của nội dung thuộc về văn hoá Nhà cung cấp nội dung chính cho dự án là Centre for Greek và Roman Antiquity (KERA) cung cấp một bộ sưu tập lớn các bản ghi và tiền xu t thời Greco-Roman
1.6.7 The Museum24 Project
Đây là một c ng thông tin ( http: www.museo24.fi ) có ý nghĩa nhằm nâng cao khả năng tiếp cận di sản văn hoá của khu vực Jämsä (Phần Lan) Việc thực hiện dự án tốn một khoảng thời gian gần 3 năm (2004-2006) và được tài trợ bởi chính quyền địa phương, các công ty và ERDF (State Provincial Office of Western Finland) Dự án mô
tả cách định nghĩa và lưu trữ tài liệu đa phương tiện được thực hiện theo cách cung cấp
dữ liệu có thể tìm kiếm dễ dàng, các dịch vụ định vị tốt hơn cho người dùng và cuối cùng là trải nghiệm thú vị Kiến trúc của dự án bao g m các công nghệ Semantic Web dặc biệt đối với các tài liệu đa phương tiện, chúng được chú thích bằng các phương pháp bán tự động, trong khi siêu dữ liệu được lưu trữ trong một bản tin dựa trên CIDOC_MPEG7 ontology
Trang 351.6.8 Cantabria Cultural Heritage Semantic Portal
Nó là một dự án đang được thực hiện với mục đích bao g m tất cả các dữ liệu liên quan đến Cantabria, một khu vực của Tây Ban Nha, trong một ontology về di sản văn hoá Dữ liệu, bao g m t các mục thuộc về thư tịch học, tiền sử đến di sản thuộc thời kỳ công nghiệp dẽ được liên kết thông qua ontology và tiêu chuẩn ngữ nghĩa như CIDOC-CRM, FRBR và Dublin Core
1.6.9 CultureSampo Portal
Dự án này (http: www.kulttuurisampo.fi) dựa trên c ng thông tin MUSEUMFINLAND chứa các tài liệu văn hoá phức tạp Bao g m t các hiện vât bảo tàng đến các phong tục tập quán của người dân Phần Lan và các bài thơ, video, các sự kiện lịch sử và nhân vật lịch sử C ng thông tin này là một phần của dự án Finnish, được duy trì bởi các qu của nhà nước và tư nhân trong suốt năm 2003 và 2010 Các công nghệ Semantic Web được sử dụng để khai thác và bản thể học về lịch sử của người Phần Lan được kết nối với nhiều bộ dữ liệu, trong đó Wikipedia và Panoramio
1.6.10 Cultura Italia Project (http://www.culturaitalia.it/)
Đây là một c ng thông tin về di sản văn hoá của Ý Trang web này hoạt động như một tập hợp dữ liệu t nhiều ngu n khác nhau Cũng giống như các c ng thông tin khác, Cultura Italia không lưu trữ thông tin nhưng đơn giản là kết nối các liên kết đa dạng liên quan đến một loạt các lĩnh vực văn hoá
1.6.11 Sisc Project
Dự án này đang trong giai đoạn tiếp diễn Cơ sở dữ liệu SISC chứa tất cả các dữ liệu liên quan đến di sản văn hoá của VENETO (Ý) Một ngữ nghĩa GeoBrowser sẽ khôi phục dữ liệu cho người dùng Dự án đã được áp dụng hai lần như là một dự án trình diễn
Trang 36CHƯƠNG 2: GIẢI PHÁP ĐỀ XUẤT
Chương này sẽ giới thiệu về Bảo tàng Đà Nẵng Ứng dụng công nghệ thông tin hiện có của Bảo tàng Đà Nẵng Phân tích bài toán tìm kiếm hiện vật, trình bày kết quả phân tíchtích thiết kế hệ thống Tìm hiểu xem để xây dựng một ứng dụng Web ngữ nghĩa cần những gì, mô hình hoạt động như thế nào, công cụ nào sẽ được lựa chọn, gói thư viện nào sẽ h trợ trong quá trình triển khai ứng dụng
2.1 Bảo tàng Đà Nẵng
2.1.1 Giới thiệu
Bảo tàng Đà Nẵng thành lập t năm 1989, được xây dựng mới tại địa điểm số 24 Trần Phú (phường Thạch Thang, quận Hải Châu), trong khuôn viên Di tích Quốc gia Thành Điện Hải Bảo tàng Đà Nẵng được đầu tư phương tiện trưng bày, thiết bị nghe nhìn và hệ thống chiếu sáng hiện đại Đội ngũ thuyết minh, hướng dẫn khách tham quan được đào tạo khá bài bản Bảo tàng Đà Nẵng chính thức khánh thành, mở cửa đón khách tham quan vào ngày 26 tháng 4 năm 2011
Bảo tàng Đà Nẵng là một công trình, thiết chế văn hóa tiêu biểu, quan trọng của thành phố Đà Nẵng và là một trong những bảo tàng khang trang, hiện đại của miền Trung Việt Nam Nội dung trưng bày của Bảo tàng đa dạng về chủ đề, phong phú về hiện vật, sống động với các không gian tái tạo, được thể hiện dưới góc nhìn và phương pháp của bảo tàng học hiện đại Nhiều tài liệu, hiện vật gốc có giá trị điển hình về lịch
sử, văn hóa, những bộ sưu tập c vật quý hiếm lần đầu tiên được đưa ra giới thiệu Tất
cả đã tái hiện khái quát và tiêu biểu tiến trình lịch sử - văn hóa của mảnh đất và con người Đà Nẵng t bu i đầu khai phá mở mang bờ cõi, chống giặc ngoại xâm, giành độc lập cho đến thời kỳ hòa bình, đ i mới, hội nhập và phát triển thành một đô thị năng động nhất miền Trung
Hiện nay, Bảo tàng Đà Nẵng có diện diện tích trưng bày khoảng 3.000 m2 với hơn 2.500 hiện vật được t chức trưng bày thường xuyên thành 9 nhóm chủ đề Ngoài
ra, Bảo tàng còn t chức các đợt triển lãm ngắn hạn tại Bảo tàng cũng như trưng bày, triển lãm lưu động ở trong và ngoài nước Bên cạnh đó, Bảo tàng còn thường xuyên t chức giới thiệu di sản văn hóa phi vật thể của thành phố đến nhiều đối tượng trong và ngoài nước
Trang 37Hiện nay, Bảo tàng có 3 tầng để trưng bày các hiện vật và được t chức thành các phòng trưng bày như sau:
- Một số hình ảnh và hiện vật về điều kiện tự nhiên:
o Hệ sinh thái tự nhiên của thành phố Đà Nẵng
o Các phong trào yêu nước trước 1930
o Các t chức cơ sở Đảng trước năm 1945
o Đà Nẵng trong kháng chiến chống Pháp (1946 - 1954)
o Đà Nẵng trong kháng chiến chống M (1955 - 1975)
Giới thiệu các bộ sưu
- Công cụ lao động sản xuất của đ ng bào các dân tộc
Trang 38sưu tập tiêu biểu như:
- Y phục, trang sức của đ ng bào các dân tộc
- Nghề dệt vải, nghề đan của đ ng bào các dân tộc
- Nhạc cụ tiêu biểu của đ ng bào miền núi Quảng Nam - Đà Nẵng
- Tín ngư ng và một số tập tục của đ ng bào các dân tộc
Bên cạnh các gian trưng bày, Bảo tàng còn có phòng chiếu phim 30 ghế ng i để trình chiếu các bộ phim tư liệu về lịch sử, văn hóa và xã hội của thành phố Đà Nẵng Liên quan đến công tác sưu tầm, bảo quản hiện vật, trưng bày, triển lãm và thuyết minh tại Bảo tàng, bộ máy t chức liên quan g m:
Phòng Giáo dục - Truyền thông:
Hoạt động giáo dục bao g m: Hướng dẫn tham quan; T chức chương trình giáo dục; T chức các hoạt động, sự kiện thường niên và không thường niên;
T chức hội thảo, tọa đàm khoa học, nói chuyện chuyên đề; Xuất bản ấn phẩm liên quan đến hoạt động giáo dục của Bảo tàng
Hoạt động truyền thông bao g m: Giới thiệu nội dung và hoạt độngcủa bảo tàng trên các phương tiện thông tin đại chúng; T chức chương trình quảng bá, phát triển công chúng và xã hội hóa hoạt động của bảo tàng; Xậy dựng mạng lưới t chức, cá nhân có liên quan để để phát triển hoạt động của bảo tàng ở trong và ngoài nước
Phòng Sưu tầm - Trưng b y:
Hoạt động nghiên cứu khoa học bao g m: Triển khai đề tài khoa học các cấp, các chương trình, dự án, đề án khác theo kế hoạch ngắn hạn, dài hạn; Liên kết các t chức, cá nhân trong và ngoài nước để triển khai các chương trình, kế hoạch nghiên cứu khoa học liên quan đến hoạt động Bảo tàng theo quy định của pháp luật
Hoạt động sưu tầm, tư liệu hóa tài liệu, hiện vật văn hóa phi vật thể bao g m: Khảo sát điền dã sưu tầm, tư liệu hóa tài liệu, hiện vật và di sản văn hóa vật thể
và phi vật thể; Khai quật khảo c ; Tiếp nhận tài liệu, hiện vật do t chức, cá nhân chuyển giao, hiến tặng; Mua, trao đ i tài liệu, hiện vật với t chức, cá nhân
Hoạt động trưng bày tài liệu, hiện vật và giới thiệu di sản văn hóa phi vật thể bao g m: Trưng bày dài hạn, ngắn hạn tại Bảo tàng; Trưng bày, triển lãm lưu động ở trong và ngoài nước; T chức giới thiệu di sản văn hóa vật thể và phi vật thể
Trang 39Phòng Kiểm kê - Bảo quản:
Thực hiện công tác kiểm kê khoa học các tài liệu, hiện vật của Bảo tàng
T chức thực hiện các biện pháp bảo quản đối với các tài liệu, hiện vật nhằm ngăn chặn và loại tr những nguyên nhân hủy hoại hiện vật
2.1.2 ng dụng CNTT tại Bảo tàng
Trong thời gian qua, lãnh đạo của Bảo tàng Đà Nẵng đã chú trọng đến việc tang cường ứng dụng CNTT trong công tác quản lý, số hoá dữ liệu, tuyên truyền và đã mang lại một số kết quả bước đầu Hiện tại, trang Web của Bảo tàng đã giới thiệu nhiều thông tin b ích về hoạt động của Bảo tàng:
Hình 2.1: Giao diện eb của Bảo t ng Đ Nẵng
Tuy nhiên, hiên nay website của bảo tàng chỉ có khả năng đưa thông tin các sự kiện lớn của Đà Nẵng đến cho độc giả trong và ngoài nước Còn chức năng chính là tìm kiếm hiện vật, tra cứu hiện vật thì vẫn còn chưa phát triển chỉ bao g m vài hiện vật tiêu biểu của bảo tàng nên gây khó khăn lớn cho viện tìm kiếm thông tin của khách tham quan Hơn nữa Bảo tàng Đà Nẵng cũng gặp một khó khăn chung của các bảo
Trang 40tàng trên thế giới là việc bảo quản các hiện vật tránh sự hư hỏng mất mát do bị ảnh hưởng của điều kiện tự nhiên
Hình 2.2: Trang giới thiệu về hiện vật của Bảo t ng Đ Nẵng
Chính vì vậy, nhu cầu ứng dụng các thành tựu khoa học, đặc biệt là ứng dụng công nghệ thông tin để h trợ cho số hoá dữ liệu của bảo tàng củng như việc số hoá các hiện vật là rất cấp thiết Việc ứng dụng công nghệ thông tin sẽ góp phần cung cấp thông tin đến khách tham quan hiệu quả hơn Mặt khác, việc áp dụng công nghệ hiện