1. Trang chủ
  2. » Luận Văn - Báo Cáo

Ứng dụng seantic web để xây dựng hệ thống tra cứu hiện vật tại bảo tàng đà nẵng

38 184 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 38
Dung lượng 1,61 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

VI ỨNG DỤNG SEMANTIC WEB ĐỂ X Y DỰNG HỆ TH NG TRA CỨU HIỆN V T TẠI BẢO TÀNG ĐÀ NẴNG Học viên: Trần Kim Hoàng Chuyên Ngành: Khoa học máy tính Mã số: Khoá: 32 Trường Đại học Bách Khoa -

Trang 1

TRẦN KIM HOÀNG

ỨNG DỤNG SEMANTIC WEB ĐỂ XÂY DỰNG

HỆ THỐNG TRA CỨU HIỆN VẬT

Trang 2

Người hướng dẫn khoa học: PGS TS Võ Trung Hùng

Phản biện 1: Phản biện 2:

Luận văn sẽ được bảo vệ trước hội đồng chấm Luận văn tốt nghiệp thạc sĩ Khoa học máy tính họp tại Trường Đại học Bách khoa vào ngày tháng năm

Có thể tìm hiểu luận văn tại:

- Trung tâm Học liệu, Đại học Đà Nẵng tại Trường Đại học Bách khoa

- Thư viện Khoa Công nghệ thông tin, Trường Đại học Bách khoa - ĐHĐN

Trang 3

I

LỜI CAM ĐOAN

Tôi xin cam đoan :

● Những nội dung trong luận văn này là do tôi thực hiện dưới

sự hướng dẫn trực tiếp của PGS.TS Võ Trung Hùng

● Mọi tham khảo dùng trong luận văn đều được trích dẫn rõ ràng và trung thực tên tác giả, tên công trình, thời gian, địa điểm công bố

● Mọi sao chép không hợp lệ, vi phạm quy chế đào tạo, hay gian trá, tôi xin chịu hoàn toàn trách nhiệm

Tác giả

Trần Kim Hoàng

Trang 4

II

MỤC LỤC LỜI CAM ĐOAN I MỤC LỤC II CÁC CHỮ VIẾT TẮT VIII DANH MỤC HÌNH ẢNH IX

MỞ ĐẦU 1

1.LÝ DO CHỌN ĐỀ TÀI 1

2.MỤC ĐÍCH NGHIÊN CỨU 2

3. ĐỐI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU 2

4.PHƯƠNG PHÁP NGHIÊN CỨU 2

5.Ý NGHĨA KHOA HỌC VÀ THỰC TIỄN CỦA ĐỀ TÀI NGHIÊN CỨU 3

6.CẤU TRÚC CỦA LUẬN VĂN 3

CHƯƠNG 1: GIỚI THIỆU TỔNG QUAN 4

1.1.WEB NGỮ NGHĨA 4

1.1.1 Những hạn chế của World Wide Web 4

1.1.2 Sự ra đời của Web ngữ nghĩa 4

1.1.3 Định nghĩa Web ngữ nghĩa 5

1.2.KI N TRÚC WEB NGỮ NGHĨA 5

1.2.1 Giới thiệu 5

1.2.2 Định nghĩa và vai trò của các tầng trong kiến trúc Web ngữ nghĩa 6

Tầng Unicode và URI Uniform Resource Identifier) 6

Tầng XML 6

1.2.2.3 Tầng RDF và RDF Schemma 6

Tầng Ontology Vocabulary 6

Tầng Lô-gíc 6

Tầng Proof 6

Tầng Trust 6

1.3.NỘI DUNG XÂY DỤNG WEB NGỮ NGHĨA 6

1.3.1 XML và RDF trên Web 6

Trang 5

III

1.3.2 Các ngôn ngữ biểu diễn Ontology cho Web có ngữ nghĩa

6

1.3.3 Phát triển nâng cao Web ngữ nghĩa 6

1.4 Ontology 6

1.4.1 hái niệm Ontology 6

1.4.2 c đ ch xây dựng Ontology 7

1.4.3 Yêu cầu khi sử d ng Ontology 7

1.4.4 Các thành phần Ontology 7

1.4.5 Ngôn ngữ OWL 7

1.4.6 Công c phát triển Ontology 8

1.5.ỨNG DỤNG VÀ TRIỂN VỌNG CỦA WEB NGỮ NGHĨA 8

1.5.1 Search Engine 8

1.5.2 Internet Agent 8

1.5.3 Push System 8

1.5.4 Relationship 8

1.6.MỘT SỐ ỨNG DỤNG CỦA WEB NGỮ NGHĨA VÀO LĨNH VỰC BẢO TÀNG TRÊN TH GIỚI 8

1.6.1 Europeana 8

1.6.2 CHIP (Cultural Heritage Information Personalization) 8 1.6.3 Ama (Archive Mapper for Archaeology) 8

1.6.4 E-Culture 8

1.6.5 The Museum Finland Portal 8

1.6.6 The Reach Project 8

1.6.7 The Museum24 Project 8

1.6.8 Cantabria Cultural Heritage Semantic Portal 8

1.6.9 CultureSampo Portal 8

1.6.10 Cultura Italia Project (http://www.culturaitalia.it/) 8

1.6.11 Sisc Project 8

CHƯƠNG 2: GIẢI PHÁP ĐỀ XUẤT 9

2.1.BẢO TÀNG ĐÀ NẴNG 9

2.1.1 Giới thiệu 9

2.1.2 Ứng d ng CNTT tại Bảo tàng 9

2.2.GIỚI THI U BÀI TOÁN 9

Trang 6

IV

2.2.1 Yêu cầu bài toán 9

2.2.2 Phân t ch v n đ 10

2.3.GIẢI PHÁP 10

2.3.1 Phác thảo kiến trúc t ng thể hệ th ng 11

2.3.2 Giải quyết yêu cầu t m kiếm 11

2.3.3 Các chức n ng c bản của ứng d ng 11

2.3.4 Quy tr nh xây dựng Web ngữ nghĩa 12

2.4.CÁC CO NG CỤ H TRỢ 12

2.4.1 Công c xây dựng ứng d ng Prot g 12

2.4.2 B Visual Studio.Net 12

2.4.3 Thư viện phát triển ứng d ng 12

2.5.PHÂN TÍCH VÀ THI T K HỆ THỐNG 12

2.5.1 Biểu đ Use Case 12

2.5.2 Biểu đ lớp 13

2.5.3 Biểu đ hoạt đ ng 13

3 Đăng nhập, đăng xuất 13

3 Cập nhật dữ liệu 13

2 .3.3 Xem thông tin hiện vật 13

3 Tìm kiếm hiện vật 14

CHƯƠNG 3 : X Y DỰNG HỆ TH NG 15

3.1.MO H NH KI N TRÚC T NG THỂ CỦA H THỐNG 15

3.2.PHÁT TRIỂN ỨNG DỤNG 16

3.2.1 Qui tr nh phát triển ứng d ng 16

3.2.2 Xây dựng Ontology 16

3.2.3 Xây dựng kết n i truy xu t dữ liệu t ontology sang giao diện web 19

3 .3 Khai báo sử dụng thư viện OwlDotNetApi 19

3 .3 Khai báo truy vấn thông tin 19

3.2.4 t s thuật toán được sử d ng để khai thác dữ liệu 19

3 Điền dữ liệu 19

3.2.4 Duyệt theo ngữ nghĩa 19

3 .3 Tìm kiếm cơ bản 20

3.2.5 Xây dựng giao diện 20

Trang 7

V

3 Trang chính của hệ thống 21

3 .3 Hiển thị thông tin của một hiện vật: 21

3 Trang đăng nhập của quản trị hệ thống 22

3 Trang chính của quản trị hệ thống 22

3 Trang Thêm mới hiện vật 23

3.3.TRIỂN KHAI HỆ THỐNG 23

3.4.ĐÁNH GIÁ K T QUẢ CỦA H THỐNG 23

ẾT LU N 25

DANH MỤC TÀI LIỆU THAM HẢO 27

Trang 8

VI

ỨNG DỤNG SEMANTIC WEB ĐỂ X Y DỰNG HỆ TH NG TRA CỨU HIỆN V T TẠI BẢO TÀNG ĐÀ NẴNG

Học viên: Trần Kim Hoàng Chuyên Ngành: Khoa học máy tính

Mã số: Khoá: 32 Trường Đại học Bách Khoa - ĐHĐN

Tóm tắt - Hiện nay ở một số quốc gia tiên tiến trên thế giới, công

việc số hóa thông tin bảo tàng để xây dựng bảo tàng điện tử được thực hiện cách đây hơn chục năm và trên thực tế, họ đã xây dựng thành công một số mô hình “Bảo tàng điện tử” Tuy nhiên ở nước ta bảo tàng điện tử vẫn chưa được áp dụng rộng rãi Nghiên cứu này được đề xuất nhằm số hóa thông tin hiện vật của bảo tàng, cũng như đưa ra giải pháp để tìm kiếm thông tin hiện vật trong bảo tàng đây là một phần nhỏ nhằm góp phần xây dựng bảo tàng điện tử Bài báo cáo gồm có tìm hiểu lý thuyết tổng quan về công nghệ Semantic Web, khái niệm Semantic Web, các ngôn ngữ và công cụ xây dựng Số hoá

cở sở dữ liệu hiện vật của bảo tàng Từ đó xây dựng website tìm kiếm thông tin hiện vật của bảo tàng

Từ khoá - Semantic Web, Website, bảo tàng, ontology, sparql,

protégé

Trang 9

VII

SEMATIC WEB APPLICATION TO BUIILD THE INSPECTION SYSTEM ARTIFACTS

IN THE MUSEUM DA NANG

Sumary - At present in some advanced countries in the world, the

digitization of museum information to build electronic museums has been done more than a decade ago and, in fact, they have successfully built some model "Electronic Museum" However, electronic museums have not yet been widely applied in Vietnam This research was proposed to digitize the museum's artifacts as well

as to provide a way to find information about the museum's artifacts This is a small part of the museum's contribution to electronic museums The report includes an overview of the semantic Web semantic theory, Semantic Web concepts, languages and build tools Digitize the Museum's database of artifacts From there, the Museum's website will be searched for information

Keyword - Semantic Web, Website, museum, ontology, sparql,

protégé

Trang 10

VIII

CÁC CHỮ VIẾT TẮT

HTML HyperText Markup Language

HTTP HyperText Transfer Protocol

IRI Internationalized Resource Identifier ISO International Organization for Standards

RDF Resource Description Framework

RDFS Resource Description Framework Schema SGML Standard Generalized Markup Language SWSE Semantic Web Search Engine

Trang 11

1.5 Kiến trúc Web ngữ nghĩa theo đề xuất của

Tim Berners Lee

5

2.12 Biểu đồ hoạt động xem thông tin hiện vật 13 2.13 Biểu đồ hoạt động tìm kiếm hiện vật 14 3.1 Mô hình kiến trúc tổng thể của hệ thống 15

3.11 Trang chính của quản trị hệ thống 22

Trang 12

tư liệu khổng lồ về các hiện vật được tìm thấy mà các nhà khoa học

đã nghiên cứu và phát hiện ra

Bên cạnh đó, cùng với sự phát triển mạnh mẽ của công nghệ thông tin, ứng dụng của công nghệ thông tin trong lĩnh vực bảo tàng đang phát triển mạnh và tạo ra những thay đổi lớn trong công tác bảo tàng

Có rất nhiều cách tiếp cận khác nhau khi ứng dụng công nghệ thông tin trong lĩnh vực bảo tàng Ở một số quốc gia tiên tiến trên thế giới, công việc số hóa thông tin bảo tàng để xây dựng bảo tàng điện tử được thực hiện cách đây hơn chục năm, trên thực tế, họ

đã xây dựng thành công một số mô hình bảo tàng điện tử Bảo tàng điện tử cho phép cung cấp dễ dàng và thuận lợi đến khách tham quan toàn bộ các hiện vật của bảo tàng cũng như toàn bộ giá trị phi vật thể tiềm ẩn trong nó Ở Việt Nam, trong vài năm gần đây, một số bảo tàng đã bắt đầu ứng dụng công nghệ thông tin trong hoạt động nghiệp vụ và bước đầu đã có những hiệu quả thực sự

Như chúng ta đã biết, hiện vật và các hoạt động liên quan đến hiện vật là vấn đề chính yếu của một bảo tàng Vì vậy, cơ sở của bảo tàng số hóa là việc ứng dụng khoa học, kĩ thuật thông tin điện tử vào tất cả những thông tin trong bảo tàng và mọi hoạt động nghiệp

vụ của bảo tàng Các hiện vật trong bảo tàng, theo quan niệm truyền thống, là một bản gốc, nên khi được số hóa, sẽ tạo ra một bản thông tin mô phỏng lưu trữ trong bộ nhớ của máy tính, từ đó đem đến nhiều thuận lợi trong phương thức khai thác thông tin Trên cơ sở số hóa, máy tính sẽ thay thế phần lớn các thao tác của cán bộ bảo tàng trong mọi khâu quản lý, sử dụng hiện vật và tự động hóa các khâu này

Trang 13

2 Tuy nhiên, các ứng dụng hiện nay vẫn dừng lại ở việc cung cấp thông tin chứ chưa cung cấp được những tri thức cần thiết nên đã

có những khó khăn nhất định trong việc tìm hiểu, tra cứu

Vì vậy, đề tài “Ứng dụng sematic web để xây dựng hệ thống tra cứu hiện vật tại Bảo tàng Đà Nẵng” đi sâu vào việc số hoá các

dữ liệu của Bảo tàng sau đó xây dựng tri thức dựa trên tư liệu của các hiện vật đã được số hoá nhằm phục vụ cho việc tìm hiểu và tra cứu một cách dễ dàng hơn

2 Mục đích nghiên cứu

Đề tài hướng đến việc số hoá dữ liệu các hiện vật đang có của Bảo tàng, sau đó dựa trên cơ sở dữ liệu có được để xây dựng một ontology đầy đủ về các hiện vật của Bảo tàng Từ ontology vừa xây dựng tiếp tục xây dựng hệ thống tìm kiếm hiện vật cho bảo tàng

3 Đối tượng và phạm vi nghiên cứu

Đối tượng nghiên cứu của đề tài là các vấn đề liên quan đến Semantic Web như phương pháp để xây dựng và lưu trữ dữ liệu trong Semantic Web và các công cụ dùng để xây dựng Semantic Web

Phạm vi nghiên cứu của đề tài là các hiện vật của Bảo tàng Đà Nẵng Hiện nay Bảo tàng Đà Nẵng có khoảng hơn 3000 hiện vật được trưng bày Tuy nhiên trong đề tài này tôi chi tổng hợp thông tin của 00 hiện vật về lịch sử các thời kỳ chiến tranh, về điều kiện tự nhiên, về văn hoá của các dân tộc, về Đà Nẵng thời tiền sơ sử Ứng dụng tìm kiếm thông tin của hiện vật được xây dựng và kiểm thử ở phạm vi Bảo tàng Đà Nẵng

4 Phương pháp nghiên cứu

Về mặt lý thuyết tập trung nghiên cứu về các vấn đề liên quan đến sematic web và việc xây dựng bảo tàng điện tử Tìm hiểu về số hoá dữ liệu liên quan đến bảo tàng Nghiên cứu về quá trình xây dựng một công cụ search engine

Phương pháp thực nghiệm tập trung vào việc số hoá dữ liệu và xây dựng kho dữ liệu các hiện vật của bảo tàng Xây dựng ontology

Trang 14

3 các hiện vật của bảo tàng Xây dựng công cụ search engine, xây dựng website tìm kiếm hiện vật của bảo tàng, triển khai thực tế trên Internet

5 Ý nghĩa khoa học và thực tiễn của đề tài nghiên cứu

Về mặt khoa học đề tài đóng góp một công cụ tìm kiếm các hiện vật theo công nghệ sematic web dành riêng cho bảo tàng Phương pháp xây dựng ontology về các hiện vật của bảo tàng Số hoá được một phần dữ liệu về các hiện vật của bảo tàng

Về thực tiễn đề tài bước đầu mở ra hướng nghiên cứu để từng bước xây dựng bảo tàng điện tử cho Bảo tàng Đà Nẵng Giúp bảo tàng từng bước số hoá được dữ liệu về hiện vật hiện có

6 Cấu trúc của luận văn

Bố cục của luận văn gồm có 3 chương như sau:

CHƯƠNG : GIỚI THIỆU T NG QUAN

Trong chương này của đề tài trình bày cơ sở lý thuyết về Sematic Web và một số ứng dụng thành công về bảo tàng trên thế giới có sử dụng công nghệ Sematic Web

CHƯƠNG : GIẢI PHÁP ĐỀ XUẤT

Chương này giới thiệu về Bảo tàng Đà Nẵng và thực trạng ứng dụng công nghệ thông tin vào lĩnh vực bảo tàng của Bảo tàng Đà Nẵng Phân tích ưu điểm và nhược điểm của website bảo tàng hiện nay Từ đó, đề xuất xây dựng hệ thống tìm kiếm hiện vật hiệu quả hơn

CHƯƠNG 3: XÂY DỰNG HỆ THỐNG

Dựa trên những đề xuất ở chương , tiến hành phân tích, thiết

kế và xây dựng ontology, xây dựng hệ thống tìm kiếm hiện vật của bảo tàng

Ngoài ra, để đánh giá toàn bộ quá trình nghiên cứu, phần cuối của luận văn có nêu lên kết quả và hướng phát triển cho đề tài

Trang 15

4

CHƯƠNG 1: GIỚI THIỆU TỔNG QUAN

Trong chương này giới thiệu các khái niệm tổng quan về Web ngữ nghĩa, các ngôn ngữ và công cụ xây dựng Web ngữ nghĩa tính đến thời điểm hiện nay Tìm hiểu kiến trúc Web ngữ nghĩa, ứng dụng

và triển vọng của Web ngữ nghĩa trong tương lai Đồng thời trong chương này cũng tìm hiểu về một số ứng dụng của Web ngữ nghĩa vào lĩnh vực bảo tàng trên thế giới

1.1 Web ngữ nghĩa

1.1.1 Những hạn chế của World Wide Web

World Wide Web gọi tắt là Web) được sáng lập bởi Tim Berners - Lee đã trở thành một kho tàng thông tin khổng lồ của nhân loại và một môi trường chuyển tải thông tin không thể thiếu được trong thời đại công nghệ thông tin ngày nay và nó cũng chính là linh hồn của Internet

Tuy nhiên, trên thực tế có một khối lượng khổng lồ các tài nguyên trên Web, điều đó đã đặt ra thách thức làm sao để khai thác thông tin trên Web một cách hiệu quả, mà cụ thể là làm thế nào để máy tính có thể trợ giúp xử lý tự động được chúng Muốn vậy, web phải có khả năng mô tả các sự vật theo cách mà máy tính có thể

“hiểu” được, có thể tích hợp dữ liệu, cũng như tái sử dụng dữ liệu thông qua các ứng dụng khác nhau

1.1.2 Sự ra đời của Web ngữ nghĩa

Các trang Web hiện nay hầu hết được sử dụng bởi con người, máy tính ch có nhiệm vụ gửi nhận dữ liệu và thể hiện thông tin dưới dạng mà ch có con người mới đọc hiểu được Người sử dụng phải làm nhiệm vụ tìm kiếm, suy luận, tổng hợp và trích rút thông tin mình cần Điều đó đã đặt ra thách thức là làm sao để khai thác thông tin trên Web hiệu quả hay nói cách khác là làm thế nào để máy tính

có thể xử lý tự động được chúng Muốn vậy thì Web phải có khả năng mô tả thông tin theo cách mà máy tính có thể hiểu được Để

Trang 16

5 chúng ta dễ dàng có được một kết quả tìm kiếm chính xác, nhanh chóng và hiểu dần tới ngữ nghĩa vấn đề chúng ta mong muốn Web 3.0 - Web ngữ nghĩa ra đời nhằm đáp ứng những yêu cầu

về xử lý và tìm kiếm thông tin, cho phép chúng ta xây dựng những CSDL phục vụ tìm kiếm chính xác

1.1.3 Định nghĩa Web ngữ nghĩa

Web ngữ nghĩa được hình thành từ ý tưởng của Tim Lee, người phát minh ra WWW, URI, HTTP và HTML Tim Berners-Lee đã định nghĩa: “The Semantic Web is an extension of the current Web in which information is given well- defined meaning, better enabling computers and people to work in cooperation”

Berners-1.2 iến trúc Web ngữ nghĩa

1.2.1 Giới thiệu

Tim Berners Lee đã đề xuất mô hình kiến trúc Web ngữ nghĩa đầu tiên đây là mô hình kiến trúc gồm các thần phần chính của Web ngữ nghĩa Mô hình kiến trúc của Web ngữ nghĩa được thay đổi theo từng thời điểm nhất định cho thấy công nghệ Web ngữ nghĩa vẫn c n đang hoàn thiện và phát triển theo thời gian

H nh 1.5: iến trúc Web ngữ nghĩa theo đ xu t của Tim Berners

Lee

Trang 17

1.3 Nội dung xây dụng Web ngữ nghĩa

Để xây dựng hệ thống Web ngữ nghĩa thay thế cho World Wide Web hiện tại, các nhà nghiên cứu đang n lực và tập trung nghiên cứu với ba hướng chính sau:

 Chuẩn hoá các ngôn ngữ biểu diễn dữ liệu XML) và siêu dữ liệu RDF) trên Web

 Chuẩn hoá các ngôn ngữ biểu diễn Ontology cho Web có ngữ nghĩa

 Phát triển nâng cao Web ngữ nghĩa Semantic Web Advanced Development - SWAD)

1.3.1 XML và RDF trên Web

1.3.2 Các ngôn ngữ biểu diễn Ontology cho Web có ngữ nghĩa 1.3.3 Phát triển nâng cao Web ngữ nghĩa

1.4 Ontology

h i niệm nto ogy

Trong khoa học máy tính, một ontology là một mô hình dữ liệu biểu diễn một lĩnh vực và được sử dụng để suy luận về các đối tượng trong lĩnh vực đó và mối quan hệ giữa chúng Ontology cung cấp một bộ từ vựng chung bao gồm các khái niệm, các thuộc tính quan trọng và các định nghĩa về các khái niệm và các thuộc tính này Ngoài bộ từ vựng, ontology c n cung cấp các ràng buộc, đôi khi các ràng buộc này được coi như các giả định cơ sở về ý nghĩa mong muốn của bộ từ vựng, nó được sử dụng trong một miền mà có thể

Trang 18

7 được giao tiếp giữa người và các hệ thống ứng dụng phân tán h n tạp khác

Các ontology thường miêu tả:

Cá thể (Individuals): Các đối tượng cơ bản, nền tảng

Lớp Classes : Các tập hợp, hay kiểu của các đối tượng

Thuộc tính Properties : Thuộc tính, tính năng, đặc điểm,

tính cách, hay các thông số mà các đối tượng có và có thể đem ra chia sẻ

Quan hệ Relation): Các con đường mà các đối tượng có

thể liên hệ tới một đối tượng khác

ục đ ch xây dựng nto ogy

Yêu c u khi sử dụng nto ogy

C c thành ph n nto ogy

Ontology được sử dụng như là một biểu mẫu trình bày tri thức

về thế giới hay một phần của nó Ontology thường miêu tả: Cá thể Individuals), lớp Classes), thuộc tính Propertises) và quan hệ (Relation)

Ng n ngữ W

OWL The Web Ontology Language) là một ngôn ngữ gần như XML dùng để mô tả các hệ cơ sở tri thức OWL là một ngôn ngữ đánh dấu dùng để xuất bản và chia sẻ dữ liệu trên Internet thông qua những mô hình dữ liệu gọi là “Ontology”

Trang 19

8

C ng cụ ph t triển nto ogy

1.5 Ứng dụng và triển vọng của Web ngữ nghĩa

1.6.5 The Museum Finland Portal

1.6.6 The Reach Project

1.6.7 The Museum24 Project

1.6.8 Cantabria Cultural Heritage Semantic Portal

1.6.9 CultureSampo Portal

1.6.10 Cultura Italia Project (http://www.culturaitalia.it/)

1.6.11 Sisc Project

Ngày đăng: 01/04/2018, 12:06

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w