1. Trang chủ
  2. » Luận Văn - Báo Cáo

Xây dựng thư viện số trên nền tảng phần mềm mã nguồn mở dspace

84 77 1

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 84
Dung lượng 5,7 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Hiện nay có rất nhiều phần mềm hỗ trợ cho việc xây dựng bộ sưu tập số như Greenstone, Eprint, Feroda, Invenio,Omeka,…Tuy nhiên, thư viện trường Đại học Khoa học Xã hội và Nhân văn lại ch

Trang 1

ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC KHOA HỌC XÃ HỘI VÀ NHÂN VĂN KHOA/BỘ MÔN: THƯ VIỆN – THÔNG TIN HỌC

CÔNG TRÌNH NGHIÊN CỨU KHOA HỌC SINH VIÊN

CẤP TRƯỜNG NĂM 2015

Tên công trình:

XÂY DỰNG THƯ VIỆN SỐ TRÊN NỀN TẢNG PHẦN MỀM MÃ

NGUỒN MỞ DSPACE

Sinh viên thực hiện:

Chủ nhiệm: Phạm Thị Kim Chi, Lớp TV-TT K27, Khóa 2011-2015

Thành viên: Trần Thị Thúy Vy, Lớp TV-TT K27, Khóa 2011-2015

Người hướng dẫn: Thạc sĩ Nguyễn Thanh Huy

Trang 2

MỤC LỤC

MỞ ĐẦU 1

CHƯƠNG 1: TỔNG QUAN VỀ PHẦN MỀM MÃ NGUỒN MỞ DSPACE 8

1.1 Các khái niệm liên quan 8

1.1.1 Khái niệm thư viện số 8

1.1.2 Khái niệm số hóa – bộ sưu tập số 8

1.1.3 Khái niệm phần mềm mã nguồn mở 9

1.2 Giới thiệu về phần mềm mã nguồn mở DSpace 9

1.2.1 Bối cảnh ra đời của phần mềm mã nguồn mở DSpace 9

1.2.2 Tình hình ứng dụng phần mềm mã nguồn mở DSpace trên thế giới và ở Việt Nam 10

1.2.3 Các khái niệm liên quan đến phần mềm mã nguồn mở DSpace và các tính năng nổi bật của phần mềm DSpace 11

CHƯƠNG 2: CÀI ĐẶT PHẦN MỀM MÃ NGUỒN MỞ DSPACE 25

2.1 Cấu hình máy tính 25

2.2 Giới thiệu về các phần mềm cần thiết để có thể cài đặt DSpace 25

2.2.1 Phần mềm Java 25

2.2.2 Phần mềm Apache Maven 26

2.2.3 Phần mềm Apache Ant 26

2.2.4 Phần mềm Apache Tomcat 27

2.2.5 PostgreSQL 28

2.3 Cài đặt phần mềm DSpace 29

CHƯƠNG 3: KẾT QUẢ THỰC NGHIỆM VỀ CÁC CHỨC NĂNG ĐƯỢC SỬ DỤNG TRONG DSPACE 53

3.1 Các chức năng của quản trị 53

3.1.1 Đăng nhập 53

3.1.2 Thêm thành viên 54

3.1.3 Thêm nhóm 56

3.1.4 Đưa tài liệu vào DSpace 58

3.2 Cài đặt cấu hình giao diện tiếng Việt cho DSpace 72

CHƯƠNG 4: NHẬN XÉT PHẦN MỀM MÃ NGUỒN MỞ DSPACE 76

4.1 Nhận xét ưu điểm và hạn chế của phần mềm DSpace 76

4.1.1 Ưu điểm 76

Trang 3

4.1.2 Hạn chế 77

4.2 So sánh phần mềm DSpace với phần mềm Greenstone 77

KẾT LUẬN 79

KIẾN NGHỊ 80

Trang 4

MỞ ĐẦU

Xã hội ngày càng phát triển dẫn đến nhiều ngành nghề cũng phát triển theo như khoa học, công nghệ, kỹ thuật … và thư viện - thông tin cũng không nằm ngoài quy luật đó Trên đà phát triển thì ngày càng có nhiều loại hình tài liệu phong phú hơn cung cấp cho người dùng tin, theo đó số lượng tài liệu cũng tăng lên một cách nhanh chóng Điều đó tạo điều kiện rất lớn cho mọi người có thể tiếp xúc được nhiều tài liệu hơn, từ đó biết được nhiều thông tin hơn, phục vụ cho nhu cầu học tập, giảng dạy, …

Tuy nhiên việc phát triển số lượng tài liệu theo cấp số nhân đã gây ra một trở ngại không nhỏ cho việc lưu trữ cũng như bảo quản tài liệu Từ đó dẫn đến yêu cầu bắt buộc thư viện phải có cách thức lưu trữ và bảo quản cùng một lúc một số lượng lớn tài liệu, một cách khoa học để khi người dùng tin có nhu cầu không phải “bơi” trong một

“biển” tài liệu Thực tế cho thấy diện tích kho lưu trữ của hầu hết các thư viện thì luôn

có hạn, khi đó việc số hóa tài liệu cũng như xây dựng thư viện số để lưu trữ, bảo quản

và phục vụ nhu cầu ngày càng cao của người dùng tin là một yêu cầu khách quan có ý nghĩa quan trọng

Việc xây dựng thư viện số với các tài liệu được số hóa không chỉ là cách có thể lưu trữ và bảo quản tốt một số lượng lớn tài liệu mà còn có thể chia sẻ, dùng chung với các thư viện trong nước, trong khu vực thậm chí trên thế giới Thêm vào đó thư viện số

sẽ là một kho thông tin số khổng lồ có tổ chức với các dịch vụ liên kết qua mạng để người dùng tin có thể truy cập ở mọi nơi

Để thư viện có thể làm tốt được việc xây dựng thư viện số thì trước hết cần phải

có 1 phần mềm để hỗ trợ xây dựng bộ sưu tập số để lưu giữ và bảo quản tốt các tài liệu

đã được số hóa Hiện nay có rất nhiều phần mềm hỗ trợ cho việc xây dựng bộ sưu tập

số như Greenstone, Eprint, Feroda, Invenio,Omeka,…Tuy nhiên, thư viện trường Đại học Khoa học Xã hội và Nhân văn lại chưa có đủ điều kiện về tài chính để có thể mua

và sử dụng các phần mềm thương mại, nên việc sử dụng các phần mềm mã nguồn mở

là giải pháp tối ưu nhất với các ưu điểm như:

Trang 5

 Miễn phí phần mềm bản quyền ( Hệ điều hành, Cơ sở dữ liệu, Phần mềm thư viện)

 Cho phép người dùng sử dụng theo bất kỳ mục đích nào

 Cộng đồng phát triển và hỗ trợ trên khắp thế giới

 Dễ dàng tùy biến, phát triển theo nhu cầu, được phép nghiên cứu và sửa đổi

 Được phép sao chép và tái phát hành phần mềm gốc, hoặc phần mềm đã sửa đổi

mà không phải trả tiền cho những người lập trình trước đó

 Liên tục được cập nhật

 100% theo chuẩn quốc tế

 Dễ dàng kết nối, liên kết với các phần mềm ứng dụng khác

 Đẩy đủ các tính năng mới nhất của thư viện

Do những ưu điểm nổi bật mà phần mềm mã nguồn mở mang lại cũng như tính thương mại của nó mà việc ứng dụng phần mềm mã nguồn mở để phát triển thư viện

số là cần thiết và khách quan

Từ lúc phần mềm mã nguồn mở DSpace được HP Labs (Công ty Packard) và Thư viện MIT (Massachusetts Institute of Technology) phát hành và giới thiệu trên thế giới, ở Việt Nam đã có một số đề tài nghiên cứu về phần mềm mã nguồn

Hewlett-mở DSpace như đề tài "Xây dựng thư viện số Học viện Báo chí và Tuyên truyền bằng phần mềm DSpace", đề tài “Xây dựng thư viện số sử dụng phần mềm mã nguồn mở DSpace” của trường Đại học Dân lập Hải Phòng,…

Tuy nhiên, chưa có một đề tài nghiên cứu cụ thể nào được nghiên cứu từ góc nhìn là cán bộ thư viện, là sinh viên ngành thư viện – thông tin học, đa số các đề tài trên được nghiên cứu từ góc nhìn công nghệ thông tin

Hiện tại trường Đại học Khoa học Xã hội và Nhân Văn – Đại học Quốc gia Hồ Chí Minh nói chung và khoa Thư viện thông tin học nói riêng chưa có công trình nghiên cứu nào về đề tài này

Trang 6

3.1 Lý do chọn đề tài

Như chúng ta đã biết, để xây dựng và quản lý tốt nguồn tài nguyên số đã số hóa của thư viện thì mỗi thư viện cần phải có một phần mềm để hỗ trợ cho việc này, hiện nay, ở thư viện trường Đại học Khoa học Xã hội và Nhân văn cũng như một số đơn vị khác đang sử dụng phần mềm mã nguồn mở Greenstone

Phần mềm Greenstone có rất nhiều ưu điểm như: có thể truy cập rộng rãi qua một trình duyệt Web chuẩn; có thể sử dụng trên nhiều hệ điều hành khác nhau như Windows, Unix/ Linux và Mac OS-X; đa ngôn ngữ với 60 ngôn ngữ khác nhau; tìm kiếm toàn văn nhanh chóng, tìm lướt linh hoạt; tương thích với giao thức Z39.50 hỗ trợ việc truy cập máy chủ bên ngoài cũng như giới thiệu bộ sưu tập của thư viện cho người sử dụng bên ngoài…

Tuy nhiên phần mềm Greenstone còn tồn tại quá nhiều hạn chế khó có thể khắc phục được như: Khả năng tùy biến giao diện kém; cách thức quản lý tài liệu số chưa linh hoạt, khả năng phân quyền đối với bộ sưu tập và từng tài liệu hạn chế; đối với các các thư viện có số lượng tài liệu nhiều thì Greenstone không hỗ trợ tốt;…

Chính vì lẽ đó, mà hiện nay ở nước ta đã có hơn 40 đơn vị chuyển đổi từ phần mềm Greenstone sang phần mềm DSpace như Thư viện Trung tâm Đại học Quốc gia

Hồ Chí Minh, Thư viện trường Đại học An Giang, Trung tâm thông tin Đại học Đà Nẵng, Trung tâm thông tin thư viện Đại học Quốc gia Hà Nội,…

Đây là phần mềm có thể khắc phục được hầu hết những khuyết điểm của Greenstone như: khả năng tùy chỉnh giao diện cao; khi cần bổ sung tài liệu vào bộ sưu tập không phải xây dựng lại từ đầu như Greenstone; cấu trúc bộ sưu tập trong DSpace được tổ chức khoa học hơn Greenstone; đáp ứng tốt hơn nếu thư viện có số lượng tài liệu lớn; đặc biệt DSpace có khả năng phân quyền mạnh có thể phân quyền đến từng tài khoản người dùng, đến từng bộ sưu tập thậm chí là từng tài liệu,…

Do đó điều cần thiết của đề tài này là xây dựng được một thư viện số dựa trên nền tảng phần mềm mã nguồn mở DSpace, từ đó có thể ứng dụng phần mềm này để từng bước thay đổi, khắc phục những hạn chế của phần mềm Greenstone để có thể hội nhập với xu hướng chung của thế giới

Trang 7

3.2 Mục tiêu của đề tài

Mục tiêu của đề tài nghiên cứu này là tìm hiểu tình hình nghiên cứu, xây dựng

và sử dụng các phần mềm mã nguồn mở nói chung trong các Trung tâm Thông tin - Thư viện ở Việt Nam hiện nay Quan trọng hơn đó là việc tìm hiểu về phần mềm mã nguồn mở DSpace, nghiên cứu những tính năng nổi bật của phần mềm DSpace so với các phần mềm khác cùng loại, từ đó từng bước đơn giản hóa cách ứng dụng phần mềm

mã nguồn mở DSpace vào hoạt động của thư viện cũng như các hoạt động về thông tin thư viện

Thêm vào đó, một mục tiêu không kém phần quan trọng đó là ứng dụng DSpace để phát triển một bộ sưu tập cụ thể từ đó đưa ra hướng ứng dụng, đề xuất, kiến nghị để đưa phần mềm DSpace vào hoạt động, phục vụ cho nhu cầu của trường Đại học Khoa học Xã hội và Nhân văn trước tiên và sau đó nó có thể làm tiền đề để ứng dụng rộng rãi cho những thư viện khác nhằm nâng cao hoạt động Thông tin - Thư viện, xây dựng một thư viện số hiện đại, hướng tới chuẩn chung của thư viện số trên thế giới, góp phần đưa lĩnh vực Thư viện - thông tin hội nhập với các quốc gia khác trên thế giới

Nhiệm vụ nghiên cứu lý luận: Phải làm rõ được các khái niệm có liên quan đến

đề tài như thư viện số, bộ sưu tập số, vv , các tính năng nổi bật của phần mềm DSpace so với những phần mềm khác cùng chức năng cũng như những lợi ích mà thư viện có được khi ứng dụng phần mềm này

Nhiệm vụ thực tiễn: Cài đặt thành công phần mềm mã nguồn mở DSpace, sau

đó dùng chính phần mềm này để xây dựng 1 thư viện số bằng một bộ sưu tập cụ thể,

mà nó có thể được ứng dụng ở thư viện trường Đại học Khoa học Xã hội và Nhân văn, nhằm khắc phục những khuyết điểm của phần mềm trước đó để lại

4.1 Phương pháp phân tích

Phương pháp nghiên cứu tài liệu

Trang 8

Phương pháp xử lý thông tin

Phương pháp thực nghiệm

4.2 Phương pháp luận

Nghiên cứu các tài liệu liên quan trên cơ sở đó phân tích, tổng hợp, hệ thống hóa và khái quát hóa những thông tin thu được Trên cơ sở đó viết lý luận cho đề tài, lựa chọn các phương pháp nghiên cứu thực tiễn, phục vụ cho việc nghiên cứu

Đối tượng nghiên cứu của đề tài là phần mềm mã nguồn mở DSpace và cách ứng dụng nó để xây dựng 1 bộ sưu tập số cụ thể

Phạm vi nghiên cứu của đề tài là các bộ sưu tập số của thư viện trường Đại học Khoa học Khoa học Xã hội và Nhân văn

Khi nghiên cứu đề tài này nhóm chúng em mong muốn rằng nó sẽ có những đóng góp nhất định cho thư viện trường Đại học Khoa học Xã hội và Nhân Văn như

có thể xây dựng được một thư viện số dựa trên nền tảng phần mềm mã mở DSpace, có thể tùy chỉnh trong việc sử dụng phần mềm này, cũng như có một cái nhìn đơn giản hơn về việc xây dựng thư viện số từ đó có thể chủ động hơn trong các hoạt động nghiệp vụ của mình

Ý nghĩa thực tiễn của đề tài: Nhấn mạnh vai trò và nâng cao giá trị của thư viện

số, góp phần đưa thư viện số đến gần hơn với người dùng tin, nhằm tăng cường, quảng

bá, giới thiệu nguồn tài nguyên số đến với người dùng tin một cách nhanh nhất và hiệu quả nhất Ngoài ra việc nghiên cứu thành công đề tài này còn giúp Thư viện trường Đại học Khoa học Xã hội và Nhân văn giảm đáng kể chi phí để trang bị phần mềm Thêm vào đó, việc ứng dụng đề tài sẽ giúp thư viện tăng cường liên thông, liên kết, chia sẻ nguồn tài liệu số giữa các đơn vị với nhau ngày càng thuận lợi hơn

Trang 9

Chương 1: Tổng quan về phần mềm mã nguồn mở DSpace

1.1 Các khái niệm liên quan

1.1.1 Khái niệm thư viện số

1.1.2 Khái niệm số hóa – bộ sưu tập số

1.1.3 Khái niệm phần mềm mã nguồn mở

1.2 Giới thiệu về phần mềm mã nguồn mở DSpace

1.2.1 Bối cảnh ra đời của phần mềm mã nguồn mở DSpace

1.2.2 Tình hình ứng dụng phần mềm mã nguồn mở DSpace trên thế giới và ở Việt Nam

1.2.3 Các khái niệm liên quan đến phần mềm mã nguồn mở DSpace và các tính năng nổi bật của phần mềm DSpace

Chương 2: Cài đặt phần mềm mã nguồn mở DSpace

Chương 3: Kết quả thực nghiệm về các chức năng được sử dụng trong DSpace

3.1 Các chức năng quản trị sử dụng trong DSpace

3.1.1 Đăng nhập

Trang 10

3.1.4.3 Thêm quyền hạn cho Bộ sưu tập

3.1.4.4 Thêm tài liệu

3.2 Cài đặt cấu hình giao diện tiếng Việt cho DSpace

Chương 4: Nhận xét phần mềm mã nguồn mở DSpace

4.1 Nhận xét ưu điểm và hạn chế của phần mềm DSpace

4.2 So sánh phần mềm DSpace với phần mềm Greenstone

KẾT LUẬN

KIẾN NGHỊ

Trang 11

CHƯƠNG 1: TỔNG QUAN VỀ PHẦN MỀM MÃ NGUỒN MỞ DSPACE

1.1.1 Khái niệm thư viện số

Hiện nay, thư viện số đã là một thuật ngữ không còn xa lạ với rất nhiều người thế nên nó cũng có rất nhiều khái niệm

"Thư viện số là cơ quan/tổ chức có các nguồn lực, kể cả các nguồn nhân lực chuyên hoá, để lựa chọn, cấu trúc việc truy cập đến diễn giải, phổ biến, bảo quản sự toàn vẹn, đảm bảo sự ổn định trong thời gian dài của sưu tập các công trình số hoá mà chúng ở dạng sẵn sàng để sử dụng một cách kinh tế cho một hoặc một số cộng đồng nhất định." - Liên đoàn Thư viện Hoa Kỳ

Hay theo Arms W.Y : “Thư viện số là một kho thông tin có quản lý với các dịch vụ liên kết, trong đó thông tin được lưu trữ ở dạng số và có thể truy cập qua một mạng.”

Hoặc, “Thư viện số là thuật ngữ được chấp nhận rộng rãi như sự mô tả việc sử dụng công nghệ số của thư viện để thu thập, lưu trữ, bảo tồn và cung cấp sự truy cập đến thông tin" - Trung tâm Nghiên cứu và đổi mới thư viện Anh

Tóm lại, Thư viện số là nơi trình bày những bộ sưu tập thông tin có tổ chức Đối tượng của những bộ sưu tập đó là nguồn tài nguyên thông tin số hóa cùng với các phương thức: truy hồi, chọn lọc, truy cập, tổ chức và bảo trì bộ sưu tập đó Ngoài ra, thư viện số là một kho thông tin số khổng lồ có tổ chức với các dịch vụ liên kết qua mạng

1.1.2 Khái niệm số hóa – bộ sưu tập số

Số hóa tài liệu là quá trình chuyển các dạng dữ liệu/tài liệu truyền thống như các bản viết tay, bản in trên giấy, hình ảnh, âm thanh, phim, dữ liệu toàn văn với nhiều định dạng khác nhau sang dữ liệu trên máy tính và được máy tính nhận biết được như tài liệu ban đầu Hay nói cách khác số hoá tài liệu là hình thức chuyển đổi các tài liệu truyền thống bên ngoài thành dạng tài liệu số mà máy tính có thể hiểu được Sản phẩm sau khi số hóa tài liệu chính là nguồn tài nguyên số/dữ liệu số - các dữ liệu dạng chữ,

Trang 12

hình ảnh, âm thanh được máy tính nhận biết đúng định dạng và được sử dụng trên máy tính

Từ đó ta có khái niệm:

Bộ sưu tập số là một tập hợp có tổ chức nhiều tài liệu đã được số hoá dưới nhiều hình thức khác nhau (văn bản, hình ảnh, Audio, Video…) về một chủ đề Mặc dù mỗi loại hình tài liệu có sự khác nhau về cách thể hiện, nhưng nó đều cung cấp một giao diện đồng nhất mà qua đó các tài liệu có thể truy cập, tìm kiếm và sử dụng dễ dàng

1.1.3 Khái niệm phần mềm mã nguồn mở

Phần mềm mã nguồn mở là phần mềm với mã nguồn được công bố và sử dụng một giấy phép nguồn mở Giấy phép này cho phép bất cứ ai cũng có thể nghiên cứu, thay đổi và cải tiến phần mềm và phân phối phần mềm ở dạng chưa thay đổi hoặc đã thay đổi Người sử dụng phần mềm được có các quyền vốn bị cấm bởi bản quyền, gồm các quyền về sử dụng, thay đổi và tái phân phối

1.2.1 Bối cảnh ra đời của phần mềm mã nguồn mở DSpace

Tháng 3 năm 2000, Công ty Hewlett-Packard (HP) đã trao tặng 1.800.000 USD cho Thư viện MIT (Massachusetts Institute of Technology) trong khuôn khổ một chương trình hợp tác 18 tháng để xây dựng thư viện số DSpace, một kho lưu trữ năng động các định dạng kỹ thuật số các tài nguyên tri thức của các tổ chức nghiên cứu đa ngành Một tháng sau khi giới thiệu, ngày 4/11/2000, HP Labs và Thư viện MIT đã phát hành trên toàn thế giới hệ thống DSpace theo các điều khoản của giấy phép mã nguồn mở như là một dịch vụ mới của thư viện MIT

Là một hệ thống mã nguồn mở, DSpace miễn phí cho các tổ chức khác để sử dụng, sửa đổi và mở rộng theo các yêu cầu của họ để đáp ứng nhu cầu của từng tổ chức DSpace ra đời là một nỗ lực để giải quyết một số vấn đề mà giảng viên của MIT

đã gặp phải trong những năm qua Khi giảng viên và các nhà nghiên cứu khác phát triển các tài liệu nghiên cứu và các ấn phẩm học thuật trong các định dạng kỹ thuật số ngày càng phức tạp, có một nhu cầu để thu thập, bảo quản và phân phối chúng: một

Trang 13

công việc tốn thời gian và tốn kém cho các giảng viên cá nhân và các phòng ban của

họ, phòng thí nghiệm, và các trung tâm DSpace cung cấp một cách để quản lý các tài liệu nghiên cứu và các ấn phẩm trong một kho lưu trữ chuyên nghiệp để duy trì, cung cấp cho họ khả năng hiển thị lớn hơn và khả năng tiếp cận theo thời gian Đầu tiên DSpace được xây dựng theo hướng tiếp cận bề rộng: nó hỗ trợ tất cả các chức năng mà một tổ chức nghiên cứu cần có: một dịch vụ tạo lập tài nguyên số, kho lưu trữ tài nguyên số bằng một cách đơn giản nhất có thể với mục tiêu sẽ được ngay lập tức hữu ích tại MIT, dần dần có thể được mở rộng và cải thiện theo thời gian, và có thể phục

vụ như một nền tảng cho các nghiên cứu trong tương lai

1.2.2 Tình hình ứng dụng phần mềm mã nguồn mở DSpace trên thế giới và ở Việt Nam

Hiện nay đã có hơn 1000 Trường Đại học, Cao đẳng và các tổ chức văn hóa sử dụng DSpace để quản lý và chia sẻ nguồn tài nguyên: sách, tạp chí, luận văn, bộ sưu tập hình ảnh, âm thanh,……

Các đơn vị đã đưa DSpace vào sử dụng :

Trong nước :

1) Thư viện Đại học Quốc Gia Thành phố Hồ Chí Minh

2) Trường Đại học Đà Lạt ( đơn vị đầu tiên Việt hóa phần mềm DSpace )

3) Thư viện Trung tâm Đại học Quốc Gia Hà Nội

4) Liên hiệp thư viện Nam Trung Bộ - Tây Nguyên

5) Thư viện Đại học Công nghiệp Thành phố Hồ Chí Minh

6) Trung tâm Thông tin – thư viện Đại học Nguyễn Tất Thành

7) …

Thế giới :

1) University of Sydney (Australia/New Zealand)

Trang 14

2) Webinito Networks ( India )

3) Umm Alqura University (Saudi Arabia)

4) National University of Singapore (Singapore)

5) University of Stellenbosch ( South Africa )

6) Arvo Consultores (Spain)

7) Shinawatra University (Thailand)

8) Sumy State University (Ukraine)

9) University of Michigan ( United States )

10) University of Hawaii ( United States )

11) …

1.2.3 Các khái niệm liên quan đến phần mềm mã nguồn mở DSpace và các tính năng nổi bật của phần mềm DSpace

DSpace là nền tảng của một phần mềm mã nguồn mở, nó có thể tổ chức:

o Chụp và mô tả tài liệu số bằng một quy trình làm việc và có nhiều lựa chọn các chương trình đưa vào

o Phân phối và tổ chức nguồn tài nguyên số trên mạng qua hệ thống tìm kiếm và truy hồi

o Bảo quản nguồn tài nguyên số trong thời gian dài

1.2.3.1 Mô hình dữ liệu (Data Model)

Mô hình dữ liệu là cách dữ liệu được tổ chức trong DSpace, phản ánh cấu trúc của sự tổ chức sử dụng trong DSpace

DSpace được thiết kế để tạo thuận lợi cho các cá nhân có thể đóng góp các tài nguyên số vào hệ thống một cách dễ dàng Mô hình thông tin của hệ thống được xây dựng xung quanh ý tưởng “Communities” tổ chức các đơn vị trực thuộc của một tổ chức nghiên cứu, một trường đại học có nhu cầu quản lý thông tin đặc biệt Mỗi

Trang 15

“communities” có thể thích ứng với hệ thống để đáp ứng các nhu cầu cụ thể của đơn vị

và quản lý quá trình nộp các xuất bản phần mềm điện tử Cấu trúc tổ chức dữ liệu trong hệ thống của DSpace phụ thuộc vào cấu trúc loại hình của cơ quan thông tin khác nhau

o Cộng đồng: Là các khối (Có thể là trường học, phòng ban, hoặc các trung tâm,

các cơ quan thông tin , tổ chức , cá nhân ), ngoài ra tùy thuộc loại hình tổ chức khác nhau có thể phân thêm ra các khối phụ (sub-community)

Mỗi Cộng đồng có thể bao gồm:

 Cộng đồng con (Sub-communities)

 Không giới hạn các Bộ sưu tập (Collection)

o Bộ sưu tập: Có thể là một chủ đề, một thư mục chứa nhiều tài liệu, các bộ sưu

tập được các tổ chức tạo lập lưu trữ và đưa vào phục vụ, sử dụng

Mỗi Bộ sưu tập có thể có các quyền truy cập và dòng xử lý công việc khác nhau

o Item : là thành phần thuộc sở hữu của bộ sưu tập và được quản lí bởi chính bộ

sưu tập đó Bao gồm các yếu tố cơ bản của việc lưu trữ, hình thức của tài liệu

có trong bộ sưu tập

o Bundle : là các yếu tố thuộc Item chứa các tập hợp các thuộc tính về lưu trữ

o Bitstream – Bitstream format : Quy định các định dạng mà phải tuân theo trong

hệ thống và có các cấp độ hỗ trợ khác nhau

Ví dụ các thành phần của một mô hình dữ liệu DSpace :

Community : Thư viện thiếu nhi Cá Chép

Bộ sưu tập : Các tuyển tập về Doraemon

Item : video , nhạc , truyện sách điện tử

Bundle : nhóm HTML, các thành phần định dạng hình ảnh

Bitstream : các dữ liệu HTML lẻ, định dạng file ảnh, nguồn dữ liệu

Bitstream Format :định dạng PNG, Adobe Reader

Trang 16

1.2.3.2 Metadata (siêu dữ liệu)

DSpace sử dụng siêu dữ liệu chuẩn Dublin core để mô tả các thông tin về tài nguyên điện tử cần lưu trữ, phân phối Trong đó có 3 yếu tố (thông tin) bắt buộc phải

mô tả: Nhan đề, ngôn ngữ, ngày đăng, tất các yếu tố còn lại là tùy chọn Ngoài ra, có một số các yếu tố bổ sung cho tài liệu: tóm tắt, từ khóa, siêu dữ liệu kỹ thuật và siêu

dữ liệu quyền Các siêu dữ liệu này được hiển thị trong biểu ghi của tài liệu trong hệ thống DSpace và được lập chỉ mục để hỗ trợ tìm kiếm, duyệt thông tin trong hệ thống (duyệt theo Bộ sưu tập, theo chủ đề, theo các đơn vị thành viên của tổ chức…) Hệ thống hỗ trợ kết xuất siêu dữ liệu và tài liệu điện tử trong kho lưu trữ theo dạng chuẩn XML, và hiện đang phát triển để hỗ trợ chuẩn METS đối với các siêu dữ liệu kỹ thuật

và siêu dữ liệu quyền cho các định dạng kỹ thuật số tùy ý

Có 3 loại siêu dữ liệu về nội dung lưu trữ:

o Siêu dữ liệu mô tả :

DSpace có thể hỗ trợ nhiều lược đồ siêu dữ liệu phẳng để mô tả một mục

Có thể cấu hình nhiều lược đồ và chọn các lĩnh vực siêu dữ liệu từ hỗn hợp các lược

đồ cấu hình để mô tả các mục của bạn

Siêu dữ liệu mô tả về các mục khác (ví dụ như siêu dữ liệu mô tả trong một sơ đồ phân cấp) có thể được tổ chức tại bitstreams Khối và các bộ sưu tập có một số siêu dữ liệu

mô tả đơn giản (một cái tên, và một số văn xuôi mô tả), được tổ chức trong DBMS

o Siêu dữ liệu quản trị :

Bao gồm siêu dữ liệu bảo quản, nguồn gốc và chính sách cấp phép dữ liệu Hầu hết trong số này được tổ chức trong lược đồ quan hệ DBMS của DSpace

Siêu dữ liệu nguồn gốc được lưu trữ trong hồ sơ Dublin Core Ngoài ra, một số siêu dữ liệu hành chính khác (ví dụ, kích thước byte bitstream và các loại MIME) được tái bản trong hồ sơ Dublin Core để nó dễ dàng có thể truy cập trong DSpace

o Siêu dữ liệu cấu trúc :

Trang 17

Bao gồm thông tin về item hiện tại, bitstream trong item, người sử dụng , mối quan hệ giữa các cấu tạo trong item

Ví dụ: Một luận văn được hình thành bằng nhiều hình ảnh định dạng TIFF, mỗi hình ảnh là một trang luận văn Cấu trúc siêu dữ liệu sẽ bao gồm mỗi hình ảnh là 1 trang duy nhất và thứ tự các hình ảnh đó

o Một plugin được xác định bởi một giao diện java

o Người sử dụng yêu cầu sử dụng plugin qua giao diện của nó

o Mediafilter là một ví dụ đơn giản của một plugin

1.2.3.3.1 Plugins Package (Plugins “đóng gói”)

Đóng gói là mô-đun phần mềm dịch giữa đối tượng trong DSpace và đại diện bên ngoài khép kín, hay "đóng gói"

Một gói thường là một tập tin lưu trữ như một tập tin zip hoặc "tar", bao gồm một tài liệu biểu hiện, trong đó có siêu dữ liệu và mô tả nội dung gói IMS Content Package là một tiêu chuẩn đóng gói điển hình Một gói phần mềm cũng có thể là một tài liệu duy nhất hoặc phương tiện truyền thông tập tin có chứa siêu dữ liệu riêng của mình, chẳng hạn như một tài liệu PDF có kèm siêu dữ liệu mô tả

Hầu hết các plugin đóng gói sử dụng plugin Crosswalk để dịch các siêu dữ liệu giữa các mô hình đối tượng DSpace và các định dạng gói

1.2.3.3.2 Plugins Crosswalk

Plugins Crosswalk là mô-đun phần mềm dịch giữa siêu dữ liệu DSpace và một đại diện bên ngoài cụ thể

Trang 18

Ví dụ, một Plugins Crosswalk MODS dịch siêu dữ liệu mô tả từ các định dạng MODS sang các trường siêu dữ liệu trên DSpace Item=> tạo ra một tài liệu MODS từ các siêu dữ liệu trên DSpace Item

Nó rất dễ dàng để thêm Plugins Crosswalk mới

Ngoài ra còn có một cặp đặc biệt của plugin Crosswalk mà sử dụng XSL stylesheets để dịch các siêu dữ liệu bên ngoài vào hoặc từ một định dạng DSpace nội

bộ Có thể thêm và sửa đổi plugin Crosswalk XSLT đơn giản bằng cách chỉnh sửa cấu hình DSpace và các stylesheets, được lưu trữ trong các tập tin trong thư mục cài đặt DSpace

Các plugin Packager và máy chủ OAH-PMH sử dụng các plugin Crosswalk

1.2.3.4 Người sử dụng và nhóm (E-People and Groups)

Có một số các chức năng của DSpace chỉ có sẵn cho một số người sử dụng "đặc quyền" Người sử dụng và các nhóm là cách xác định người dùng ứng dụng DSpace với mục đích đặc quyền được cấp

Người sử dụng: chứa các thông tin về mỗi người sử dụng như địa chỉ email, tên, mật khẩu…: Dùng để chỉ chung cho những người sử dụng website

Một thành viên có thể có các quyền sau:

o Người dùng bình thường (normal user)

o Người quản trị (administrators)

o Người đăng tải tài liệu (submitters)

o Người đăng ký (subscribers)

o Người tham gia tiến trong trình công việc (submission workflow participants) Trở thành thành viên theo hai cách:

o Người quản trị tạo tài khoản đăng nhập cho thành viên

o Người dùng tự đăng ký và xác nhận thông tin qua tài khoản email đã đăng ký

Trang 19

Nhóm: là một danh sách các người sử dụng được cấp quyền truy cập vào hệ thống

ủy quyền: Nhóm đại diện cho các thành viên có cùng quyền hạn –những người được phép thực hiện một số chức năng trên bộ sưu tập Nhóm có thể là:

o Nhóm người quản lí thư viện

o Nhóm sinh viên

o Nhóm những người xem xét lại các tài liệu

o Nhóm vô danh – chưa xác định (Anonymous) là tất cả những người sử dụng hệ thống

1.2.3.5 Cơ chế nhận dạng

Đây là cơ chế nhận dạng của DSpace, phân biệt người sử dụng và một nhóm nhằm đưa ra các quyền hạn phù hợp cho họ

Cơ cấu này đem lại các lợi ích:

o Tách các xác nhận từ giao diện Web của người dùng ra thành các ứng dụng khác có khả năng tương tác vs dịch vụ Web

o Việc xác nhận là hoàn toàn độc lập

o Dọn dẹp các xác nhận rác , ẩn mà người sử dụng đã tạo rồi không sử dụng

Trang 20

Bộ sưu tập hoặc những khối nhỏ trong một khối lớn, thêm hoặc di chuyển những item trong một Bộ sưu tập, thêm hoặc di chuyển những Bundle trong một item…

Tuy nhiên trong chính sách này ko có hành động “xóa” Nếu muốn xóa một chủ thể, ví dụ một item từ kho lưu trữ phải sử dụng chức năng “di chuyển” cho tất cả chủ

đề đó trong bộ sưu tập.sau đó các item này sẽ tự động được xóa

Trên tập tin (Bitstream):

o READ: có thể mở file

o WRITE: có thể thay đổi file

Trên bó (Bundle)

o ADD: có thể thêm nhiều tập tin vào bó

o REMOVE: xoá tập tin ra khỏi bó

Trên mục (Item)

o READ: có thể xem mục

o WRITE: có thể thay đổi mục

o ADD/REMOVE: có thể thêm hoặc xóa các tập tin

Trên bộ sưu tập (Collection)

o ADD/REMOVE: có thể thêm hoặc xóa các tập tin khỏi bộ sưu tập

o DEFAULT_ITEM_READ: các mục mới có thuộc tính đọc

o DEFAULT_BITSTREAM_READ: các tập tin mới được phép đọc

o COLLECTION_ADMIN: có thể thay đổi, rút trích hoặc ánh xạ các mục vào bộ sưu tập

1.2.3.7 Quá trình tiếp nhận dữ liệu và hệ thống tự động hóa

Tự động hóa các thủ tục văn bản trong một tổ chức bằng cách thay thế các hệ thống giấy tờ bằng các văn bản điện tử Một mạng cung cấp hệ thống chuyển theo đường đã định để chuyển các văn bản đi và đến từ bộ phận lưu trữ

Trang 21

Là quy trình xử lí thông tin thêm nhằm hoàn thiện các thuộc tính phục vụ tốt cho việc lưu trữ

Phụ thuộc vào các quy định của bộ sưu tập mà chọn cách xử lí thích hợp nhằm hoàn thành các mục tiệu

Đưa một file dữ liệu vào quá trình sẽ xử lí biến đổi nhằm gán thêm các thuộc tính, cài đặt thêm một số tính năng nhằm phục vụ cho việc lưu trữ

1.2.3.7.1/ Quy trình xử lí , làm việc :

Quy trình nãy thuộc công đoạn xử lí file dữ liệu được đưa vào

Là quy trình kiểm tra , sửa đổi các dữ liệu nhằm hoàn thiện đưa vào lưu trữ sử dụng

Có thể sửa đổi siêu dữ liệu

Tất cả đều theo một quy trình các bước ổn định và trật tự không được nhảy bước

Trong quy trình này thì máy chủ sever có khả năng hủy bỏ tiến trình nhằm tránh các rủi ro cho CSDL về sau

Ví dụ bằng cách áp dụng mô hình luồng công việc, DSpace là một kho lưu trữ tài liệu điện tử mã nguồn mở đầu tiên đã giải quyết những vấn đề phức tạp của một thư viện khoa học tổng hợp tỉnh Nói cách khác, mỗi thư viện quận, huyện trong tỉnh sẽ có những quy định rất khác nhau về các tài nguyên điện tử phải nộp cho “thư viện số”: loại tài liệu điện tử phải nộp là gì? Ai là người gửi tài liệu?Ai là người duyệt? Ai được xem và ai là người bị hạn chế xem các tài liệu này… Tất cả những vấn đề này đều được giải quyết bởi các đại diện của các thư viện quận, huyện và các cán bộ thư viện tỉnh Sau đó được mô phỏng bằng luồng công việc cho mỗi bộ sưu tập để thực thi các quyết định Mỗi thành viên trong DSpace đều được gán các quyền thích hợp với vai trò của mình: vai trò người đăng tài liệu điện tử, vai trò người biên tập siêu dữ liệu, vai trò quản trị các bộ sưu tập, vai trò quản trị hệ thống …

Có 2 cách để tạo lập, quản trị bộ sưu tập số :

Trang 22

o Cách thứ nhất, thư viện có thể quy định tất cả mọi bạn đọc đều có quyền đăng tài liệu điện tử, và bất kỳ người dùng nào (trong nội bộ và bên ngoài) đều có quyền xem các tài liệu đã được đăng tải

o Cách thứ hai, thư viện có thể tổ chức mô hình lưu trữ và phân phối tài liệu chặt chẽ hơn: các tác giả nộp các tài liệu điện tử do mình tạo lập, sau đó sẽ có một

bộ phận chịu trách nhiệm biên tập siêu dữ liệu và người có quyền cao nhất sẽ quyết định có xuất bản tài liệu đó không Như vậy mỗi bước trong quá trình đăng tài liệu điện tử sẽ được xem xét, phê duyệt trước khi tài liệu đó được đưa vào bộ sưu tập, các tài liệu điện tử không được thông qua trong quá trình này sẽ không được phép lưu trữ trong hệ thống DSpace

1.2.3.10 Chuỗi nhận dạng Bitstream – (Cung cấp 1 chuỗi ổn định cho các DSpace)

Tương tự việc định danh cho DSpace items, Bitstreams cũng có chuỗi nhận dạng Nhưng nó có nhiều biến động hơn, vì nếu nội dung được chuyển sang một máy chủ khác hoặc tổ chức khác, nó sẽ không còn làm việc

Mỗi bitstream có dãy ID, duy nhất trong mỗi item Dãy ID này được sử dụng để tạo ra một ID có dạng:

DSpace url/bitstream/handle/sequence ID/filename

1.2.3.11 Hỗ trợ

1.2.3.11.1 Hỗ trợ nguồn lưu trữ tập tin

Trang 23

Cung cấp nguồn lưu trữ không giới hạn và các phương tiện đơn giản để tái tạo các nội dung

DSpace cung cấp 2 phương tiện để lưu trữ tập tin Đầu tiên là trong tập tin hệ thống trên máy chủ Thứ hai là sử dụng SRB

Cả hai đều được sử dụng 1 cách đơn giản , dung lượng nhỏ API

SRB là một lựa chọn có thể sử dụng thay cho các tập tin hệ thống của máy chủ hoặc bổ sung cho các tập tin hệ thống

SRB là một trình quản lý rất mạnh mẽ và tinh vi, cung cấp nguồn lưu trữ không giới hạn và các phương tiện đơn giản để tái tạo các nội dung

DSpace cho phép người dùng có thể khám phá các nội dung bằng nhiều cách, bao gồm:

o Qua các tham chiếu mở rộng như Handle…

o Tìm kiếm một hoặc nhiều từ khóa trong siêu dữ liệu hoặc toàn văn

o Có khả năng tìm kiếm thông qua tên nhan đề, tên tác giả, ngày…

Tìm kiếm là một công cụ cần thiết trong DSpace Người sử dụng kỳ vọng một công

cụ tìm kiếm khá cao do đó mục tiêu của DSpace là cung cấp càng nhiều tính năng tìm kiếm càng tốt

Một phần rất quan trọng trong DSpace là trình duyệt Đây là quá trình mà người dùng xem một chỉ số cụ thể như chỉ số tiêu đề và điều hướng xung quanh nó trong việc tìm kiếm các items Ngoài ra trình duyệt có thể giới hạn các items trong các bộ sưu tập hoặc cộng đồng cụ thể

1.2.3.11.3 Hỗ trợ HTML

DSpace hỗ trợ tải lên và tải xuống với các tập tin Điều này tốt đối với các định dạng thông dụng như file PDF, tài liệu Word, bảng tính Excel vv Nhưng tài liệu HTML thì phức tạp hơn và nó rất quan trọng trong việc bảo quản số

Trang 24

Các trang web có xu hướng bao gồm một số tập tin - một hoặc nhiều tập tin HTML có chứa tài liệu tham khảo với nhau, và stylesheets và các tập tin hình ảnh được tham khảo từ các tập tin HTML

Các trang web cũng liên kết đến hoặc bao gồm nội dung từ các trang web khác

và người dùng thường không nhận ra được Như vậy, trong thời gian một vài năm, khi

có ai đó xem trang web đó, họ sẽ có thể tìm thấy nhiều liên kết bị hỏng

1.2.3.11.4 Hỗ trợ OAI (sáng kiến lưu trữ mở)

Sáng kiến lưu trữ mở đã phát triển một giao thức để thu hoạch siêu dữ liệu Điều này cho phép các trang web lấy hoặc 'thu hoạch' siêu dữ liệu từ nhiều nguồn, các dịch vụ phục vụ bằng cách sử dụng siêu dữ liệu, chẳng hạn như đánh chỉ số hoặc các dịch vụ liên kết Cho phép người dùng truy cập thông tin nhiều trang web từ một nơi

1.2.3.11.5 Hỗ trợ URL mở

DSpace hỗ trợ giao thức Open URL từ SFX, 1 cách đơn giản

Nếu bạn có 1 máy chủ SFX, DSpace sẽ hiển thị 1 liên kết Open URL trên mỗi trang Item ( bằng cách tự động sử dụng siêu dữ liệu Dublin Core)

Trang 25

Người dùng có thể sử dụng nguồn cấp dữ liệu RSS để nhận thông tin

1.2.3.13 Nhập/ xuất dữ liệu giữa DSpace và các hệ thống khác

DSpace bao gồm các công cụ nhập/ xuất các item trong 1 cấu trúc thư mục đơn giản, nơi mà các siêu dữ liệu được lưu trữ dưới dạng file XML

Nhờ đó DSpace có thể chuyển đổi nội dung với các hệ thống khác

1.2.3.14 Đăng kí để sử dụng hệ thống

Sử dụng các giao thức cho phép đăng nhập và quá trình đăng kí thuận lợi cho mọi người

1.2.3.15 Thống kê ( về số liệu trong việc sử dụng hệ thống)

Bản báo cáo bao gồm các dữ liệu như:

o Số lượt xem item

o Số lượt truy cập bộ sưu tập

o Số lượt truy cập vào các khối

o Số yêu cầu OAI

o Tóm tắt tùy biến các nội dung lưu trữ

1.2.3.16 Ứng dụng kiểm tra bộ nhớ

Mục đích của việc kiểm tra là để xác minh bộ nhớ lưu trữ tài liệu của DSpace không bị sửa đổi hoặc xáo trộn

Công cụ này có thể mở rộng để báo cáo mới và kiểm tra cách tiếp cận ưu tiên

1.2.3.17 Quản lý dung lƣợng sử dụng trong hệ thống

Trang 26

DSpace có thể báo cáo về các hoạt động sử dụng như tải tập tin

Được sử dụng để phát triển tùy biến, thống kê các hoạt động trong hệ thống

1.2.3.18 Giao diện người dùng

DSpace sử dụng giao diện người dùng dạng web-based Có 3 giao diện người dùng trong hệ thống DSpace: giao diện người dùng cho những người tham gia trong quá trình đăng, xuất bản phần mềm điện tử; giao diện cho người dùng tin: tìm kiếm, duyệt thông tin trong kho lưu trữ; giao diện người dùng cho người quản trị

Giao diện cho người dùng tin hỗ trợ tìm kiếm và nhận thông tin trả về bằng cách duyệt hoặc tìm kiếm siêu dữ liệu Một biểu ghi thỏa mãn các điều kiện tìm kiếm trong kho lưu trữ sẽ được trả về, người dùng tin có thể tải tài liệu điện tử gắn với biểu ghi thông qua các siêu liên kết, người dùng tin có thể xem trực tiếp nội dung tài liệu trên web bằng cách cài đặt các plug-in cho trình duyệt web hoặc tải về máy tính của mình để xem thông qua các ứng dụng hỗ trợ đọc các định dạng điện tử khác nhau như: Microsoft Office, Acrobat, Windows Media Player , CAD/CAM

1.2.3.19 Nền tảng công nghệ

DSpace được thiết kế để chạy trên nền tảng UNIX, hiện nay đã có phiên bản chạy trên nền tảng hệ điều hành Windows Các mã ban đầu được lập trình bằng ngôn ngữ Java Các thành phần khác: Hệ quản trị CSDL sử dụng PostgreSQL; máy chủ web

và Java Servlet sử dụng Apache và Tomcat; Jena - một bộ công cụ RDF được phát triển từ HP Labs, OAICat từ OCLC

1.2.3.20 Bảo mật

Phần mềm hỗ trợ phân quyền theo hướng phân cấp:

o Đối với bộ sưu tập: Có các quyền như: Quyền quản trị bộ sưu tập, Quyền đưa tài liệu vào bộ sưu tập, quyền duyệt tài liệu trước khi xuất hiện trrong bộ sưu tập…

o Đối với tài liệu: Có các quyền như: Quyền xem mô tả biểu ghi tài liệu, quyền đọc trực tuyến toàn văn tài liệu, quyền tải tập tin toàn văn,…

Trang 27

Ngoài ra phần mềm còn hỗ trợ phân quyền theo từng nhóm bạn đọc hoặc từng bạn đọc

Với cơ chế thừa kế quyền từ các đơn vị và bộ sưu tập, trong cấu trúc phân cấp của DSpace, người quản trị dễ dàng hơn trong việc cấu hình và quản lý

Trang 28

CHƯƠNG 2: CÀI ĐẶT PHẦN MỀM MÃ NGUỒN MỞ DSPACE

Yêu cầu cấu hình máy tính :

o Hệ điều hành : Windows XP trở lên

o CPU Intel (R) Pentium (R) D CPU 2.66GHz (2CPUs), RAM 1GB, ổ cứng 80GB

mã máy hoặc thông dịch mã nguồn khi chạy, Java được thiết kế để biên dịch mã nguồn thành bytecode, bytecode sau đó sẽ được môi trường thực thi (runtime environment) chạy

Trước đây, Java chạy chậm hơn những ngôn ngữ dịch thẳng ra mã máy như C

và C++, nhưng sau này nhờ công nghệ "biên dịch tại chỗ" - Just in time compilation, khoảng cách này đã được thu hẹp, và trong một số trường hợp đặc biệt Java có thể chạy nhanh hơn Java chạy nhanh hơn những ngôn ngữ thông dịch như Python, Perl, PHP gấp nhiều lần Java chạy tương đương so với C#, một ngôn ngữ khá tương đồng

về mặt cú pháp và quá trình dịch/chạy

Cú pháp Java được vay mượn nhiều từ C & C++ nhưng có cú pháp hướng đối tượng đơn giản hơn và ít tính năng xử lý cấp thấp hơn Do đó việc viết một chương trình bằng Java dễ hơn, đơn giản hơn, đỡ tốn công sửa lỗi hơn

Trong Java, hiện tượng rò rỉ bộ nhớ hầu như không xảy ra do bộ nhớ được quản

lí bởi Java Virtual Machine (JVM) bằng cách tự động "dọn dẹp rác" Người lập trình không phải quan tâm đến việc cấp phát và xóa bộ nhớ như C, C++ Tuy nhiên khi sở

Trang 29

dụng những tài nguyên mạng, file IO, database (nằm ngoài kiểm soát của JVM) mà người lập trình không đóng (close) các streams thì rò rỉ dữ liệu vẫn có thể xảy ra

2.2.2 Phần mềm Apache Maven

Tư duy khi phân tích và thiết kế một ứng dụng phần mềm đó là có thể tách một

hệ thống lớn thành các thành phần nhỏ Với tư duy như vậy ta có thể nôm na định nghĩa ràng một ứng dụng phần mềm sẽ là sự tổng hợp của các thành phần (component) lại với nhau Các thành phần ở đây thường được thể hiện ra là các thư viện cung cấp cho người lập trình viên các công cụ lập để việc lập trình trở nên dễ dàng hơn Nói như vậy một ứng dụng có thể phụ thuộc vào nhiều thành phần mà bản thân mỗi thành phần

đó lại phụ thuộc vào các thành phần khác.Việc quản lý sự phụ thuộc giữa các thành phần này thực sự là không dễ dàng và nó sẽ trở nên phức tạp hơn khi mà ứng dụng càng ngày càng lớn ra Để có thể giải quyết vấn đề này, Apache Maven được ra đời

Maven là một công cụ để quản lý dự án và việc xây dựng một cách tự động Nó phục vụ chính cho các dự án viết bằng Java nhưng cũng có thể hỗ trợ cho các dự án khác viết bằng C#, Ruby, Scala

Maven dùng khái niệm Project Object Model (POM) để mô tả việc xây dựng dự

án, các thành phần phụ thuộc và các module Nó định nghĩa trước các target cho việc khai báo task, trình biên dịch, đóng gói và thứ tự hoạt động để mọi việc diến ra tốt nhất Maven tải các thư viện, plug-in từ 1 hoặc nhiều kho Cũng có thể tải các sản phẩm lên kho sau khi đã xây dựng xong

Hiện tại Apache đã có phiên bản Maven 3.0 với rất nhiều thay đổi quan trọng:

o Hỗ trợ parralel build với các module và tối ưu hóa hệ thống

o Cải tiến hiệu năng và khả năng tích hợp với các IDE

o Tương thích 100% với các version trước đó

2.2.3 Phần mềm Apache Ant

ANT (Another Neat Tool), là công cụ xây dựng hỗ trợ đặc biệt cho lập trình bằng Java nhưng cũng có thể sử dụng cho nhiều thứ khác, vì đây là công cụ được viết hoàn toàn bằng Java nên không phụ thuộc vào bất cứ nền ứng dụng nào Ant rất hữu

Trang 30

ích trong công việc phức tạp đòi hỏi phải lập đi lập lại nhiều lần, vì vậy nên thích hợp với việc xử lý một cách tự động và được chuẩn hóa Ant dùng định dạng XML để làm

cơ chế hoạt động cho công cụ dưới dạng những lời hướng dẫn ( instructions), do đó dễ dàng mở rộng và bảo trì

Ant mang lại rất nhiều lợi ích, nó giúp bạn biên dịch mã nguồn một cách nhanh chóng Biên dịch mã nguồn, đóng gói thành file jar, và thậm chí sinh ra file docs chỉ trong một lệnh duy nhất Chúng ta có thể áp dụng để biên dịch mã nguồn tiện lợi mà không cần phụ thuộc vào IDE Nó có thể được áp dụng để build các ứng dụng từ Java

SE đến Java EE và Java ME

Ant là 1 công cụ rất mạnh và phổ biến với Java developer Khác với Maven là 1 công cụ quản lý dự án , Ant đơn thuần chỉ là 1 công cụ xây dựng Chính nhờ vào ưu điểm đơn giản, dễ sử dụng mà đa số các nhà phát triển đều sử dụng nó Hơn nữa, trong khi Ant thích hợp cho mọi loại dư án , thi Maven lại chứng tỏ sức mạnh rõ rệt ở các dự

án lớn và rất lớn nhằm giúp cho việc quản lý dễ dàng và thống nhất hơn Ngoài ra Ant

ra đời trước(2000) so với Maven(2006) và tới nay nó vẫn còn rất hữu dụng

2.2.4 Phần mềm Apache Tomcat

Apache Tomcat là một Java Servlet được phát triển bởi Apache Software Foundation (ASF) Tomcat thi hành các ứng dụng Java Servlet và JavaServer Pages (JSP) từ Sun Microsystems, và cung cấp một máy chủ HTTP cho ngôn ngữ Java thuần túy để thực thi các chương trình lệnh viết bằng ngôn ngữ Java

Tomcat không nên được hiểu nhầm với các máy chủ HTTP Apache - cái mà dùng để thực thi các câu lệnh viết bằng ngôn ngữ C trên máy chủ HTTP; có 2 máy chủ web được kết nối với nhau Apache Tomcat cung cấp các công cụ cho việc cấu hình và quản lý, nhưng cũng có thể được cấu hình bởi việc soạn thảo các file cấu hình viết bằng XML

Apache Tomcat thực hiện phần mềm mã nguồn mở của công nghệ Java Servlet

và JavaServer Pages.Các thông số kỹ thuật Java Servlet và JavaServer Pages được phát triển dưới sự Java Community Process

Trang 31

Apache Tomcat được phát triển trong một môi trường mở và có sự tham gia và phát hành theo Giấy phép Apache phiên bản 2

Apache Tomcat có quy mô lớn, các ứng dụng web nhiệm vụ quan trọng trên một phạm vi đa dạng của các ngành công nghiệp và các tổ chức Apache Tomcat, Tomcat, Apache, the Apache feather, và biểu tượng của dự án Apache Tomcat là thương hiệu của Apache Software Foundation

2.2.5 PostgreSQL

PostgreSQL là một hệ quản trị cơ sở dữ liệu quan hệ và đối tượng dựa trên POSTGRES, bản 4.2, được khoa điện toán của đại học California tại Berkeley phát triển.POSTGRES mở đường cho nhiều khái niệm quan trọng mà các hệ quản trị dữ liệu thương mại rất lâu sau mới có

PostgreSQL là một chương trình mã nguồn mở xây dựng trên mã nguồn ban đầu của đại học Berkeley Nó theo chuẩn SQL99 và có nhiều đặc điểm hiện đại:

o Câu truy vấn phức hợp (complex query)

o Khóa ngoại (foreign key)

o Thủ tục sự kiện (trigger)

o Các khung nhìn (view)

o Tính toàn vẹn của các giao dịch (integrity transactions)

o Việc kiểm tra truy cập đồng thời đa phiên bản (multiversion concurrency control)

Hơn nữa, PostgreSQL có thể dùng trong nhiều trường hợp khác, chẳng hạn như tạo

ra các khả năng mới như:

Trang 32

PostgreSQL được phổ biến bằng giấy phép BSD cổ điển.Nó không quy định những hạn chế trong việc sử dụng mã nguồn của phần mềm Bởi vậy PostgreSQL có thể được dùng, sửa đổi và phổ biến bởi bất kỳ ai cho bất kỳ mục đích nào

PostgreSQL cũng là hệ quản trị cơ sở dữ liệu hỗ trợ mạnh trong việc lưu trữ dữ liệu không gian PostgreSQL kết hợp với module Postgis cho phép người dùng lưu trữ các lớp dữ liệu không gian Khi sử dụng PostgreSQL, Postgis kết hợp với các phần mềm GIS hỗ trợ hiển thị, truy vấn, thống kê hoặc xử lý dữ liệu không gian

Ngày nay, PostgreSQL là một trong những hệ quản trị cơ sở lớn nhất hiện có Với những tính năng được chỉ ra dưới đây, chúng ta có cái nhìn tổng quan về PostgreSQL :

o Trong quan hệ đối tượng PostgreSQL, mọi bảng định nghĩa như một lớp PostgreSQL thực thi kế thừa giữa các bảng, hàm và toán tử là đa hình

o Cú pháp chuẩn của PostgreSQL tuân thủ theo chuẩn của SQL92 và nhiều tính năng của SQL99

PostgreSQL cung cấp nhiều kiểu dữ liệu Bên cạnh kiểu dữ liệu numeric, string thông thường, nó còn cung cấp kiểu dữ liệu geometry, Boolean và kiểu dữ liệu được thiết kết đặc biệt để dùng cho các địa chỉ mạng Khả năng mở rộng là một trong những tính năng của PostgreSQL đó là nó có thể được mở rộng Nếu với những gì mà PostgreSQL cung cấp mà bạn vẫn chưa hài lòng, bạn có thể thêm vào PostgreSQL những gì của bạn Ví dụ, bạn có thể thêm vào kiểu dữ liệu mới, hàm và toán tử mới và các thủ tục mới

2.3.1 Cài đặt Java

Trang 34

Chọn đường dẫn chưa file cài đặt :

Trang 35

Hoàn tất quá trình cài đặt

2.3.2 Cài đặt Apache Ant, Apache Maven

Trang 36

Tạo thư mục ANT trong ổ đĩa C, giải nén copy Apache Ant vào thư mục ANT vừa tạo

Tạo thư mục MAVEN trong ổ đĩa C, giải nén và copy Apache Maven vào thư mục MAVEN vừa tạo

Trang 37

Tạo đường dẫn

Chuột phải vào My computer  Properties

Trang 38

Chọn Advanced system settings

Trong hộp thoại System Properties chọn Environment Variables

Chọn Path và thêm vào chuỗi sau :

C:\Program Files\Java\jdk1.6.0_24\bin; C:\ANT\bin; C:\MAVEN\bin

Trang 39

Vào New tạo biến mới ANT_HOME với đường dẫn: C:\ANT

Tiếp tục tạo biến mới JAVA_HOME với đường dẫn: C:\Program Files\Java\jdk1.6.0_24

Trang 40

Tạo biến mới MVN_HOME với đường dẫn C:\MAVEN

Tạo biến mới JAVA_OPTS với giá trị : -Dfile.encoding=UTF-8

Kiểm tra phiên bản

Vào Run  cmd

Phiên bản Java : gõ java -version

Ngày đăng: 22/04/2021, 23:34

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
1. Nguyễn Huy Chương, Nguyễn Tiến Hùng (2011), “Dspace - Giải pháp tạo lập, lưu trữ và phổ biến tài nguyên điện tử cho các thư viện ở Việt Nam”. Hội nghị - Hội thảo xây dựng và chia sẻ nguồn lực thông tin địa phương dạng số phục vụ bảo tồn di sản. Nxb Đại học Quốc gia Hà Nội, Hà Nội, tr. 100-107 Sách, tạp chí
Tiêu đề: Dspace - Giải pháp tạo lập, lưu trữ và phổ biến tài nguyên điện tử cho các thư viện ở Việt Nam”". Hội nghị - Hội thảo xây dựng và chia sẻ nguồn lực thông tin địa phương dạng số phục vụ bảo tồn di sản
Tác giả: Nguyễn Huy Chương, Nguyễn Tiến Hùng
Nhà XB: Nxb Đại học Quốc gia Hà Nội
Năm: 2011
2. Phan Ngọc Đông (2012), “Dspace – Giải pháp xây dựng thư viện số” , Tạp chí Thư viện Việt Nam, 3(35), tr, 39-41 Sách, tạp chí
Tiêu đề: Dspace – Giải pháp xây dựng thư viện số” , "Tạp chí Thư viện Việt Nam
Tác giả: Phan Ngọc Đông
Năm: 2012
3. Phan Ngọc Đông (2014), “ Kinh nghiệm triển khai sử dụng phần mềm nguồn mở Dspace trong xây dựng các bộ sưu tập nội sinh tại trung tâm thông tin – thư viện trường Đại học Đà Lạt”. Tham luận trong Hội thảo khoa học: Thư viện hướng đến tương lai: Hợp tác, tiến bộ và phát triển Sách, tạp chí
Tiêu đề: Phan Ngọc Đông (2014), “ Kinh nghiệm triển khai sử dụng phần mềm nguồn mở Dspace trong xây dựng các bộ sưu tập nội sinh tại trung tâm thông tin – thư viện trường Đại học Đà Lạt”
Tác giả: Phan Ngọc Đông
Năm: 2014
4. Phan Ngọc Đông (2014), “Ứng dụng phần mềm Dspace phiên bản 4.0 trong xây dựng thư viện số”, Tạp chí Thư viện Việt Nam, 4(48), tr. 31-33 Sách, tạp chí
Tiêu đề: Ứng dụng phần mềm Dspace phiên bản 4.0 trong xây dựng thư viện số”, "Tạp chí Thư viện Việt Nam
Tác giả: Phan Ngọc Đông
Năm: 2014
5. Phan Ngọc Đông (2014), “Ứng dụng phần mềm mã nguồn mở Dspace trong xây dựng thư viện số ở các trường đại học và cao đẳng”. Hội thảo khoa học:Hoạt động thông tin – thư viện với vấn đề đổi mới căn bản và toàn diện giáo dục đại học Việt Nam. Nxb Đại học Quốc gia Hà Nội, Hà Nội, tr. 404-412 Sách, tạp chí
Tiêu đề: Ứng dụng phần mềm mã nguồn mở Dspace trong xây dựng thư viện số ở các trường đại học và cao đẳng”. "Hội thảo khoa học: "Hoạt động thông tin – thư viện với vấn đề đổi mới căn bản và toàn diện giáo dục đại học Việt Nam
Tác giả: Phan Ngọc Đông
Nhà XB: Nxb Đại học Quốc gia Hà Nội
Năm: 2014
6. Nguyễn Mạnh Hùng (2006), “Thư viện số với hệ thống nguồn mở”. Bản tin thư viện công nghệ thông tin, 8/2006 Sách, tạp chí
Tiêu đề: Nguyễn Mạnh Hùng (2006), “Thư viện số với hệ thống nguồn mở”
Tác giả: Nguyễn Mạnh Hùng
Năm: 2006
7. Nguyễn Tuyến (2004), “Biên mục Phần mềm thư viện số DSpace (DSpace Cataloguing)”. Bản tin Thư viện - Công nghệ thông tin tháng 10/2004.8. http:// dspace.org Sách, tạp chí
Tiêu đề: Biên mục Phần mềm thư viện số DSpace (DSpace Cataloguing)”. "Bản tin Thư viện - Công nghệ thông tin tháng 10/2004
Tác giả: Nguyễn Tuyến
Năm: 2004

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w