Hiện nay có rất nhiều phần mềm hỗ trợ cho việc xây dựng bộ sưu tập số như Greenstone, Eprint, Feroda, Invenio,Omeka,…Tuy nhiên, thư viện trường Đại học Khoa học Xã hội và Nhân văn lại ch
Trang 1ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC KHOA HỌC XÃ HỘI VÀ NHÂN VĂN KHOA/BỘ MÔN: THƯ VIỆN – THÔNG TIN HỌC
CÔNG TRÌNH NGHIÊN CỨU KHOA HỌC SINH VIÊN
CẤP TRƯỜNG NĂM 2015
Tên công trình:
XÂY DỰNG THƯ VIỆN SỐ TRÊN NỀN TẢNG PHẦN MỀM MÃ
NGUỒN MỞ DSPACE
Sinh viên thực hiện:
Chủ nhiệm: Phạm Thị Kim Chi, Lớp TV-TT K27, Khóa 2011-2015
Thành viên: Trần Thị Thúy Vy, Lớp TV-TT K27, Khóa 2011-2015
Người hướng dẫn: Thạc sĩ Nguyễn Thanh Huy
Trang 2MỤC LỤC
MỞ ĐẦU 1
CHƯƠNG 1: TỔNG QUAN VỀ PHẦN MỀM MÃ NGUỒN MỞ DSPACE 8
1.1 Các khái niệm liên quan 8
1.1.1 Khái niệm thư viện số 8
1.1.2 Khái niệm số hóa – bộ sưu tập số 8
1.1.3 Khái niệm phần mềm mã nguồn mở 9
1.2 Giới thiệu về phần mềm mã nguồn mở DSpace 9
1.2.1 Bối cảnh ra đời của phần mềm mã nguồn mở DSpace 9
1.2.2 Tình hình ứng dụng phần mềm mã nguồn mở DSpace trên thế giới và ở Việt Nam 10
1.2.3 Các khái niệm liên quan đến phần mềm mã nguồn mở DSpace và các tính năng nổi bật của phần mềm DSpace 11
CHƯƠNG 2: CÀI ĐẶT PHẦN MỀM MÃ NGUỒN MỞ DSPACE 25
2.1 Cấu hình máy tính 25
2.2 Giới thiệu về các phần mềm cần thiết để có thể cài đặt DSpace 25
2.2.1 Phần mềm Java 25
2.2.2 Phần mềm Apache Maven 26
2.2.3 Phần mềm Apache Ant 26
2.2.4 Phần mềm Apache Tomcat 27
2.2.5 PostgreSQL 28
2.3 Cài đặt phần mềm DSpace 29
CHƯƠNG 3: KẾT QUẢ THỰC NGHIỆM VỀ CÁC CHỨC NĂNG ĐƯỢC SỬ DỤNG TRONG DSPACE 53
3.1 Các chức năng của quản trị 53
3.1.1 Đăng nhập 53
3.1.2 Thêm thành viên 54
3.1.3 Thêm nhóm 56
3.1.4 Đưa tài liệu vào DSpace 58
3.2 Cài đặt cấu hình giao diện tiếng Việt cho DSpace 72
CHƯƠNG 4: NHẬN XÉT PHẦN MỀM MÃ NGUỒN MỞ DSPACE 76
4.1 Nhận xét ưu điểm và hạn chế của phần mềm DSpace 76
4.1.1 Ưu điểm 76
Trang 34.1.2 Hạn chế 77
4.2 So sánh phần mềm DSpace với phần mềm Greenstone 77
KẾT LUẬN 79
KIẾN NGHỊ 80
Trang 4MỞ ĐẦU
Xã hội ngày càng phát triển dẫn đến nhiều ngành nghề cũng phát triển theo như khoa học, công nghệ, kỹ thuật … và thư viện - thông tin cũng không nằm ngoài quy luật đó Trên đà phát triển thì ngày càng có nhiều loại hình tài liệu phong phú hơn cung cấp cho người dùng tin, theo đó số lượng tài liệu cũng tăng lên một cách nhanh chóng Điều đó tạo điều kiện rất lớn cho mọi người có thể tiếp xúc được nhiều tài liệu hơn, từ đó biết được nhiều thông tin hơn, phục vụ cho nhu cầu học tập, giảng dạy, …
Tuy nhiên việc phát triển số lượng tài liệu theo cấp số nhân đã gây ra một trở ngại không nhỏ cho việc lưu trữ cũng như bảo quản tài liệu Từ đó dẫn đến yêu cầu bắt buộc thư viện phải có cách thức lưu trữ và bảo quản cùng một lúc một số lượng lớn tài liệu, một cách khoa học để khi người dùng tin có nhu cầu không phải “bơi” trong một
“biển” tài liệu Thực tế cho thấy diện tích kho lưu trữ của hầu hết các thư viện thì luôn
có hạn, khi đó việc số hóa tài liệu cũng như xây dựng thư viện số để lưu trữ, bảo quản
và phục vụ nhu cầu ngày càng cao của người dùng tin là một yêu cầu khách quan có ý nghĩa quan trọng
Việc xây dựng thư viện số với các tài liệu được số hóa không chỉ là cách có thể lưu trữ và bảo quản tốt một số lượng lớn tài liệu mà còn có thể chia sẻ, dùng chung với các thư viện trong nước, trong khu vực thậm chí trên thế giới Thêm vào đó thư viện số
sẽ là một kho thông tin số khổng lồ có tổ chức với các dịch vụ liên kết qua mạng để người dùng tin có thể truy cập ở mọi nơi
Để thư viện có thể làm tốt được việc xây dựng thư viện số thì trước hết cần phải
có 1 phần mềm để hỗ trợ xây dựng bộ sưu tập số để lưu giữ và bảo quản tốt các tài liệu
đã được số hóa Hiện nay có rất nhiều phần mềm hỗ trợ cho việc xây dựng bộ sưu tập
số như Greenstone, Eprint, Feroda, Invenio,Omeka,…Tuy nhiên, thư viện trường Đại học Khoa học Xã hội và Nhân văn lại chưa có đủ điều kiện về tài chính để có thể mua
và sử dụng các phần mềm thương mại, nên việc sử dụng các phần mềm mã nguồn mở
là giải pháp tối ưu nhất với các ưu điểm như:
Trang 5 Miễn phí phần mềm bản quyền ( Hệ điều hành, Cơ sở dữ liệu, Phần mềm thư viện)
Cho phép người dùng sử dụng theo bất kỳ mục đích nào
Cộng đồng phát triển và hỗ trợ trên khắp thế giới
Dễ dàng tùy biến, phát triển theo nhu cầu, được phép nghiên cứu và sửa đổi
Được phép sao chép và tái phát hành phần mềm gốc, hoặc phần mềm đã sửa đổi
mà không phải trả tiền cho những người lập trình trước đó
Liên tục được cập nhật
100% theo chuẩn quốc tế
Dễ dàng kết nối, liên kết với các phần mềm ứng dụng khác
Đẩy đủ các tính năng mới nhất của thư viện
Do những ưu điểm nổi bật mà phần mềm mã nguồn mở mang lại cũng như tính thương mại của nó mà việc ứng dụng phần mềm mã nguồn mở để phát triển thư viện
số là cần thiết và khách quan
Từ lúc phần mềm mã nguồn mở DSpace được HP Labs (Công ty Packard) và Thư viện MIT (Massachusetts Institute of Technology) phát hành và giới thiệu trên thế giới, ở Việt Nam đã có một số đề tài nghiên cứu về phần mềm mã nguồn
Hewlett-mở DSpace như đề tài "Xây dựng thư viện số Học viện Báo chí và Tuyên truyền bằng phần mềm DSpace", đề tài “Xây dựng thư viện số sử dụng phần mềm mã nguồn mở DSpace” của trường Đại học Dân lập Hải Phòng,…
Tuy nhiên, chưa có một đề tài nghiên cứu cụ thể nào được nghiên cứu từ góc nhìn là cán bộ thư viện, là sinh viên ngành thư viện – thông tin học, đa số các đề tài trên được nghiên cứu từ góc nhìn công nghệ thông tin
Hiện tại trường Đại học Khoa học Xã hội và Nhân Văn – Đại học Quốc gia Hồ Chí Minh nói chung và khoa Thư viện thông tin học nói riêng chưa có công trình nghiên cứu nào về đề tài này
Trang 63.1 Lý do chọn đề tài
Như chúng ta đã biết, để xây dựng và quản lý tốt nguồn tài nguyên số đã số hóa của thư viện thì mỗi thư viện cần phải có một phần mềm để hỗ trợ cho việc này, hiện nay, ở thư viện trường Đại học Khoa học Xã hội và Nhân văn cũng như một số đơn vị khác đang sử dụng phần mềm mã nguồn mở Greenstone
Phần mềm Greenstone có rất nhiều ưu điểm như: có thể truy cập rộng rãi qua một trình duyệt Web chuẩn; có thể sử dụng trên nhiều hệ điều hành khác nhau như Windows, Unix/ Linux và Mac OS-X; đa ngôn ngữ với 60 ngôn ngữ khác nhau; tìm kiếm toàn văn nhanh chóng, tìm lướt linh hoạt; tương thích với giao thức Z39.50 hỗ trợ việc truy cập máy chủ bên ngoài cũng như giới thiệu bộ sưu tập của thư viện cho người sử dụng bên ngoài…
Tuy nhiên phần mềm Greenstone còn tồn tại quá nhiều hạn chế khó có thể khắc phục được như: Khả năng tùy biến giao diện kém; cách thức quản lý tài liệu số chưa linh hoạt, khả năng phân quyền đối với bộ sưu tập và từng tài liệu hạn chế; đối với các các thư viện có số lượng tài liệu nhiều thì Greenstone không hỗ trợ tốt;…
Chính vì lẽ đó, mà hiện nay ở nước ta đã có hơn 40 đơn vị chuyển đổi từ phần mềm Greenstone sang phần mềm DSpace như Thư viện Trung tâm Đại học Quốc gia
Hồ Chí Minh, Thư viện trường Đại học An Giang, Trung tâm thông tin Đại học Đà Nẵng, Trung tâm thông tin thư viện Đại học Quốc gia Hà Nội,…
Đây là phần mềm có thể khắc phục được hầu hết những khuyết điểm của Greenstone như: khả năng tùy chỉnh giao diện cao; khi cần bổ sung tài liệu vào bộ sưu tập không phải xây dựng lại từ đầu như Greenstone; cấu trúc bộ sưu tập trong DSpace được tổ chức khoa học hơn Greenstone; đáp ứng tốt hơn nếu thư viện có số lượng tài liệu lớn; đặc biệt DSpace có khả năng phân quyền mạnh có thể phân quyền đến từng tài khoản người dùng, đến từng bộ sưu tập thậm chí là từng tài liệu,…
Do đó điều cần thiết của đề tài này là xây dựng được một thư viện số dựa trên nền tảng phần mềm mã nguồn mở DSpace, từ đó có thể ứng dụng phần mềm này để từng bước thay đổi, khắc phục những hạn chế của phần mềm Greenstone để có thể hội nhập với xu hướng chung của thế giới
Trang 73.2 Mục tiêu của đề tài
Mục tiêu của đề tài nghiên cứu này là tìm hiểu tình hình nghiên cứu, xây dựng
và sử dụng các phần mềm mã nguồn mở nói chung trong các Trung tâm Thông tin - Thư viện ở Việt Nam hiện nay Quan trọng hơn đó là việc tìm hiểu về phần mềm mã nguồn mở DSpace, nghiên cứu những tính năng nổi bật của phần mềm DSpace so với các phần mềm khác cùng loại, từ đó từng bước đơn giản hóa cách ứng dụng phần mềm
mã nguồn mở DSpace vào hoạt động của thư viện cũng như các hoạt động về thông tin thư viện
Thêm vào đó, một mục tiêu không kém phần quan trọng đó là ứng dụng DSpace để phát triển một bộ sưu tập cụ thể từ đó đưa ra hướng ứng dụng, đề xuất, kiến nghị để đưa phần mềm DSpace vào hoạt động, phục vụ cho nhu cầu của trường Đại học Khoa học Xã hội và Nhân văn trước tiên và sau đó nó có thể làm tiền đề để ứng dụng rộng rãi cho những thư viện khác nhằm nâng cao hoạt động Thông tin - Thư viện, xây dựng một thư viện số hiện đại, hướng tới chuẩn chung của thư viện số trên thế giới, góp phần đưa lĩnh vực Thư viện - thông tin hội nhập với các quốc gia khác trên thế giới
Nhiệm vụ nghiên cứu lý luận: Phải làm rõ được các khái niệm có liên quan đến
đề tài như thư viện số, bộ sưu tập số, vv , các tính năng nổi bật của phần mềm DSpace so với những phần mềm khác cùng chức năng cũng như những lợi ích mà thư viện có được khi ứng dụng phần mềm này
Nhiệm vụ thực tiễn: Cài đặt thành công phần mềm mã nguồn mở DSpace, sau
đó dùng chính phần mềm này để xây dựng 1 thư viện số bằng một bộ sưu tập cụ thể,
mà nó có thể được ứng dụng ở thư viện trường Đại học Khoa học Xã hội và Nhân văn, nhằm khắc phục những khuyết điểm của phần mềm trước đó để lại
4.1 Phương pháp phân tích
Phương pháp nghiên cứu tài liệu
Trang 8Phương pháp xử lý thông tin
Phương pháp thực nghiệm
4.2 Phương pháp luận
Nghiên cứu các tài liệu liên quan trên cơ sở đó phân tích, tổng hợp, hệ thống hóa và khái quát hóa những thông tin thu được Trên cơ sở đó viết lý luận cho đề tài, lựa chọn các phương pháp nghiên cứu thực tiễn, phục vụ cho việc nghiên cứu
Đối tượng nghiên cứu của đề tài là phần mềm mã nguồn mở DSpace và cách ứng dụng nó để xây dựng 1 bộ sưu tập số cụ thể
Phạm vi nghiên cứu của đề tài là các bộ sưu tập số của thư viện trường Đại học Khoa học Khoa học Xã hội và Nhân văn
Khi nghiên cứu đề tài này nhóm chúng em mong muốn rằng nó sẽ có những đóng góp nhất định cho thư viện trường Đại học Khoa học Xã hội và Nhân Văn như
có thể xây dựng được một thư viện số dựa trên nền tảng phần mềm mã mở DSpace, có thể tùy chỉnh trong việc sử dụng phần mềm này, cũng như có một cái nhìn đơn giản hơn về việc xây dựng thư viện số từ đó có thể chủ động hơn trong các hoạt động nghiệp vụ của mình
Ý nghĩa thực tiễn của đề tài: Nhấn mạnh vai trò và nâng cao giá trị của thư viện
số, góp phần đưa thư viện số đến gần hơn với người dùng tin, nhằm tăng cường, quảng
bá, giới thiệu nguồn tài nguyên số đến với người dùng tin một cách nhanh nhất và hiệu quả nhất Ngoài ra việc nghiên cứu thành công đề tài này còn giúp Thư viện trường Đại học Khoa học Xã hội và Nhân văn giảm đáng kể chi phí để trang bị phần mềm Thêm vào đó, việc ứng dụng đề tài sẽ giúp thư viện tăng cường liên thông, liên kết, chia sẻ nguồn tài liệu số giữa các đơn vị với nhau ngày càng thuận lợi hơn
Trang 9Chương 1: Tổng quan về phần mềm mã nguồn mở DSpace
1.1 Các khái niệm liên quan
1.1.1 Khái niệm thư viện số
1.1.2 Khái niệm số hóa – bộ sưu tập số
1.1.3 Khái niệm phần mềm mã nguồn mở
1.2 Giới thiệu về phần mềm mã nguồn mở DSpace
1.2.1 Bối cảnh ra đời của phần mềm mã nguồn mở DSpace
1.2.2 Tình hình ứng dụng phần mềm mã nguồn mở DSpace trên thế giới và ở Việt Nam
1.2.3 Các khái niệm liên quan đến phần mềm mã nguồn mở DSpace và các tính năng nổi bật của phần mềm DSpace
Chương 2: Cài đặt phần mềm mã nguồn mở DSpace
Chương 3: Kết quả thực nghiệm về các chức năng được sử dụng trong DSpace
3.1 Các chức năng quản trị sử dụng trong DSpace
3.1.1 Đăng nhập
Trang 103.1.4.3 Thêm quyền hạn cho Bộ sưu tập
3.1.4.4 Thêm tài liệu
3.2 Cài đặt cấu hình giao diện tiếng Việt cho DSpace
Chương 4: Nhận xét phần mềm mã nguồn mở DSpace
4.1 Nhận xét ưu điểm và hạn chế của phần mềm DSpace
4.2 So sánh phần mềm DSpace với phần mềm Greenstone
KẾT LUẬN
KIẾN NGHỊ
Trang 11CHƯƠNG 1: TỔNG QUAN VỀ PHẦN MỀM MÃ NGUỒN MỞ DSPACE
1.1.1 Khái niệm thư viện số
Hiện nay, thư viện số đã là một thuật ngữ không còn xa lạ với rất nhiều người thế nên nó cũng có rất nhiều khái niệm
"Thư viện số là cơ quan/tổ chức có các nguồn lực, kể cả các nguồn nhân lực chuyên hoá, để lựa chọn, cấu trúc việc truy cập đến diễn giải, phổ biến, bảo quản sự toàn vẹn, đảm bảo sự ổn định trong thời gian dài của sưu tập các công trình số hoá mà chúng ở dạng sẵn sàng để sử dụng một cách kinh tế cho một hoặc một số cộng đồng nhất định." - Liên đoàn Thư viện Hoa Kỳ
Hay theo Arms W.Y : “Thư viện số là một kho thông tin có quản lý với các dịch vụ liên kết, trong đó thông tin được lưu trữ ở dạng số và có thể truy cập qua một mạng.”
Hoặc, “Thư viện số là thuật ngữ được chấp nhận rộng rãi như sự mô tả việc sử dụng công nghệ số của thư viện để thu thập, lưu trữ, bảo tồn và cung cấp sự truy cập đến thông tin" - Trung tâm Nghiên cứu và đổi mới thư viện Anh
Tóm lại, Thư viện số là nơi trình bày những bộ sưu tập thông tin có tổ chức Đối tượng của những bộ sưu tập đó là nguồn tài nguyên thông tin số hóa cùng với các phương thức: truy hồi, chọn lọc, truy cập, tổ chức và bảo trì bộ sưu tập đó Ngoài ra, thư viện số là một kho thông tin số khổng lồ có tổ chức với các dịch vụ liên kết qua mạng
1.1.2 Khái niệm số hóa – bộ sưu tập số
Số hóa tài liệu là quá trình chuyển các dạng dữ liệu/tài liệu truyền thống như các bản viết tay, bản in trên giấy, hình ảnh, âm thanh, phim, dữ liệu toàn văn với nhiều định dạng khác nhau sang dữ liệu trên máy tính và được máy tính nhận biết được như tài liệu ban đầu Hay nói cách khác số hoá tài liệu là hình thức chuyển đổi các tài liệu truyền thống bên ngoài thành dạng tài liệu số mà máy tính có thể hiểu được Sản phẩm sau khi số hóa tài liệu chính là nguồn tài nguyên số/dữ liệu số - các dữ liệu dạng chữ,
Trang 12hình ảnh, âm thanh được máy tính nhận biết đúng định dạng và được sử dụng trên máy tính
Từ đó ta có khái niệm:
Bộ sưu tập số là một tập hợp có tổ chức nhiều tài liệu đã được số hoá dưới nhiều hình thức khác nhau (văn bản, hình ảnh, Audio, Video…) về một chủ đề Mặc dù mỗi loại hình tài liệu có sự khác nhau về cách thể hiện, nhưng nó đều cung cấp một giao diện đồng nhất mà qua đó các tài liệu có thể truy cập, tìm kiếm và sử dụng dễ dàng
1.1.3 Khái niệm phần mềm mã nguồn mở
Phần mềm mã nguồn mở là phần mềm với mã nguồn được công bố và sử dụng một giấy phép nguồn mở Giấy phép này cho phép bất cứ ai cũng có thể nghiên cứu, thay đổi và cải tiến phần mềm và phân phối phần mềm ở dạng chưa thay đổi hoặc đã thay đổi Người sử dụng phần mềm được có các quyền vốn bị cấm bởi bản quyền, gồm các quyền về sử dụng, thay đổi và tái phân phối
1.2.1 Bối cảnh ra đời của phần mềm mã nguồn mở DSpace
Tháng 3 năm 2000, Công ty Hewlett-Packard (HP) đã trao tặng 1.800.000 USD cho Thư viện MIT (Massachusetts Institute of Technology) trong khuôn khổ một chương trình hợp tác 18 tháng để xây dựng thư viện số DSpace, một kho lưu trữ năng động các định dạng kỹ thuật số các tài nguyên tri thức của các tổ chức nghiên cứu đa ngành Một tháng sau khi giới thiệu, ngày 4/11/2000, HP Labs và Thư viện MIT đã phát hành trên toàn thế giới hệ thống DSpace theo các điều khoản của giấy phép mã nguồn mở như là một dịch vụ mới của thư viện MIT
Là một hệ thống mã nguồn mở, DSpace miễn phí cho các tổ chức khác để sử dụng, sửa đổi và mở rộng theo các yêu cầu của họ để đáp ứng nhu cầu của từng tổ chức DSpace ra đời là một nỗ lực để giải quyết một số vấn đề mà giảng viên của MIT
đã gặp phải trong những năm qua Khi giảng viên và các nhà nghiên cứu khác phát triển các tài liệu nghiên cứu và các ấn phẩm học thuật trong các định dạng kỹ thuật số ngày càng phức tạp, có một nhu cầu để thu thập, bảo quản và phân phối chúng: một
Trang 13công việc tốn thời gian và tốn kém cho các giảng viên cá nhân và các phòng ban của
họ, phòng thí nghiệm, và các trung tâm DSpace cung cấp một cách để quản lý các tài liệu nghiên cứu và các ấn phẩm trong một kho lưu trữ chuyên nghiệp để duy trì, cung cấp cho họ khả năng hiển thị lớn hơn và khả năng tiếp cận theo thời gian Đầu tiên DSpace được xây dựng theo hướng tiếp cận bề rộng: nó hỗ trợ tất cả các chức năng mà một tổ chức nghiên cứu cần có: một dịch vụ tạo lập tài nguyên số, kho lưu trữ tài nguyên số bằng một cách đơn giản nhất có thể với mục tiêu sẽ được ngay lập tức hữu ích tại MIT, dần dần có thể được mở rộng và cải thiện theo thời gian, và có thể phục
vụ như một nền tảng cho các nghiên cứu trong tương lai
1.2.2 Tình hình ứng dụng phần mềm mã nguồn mở DSpace trên thế giới và ở Việt Nam
Hiện nay đã có hơn 1000 Trường Đại học, Cao đẳng và các tổ chức văn hóa sử dụng DSpace để quản lý và chia sẻ nguồn tài nguyên: sách, tạp chí, luận văn, bộ sưu tập hình ảnh, âm thanh,……
Các đơn vị đã đưa DSpace vào sử dụng :
Trong nước :
1) Thư viện Đại học Quốc Gia Thành phố Hồ Chí Minh
2) Trường Đại học Đà Lạt ( đơn vị đầu tiên Việt hóa phần mềm DSpace )
3) Thư viện Trung tâm Đại học Quốc Gia Hà Nội
4) Liên hiệp thư viện Nam Trung Bộ - Tây Nguyên
5) Thư viện Đại học Công nghiệp Thành phố Hồ Chí Minh
6) Trung tâm Thông tin – thư viện Đại học Nguyễn Tất Thành
7) …
Thế giới :
1) University of Sydney (Australia/New Zealand)
Trang 142) Webinito Networks ( India )
3) Umm Alqura University (Saudi Arabia)
4) National University of Singapore (Singapore)
5) University of Stellenbosch ( South Africa )
6) Arvo Consultores (Spain)
7) Shinawatra University (Thailand)
8) Sumy State University (Ukraine)
9) University of Michigan ( United States )
10) University of Hawaii ( United States )
11) …
1.2.3 Các khái niệm liên quan đến phần mềm mã nguồn mở DSpace và các tính năng nổi bật của phần mềm DSpace
DSpace là nền tảng của một phần mềm mã nguồn mở, nó có thể tổ chức:
o Chụp và mô tả tài liệu số bằng một quy trình làm việc và có nhiều lựa chọn các chương trình đưa vào
o Phân phối và tổ chức nguồn tài nguyên số trên mạng qua hệ thống tìm kiếm và truy hồi
o Bảo quản nguồn tài nguyên số trong thời gian dài
1.2.3.1 Mô hình dữ liệu (Data Model)
Mô hình dữ liệu là cách dữ liệu được tổ chức trong DSpace, phản ánh cấu trúc của sự tổ chức sử dụng trong DSpace
DSpace được thiết kế để tạo thuận lợi cho các cá nhân có thể đóng góp các tài nguyên số vào hệ thống một cách dễ dàng Mô hình thông tin của hệ thống được xây dựng xung quanh ý tưởng “Communities” tổ chức các đơn vị trực thuộc của một tổ chức nghiên cứu, một trường đại học có nhu cầu quản lý thông tin đặc biệt Mỗi
Trang 15“communities” có thể thích ứng với hệ thống để đáp ứng các nhu cầu cụ thể của đơn vị
và quản lý quá trình nộp các xuất bản phần mềm điện tử Cấu trúc tổ chức dữ liệu trong hệ thống của DSpace phụ thuộc vào cấu trúc loại hình của cơ quan thông tin khác nhau
o Cộng đồng: Là các khối (Có thể là trường học, phòng ban, hoặc các trung tâm,
các cơ quan thông tin , tổ chức , cá nhân ), ngoài ra tùy thuộc loại hình tổ chức khác nhau có thể phân thêm ra các khối phụ (sub-community)
Mỗi Cộng đồng có thể bao gồm:
Cộng đồng con (Sub-communities)
Không giới hạn các Bộ sưu tập (Collection)
o Bộ sưu tập: Có thể là một chủ đề, một thư mục chứa nhiều tài liệu, các bộ sưu
tập được các tổ chức tạo lập lưu trữ và đưa vào phục vụ, sử dụng
Mỗi Bộ sưu tập có thể có các quyền truy cập và dòng xử lý công việc khác nhau
o Item : là thành phần thuộc sở hữu của bộ sưu tập và được quản lí bởi chính bộ
sưu tập đó Bao gồm các yếu tố cơ bản của việc lưu trữ, hình thức của tài liệu
có trong bộ sưu tập
o Bundle : là các yếu tố thuộc Item chứa các tập hợp các thuộc tính về lưu trữ
o Bitstream – Bitstream format : Quy định các định dạng mà phải tuân theo trong
hệ thống và có các cấp độ hỗ trợ khác nhau
Ví dụ các thành phần của một mô hình dữ liệu DSpace :
Community : Thư viện thiếu nhi Cá Chép
Bộ sưu tập : Các tuyển tập về Doraemon
Item : video , nhạc , truyện sách điện tử
Bundle : nhóm HTML, các thành phần định dạng hình ảnh
Bitstream : các dữ liệu HTML lẻ, định dạng file ảnh, nguồn dữ liệu
Bitstream Format :định dạng PNG, Adobe Reader
Trang 161.2.3.2 Metadata (siêu dữ liệu)
DSpace sử dụng siêu dữ liệu chuẩn Dublin core để mô tả các thông tin về tài nguyên điện tử cần lưu trữ, phân phối Trong đó có 3 yếu tố (thông tin) bắt buộc phải
mô tả: Nhan đề, ngôn ngữ, ngày đăng, tất các yếu tố còn lại là tùy chọn Ngoài ra, có một số các yếu tố bổ sung cho tài liệu: tóm tắt, từ khóa, siêu dữ liệu kỹ thuật và siêu
dữ liệu quyền Các siêu dữ liệu này được hiển thị trong biểu ghi của tài liệu trong hệ thống DSpace và được lập chỉ mục để hỗ trợ tìm kiếm, duyệt thông tin trong hệ thống (duyệt theo Bộ sưu tập, theo chủ đề, theo các đơn vị thành viên của tổ chức…) Hệ thống hỗ trợ kết xuất siêu dữ liệu và tài liệu điện tử trong kho lưu trữ theo dạng chuẩn XML, và hiện đang phát triển để hỗ trợ chuẩn METS đối với các siêu dữ liệu kỹ thuật
và siêu dữ liệu quyền cho các định dạng kỹ thuật số tùy ý
Có 3 loại siêu dữ liệu về nội dung lưu trữ:
o Siêu dữ liệu mô tả :
DSpace có thể hỗ trợ nhiều lược đồ siêu dữ liệu phẳng để mô tả một mục
Có thể cấu hình nhiều lược đồ và chọn các lĩnh vực siêu dữ liệu từ hỗn hợp các lược
đồ cấu hình để mô tả các mục của bạn
Siêu dữ liệu mô tả về các mục khác (ví dụ như siêu dữ liệu mô tả trong một sơ đồ phân cấp) có thể được tổ chức tại bitstreams Khối và các bộ sưu tập có một số siêu dữ liệu
mô tả đơn giản (một cái tên, và một số văn xuôi mô tả), được tổ chức trong DBMS
o Siêu dữ liệu quản trị :
Bao gồm siêu dữ liệu bảo quản, nguồn gốc và chính sách cấp phép dữ liệu Hầu hết trong số này được tổ chức trong lược đồ quan hệ DBMS của DSpace
Siêu dữ liệu nguồn gốc được lưu trữ trong hồ sơ Dublin Core Ngoài ra, một số siêu dữ liệu hành chính khác (ví dụ, kích thước byte bitstream và các loại MIME) được tái bản trong hồ sơ Dublin Core để nó dễ dàng có thể truy cập trong DSpace
o Siêu dữ liệu cấu trúc :
Trang 17Bao gồm thông tin về item hiện tại, bitstream trong item, người sử dụng , mối quan hệ giữa các cấu tạo trong item
Ví dụ: Một luận văn được hình thành bằng nhiều hình ảnh định dạng TIFF, mỗi hình ảnh là một trang luận văn Cấu trúc siêu dữ liệu sẽ bao gồm mỗi hình ảnh là 1 trang duy nhất và thứ tự các hình ảnh đó
o Một plugin được xác định bởi một giao diện java
o Người sử dụng yêu cầu sử dụng plugin qua giao diện của nó
o Mediafilter là một ví dụ đơn giản của một plugin
1.2.3.3.1 Plugins Package (Plugins “đóng gói”)
Đóng gói là mô-đun phần mềm dịch giữa đối tượng trong DSpace và đại diện bên ngoài khép kín, hay "đóng gói"
Một gói thường là một tập tin lưu trữ như một tập tin zip hoặc "tar", bao gồm một tài liệu biểu hiện, trong đó có siêu dữ liệu và mô tả nội dung gói IMS Content Package là một tiêu chuẩn đóng gói điển hình Một gói phần mềm cũng có thể là một tài liệu duy nhất hoặc phương tiện truyền thông tập tin có chứa siêu dữ liệu riêng của mình, chẳng hạn như một tài liệu PDF có kèm siêu dữ liệu mô tả
Hầu hết các plugin đóng gói sử dụng plugin Crosswalk để dịch các siêu dữ liệu giữa các mô hình đối tượng DSpace và các định dạng gói
1.2.3.3.2 Plugins Crosswalk
Plugins Crosswalk là mô-đun phần mềm dịch giữa siêu dữ liệu DSpace và một đại diện bên ngoài cụ thể
Trang 18Ví dụ, một Plugins Crosswalk MODS dịch siêu dữ liệu mô tả từ các định dạng MODS sang các trường siêu dữ liệu trên DSpace Item=> tạo ra một tài liệu MODS từ các siêu dữ liệu trên DSpace Item
Nó rất dễ dàng để thêm Plugins Crosswalk mới
Ngoài ra còn có một cặp đặc biệt của plugin Crosswalk mà sử dụng XSL stylesheets để dịch các siêu dữ liệu bên ngoài vào hoặc từ một định dạng DSpace nội
bộ Có thể thêm và sửa đổi plugin Crosswalk XSLT đơn giản bằng cách chỉnh sửa cấu hình DSpace và các stylesheets, được lưu trữ trong các tập tin trong thư mục cài đặt DSpace
Các plugin Packager và máy chủ OAH-PMH sử dụng các plugin Crosswalk
1.2.3.4 Người sử dụng và nhóm (E-People and Groups)
Có một số các chức năng của DSpace chỉ có sẵn cho một số người sử dụng "đặc quyền" Người sử dụng và các nhóm là cách xác định người dùng ứng dụng DSpace với mục đích đặc quyền được cấp
Người sử dụng: chứa các thông tin về mỗi người sử dụng như địa chỉ email, tên, mật khẩu…: Dùng để chỉ chung cho những người sử dụng website
Một thành viên có thể có các quyền sau:
o Người dùng bình thường (normal user)
o Người quản trị (administrators)
o Người đăng tải tài liệu (submitters)
o Người đăng ký (subscribers)
o Người tham gia tiến trong trình công việc (submission workflow participants) Trở thành thành viên theo hai cách:
o Người quản trị tạo tài khoản đăng nhập cho thành viên
o Người dùng tự đăng ký và xác nhận thông tin qua tài khoản email đã đăng ký
Trang 19Nhóm: là một danh sách các người sử dụng được cấp quyền truy cập vào hệ thống
ủy quyền: Nhóm đại diện cho các thành viên có cùng quyền hạn –những người được phép thực hiện một số chức năng trên bộ sưu tập Nhóm có thể là:
o Nhóm người quản lí thư viện
o Nhóm sinh viên
o Nhóm những người xem xét lại các tài liệu
o Nhóm vô danh – chưa xác định (Anonymous) là tất cả những người sử dụng hệ thống
1.2.3.5 Cơ chế nhận dạng
Đây là cơ chế nhận dạng của DSpace, phân biệt người sử dụng và một nhóm nhằm đưa ra các quyền hạn phù hợp cho họ
Cơ cấu này đem lại các lợi ích:
o Tách các xác nhận từ giao diện Web của người dùng ra thành các ứng dụng khác có khả năng tương tác vs dịch vụ Web
o Việc xác nhận là hoàn toàn độc lập
o Dọn dẹp các xác nhận rác , ẩn mà người sử dụng đã tạo rồi không sử dụng
Trang 20Bộ sưu tập hoặc những khối nhỏ trong một khối lớn, thêm hoặc di chuyển những item trong một Bộ sưu tập, thêm hoặc di chuyển những Bundle trong một item…
Tuy nhiên trong chính sách này ko có hành động “xóa” Nếu muốn xóa một chủ thể, ví dụ một item từ kho lưu trữ phải sử dụng chức năng “di chuyển” cho tất cả chủ
đề đó trong bộ sưu tập.sau đó các item này sẽ tự động được xóa
Trên tập tin (Bitstream):
o READ: có thể mở file
o WRITE: có thể thay đổi file
Trên bó (Bundle)
o ADD: có thể thêm nhiều tập tin vào bó
o REMOVE: xoá tập tin ra khỏi bó
Trên mục (Item)
o READ: có thể xem mục
o WRITE: có thể thay đổi mục
o ADD/REMOVE: có thể thêm hoặc xóa các tập tin
Trên bộ sưu tập (Collection)
o ADD/REMOVE: có thể thêm hoặc xóa các tập tin khỏi bộ sưu tập
o DEFAULT_ITEM_READ: các mục mới có thuộc tính đọc
o DEFAULT_BITSTREAM_READ: các tập tin mới được phép đọc
o COLLECTION_ADMIN: có thể thay đổi, rút trích hoặc ánh xạ các mục vào bộ sưu tập
1.2.3.7 Quá trình tiếp nhận dữ liệu và hệ thống tự động hóa
Tự động hóa các thủ tục văn bản trong một tổ chức bằng cách thay thế các hệ thống giấy tờ bằng các văn bản điện tử Một mạng cung cấp hệ thống chuyển theo đường đã định để chuyển các văn bản đi và đến từ bộ phận lưu trữ
Trang 21Là quy trình xử lí thông tin thêm nhằm hoàn thiện các thuộc tính phục vụ tốt cho việc lưu trữ
Phụ thuộc vào các quy định của bộ sưu tập mà chọn cách xử lí thích hợp nhằm hoàn thành các mục tiệu
Đưa một file dữ liệu vào quá trình sẽ xử lí biến đổi nhằm gán thêm các thuộc tính, cài đặt thêm một số tính năng nhằm phục vụ cho việc lưu trữ
1.2.3.7.1/ Quy trình xử lí , làm việc :
Quy trình nãy thuộc công đoạn xử lí file dữ liệu được đưa vào
Là quy trình kiểm tra , sửa đổi các dữ liệu nhằm hoàn thiện đưa vào lưu trữ sử dụng
Có thể sửa đổi siêu dữ liệu
Tất cả đều theo một quy trình các bước ổn định và trật tự không được nhảy bước
Trong quy trình này thì máy chủ sever có khả năng hủy bỏ tiến trình nhằm tránh các rủi ro cho CSDL về sau
Ví dụ bằng cách áp dụng mô hình luồng công việc, DSpace là một kho lưu trữ tài liệu điện tử mã nguồn mở đầu tiên đã giải quyết những vấn đề phức tạp của một thư viện khoa học tổng hợp tỉnh Nói cách khác, mỗi thư viện quận, huyện trong tỉnh sẽ có những quy định rất khác nhau về các tài nguyên điện tử phải nộp cho “thư viện số”: loại tài liệu điện tử phải nộp là gì? Ai là người gửi tài liệu?Ai là người duyệt? Ai được xem và ai là người bị hạn chế xem các tài liệu này… Tất cả những vấn đề này đều được giải quyết bởi các đại diện của các thư viện quận, huyện và các cán bộ thư viện tỉnh Sau đó được mô phỏng bằng luồng công việc cho mỗi bộ sưu tập để thực thi các quyết định Mỗi thành viên trong DSpace đều được gán các quyền thích hợp với vai trò của mình: vai trò người đăng tài liệu điện tử, vai trò người biên tập siêu dữ liệu, vai trò quản trị các bộ sưu tập, vai trò quản trị hệ thống …
Có 2 cách để tạo lập, quản trị bộ sưu tập số :
Trang 22o Cách thứ nhất, thư viện có thể quy định tất cả mọi bạn đọc đều có quyền đăng tài liệu điện tử, và bất kỳ người dùng nào (trong nội bộ và bên ngoài) đều có quyền xem các tài liệu đã được đăng tải
o Cách thứ hai, thư viện có thể tổ chức mô hình lưu trữ và phân phối tài liệu chặt chẽ hơn: các tác giả nộp các tài liệu điện tử do mình tạo lập, sau đó sẽ có một
bộ phận chịu trách nhiệm biên tập siêu dữ liệu và người có quyền cao nhất sẽ quyết định có xuất bản tài liệu đó không Như vậy mỗi bước trong quá trình đăng tài liệu điện tử sẽ được xem xét, phê duyệt trước khi tài liệu đó được đưa vào bộ sưu tập, các tài liệu điện tử không được thông qua trong quá trình này sẽ không được phép lưu trữ trong hệ thống DSpace
1.2.3.10 Chuỗi nhận dạng Bitstream – (Cung cấp 1 chuỗi ổn định cho các DSpace)
Tương tự việc định danh cho DSpace items, Bitstreams cũng có chuỗi nhận dạng Nhưng nó có nhiều biến động hơn, vì nếu nội dung được chuyển sang một máy chủ khác hoặc tổ chức khác, nó sẽ không còn làm việc
Mỗi bitstream có dãy ID, duy nhất trong mỗi item Dãy ID này được sử dụng để tạo ra một ID có dạng:
DSpace url/bitstream/handle/sequence ID/filename
1.2.3.11 Hỗ trợ
1.2.3.11.1 Hỗ trợ nguồn lưu trữ tập tin
Trang 23Cung cấp nguồn lưu trữ không giới hạn và các phương tiện đơn giản để tái tạo các nội dung
DSpace cung cấp 2 phương tiện để lưu trữ tập tin Đầu tiên là trong tập tin hệ thống trên máy chủ Thứ hai là sử dụng SRB
Cả hai đều được sử dụng 1 cách đơn giản , dung lượng nhỏ API
SRB là một lựa chọn có thể sử dụng thay cho các tập tin hệ thống của máy chủ hoặc bổ sung cho các tập tin hệ thống
SRB là một trình quản lý rất mạnh mẽ và tinh vi, cung cấp nguồn lưu trữ không giới hạn và các phương tiện đơn giản để tái tạo các nội dung
DSpace cho phép người dùng có thể khám phá các nội dung bằng nhiều cách, bao gồm:
o Qua các tham chiếu mở rộng như Handle…
o Tìm kiếm một hoặc nhiều từ khóa trong siêu dữ liệu hoặc toàn văn
o Có khả năng tìm kiếm thông qua tên nhan đề, tên tác giả, ngày…
Tìm kiếm là một công cụ cần thiết trong DSpace Người sử dụng kỳ vọng một công
cụ tìm kiếm khá cao do đó mục tiêu của DSpace là cung cấp càng nhiều tính năng tìm kiếm càng tốt
Một phần rất quan trọng trong DSpace là trình duyệt Đây là quá trình mà người dùng xem một chỉ số cụ thể như chỉ số tiêu đề và điều hướng xung quanh nó trong việc tìm kiếm các items Ngoài ra trình duyệt có thể giới hạn các items trong các bộ sưu tập hoặc cộng đồng cụ thể
1.2.3.11.3 Hỗ trợ HTML
DSpace hỗ trợ tải lên và tải xuống với các tập tin Điều này tốt đối với các định dạng thông dụng như file PDF, tài liệu Word, bảng tính Excel vv Nhưng tài liệu HTML thì phức tạp hơn và nó rất quan trọng trong việc bảo quản số
Trang 24Các trang web có xu hướng bao gồm một số tập tin - một hoặc nhiều tập tin HTML có chứa tài liệu tham khảo với nhau, và stylesheets và các tập tin hình ảnh được tham khảo từ các tập tin HTML
Các trang web cũng liên kết đến hoặc bao gồm nội dung từ các trang web khác
và người dùng thường không nhận ra được Như vậy, trong thời gian một vài năm, khi
có ai đó xem trang web đó, họ sẽ có thể tìm thấy nhiều liên kết bị hỏng
1.2.3.11.4 Hỗ trợ OAI (sáng kiến lưu trữ mở)
Sáng kiến lưu trữ mở đã phát triển một giao thức để thu hoạch siêu dữ liệu Điều này cho phép các trang web lấy hoặc 'thu hoạch' siêu dữ liệu từ nhiều nguồn, các dịch vụ phục vụ bằng cách sử dụng siêu dữ liệu, chẳng hạn như đánh chỉ số hoặc các dịch vụ liên kết Cho phép người dùng truy cập thông tin nhiều trang web từ một nơi
1.2.3.11.5 Hỗ trợ URL mở
DSpace hỗ trợ giao thức Open URL từ SFX, 1 cách đơn giản
Nếu bạn có 1 máy chủ SFX, DSpace sẽ hiển thị 1 liên kết Open URL trên mỗi trang Item ( bằng cách tự động sử dụng siêu dữ liệu Dublin Core)
Trang 25Người dùng có thể sử dụng nguồn cấp dữ liệu RSS để nhận thông tin
1.2.3.13 Nhập/ xuất dữ liệu giữa DSpace và các hệ thống khác
DSpace bao gồm các công cụ nhập/ xuất các item trong 1 cấu trúc thư mục đơn giản, nơi mà các siêu dữ liệu được lưu trữ dưới dạng file XML
Nhờ đó DSpace có thể chuyển đổi nội dung với các hệ thống khác
1.2.3.14 Đăng kí để sử dụng hệ thống
Sử dụng các giao thức cho phép đăng nhập và quá trình đăng kí thuận lợi cho mọi người
1.2.3.15 Thống kê ( về số liệu trong việc sử dụng hệ thống)
Bản báo cáo bao gồm các dữ liệu như:
o Số lượt xem item
o Số lượt truy cập bộ sưu tập
o Số lượt truy cập vào các khối
o Số yêu cầu OAI
o Tóm tắt tùy biến các nội dung lưu trữ
1.2.3.16 Ứng dụng kiểm tra bộ nhớ
Mục đích của việc kiểm tra là để xác minh bộ nhớ lưu trữ tài liệu của DSpace không bị sửa đổi hoặc xáo trộn
Công cụ này có thể mở rộng để báo cáo mới và kiểm tra cách tiếp cận ưu tiên
1.2.3.17 Quản lý dung lƣợng sử dụng trong hệ thống
Trang 26DSpace có thể báo cáo về các hoạt động sử dụng như tải tập tin
Được sử dụng để phát triển tùy biến, thống kê các hoạt động trong hệ thống
1.2.3.18 Giao diện người dùng
DSpace sử dụng giao diện người dùng dạng web-based Có 3 giao diện người dùng trong hệ thống DSpace: giao diện người dùng cho những người tham gia trong quá trình đăng, xuất bản phần mềm điện tử; giao diện cho người dùng tin: tìm kiếm, duyệt thông tin trong kho lưu trữ; giao diện người dùng cho người quản trị
Giao diện cho người dùng tin hỗ trợ tìm kiếm và nhận thông tin trả về bằng cách duyệt hoặc tìm kiếm siêu dữ liệu Một biểu ghi thỏa mãn các điều kiện tìm kiếm trong kho lưu trữ sẽ được trả về, người dùng tin có thể tải tài liệu điện tử gắn với biểu ghi thông qua các siêu liên kết, người dùng tin có thể xem trực tiếp nội dung tài liệu trên web bằng cách cài đặt các plug-in cho trình duyệt web hoặc tải về máy tính của mình để xem thông qua các ứng dụng hỗ trợ đọc các định dạng điện tử khác nhau như: Microsoft Office, Acrobat, Windows Media Player , CAD/CAM
1.2.3.19 Nền tảng công nghệ
DSpace được thiết kế để chạy trên nền tảng UNIX, hiện nay đã có phiên bản chạy trên nền tảng hệ điều hành Windows Các mã ban đầu được lập trình bằng ngôn ngữ Java Các thành phần khác: Hệ quản trị CSDL sử dụng PostgreSQL; máy chủ web
và Java Servlet sử dụng Apache và Tomcat; Jena - một bộ công cụ RDF được phát triển từ HP Labs, OAICat từ OCLC
1.2.3.20 Bảo mật
Phần mềm hỗ trợ phân quyền theo hướng phân cấp:
o Đối với bộ sưu tập: Có các quyền như: Quyền quản trị bộ sưu tập, Quyền đưa tài liệu vào bộ sưu tập, quyền duyệt tài liệu trước khi xuất hiện trrong bộ sưu tập…
o Đối với tài liệu: Có các quyền như: Quyền xem mô tả biểu ghi tài liệu, quyền đọc trực tuyến toàn văn tài liệu, quyền tải tập tin toàn văn,…
Trang 27Ngoài ra phần mềm còn hỗ trợ phân quyền theo từng nhóm bạn đọc hoặc từng bạn đọc
Với cơ chế thừa kế quyền từ các đơn vị và bộ sưu tập, trong cấu trúc phân cấp của DSpace, người quản trị dễ dàng hơn trong việc cấu hình và quản lý
Trang 28CHƯƠNG 2: CÀI ĐẶT PHẦN MỀM MÃ NGUỒN MỞ DSPACE
Yêu cầu cấu hình máy tính :
o Hệ điều hành : Windows XP trở lên
o CPU Intel (R) Pentium (R) D CPU 2.66GHz (2CPUs), RAM 1GB, ổ cứng 80GB
mã máy hoặc thông dịch mã nguồn khi chạy, Java được thiết kế để biên dịch mã nguồn thành bytecode, bytecode sau đó sẽ được môi trường thực thi (runtime environment) chạy
Trước đây, Java chạy chậm hơn những ngôn ngữ dịch thẳng ra mã máy như C
và C++, nhưng sau này nhờ công nghệ "biên dịch tại chỗ" - Just in time compilation, khoảng cách này đã được thu hẹp, và trong một số trường hợp đặc biệt Java có thể chạy nhanh hơn Java chạy nhanh hơn những ngôn ngữ thông dịch như Python, Perl, PHP gấp nhiều lần Java chạy tương đương so với C#, một ngôn ngữ khá tương đồng
về mặt cú pháp và quá trình dịch/chạy
Cú pháp Java được vay mượn nhiều từ C & C++ nhưng có cú pháp hướng đối tượng đơn giản hơn và ít tính năng xử lý cấp thấp hơn Do đó việc viết một chương trình bằng Java dễ hơn, đơn giản hơn, đỡ tốn công sửa lỗi hơn
Trong Java, hiện tượng rò rỉ bộ nhớ hầu như không xảy ra do bộ nhớ được quản
lí bởi Java Virtual Machine (JVM) bằng cách tự động "dọn dẹp rác" Người lập trình không phải quan tâm đến việc cấp phát và xóa bộ nhớ như C, C++ Tuy nhiên khi sở
Trang 29dụng những tài nguyên mạng, file IO, database (nằm ngoài kiểm soát của JVM) mà người lập trình không đóng (close) các streams thì rò rỉ dữ liệu vẫn có thể xảy ra
2.2.2 Phần mềm Apache Maven
Tư duy khi phân tích và thiết kế một ứng dụng phần mềm đó là có thể tách một
hệ thống lớn thành các thành phần nhỏ Với tư duy như vậy ta có thể nôm na định nghĩa ràng một ứng dụng phần mềm sẽ là sự tổng hợp của các thành phần (component) lại với nhau Các thành phần ở đây thường được thể hiện ra là các thư viện cung cấp cho người lập trình viên các công cụ lập để việc lập trình trở nên dễ dàng hơn Nói như vậy một ứng dụng có thể phụ thuộc vào nhiều thành phần mà bản thân mỗi thành phần
đó lại phụ thuộc vào các thành phần khác.Việc quản lý sự phụ thuộc giữa các thành phần này thực sự là không dễ dàng và nó sẽ trở nên phức tạp hơn khi mà ứng dụng càng ngày càng lớn ra Để có thể giải quyết vấn đề này, Apache Maven được ra đời
Maven là một công cụ để quản lý dự án và việc xây dựng một cách tự động Nó phục vụ chính cho các dự án viết bằng Java nhưng cũng có thể hỗ trợ cho các dự án khác viết bằng C#, Ruby, Scala
Maven dùng khái niệm Project Object Model (POM) để mô tả việc xây dựng dự
án, các thành phần phụ thuộc và các module Nó định nghĩa trước các target cho việc khai báo task, trình biên dịch, đóng gói và thứ tự hoạt động để mọi việc diến ra tốt nhất Maven tải các thư viện, plug-in từ 1 hoặc nhiều kho Cũng có thể tải các sản phẩm lên kho sau khi đã xây dựng xong
Hiện tại Apache đã có phiên bản Maven 3.0 với rất nhiều thay đổi quan trọng:
o Hỗ trợ parralel build với các module và tối ưu hóa hệ thống
o Cải tiến hiệu năng và khả năng tích hợp với các IDE
o Tương thích 100% với các version trước đó
2.2.3 Phần mềm Apache Ant
ANT (Another Neat Tool), là công cụ xây dựng hỗ trợ đặc biệt cho lập trình bằng Java nhưng cũng có thể sử dụng cho nhiều thứ khác, vì đây là công cụ được viết hoàn toàn bằng Java nên không phụ thuộc vào bất cứ nền ứng dụng nào Ant rất hữu
Trang 30ích trong công việc phức tạp đòi hỏi phải lập đi lập lại nhiều lần, vì vậy nên thích hợp với việc xử lý một cách tự động và được chuẩn hóa Ant dùng định dạng XML để làm
cơ chế hoạt động cho công cụ dưới dạng những lời hướng dẫn ( instructions), do đó dễ dàng mở rộng và bảo trì
Ant mang lại rất nhiều lợi ích, nó giúp bạn biên dịch mã nguồn một cách nhanh chóng Biên dịch mã nguồn, đóng gói thành file jar, và thậm chí sinh ra file docs chỉ trong một lệnh duy nhất Chúng ta có thể áp dụng để biên dịch mã nguồn tiện lợi mà không cần phụ thuộc vào IDE Nó có thể được áp dụng để build các ứng dụng từ Java
SE đến Java EE và Java ME
Ant là 1 công cụ rất mạnh và phổ biến với Java developer Khác với Maven là 1 công cụ quản lý dự án , Ant đơn thuần chỉ là 1 công cụ xây dựng Chính nhờ vào ưu điểm đơn giản, dễ sử dụng mà đa số các nhà phát triển đều sử dụng nó Hơn nữa, trong khi Ant thích hợp cho mọi loại dư án , thi Maven lại chứng tỏ sức mạnh rõ rệt ở các dự
án lớn và rất lớn nhằm giúp cho việc quản lý dễ dàng và thống nhất hơn Ngoài ra Ant
ra đời trước(2000) so với Maven(2006) và tới nay nó vẫn còn rất hữu dụng
2.2.4 Phần mềm Apache Tomcat
Apache Tomcat là một Java Servlet được phát triển bởi Apache Software Foundation (ASF) Tomcat thi hành các ứng dụng Java Servlet và JavaServer Pages (JSP) từ Sun Microsystems, và cung cấp một máy chủ HTTP cho ngôn ngữ Java thuần túy để thực thi các chương trình lệnh viết bằng ngôn ngữ Java
Tomcat không nên được hiểu nhầm với các máy chủ HTTP Apache - cái mà dùng để thực thi các câu lệnh viết bằng ngôn ngữ C trên máy chủ HTTP; có 2 máy chủ web được kết nối với nhau Apache Tomcat cung cấp các công cụ cho việc cấu hình và quản lý, nhưng cũng có thể được cấu hình bởi việc soạn thảo các file cấu hình viết bằng XML
Apache Tomcat thực hiện phần mềm mã nguồn mở của công nghệ Java Servlet
và JavaServer Pages.Các thông số kỹ thuật Java Servlet và JavaServer Pages được phát triển dưới sự Java Community Process
Trang 31Apache Tomcat được phát triển trong một môi trường mở và có sự tham gia và phát hành theo Giấy phép Apache phiên bản 2
Apache Tomcat có quy mô lớn, các ứng dụng web nhiệm vụ quan trọng trên một phạm vi đa dạng của các ngành công nghiệp và các tổ chức Apache Tomcat, Tomcat, Apache, the Apache feather, và biểu tượng của dự án Apache Tomcat là thương hiệu của Apache Software Foundation
2.2.5 PostgreSQL
PostgreSQL là một hệ quản trị cơ sở dữ liệu quan hệ và đối tượng dựa trên POSTGRES, bản 4.2, được khoa điện toán của đại học California tại Berkeley phát triển.POSTGRES mở đường cho nhiều khái niệm quan trọng mà các hệ quản trị dữ liệu thương mại rất lâu sau mới có
PostgreSQL là một chương trình mã nguồn mở xây dựng trên mã nguồn ban đầu của đại học Berkeley Nó theo chuẩn SQL99 và có nhiều đặc điểm hiện đại:
o Câu truy vấn phức hợp (complex query)
o Khóa ngoại (foreign key)
o Thủ tục sự kiện (trigger)
o Các khung nhìn (view)
o Tính toàn vẹn của các giao dịch (integrity transactions)
o Việc kiểm tra truy cập đồng thời đa phiên bản (multiversion concurrency control)
Hơn nữa, PostgreSQL có thể dùng trong nhiều trường hợp khác, chẳng hạn như tạo
ra các khả năng mới như:
Trang 32PostgreSQL được phổ biến bằng giấy phép BSD cổ điển.Nó không quy định những hạn chế trong việc sử dụng mã nguồn của phần mềm Bởi vậy PostgreSQL có thể được dùng, sửa đổi và phổ biến bởi bất kỳ ai cho bất kỳ mục đích nào
PostgreSQL cũng là hệ quản trị cơ sở dữ liệu hỗ trợ mạnh trong việc lưu trữ dữ liệu không gian PostgreSQL kết hợp với module Postgis cho phép người dùng lưu trữ các lớp dữ liệu không gian Khi sử dụng PostgreSQL, Postgis kết hợp với các phần mềm GIS hỗ trợ hiển thị, truy vấn, thống kê hoặc xử lý dữ liệu không gian
Ngày nay, PostgreSQL là một trong những hệ quản trị cơ sở lớn nhất hiện có Với những tính năng được chỉ ra dưới đây, chúng ta có cái nhìn tổng quan về PostgreSQL :
o Trong quan hệ đối tượng PostgreSQL, mọi bảng định nghĩa như một lớp PostgreSQL thực thi kế thừa giữa các bảng, hàm và toán tử là đa hình
o Cú pháp chuẩn của PostgreSQL tuân thủ theo chuẩn của SQL92 và nhiều tính năng của SQL99
PostgreSQL cung cấp nhiều kiểu dữ liệu Bên cạnh kiểu dữ liệu numeric, string thông thường, nó còn cung cấp kiểu dữ liệu geometry, Boolean và kiểu dữ liệu được thiết kết đặc biệt để dùng cho các địa chỉ mạng Khả năng mở rộng là một trong những tính năng của PostgreSQL đó là nó có thể được mở rộng Nếu với những gì mà PostgreSQL cung cấp mà bạn vẫn chưa hài lòng, bạn có thể thêm vào PostgreSQL những gì của bạn Ví dụ, bạn có thể thêm vào kiểu dữ liệu mới, hàm và toán tử mới và các thủ tục mới
2.3.1 Cài đặt Java
Trang 34Chọn đường dẫn chưa file cài đặt :
Trang 35Hoàn tất quá trình cài đặt
2.3.2 Cài đặt Apache Ant, Apache Maven
Trang 36Tạo thư mục ANT trong ổ đĩa C, giải nén copy Apache Ant vào thư mục ANT vừa tạo
Tạo thư mục MAVEN trong ổ đĩa C, giải nén và copy Apache Maven vào thư mục MAVEN vừa tạo
Trang 37Tạo đường dẫn
Chuột phải vào My computer Properties
Trang 38Chọn Advanced system settings
Trong hộp thoại System Properties chọn Environment Variables
Chọn Path và thêm vào chuỗi sau :
C:\Program Files\Java\jdk1.6.0_24\bin; C:\ANT\bin; C:\MAVEN\bin
Trang 39Vào New tạo biến mới ANT_HOME với đường dẫn: C:\ANT
Tiếp tục tạo biến mới JAVA_HOME với đường dẫn: C:\Program Files\Java\jdk1.6.0_24
Trang 40Tạo biến mới MVN_HOME với đường dẫn C:\MAVEN
Tạo biến mới JAVA_OPTS với giá trị : -Dfile.encoding=UTF-8
Kiểm tra phiên bản
Vào Run cmd
Phiên bản Java : gõ java -version