Công nghệ thông tin còn tạo ra một bước phát triển vượt bậc cho ngành thư viện thông tin đó là nguồn tài nguyên thông tin đã được phát hành dưới dạng số hóa, trên cơ sở đó xây dựng nên c
Trang 2DANH MỤC THUẬT NGỮ VIẾT TẮT
CBQLGD: Cán bộ Quản lý Giáo dục Thành Phố Hồ Chí Minh
ĐHKHTN TP HCM: Đại học Khoa học Tự nhiên Thành Phố Hồ Chí Minh
ĐHNH TP HCM: Đại học Ngân Hàng Thành Phố Hồ Chí Minh
ĐHBK TP HCM: Đại học Bách Khoa Thành Phố Hồ Chí Minh
ĐHQG TP.HCM: Đại học Quốc Gia Thành Phố Hồ Chí Minh
TP HCM: Thành Phố Hồ CHí Minh
UNESCO: United Nations Educational, Scientific, and Cultural
Organization GLI: Greenstone Librarian Interface
DLF: Digital Libraries Federation (Liên doàn thư viện số thế giới)
Trang 3LỜI CẢM ƠN
Để hoàn thành được khóa luận tốt nghiệp này, tôi xin chân thành cảm ơn
Thầy giáo hướng dẫn, Th.S Trương Đại Lượng đã trực tiếp hướng dẫn tôi trong
suốt thời gian thực hiện đề tài này
Tôi cũng xin chân thành cảm ơn các Thầy, Cô giáo trong khoa Thư viện – Thông tin đã tận tình giảng dạy và trang bị cho chúng tôi những kiến thức cần thiết, quý báu trong suốt những năm học tại trường
Mặc dù tôi đã hoàn thành khóa luận với tất cả nỗ lực của bản thân, nhưng do chưa có kinh nghiệm trong việc nghiên cứu khoa học cũng như hạn chế về trình độ hiểu biết nên khóa luận không thể tránh khỏi thiếu sót nhất định về mặt nội dung
và hình thức trình bày, kính mong nhận được sự cảm thông và chỉ bảo của Quý Thầy Cô và các bạn
Trang 4MỤC LỤC
LỜI CẢM ƠN
DANH MỤC THUẬT NGỮ VIẾT TẮT
LỜI NÓI ĐẦU 1
CHƯƠNG 1: TỔNG QUAN VỀ NGUỒN MỞ GREENSTONE 5
1.1 Khái niệm Thư viện và Thư viện số 5
1.1.1 Khái niệm về Thư viện 5
1.1.2 Khái niệm về Thư viện số 6
1.2 Giới thiệu về nguồn mở Greenstone 9
1.2.1 Bối cảnh ra đời của nguồn mở Greenstone 9
1.2.2 Sơ lược tình hình sử dụng phần mềm nguồn mở Greenstone trên Thế giới và Việt Nam 11
CHƯƠNG 2: PHÂN TÍCH KHẢ NĂNG NGUỒN MỞ GREENSTONE VÀ THỰC TRẠNG ỨNG DỤNG TẠI VIỆT NAM 14
2.1 Các khái niệm liên quan đến nguồn mở Greenstone 14
2.1.1 Bộ sưu tập 14
2.1.2 Metadata 14
2.1.3 Plugin 19
2.1.4 Classifier 21
2.1.5 Duyệt tài liệu 26
2.1.6 Tìm kiếm 27
2.2 Tính năng, ưu điểm và hạn chế của nguồn mở Greenstone 28
Trang 52.2.1 Tính năng của nguồn mở Greenstone 28
2.2.2 Ưu điểm của nguồn mở Greenstone 31
2.2.3 Một số hạn chế của nguồn mở Greenstone 34
2.3 Thực trạng nghiên cứu, ứng dụng nguồn mở Greenstone ở Việt Nam 36
2.3.1 Thực trạng nghiên cứu và giảng dạy nguồn mở Greenstone ở Việt Nam 36 2.3.2 Thực trạng triển khai ứng dụng nguồn mở Greenstone ở Việt Nam 39 2.3.2.1 Đại học Khoa học Tự nhiên Thành phố Hồ Chí Minh 39
2.3.2.2 Đại học Ngân Hàng Thành phố Hồ Chí Minh 50
2.3.3 Đại học Bách Khoa Thành phố Hồ Chí Minh 55
2.3.4 Thư viện Hải Phú (Tỉnh Phú Yên) 57
2.3.5 Trường Cán bộ Quản lý Giáo dục 62
2.3.6 Trung tâm học liệu – Đại học Thái Nguyên 65
CHƯƠNG 3: NHẬN XÉT VÀ KIẾN NGHỊ 71
3.1 Nhận xét 71
3.1.1 Nhận xét về phần mềm 71
3.1.2 Nhận xét về việc triển khai ứng dụng nguồn mở Greenstone ở Việt Nam 74 3.1.3 Nhận xét về kết quả Nghiên cứu và giảng dạy nguồn mở Greenstone ở Việt Nam 79
Trang 63.2 Kiến nghị 81 KẾT LUẬN 84 DANH MỤC TÀI LIỆU THAM KHẢO
Trang 7LỜI NÓI ĐẦU
Lý do chọn đề tài
Công nghệ thông tin phát triển dẫn đến sự phát triển nhanh chóng của các ngành nghề trong xã hội, trong đó có ngành thư viện – thông tin Đồng thời, nó đã làm thay đổi các hình thức xuất bản, không những tạo ra nhiều loại hình tài liệu mới mà còn làm cho số lượng tài liệu ra tăng theo cấp số nhân Số lượng tài liệu ngày càng nhiều tạo điều kiện thuận lợi cho mọi người tiếp cận với nguồn tri thức của nhân loại, nhưng đồng thời nó lại gây ra khó khăn cho việc lưu trữ và bảo quản tài liệu tại các trung tâm thông tin thư viện Công nghệ thông tin còn tạo ra một bước phát triển vượt bậc cho ngành thư viện thông tin đó là nguồn tài nguyên thông tin đã được phát hành dưới dạng số hóa, trên cơ sở đó xây dựng nên các bộ sưu tập số giúp cho việc trao đổi nguồn lực thông tin giữa các thư viện không chỉ trong một quốc gia, một khu vực mà trên cả thế giới được dễ dàng, tạo điều kiện cho việc sử dụng chung nguồn thông tin ở khắp nơi trên trái đất
Với bước phát triển này, hình ảnh, vai trò và chức năng của thư viện cũng đã thay đổi theo Từ thư viện truyền thống phát triển lên thư viện điện tử và giờ đây là thư viện số Từ việc muốn sử dụng thư viện người dùng tin phải trực tiếp tới thư viện mà mình đăng kí để sử dụng tài liệu, giờ đây người dùng tin có thể sử dụng thư viện số ở bất cứ nơi đâu, bất cứ lúc nào, không chỉ thư viện trong nước mà ở cả thư viện của nhiều nước khác miễn là người dùng tin có máy tính được kết nối Internet
Để tổ chức, xây dựng, quản lý và phân phối tốt nguồn thông tin của thư viện, đặc biệt là nguồn thông tin số hóa, đáp ứng cao nhất nhu cầu thông tin của người
sử dụng các thư viện phải tìm ra một giải pháp hữu ích và Greenstone là phần mềm
Trang 8nguồn mở thư viện số giúp giải quyết các vấn đề trên một cách đơn giản và hiệu quả nhất
Nhận thức được tầm quan trọng của việc ứng dụng công nghệ thông tin vào hoạt động thư viện, và thấy được sự thành công của các thư viện trên thế giới đã ứng dụng Greenstone, thư viện Trường Đại học Khoa học Tự nhiên Thành phố Hồ Chí Minh (ĐHKHTN TP HCM) đã mạnh dạn sử dụng phần mềm Greenstone và hợp tác với một nhóm chuyên gia công nghệ thông tin để chuyển đổi phần mềm này sang tiếng Việt có tên gọi là HÒN ĐÁ XANH Tiếp đó thư viện Đại học Ngân Hàng Thành phố Hồ Chí Minh (ĐHNH TP HCM) và một số thư viện khác cũng
đã ứng dụng phần mềm này để xây dựng các bộ sưu tập số cho thư viện mình
Phát triển thư viện số là một xu thế tất yếu Việc lựa chọn phần mềm thích hợp để xây dựng thư viện số là một công việc không dễ Hiện nay trên thế giới có rất nhiều phần mềm quản lý thư viện, ở Việt Nam cũng đã có một số phần mềm được sử dụng nhiều trong các thư viện Tuy nhiên các phần mềm ở Việt Nam đã ít nhiều cho thấy những hạn chế trong quá trình sử dụng Gần đây những phần mềm nguồn mở được sử dụng khá phổ biến trên thế giới đã bắt đầu được sử dụng ở Việt Nam nhưng ở mức độ hạn chế Với điều kiện kinh tế còn hạn hẹp, ứng dụng công nghệ thông tin vào thư viện chưa cao và đầu tư cho các thư viện chưa lớn thì việc lựa chọn phần mềm nguồn mở để xây dựng các bộ sưu tập số hóa làm cơ sở cho xây dựng thư viện số là một lụa chọn hợp lý Tuy nhiên, việc ứng dụng phần mềm nguồn mở ở Việt Nam vẫn ở mức độ khiêm tốn Để tìm hiểu kỹ hơn về các khả năng hữu ích của phần mềm nguồn mở Greenstone trong việc xây dựng và phát triển thư viện số tôi đã chọn đề tài “Tìm hiểu phần mềm nguồn mở Greenstone và tình hình ứng dụng tại Việt Nam” làm đề tài khóa luận
Mục đích nghiên cứu
Trang 9Mục đích nghiên cứu của khóa luận là tìm hiểu về phần mềm nguồn mở thư viện số - Greestone, phân tích những đặc điểm nổi bật của phần mềm này trong việc ứng dựng vào hoạt động thư viện Khảo sát bộ sưu tập số của một số thư viện
đã ứng dụng Greenstone tại Việt Nam để làm rõ những ứng dụng của phần mềm này, từ đó đưa ra những đề xuất, kiến nghị giúp cho phần mềm này được sử dụng rộng rãi hơn trong các thư viện nhằm nâng cao hiệu quả hoạt động của hệ thống thư viện trong cả nước
Đối tượng và phạm vi nghiên cứu:
Đối tượng nghiên cứu của khóa luận là phần mềm nguồn mở thư viện số- Greenstone và thực trạng ứng dụng phần mềm này tại Việt Nam
Phạm vi nghiên cứu là bộ sưu tập số của các thư viện ở Việt Nam có ứng dụng phần mềm này và đang phổ biến trên internet
Phương pháp nghiên cứu
Trong quá trình thực hiện đề tài này tôi đã tiến hành phương pháp sau:
- Phương pháp trực quan
- Tham khảo ý kiến chuyên gia
- Phân tích, tổng hợp tài liệu
- Phân tích khả năng tiện ích của giao diện (interface usability)
Tình hình nghiên cứu
Cho đến nay đã có một số đề tài nghiên cứu về phần mềm Greenstone Tuy nhiên, chưa có đề tài nào đi sâu vào nghiên cứu Greenstone về mặt lý luận và việc ứng dụng phần mềm này tại Việt Nam
Cơ cấu của khóa luận
Trang 10Ngoài lời nói đầu, kết luận, danh mục tài liệu tham khảo, khóa luận được chia làm 3 chương
Chương 1: Tổng quan về nguồn mở Greenstone
Chương 2 : Phân tích khả năng nguồn mở Greenstone và thực trạng ứng dụng tại Việt Nam
Chương 3 : Nhận xét và kiến nghị
Trang 11Chương 1 TỔNG QUAN VỀ NGUỒN MỞ GREENSTONE
1.1 Khái niệm thư viện và thư viện số
1.1.1 Khái niệm về thư viện
Thư viện là kho tàng tri thức của xã hội đã có những đóng góp có ý nghĩa cho sự phát triển của con người; có người còn cho rằng thư viện là đền đài của văn hóa và
sự uyên thâm Trước đây người ta quan niệm thư viện là nơi bảo quản và tàng trữ sách Hiện nay có rất nhiều quan niệm khác nhau về thư viện:
Theo định nghĩa của UNESCO (United Nations Educational, Scientific, and Cultural Organization – Tổ chức Giáo dục, Khoa học, văn hóa Liên Hiệp Quốc):
“Thư viện không phụ thuộc vào tên gọi của nó, là bất kỳ bộ sưu tập có tổ chức nào của sách, ấn phẩm định kỳ hoặc các tài liệu khác kể cả đồ họa, nghe nhìn và nhân viên phục vụ có trách nhiệm tổ chức cho bạn đọc sử dụng các tài liệu đó nhằm mục đích thông tin, nghiên cứu khoa học, giáo dục hoặc giải trí”
Trong pháp lệnh thư viện Việt Nam năm 2000, thư viện được định nghĩa:
“Thư viện có chức năng, nhiệm vụ giữ gìn sách vở, giấy tờ, di sản thư tịch của dân tộc; thu thập, tàng trữ, tổ chức việc khai thác và sử dụng chung vốn tài liệu trong
xã hội nhằm truyền bá tri thức, cung cấp thông tin phục vụ nhu cầu học tập, nghiên cứu, công tác và giải trí của mọi tầng lớp nhân dân; góp phần nâng cao dân trí, đào tạo nhân lực, bồi dưỡng nhân tài, phát triển khoa học, công nghệ, kinh tế, văn hóa, phục vụ công cuộc công nghiệp hóa, hiện đại hóa đất nước”
Thư viện luôn đóng vai trò quan trọng trong việc hỗ trợ công tác học tập, nghiên cứu và giảng dạy trong trường đại học; cũng như đáp ứng nhu cầu thông tin cho quần chúng Được hình thành trong thời kỳ nông nghiệp thống trị trong tư duy của nhân loại, thư viện đã trải nghiệm qua một cuộc hồi sinh với việc phát minh ngành in trong thời kỳ phục hưng, và thực sự bắt đầu khởi sắc khi cuộc cách mạng
Trang 12công nghiệp bùng phát với hàng loạt những phát minh cơ giới hóa quá trình in ấn Tuy nhiên khi lượng thông tin vận hành trong xã hội trở nên nhiều hơn, thư viện truyền thống, với hình thức lưu trữ chủ yếu trên giấy, có còn vị trí độc tôn, và có thích hợp không? Thời đại của Internet, của mạng thông tin toàn cầu, người ta cần
Trang 13tìm ra một cách quản lý thông tin sao cho hiệu quả Điều này tập trung vào hai khía cạnh chủ yếu Thứ nhất, phải tiết kiệm không gian lưu trữ; thứ hai, tốc độ truy tìm thông tin phải thật nhanh Giờ đây, người trao đổi thông tin không chỉ qua giấy tờ,
mà còn thường xuyên sử dụng đến hình thức tài liệu điện tử: sách điện tử, báo điện
tử, email, phim ảnh,…Hơn thế nữa, ngày nay người dùng tin dù ở bất cứ đâu trên thế giới cũng có thể tìm và lấy được thông tin cần thiết nếu có có máy tính được kết nối internet Tất cả những điều đó đặt ra yêu cầu phải xây dựng một hệ thống
có chức năng của một thư viện bình thường, nhưng chủ yếu quản lý tài liệu điện tử
và có thể truy cập ở bất cứ nơi đâu, vào bất kỳ lúc nào.Và những cụm từ như
“virtual library” (thư viện ảo), “electronic library” (thư viện điện tử), “library without walls” (thư viện không có tường), và gần đây nhất, là “digital library” (thư viện số) xuất hiện, để chỉ về loại hình thư viện khá mới mẻ này
1.1.2 Khái niệm thư viện số
Hiện nay có nhiều định nghĩa khác nhau về thư viện số dưới đây là một số định nghĩa tiêu biểu:
Định nghĩa của Trung tâm nghiên cứu và đổi mới thư viện Anh: “Thư viện
số là thuật ngữ được chấp nhận rộng rãi như sự mô tả việc sử dụng công nghệ số (công nghệ điện tử) của thư viện để thu thập, lưu trữ, bảo tồn, và cung cấp sự truy cập đến thông tin”
Định nghĩa của Liên đoàn Thư viện Hoa kỳ: “Thư viện số là cơ quan, tổ chức có các nguồn nhân lực chuyên hóa, để lựa chọn cấu trúc việc truy cập đến diễn giải, phổ biến, bảo quản sự toàn vẹn, đảm bảo sự ổn định trong thời gian dài của sưu tập các công trình số hóa mà chúng ở dạng sẵn sàng để sử dụng một cách kinh tế cho một hoặc một số cộng đông nhất định”
Trang 14Định nghĩa của TS Ian Witten, chuyên gia Thư viện số Đại học Waikato, New Zealand : “Thư viện số là tập hợp những bộ sưu tập thông tin các đối tượng
số hoặc đã được số hóa có tổ chức và tập trung Tập trung theo đề tài hay chủ đề và
có tổ chức để thông tin dễ truy cập và lưu trữ theo những tiêu chuẩn chuyên biệt cung cấp hai khả năng chính:
- Phương thức truy cập, chọn lọc, hiển thị tài nguyên số (dành cho người sử dụng);
- Phương thức xây dựng, tổ chức và lưu hành (dành cho cán bộ thư viện) Định nghĩa của Liên đoàn thư viện số thế giới – DLF: “Thư viện số là một tổ chức cung cấp tài nguyên, để chọn lọc, cấu trúc, cung ứng truy cập, biên dịch, phân phối, bảo quản nguyên vẹn, và đảm bảo bền vững theo thời gian những bộ sưu tập
kỹ thuật số để sẵn sàng phục vụ cộng đồng một cách kinh tế”
Một câu hỏi đặt ra là: World Wide Web có phải là một thư viện số hay không? Nó cũng là một kho dữ liệu khổng lồ chuyên thu thập hàng ngàn, hàng triệu trang tài liệu, cho phép người ta tìm kiếm thông tin trên đó Tuy nhiên, theo Clifford Lyunch, một trong những nhà nghiên cứu hàng đầu trong lĩnh vực thư viện nói chung và thư viện số nói riêng thì câu trả lời là không “Internet và những tài nguyên đa phương tiện của nó, còn gọi là World Wide Web, không được thiết
kế để hỗ trợ xuất bản và thu thập thông tin có tổ chức Nó chỉ là một kho hỗn độn của các thông tin vô tổ chức trên thế giới số…Internet không phải là một thư viện số” Khi so sánh những thông tin trên Internet với những thông tin được cung cấp
từ thư viện số, thạc sĩ Nguyễn Minh Hiệp, Giám đốc thư viện ĐH KHTN TP HCM
đã nói “Có thể ví các thông tin từ các chương trình tìm kiếm trên Internet như bột
mì, nếu muốn dùng phải nhào nặn rồi nướng lên còn ở đây với hệ thống Greenstone bạn đọc được cung cấp trực tiếp bánh mì, tiết kiệm được thời gian và
Trang 15công sức tìm kiếm” (Nguyễn Minh Hiệp, Vòng quanh hệ thống thư viện hy vọng
từ hòn đá xanh, Sài Gòn Giải Phóng Online)
Thư viện số trước hết là một thư viện Thêm vào đó nó có các đặc trưng riêng của một hệ thống điện tử với những công nghệ, dịch vụ mới Nhờ vào những công nghệ và dịch vụ mới đó các nguồn tài nguyên của thư viện được lưu trữ, quản
lý, phục vụ tra cứu một cách hiệu quả
Hiện nay trên thế giới có rất nhiều hệ thống phần mềm thư viện số như: Project Gutenberg, Ibiblio, và Internet Archieve Tuy nhiên, chúng hầu hết là những sản phẩm thương mại Chỉ tính riêng ở Việt Nam đã có ít nhất ba nhà cung cấp hệ thống phần mềm thư viện điện tử - thư viện số Đó là Công ty trách nhiệm hữu hạn CMC (CMC Co.,Ltd) với hệ thống Ilib; Công ty Tin học Lạc Việt (LAC VIET Computing Corp) với phần mềm VeBrary; và phần mềm Libol của Công ty Tin học Tinh Vân (TINH VAN Infomatic Technology Co.) Theo các chuyên gia đánh giá, “Các phần mềm hiện nay đang sử dụng tại các thư viện Việt Nam do các nhà sản xuất Việt Nam cung cấp đang còn có một số hạn chế về độ tin cậy Do thời gian dùng thử nghiệm chưa nhiều, quy mô khai thác chưa lớn nên chưa thể có kết luận một cách rõ ràng chất lượng các sản phẩm này” Do đó, việc sử dụng một hệ thống thư viện số thỏa mãn những tiêu chuẩn quốc tế, tạo mặt bằng chung trong quá trình liên kết hệ thống các thư viện hiện nay là rất cần thiết Về lâu dài, các chuyên gia tư vấn của Chương trình Phát triển của Liên hiệp quốc thống nhất quan điểm cần tích cực khuyến cáo Chính phủ các quốc gia đang phát triển tập trung đầu
tư cho ứng dụng và phát triển các phần mềm tự do và phần mềm nguồn mở như một giải pháp căn bản và nhanh chóng nhất để thu ngắn khoảng cách số đối với các quốc gia phát triển, tránh sự phụ thuộc quá nhiều về công nghệ, về sở sữu trí tuệ trong lĩnh vực công nghệ thông tin (theo quan điểm của tác giả sự phụ thuộc này sẽ dẫn đến hình thức bóc lột tư bản kiểu mới trong thời đại công nghệ thông tin)
Trang 16(Phần mềm tự do và phần mềm nguồn mở, Bản tin thư viện - công nghệ thông tin, 4/2004)
1.2 Giới thiệu về nguồn mở Greenstone
1.2.1 Bối cảnh ra đời của nguồn mở Greenstone
Trong những thập niên cuối của thế kỷ 20 với sự phát triển mạnh mẽ của công nghệ thông tin đã tạo ra những thay đổi sâu sắc trong đời sống xã hội không chỉ trong phạm vi một quốc gia mà trên phạm vi toàn cầu Cùng với sự phát triển của công nghệ thông tin, xã hội loài người đã phát triển lên một bước cao hơn, tiếp cận với loại hình kinh tế mới – “Kinh tế tri thức”
Trong bối cảnh kinh tế tri thức, tri thức nổi lên như là nguồn lực quan trọng nhất, lấn át các nguồn lực truyền thống (lao động, tài nguyên thiên nhiên, vốn) Các nguồn lực truyền thống quan trọng theo nghĩa nếu không có chúng thì không
có sản phẩm được tạo ra, hoặc nếu có thì số lượng giới hạn Tri thức quan trọng theo nghĩa nhờ có chúng người ta có thể tạo ra số lượng hoặc chất lượng nguồn thông tin rất cao chỉ với nguồn lực (truyền thống) hạn chế
Cùng với tầm quan trọng của nguồn lực tri thức ngày càng được nâng cao, vai trò của ngành quản lý thông tin và tri thức càng trở nên quan trọng Khi thông tin và tri thức ngày càng trở nên phong phú, đa dạng, và phát triển mạnh mẽ theo thời gian; khi nhu cầu của xã hội về thông tin ngày càng trở nên cao cấp hơn, việc lưu trữ, khai thác, tổ chức, và phân phối thông tin theo kiểu truyền thống trở nên không phù hợp, đòi hỏi một cách thức mới Cùng lúc đó, với cách mạng công nghệ thông tin, đặc biệt là sự bùng nổ của kỹ thuật số hóa làm cho khả năng đáp ứng nhu cầu đang tăng lên chưa từng có về lưu trữ, tổ chức và phân phối thông tin trở nên hiện thực Thư viện số ra đời trong bối cảnh trên, thật sự bắt đầu cho một cuộc cách mạng trong lĩnh vực thư viện, đã và đang thay đổi hẳn cách nhìn về nghề thư
Trang 17viện Các thư viện số đã làm thay đổi nhanh chóng cách thức thu thập và phổ biến thông tin ở nhiều quốc gia, đặc biệt là các quốc gia chậm phát triển Đứng trước yêu cầu thực tế, năm 1995 một nhóm nhỏ các giảng viên và sinh viên Đại học Waikato, New Zealand đã xây dựng phần mềm thư viện số Greenstone, giúp người dùng dễ dàng xây dựng và phân phối các bộ sưu tập thư viện số Phần mềm Greenstone cung cấp một phương pháp mới để tổ chức và xuất bản thông tin trên Internet và qua CD-ROM Greenstone ban đầu là sản phẩm của dự án New Zealand Digital Library của trường Đại học Waikato Sau đó, thấy được ý nghĩa và tác dụng của phàn mềm, từ tháng 8/2000, UNESCO và tổ chức Human Info NGO
đã tham gia phát triển, hỗ trợ, xuất bản và phân phối cho các quốc gia đang phát triển Đây là phần mềm mã nguồn mở được cung cấp trên
1.2.2 Sơ lược tình hình ứng dụng Phần mềm nguồn mở Greenstone trên thế giới và Việt Nam
Trong khoảng hơn 10 năm ra đời và phát triển, phần mềm Greenstone đã được UNESCO và Human Info NGO phát triển và phân phối Đến nay Greenstone
đã được sử dụng rộng rãi ở nhiều trường đại học và tổ chức của nhiều nước trên thế giới như: Anh, Hoa Kỳ, Trung Quốc, Đức, Ấn Độ, Nga…mà đặc biệt là các thư
viện trong dự án The New Zealand Digital Library, The University of Waikato
và ngay cả một số quốc gia ở Châu Phi Trang web của New Zealand Digital Library (http://nzdl.org) chứa nhiều bộ sưu tập mẫu được tạo với phần mềm Greenstone Các bộ sưu tập mẫu được minh họa bằng nhiều ví dụ khác nhau về tìm kiếm và hiển thị các tùy chọn Chúng bao gồm nhiều bộ sưu tập các tài liệu bằng tiếng Arập, Trung Quốc, Pháp, Maori ( tiếng của người Maori ở New Zealand) và Tây Ban Nha cũng như tiếng Anh Trong đó còn có cả các bộ sưu tập về âm nhạc Nhiều bộ sưu tập tài liệu sử dụng Greenstone được cung cấp trên CD-ROM rất giá
Trang 18trị cho việc nghiên cứu như: Humanity Development chứa 1.230 tài liệu từ kế toán tài chính cho đến vấn đề an toàn nguồn nước Và quan trọng hơn Greestone đã có thể chuyển đổi trên 40 ngôn ngữ khác nhau như: Anh, Pháp, Đức, Nga, Tây Ban Nha, Bồ Đào Nha, Italia, Hà Lan, Ả-rập, Thổ Nhĩ Kỳ, Do Thái (Hebrew), Bosnia, Ac-mê-ni (Armenia), Ucraina, Farsi, Croatia, Xéc Bi, Ấn Độ, Trung Quốc, Nhật Bản, Thái Lan, Inđônêxia,vv…trong đó có tiếng Việt Với tốc độ phát triển theo hướng đa ngôn ngữ như hiện nay Greenstone dễ dàng trở thành công cụ xây dựng
và phát triển thư viện số phổ biến nhất toàn cầu
Khu vực Châu Á – Thái Bình Dương hiện là nơi có xu hướng sử dụng Phần mềm Tự do và Phần mềm nguồn mở khá mạnh, với nhiều chương trình, dự án có
sự tham gia của chính phủ được khởi động từ Nhật Bản, Trung Quốc, Hàn Quốc đến Ấn Độ, Đài Loan, Thái Lan, Việt Nam, Philipin, Malaysia, …Nguyên nhân chủ yếu của các động thái trên là nhu cầu tiết giảm tổng chi phí sở hữu phần mềm, nâng cao tính bảo mật, giảm thiểu các vi phạm bản quyền và hỗ trợ phát triển công nghiệp phần mềm địa phương Một vấn đề khác được các quốc gia đang phát triển như Việt Nam hiện rất quan tâm là làm sao “vừa phải thỏa mãn các yêu cầu trong quá trình hội nhập quốc tế, vừa phải phòng ngừa tránh được những cạm bẫy về vấn
đề sở hữu trí tuệ thường hay được các quốc gia phát triển hơn sử dụng, như một thứ công cụ gây áp lực khi gặp phải những vấn đề tranh chấp, kiện tụng” (TS Hoàng Lê Minh, Phần mềm tự do và phần mềm nguồn mở) Greenstone là một trong những phần mềm nguồn mở giúp ta thực hiện các công việc trong thư viện số một cách hiệu quả, nó giải thích cho lý do tại sao phần mềm này lại được nhiều quốc gia lựa chọn sử dụng đến như vậy
Nhu cầu thay đổi nói trên đã là xu thế trong khu vực và đã được hình thành khá rõ ràng tại Việt Nam Đầu năm 2004, Thư viện ĐHKHTN TP HCM – Đơn vị đầu tiên ở Việt Nam sử dụng Greenstone cho việc xây dựng thư viện số với sự hỗ
Trang 19trợ phát triển phiên bản tiếng Việt của Itegrated e-Solution, Ltd Việt Nam (IeS); giữa năm 2004, Thư viện trường ĐHNH TP HCM là đơn vị thứ hai sử dụng Greestone xây dựng thư viện số; tiếp đến là thư viện trường Đại học Bách Khoa Thành Phố Hồ Chí Minh (ĐHBK TP HCM), thư viện trường Cán bộ quản lý giáo dục Thành Phố Hồ Chí Minh (CBQLGD TP HCM), và Trung tâm học liệu Đại học Thái Nguyên cũng đã sử dụng để tạo lập các bộ sưu tập số hóa kết hợp với phần mềm có sẵn để phát triển thư viện số Một số bộ sưu tập ban đầu đã được hình thành như: bộ sưu tập hình ảnh trang thiết bị thư viện của thư viện ĐHKHTN TP.HCM rất bổ ích cho các thư viện đang sửa chữa hoặc xây dựng mới, bộ sưu tập tiền của trường ĐHNH TP HCM, hay các bộ sưu tập luận án, luận văn của một số trường kể trên Hiện nay ở phía Nam, thư viện của nhiều trường đại học cũng đã bắt đầu nghiên cứu đưa Greenstone vào sử dụng Trong một tương lại không xa phần mềm nguồn mở nói chung và phần mềm thư viện số Greenstone nói riêng sẽ được sử dụng rộng rãi trong cả nước, khi nhận thức về tầm quan trọng của việc xây dựng các bộ sưu tập số hóa, tiến tói xây dựng thư viện số ngày càng được nâng cao
Trang 20Chương 2 PHÂN TÍCH KHẢ NĂNG NGUỒN MỞ GREENSTONE
VÀ THỰC TRẠNG ỨNG DỤNG TẠI VIỆT NAM
2.1 Các khái niệm liên quan đến nguồn mở Greenstone
2.1.1 Bộ sưu tập
Theo Ian H Witten, chuyên gia Thư viện số ĐH Waikato, New Zealand
“Thư viện số là tập hợp những bộ sưu tập thông tin của các đối tượng số hoặc đã được số hóa có tổ chức và tập trung” Bằng cách sử dụng phần mềm nguồn mở Greenstone ta có thể tạo lập một cách nhanh chóng những bộ sưu tập thông tin như thế, có tổ chức và làm tăng năng lực truy tìm và lướt tìm của người sử dụng để hình thành thư viện số
Một bộ sưu tập thông tin bao gồm nhiều tài liệu dưới nhiều dạng thức khác nhau: văn bản, âm thanh, hình ảnh, hình ảnh động, tuy nhiên cung cấp một giao diện đồng nhất qua đó tất cả các tài liệu có thể được truy cập, mặc dù cách mà tài liệu đó hiển thị sẽ tùy thuộc vào phương tiện và dạng thức của tài liệu đó
Một thư viện nói chung bao gồm nhiều bộ sưu tập khác nhau, mỗi sưu tập tổ chức mỗi khác nhau, tùy hình thức tài liều được sưu tầm và tùy theo chủ đề, đề tài được quan tâm, tuy nhiên hoàn toàn giống nhau về cách thức xây dựng và hiển thị Các bộ sưu tập có thể được bổ sung cập nhật Kích thước bộ sưu tập có thể lên đến hàng gigabyte dữ liệu Bộ sưu tập có thể xem là đơn vị của một thư viện số Greenstone
2.1.2 Metadata (Siêu dữ liệu)
Trang 21Trong thư viện truyền thống, người ta biên mục để tạo nên những biểu ghi thư mục nhằm xây dựng hệ thống tra cứu qua mục lục phiếu Biểu ghi thư mục hay mục lục phiếu miêu tả lý lịch của tài liệu: nhan đề, đề mục, tác giả, xuất bản,vv…Khi sử dụng máy tính, biểu ghi thư mục này được biểu thị bằng một dạng thức máy đọc được (MARC) Cách biên mục này chỉ thể hiện được dạng thư mục tức lý lịch chứ không có toàn văn và đa phương tiện, được gọi là biên mục theo dạng liên tuyến (analog) Trong môi trường số, dữ liệu được đóng gói bằng ngôn ngữ XML Cách biên mục phải thay đổi qua môi trường Web, nghĩa là các dữ liệu thư mục phải được đóng gói, người ta gọi là biên mục theo dạng kỹ thuật số (digital) Các biểu ghi thư mục trở thành siêu dữ liệu thư tịch – metadata Vậy metadata chính là phiếu mục lục miêu tả lý lịch tài liệu được phát sinh tự động trong môi trường số Cụ thể metadata là thông tin mô tả cho một tài liệu trong bộ sưu tập, ví dụ tựa đề tài liệu, tên tác giả, ngày xuất bản,…Nói một cách khác metada tức là dữ liệu về dữ liệu, phục vụ hai mục đích chính là nhận dạng và mô tả
dữ liệu Nó sẽ được dùng để di chuyển tới hoặc xác định vị trí dữ liệu khi duyệt hoặc tìm kiếm trên một kho dữ liệu cũng như thu thập thông tin nhiều hơn về chính
dữ liệu đã được tìm thấy
Phần mềm nguồn mở Greenstone đã sử dụng Chuẩn Dublin Core, nội dung chủ yếu của chuẩn mô tả dữ liệu này gồm 15 trường dữ liệu dùng để mô tả chi tiết các nguồn tài liệu kể cả tóm tắt nội dung với đầy đủ những tiêu đề (nhan đề, tác giả, đề mục) và những điểm truy cập khác
Các yếu tố cơ bản của Dublin Core đều mang thuộc tính lựa chọn và có thể lặp lại Mỗi yếu tố cũng có một giới hạn những hạn định, thuộc tính nhằm diễn giải chính xác ý nghĩa của các yếu tố
1) Nhan đề (Title): Nhan đề tài liệu
Trang 222) Tác giả (Creator): Người hoặc cơ quan chịu tránh nhiệm chính về nội dung
trí tuệ của tài liệu
3) Đề mục (Subject): Chủ đề của nguồn thông tin và được thể hiện bằng từ
vựng có kiểm soát gồm tiêu đề đề mục, số phân loại,
4) Mô tả (Description): Phần thể hiện nội dung của nguồn thông tin bao gồm
cả phần tóm tắt của tư liệu văn bản hoặc nội dung của tư liệu nghe nhìn
5) Xuất bản (Publisher): Cơ quan, tổ chức chịu trách nhiệm tạo lập, xuất bản
nguồn thông tin trong định dạng thực
6) Tác giả phụ (Contributor): Cá nhân hay tổ chức có những đóng góp về
mặt trí tuệ cho tư liệu nhưng không phải là tác giả chính
7) Ngày tháng (Date): ngày tháng có liên quan đến việc tạo lập, xuất bản hay
công bố tư liệu
8) Loại hình (Type): hình thức vật chứa nội dung tư liệu
9) Mô tả vật lý (Format): Định dạng vật lý và kích thước của tư liệu như kích
cỡ, thời lượng, Định dạng cũng còn được dùng để chỉ rõ phần mềm và phần cứng cần thiết để sử dụng tư liệu
10) Định danh tư liệu (Identifier): Là một dãy ký tự hoặc số nhằm thể hiện
tính đơn nhất của tư liệu như: URLs và URNs, ISBN, ISSN,
11) Nguồn gốc (Source): Nguồn gốc mà tư liệu được tạo thành, yếu tố này có
thể bao gồm siêu dữ liệu về nguồn thông tin thứ hai nhằm khai thác tư liệu hiện hành
12) Ngôn ngữ (Language): Ngôn ngữ của nội dung tư liệu
13) Liên kết (Relation): Yếu tố này thể hiện những kết nối giữa những nguồn
tư liệu có liên quan
Trang 2314) Nơi chứa (Coverage): Những đặc tính về không gian và/hoặc thời gian
của tư liệu Không gian nơi chứa chỉ ra một vùng sử dụng địa danh hoặc toạ
độ Đặc tính thời gian trong yếu tố này chỉ ra khoảng thời gian mà tư liệu
đề cập tới
15) Bản quyền (Rights): Thông tin về tình trạng bản quyền (Ghi lại nguồn
tham khảo: http://dublincore.org/documents/dces/)
Dưới đây là hình minh họa các yếu tố của Dublin Core được sử dụng trong phần Enrich của Greenstone
Tiếp theo là hình mô tả siêu dữ liệu thư mục với liên kết đến phần toàn văn tài liệu
Trang 24Nếu muốn xem phần toàn văn thì click chuột vào đường liên kết ở thành
phần Indentifier đến server – nơi cung cấp bộ sưu tập
Greenstone dùng các thẻ XML để mô tả thông tin cho tài liệu, ví dụ:
<Metadata name =“Title”> Tìm hiểu nguồn mở Greenstone </Metadata>
<Metadata name =“Author”>Quy,Quỳnh </Metadata>
Các thẻ này có thể:
- Được nhúng trong tài liệu của bộ sưu tập, ví dụ các thẻ HTML trong tài liệu HTML
- Được lưu thành tập tin metadata kèm theo tài liệu
- Được trích một cách tự động từ một tài liệu nào đó, ví dụ thông tin về tên, kích thước, ngày tạo, ngày hiệu chỉnh,…tập tin tài liệu
Trang 25Mỗi bộ sưu tập có một tập tin cấu hình collect.cfg Tập tin này liệt kê các plugin được dùng trong quá trình xây dựng bộ sưu tập Tùy theo tài liệu nguồn có định dạng thế nào, ta sẽ chọn các plugin tương ứng Ví dụ nếu tập tài liệu nguồn là tập tin word thì ta dùng plugin WordPlug
Trang 26Các plugin được viết bằng ngôn ngữ lập trình Perl Mỗi plugin đều kế thừa
từ plugin cơ sở BasPlug Plugin cơ sở BasPlug thực hiện những thao tác cơ bản như tạo tài liệu mới XML theo đinh dạng của Greenstone, gán định danh cho tài liệu Các plugin được đặt trong thư mục “greenstone\perllib\plugins”
Để tìm hiểu thông tin của một plugin, ta dùng lệnh sau ở chế độ command prompt: pluginfo.pl plugin-name Ta cũng có thể viết các plugin mới
Hiện có khoảng 18 plugin được sử dụng trong quá trình xây dựng bộ sưu tập
số đó là : ArcPlug, BasPlug, ConvertToPlug, RecPlug, GaPlug, TextPlug, HTMLPlug, WordPlug, PDFPlug, PSPlug, EMAILPlug, BibTexPlug, ReferPlug, SRCPlug, ImagePlug, SplitPlug, FOXPlug, ZIPPlug Tuy nhiên, trong số các plugin kể trên chỉ có một số plugin được sử dụng thường xuyên để xử lý các dạng tài liệu tương ứng như:
- TEXTPlug (*.txt, *.text): Xử lý tệp tin text thuần túy
- HTMLPlug (*.htm, *.html; also, shtml, shm, asp, php, cgi): Xử lý các file HTML
- WORDPlug (*.doc): Xử lý các tài liệu Word
- ZIPPlug (.gz, z, tgz, taz, zip, tar): Xử lý các file dưới dạng nén hoặc lưu trữ như gzip (.gz, z, tgz, taz), bzip (.bz), zip (.zip, jar) và tar (.tar)
Trang 27- IMAGEPlug (.gzip, bzip, zip, tar,…): Xử lý các tập tin ảnh Plugin này chỉ dùng trên UNIX
Các plugin xử lý tài liệu độc quyền: Đối với tài liệu độc quyền như word, pdf, ta dùng các plugin tương ứng là WordPlug, PDFPlug, Các plugin này thực hiện hai thao tác:
1 Chuyển tài liệu nguồn sang dạng html hay plain text
2 Xử lý plugin HTMLPlug hay TEXTPlug chuyển kết quả ở bước 1 sang dạng XML của Greenstone
2.1.4 Classifier
Classifier dùng để xây dựng cấu trúc duyệt tài liệu trên web của một bộ sưu tập Tương tự các plugin, các classifier được đặc tả trong tập tin cấu hình collect.cfg của mỗi bộ sưu tập
Trong phần cuối cùng của quá trình xây dựng bộ sưu tập (nén và tạo chỉ mục trên tài liệu), các classifier được script buidcol.pl gọi sẽ lưu cấu trúc duyệt tài liệu vào cơ sở dữ liệu bộ sưu tập
Trang 28Hình minh họa về một số classifier
Cú pháp: classifier <Tên classifier> <Các tham số>
Ví dụ: classifier AZList – metadata Title – buttonnam TitleA-Z
Trong dòng đặc tả có một tham số quan trọng là metadata xác định rằng các tài liệu của bộ sưu tập sẽ được sắp xếp theo metadata đã được chỉ ra Với ví dụ trên, các tài liệu được sắp xếp theo tựa đề của tài liệu (Title)
Tham số buttonname xác định tên nút xuất hiện trên thanh duyệt Với dòng đặc tả trên, khi ta click vào nút TitleA-Z trên thanh duyệt, các tài liệu của bộ sưu tập được liệt kê theo thứ tự từng vùng alphabet
Trang 29(Hình minh họa về classifier khi duyệt tài liệu theo trường tác giả)
Các classifier được đặt trong thư mục greenstone\perllib\classify Để biết thêm thông tin của classifier, dùng lệnh: classinfo.pl <Tên classifier> Ta có thể viết các classifier mới
Những nút trên thanh duyệt, ngoại trừ nút Search, được quản lý bởi các classifier Khi định nghĩa một classifier trong tập tin collect.cfg, những nút liên quan sẽ xuất hiện trên thanh duyệt
Các nhóm classifier:
- Nhóm classifier liệt kê tài liệu dưới dạng danh sách (list):
+ Classifier AZList: liệt kê tài liệu theo từng vùng alphabet
Trang 30Hình minh họa liệt kê tài liệu theo dạng AZList
+ Classifier List: liệt kê tài liệu thành một danh sách sắp thứ tự alphabet + Classifier DateList: liệt kê tài liệu theo từng vùng thời gian
Trang 31- Nhóm classifier liệt kê tài liệu dưới dạng phân cấp:
+ Classifier Hierarchy: liệt kê các tài liệu dưới dạng phân cấp
Trang 322.1.5 Duyệt tài liệu
Greenstone cho phép định nghĩa trước các cấu trúc để duyệt tài liệu trong mỗi bộ sưu tập dựa trên những metadata tìm thấy trong bộ sưu tập đó
Ví dụ, bộ sưu tập Greenstone Demo cho phép ta duyệt các tài liệu theo metadata “đề mục”
Với những tài liệu phân cấp theo bảng mục lục, ta có thể duyệt theo chính mục lục đó, rất tiện lợi, như hình dưới đây
Trang 332.1.6 Tìm kiếm
Theo chế độ mặc định, các bộ sưu tập cho phép tìm kiếm trên toàn bộ nội dung văn bản, hoặc có thể tìm trên từng vùng (section) hay đoạn (paragraph) Cũng
có thể tìm kiếm theo các từ khóa, hay các cụm từ, và kết quả sẽ được sắp xếp thứ
tự theo yêu cầu của câu truy vấn Với cách tìm kiếm linh hoạt này, việc truy cập đến các bộ sưu tập sẽ trở nên dễ dàng và thuận tiện, tiết kiệm được thời gian tìm kiếm cho người sử dụng
Tuy nhiên người xây dựng bộ sưu tập có thể tự lựa chọn chế độ tìm kiếm cho mỗi bộ sưu tập cũng như thiết kế các tiêu chí tìm kiếm riêng cho từng bộ sưu tập đó Greenstone không hạn chế số lượng các trường tìm kiếm, điều này phụ thuộc vào bộ metadata mà người xây dựng thư viện sử dụng và thiết kế
Trang 34Hình minh họa chế độ tìm theo toàn văn, nhan đề, tác giả, nhà xuất bản, chủ đề
2.2 Tính năng, ưu điểm và hạn chế của nguồn mở Greenstone
2.2.1 Tính năng của nguồn mở Greenstone
Sau đây là những đặc trưng nổi bật, và cũng là ưu thế của Greenstone
- Truy cập qua trình duyệt web, cả ở chế độ cục bộ (local) và từ xa (remote)
- Tương thích Z39.50 Giao thức Z39.50 hỗ trợ việc truy cập máy chủ bên ngoài cũng như giới thiệu bộ sưu tập Greenstone cho người sử dụng bên ngoài
- Chạy được trên nhiều hệ điều hành: Windows, Unix, Mac OS X Nhờ vậy, Greenstone dễ dàng được sử dụng ở nhiều nơi
- Tìm kiếm toàn văn và tìm kiếm theo từng trường riêng biệt
- Khả năng trình duyệt linh động, đa dạng
Trang 35- Cấu trúc duyệt tài liệu được xây dựng hoàn toàn tự động
- Tận dụng các metadata sẵn có trong tài liệu, giúp người tạo bộ sưu tập không phải làm bằng tay
- Khả năng linh động, dễ mở rộng và chỉnh sửa hệ thống nhờ các thành phần như plugin, classifier Các đinh dạng mới của một tài liệu và metadata được cung cấp bằng cách viết “plugin” (trong Perl) Tương tự, việc duyệt cấu trúc của metadata có thể thực hiện bằng cách viết “classifiers” Giao diện người sử dụng có thể được thay thế bằng cách viết các “macros” Giao thức Corba cho phép các chương trình thông minh (ví dụ trong Java) sử dụng tất cả các tiện ích đi kèm với
bộ sưu tập Cuối cùng, source code bằng C++ và Perl được cung cấp miễn phí và cho phép sửa đổi
- Hỗ trợ xử lý tài liệu với nhiều loại ngôn ngữ Unicode được dùng để hỗ trợ việc chuyển đổi ngôn ngữ Chỉ mục riêng biệt có thể tạo ra cho những ngôn ngữ khác nhau Cung cấp giao diện đa ngôn ngữ là vấn đề hết sức cần thiết vì chúng ta không thể phụ thuộc vào phần mềm, chờ đợi các phiên bản mới cho một ngôn ngữ mới nếu như ví dụ chúng ta muốn thêm chỉ một bộ sưu tập về bia đá đời Đường của Trung Quốc với các hình ảnh chụp và các các chú dẫn tiếng Trung Quốc Hơn nữa, đây là phần mềm nguồn mở sẽ còn nhiều thư viện của nhiều quốc gia sử dụng phần mềm này Giao diện đa ngôn ngữ sẽ cho phép các quốc gia mới cập nhật giao diện mới với ngôn ngữ của họ vào giao diện chung của phần mềm Greenstone Khi
đó, vấn đề ngôn ngữ sẽ không trở thành rào cản gây khó khăn cho việc trao đổi thông tin trên toàn cầu
- Ngoài các bộ sưu tập văn bản, hình ảnh thông thường, Greenstone còn cho phép tạo các bộ sưu tập hình ảnh, âm thanh đa phương tiện (multimedia) Nhờ vậy, các thư viện và trung tâm thông tin có thể lưu trữ, quản lý, bổ sung được nhiều loại hình tài liệu phục vụ cho nhu cầu đa dạng của người sử dụng
Trang 36- Khả năng lưu trữ rất lớn, tới hàng Gigabyte dữ liệu Đây cũng là tính năng rất quan trọng của Greenstone vì yêu cầu đối với một phần mềm tốt là làm sao phải lưu trữ được nhiều dữ liệu đáp ứng được việc số lượng tài liệu trong các thư viện ngày càng tăng theo thời gian
- Thêm mới bộ sưu tập đơn giản, có hiệu quả tức thì Khi sưu tầm thêm được những tài liệu mới, ta có thể dễ dàng bổ sung vào bộ sưu tập bằng cách tái xây dựng
- Khả năng xuất bản các bộ sưu tập ra CD - ROM hoặc DVD - ROM, với đầy đủ tính năng để có thể tự cài đặt và chạy độc lập Mỗi bộ sưu tập được xuất bản lên Internet hay CD-ROM đều có một giao diện Greenstone kèm theo Nếu trên CD-ROM thì giao diện Greenstone có chứa sẵn một phần trình duyệt (web browser) Netscape để tải xuống (download) cho những máy cá nhân nào không sử dụng web Như thế cho chúng ta thấy rằng mỗi khi một bộ sưu tập được xuất ra CD-ROM thì người sử dụng có thể dùng bất kỳ một máy tính với bất kỳ một hệ điều hành nào đều có thể đọc, truy tìm, lướt tìm, in ra những thông tin trên bộ sưu tập với giao điện thân thiện của Greenstone Nếu chúng ta sử dụng và truy cập vào
bộ sưu tập của các quốc gia khác nhau ở khắp nơi trên thế giới thì có thể sử dụng giao diện của nhiều ngôn ngữ, trong đó có cả giao diện tiếng Việt
- Các bộ sưu tập dễ dàng được mang chuyển, phân phối, chia sẻ Việc phân phối bao gồm các bản cài đặt cho tất cả các phiên bản của Windows, Linux và Mac
OS X Nó cũng cung cấp toàn bộ mã nguồn (source code) của hệ thống để người
sử dụng có thể biên dịch lại bằng Microsoft C++ hoặc gcc Phần mềm đi kèm với Greenstone cũng hoàn toàn miễn phí, ví dụ Apache Webserver và PERL Giao diện người sử dụng dùng một Web browser điển hình là Netscape Navigator hoặc Internet Explorer
- Theo phong cách WYSIWYG (What you see is what you get), dễ
Trang 37dùng, thuận tiện Tính năng này giúp cho Greenstone nhanh chóng được người sử dụng chấp nhận
- Phát triển thêm các chức năng khác theo yêu cầu Đây là tính năng nổi bật của phần mềm nguồn mở nói chung và phần mềm Greenstone nói riêng Nó cũng
là tính năng quan trọng mà các phần mềm thương mại không thể có Nhờ tính năng này người sử dụng sẽ tự điều chỉnh phần mềm cho phù hợp với tình hình sử dụng
và điều kiện cụ thể của thư viện và trung tâm thông tin mình
2.2.2 Ưu điểm của nguồn mở Greenstone
Phần mềm nguồn mở Greenstone đem lại cho chúng ta một hướng đi mới, một giải pháp mới để xây dựng và phân phối các bộ sưu tập thư viện số trong công tác thông tin – thư viện ở các nước đang phát triển nói chung và ở Việt Nam nói riêng, nhằm phục vụ một cách tốt nhất, thuận lợi nhất cho người làm công tác thư viện cũng như người khai thác thông tin, và đó cũng là một xu thế trong công tác thông tin - thư viện hiện nay trên thế giới – đích đến của thư viện số Dưới đây là những ưu điểm của phần mềm này:
Greenstone là phần mềm đa ngôn ngữ, với các giao diện sẵn có bằng tiếng Anh, tiếng Pháp, tiếng Nga và được dịch ra hơn 50 ngôn ngữ khác
- 4 ngôn ngữ lòng cốt: Anh, Pháp, Tây Ban Nha, và Nga Ấn bản Greenstone tiếng Pháp, Tây Ban Nha, và Nga được UNESCO bảo trì; ấn bản tiếng Anh do Chương trình Dự án thư viện số New Zealand bảo trì Khi chúng ta download Greenstone thì giao diện của bốn ngôn ngữ nòng cốt tự động được cài đặt; còn các ngôn ngữ khác phải cần có sự tham gia của người bảo trì hệ thống Greenstone
- Các ấn bản của các ngôn ngữ đã hoàn chỉnh bao gồm: Arập, Hoa Kỳ, Ba Lan, Bungari, Bồ Đào Nha (Brazil), Bồ Đào Nha (Portugal), Catalan, Croatia, Séc,
Trang 38Đức, Farsi, Galician, Georgian, Hà Lan, Hê-brơ (của người Do Thái cổ), Ấn Độ,
Hy Lạp, Inđônêxia, Ý, Kannađa, Kazakh, Kirghiz, Latvia (ngôn ngữ vùng Bantic của người Latvia), Mãori, Mông Cổ, Nhật Bản, Phần Lan, Xéc Bi, Thái Lan, Thổ Nhí Kỳ, Trung Hoa (phổ thông), Trung Hoa (Truyền thống), Ucraina, Việt Nam
- Các ấn bản của các ngôn ngữ đang tiến hành phiên dịch bao gồm: Bislama, Blackfoot/Siksika, Bôsnia, Espêrantô (Quốc tế ngữ), Hungari, Hàn Quốc, Maxêđônia, Maratha (của người ở xứ Maratha ở Trung Ấn Độ) , Nêpan, Rôman, Sôna, Tamin (của người gốc Nam Ấn Độ và Srilanca)
Greenstone là một phần mềm mới, hữu ích nó sẽ còn được dịch ra nhiều ngôn ngữ hơn nữa
Điểm mạnh thứ hai là có sẵn một số lượng lớn sự giúp đỡ trực tuyến và từ những người khác Website của Greenstone có một trang Wiki hướng dẫn trực tuyến, hai địa chỉ thư điện tử, và chương trình đào tạo toàn cầu Những phần khác giải thích cụ thể cho sự hỗ trợ rộng rãi là một trong những điểm mạnh nhất của Greenstone Greenstone có nhiều tài liệu hướng dẫn sử dụng, hướng dẫn cài đặt Trong quá trình xây dựng các thư viện có thể trao đổi kinh kinh nghiệm với nhau
và có thể tham khảo từ các thư viện nước ngoài thông qua thư điện tử Hiện nay các tài liệu hướng dẫn sử dụng đã được dịch sang tiếng Việt rất thuận lợi cho các thư viện ở Việt Nam khi muốn sử dụng phần mềm này
Điểm mạnh thứ ba nằm ở sự phân phối và giấy phép của Greenstone Greenstone được phân phối với sự hỗ trợ của UNESCO và Human Info NGO làm cho phần mềm này miễn phí Các thư viện, thậm chí cả những cá nhân đều có thể
sử dụng Greenstone bằng cách download phần mềm này từ trang web
Giấy phép cho phần mềm Greenstone là chuẩn của GNU General Public Licence Chẳng hạn như ta có thể kiểm tra Greenstone trong máy tính cá nhân trước khi đưa
Trang 39chúng vào sử dụng miễn phí trong thư viện Greenstone sẽ dễ dàng chạy trên nhiều
hệ điều hành vì nó được hỗ trợ chậy trên tất cả các hệ điều hành từ Windows95 đến WindowsXP, các phiên bản của Unix và Max OS X Đặc biệt, khi Greenstone không chạy được trên máy tính cá nhân của bạn, bạn vẫn có thể truy cập thư viện
số qua trang web của Greenstone
Điểm mạnh thứ tư, Greenstone là một chương trình rất dễ chỉnh sửa mà không cần trình độ cao về máy tính Có bốn cấp độ quản lý việc truy cập (cán bộ thủ thư trợ giúp, thủ thư, hệ thống chuyên gia, và các nhà chuyên môn) cùng với việc truy cập của độc giả Mức độ truy cập của thủ thư cho phép họ có thể tùy biến Greenstone để đáp ứng nhu cầu cụ thể của từng thư viện riêng, trong khi đó cấp độ
hệ thống chuyên gia và nhà chuyên môn truy cập cho phép họ xây dựng và kết hợp chúng với các chương trình đã có trước đó (Witten và Bainbridge, 2005) Nhờ sự linh động này mà Greenstone sẽ phù hợp với mọi thư viện nếu cán bộ ở thư viện
đó chỉnh sửa lại chúng theo đặc điểm của thư viện họ Hơn nữa, nhờ cơ chế này mà thư viện số sẽ có ý nghĩa và hữu ích hơn vì độc giả và nhân viên thư viện cùng hợp tác xây dựng các bộ sưu tập, đặc biệt là các bộ sưu tập chuyên ngành; cũng như nhiều thư viện cùng hợp tác chia sẻ với nhau những bộ sưu tập đó Ví dụ, ở thư viện trường ĐH KHTN TP HCM nhờ nhận thức được điều này nên họ đã nỗ lực quảng bá việc sử dụng Greenstone đến nhiều đồng nghiệp; đồng thời đề xuất với nhà trường một kế hoạch tập huấn và động viên cán bộ giảng dạy, các nhà nghiên cứu quan tâm và sử dụng Greenstone nhằm xây dựng những bộ sưu tập theo chuyên ngành của mình để sử dụng và đóng góp cho thư viện, tạo thành Kho tài nguyên học tập dùng chung cho tất cả mọi người
Greenstone còn có khả năng vượt trội hơn nữa đó là khả năng xây dựng các
bộ sưu tập ảo bằng cách nhúng Greenstone vào cổng thông tin tích hợp, kế thừa các tính năng tổ chức và tìm kiếm tài liệu sẵn có ở thư viện để gặt hái siêu dữ liệu
Trang 40từ các nguồn trên internet dựa vào giao thức OAI-PMH nổi tiếng Mỗi bộ sưu tập được xây dựng là tập hợp các biểu ghi OAI từ một hoặc nhiều địa chỉ liên kết URL Thư viện trường ĐH KHTN TP HCM đã xây dựng được bộ sưu tập ảo nhờ phương thức này ta có thể truy cập vào bộ sưu tập tương tự như truy cập các bộ sưu tập số
2.2.3 Một số hạn chế của nguồn mở Greenstone
Greenstone là phần mềm mã nguồn mở có nhiều ưu điểm nên đã được nhiều thư viện lựa chọn sử dụng Cho đến nay các nhà nghiên cứu mới chỉ phát hiện được hai hạn chế của Greenstone đó là:
“Greenstone quản lý các thư viện số nhưng nó lại không bảo vệ chúng” (theo Witten, Baneridge, Tanslay, Huang, Don; 2005) Tức là Greenstone quản lý các nguồn tài nguyên số hóa nhưng việc truy cập đến những nguồn tài nguyên này lại không được quản lý Bạn đọc có thể truy cập một cách rộng rãi mà không cần có tài khoản và mật khẩu Điều này sẽ gây ra những khó khăn cho việc quản lý các tài liệu số hóa trong trường hợp đó là những tài liệu dành riêng cho một nhóm độc giả nhất định, ví dụ như tài liệu dành riêng cho các nhà nghiên cứu hay dành riêng cho giảng viên Đối với những nguồn tài liệu quý hiếm thì quản lý việc truy cập đến nguồn tài liệu này càng trở nên quan trọng Để bảo quản tốt các nguồn tài nguyên
số các thư viện sử dụng phần mềm Greenstone phải có thêm chương trình quản lý tài nguyên số Nếu trong thư viện chưa có một chương trình riêng để bảo quản các nguồn tài nguyên số thì nó sẽ cần phải có một chương trình như vậy Trong khi để
có một chương trình riêng quản lý các tài liệu số các thư viện sẽ phải mua ở các công ty cung cấp phần mềm mà giá của các phần mềm này sẽ phụ thuộc vào nhà cung cấp, thậm chí các thư viện sẽ phải trả với giá cao để mua được chương trình như vậy Nhưng rất may, Greenstone là một chương trình nguồn mở được cung cấp