Giới thiệu Greenstone– Greenstone không phải là thư viện số – Greenstone là phần mềm dùng để xây dựng, phát hành và truy cập tới các bộ sưu tập số của thư viện số – Greenstone cung cấp
Trang 1PHD DO QUANG VINH
Email: dqvinh@live.com
HANOI - 2013
Trang 2BÀI GIẢNG THƯ VIỆN SỐ
TS ĐỖ QUANG VINH
Email: dqvinh@live.com
Trang 3NỘI DUNG
I TỔNG QUAN VỀ THƯ VIỆN SỐ DL
II MÔ HÌNH HÌNH THỨC CHO THƯ VIỆN SỐ DL III CHỈ MỤC TÀI LIỆU
IV TÌM KIẾM THÔNG TIN
V CÁC CHUẨN SỬ DỤNG TRONG THƯ VIỆN SỐ
VI THỰC HÀNH HỆ PHẦN MỀM
THƯ VIỆN SỐ GREENSTONE
Trang 56.1 Giới thiệu Greenstone
– Greenstone không phải là thư viện số
– Greenstone là phần mềm dùng để xây dựng, phát hành và
truy cập tới các bộ sưu tập số của thư viện số
– Greenstone cung cấp một phương pháp mới để tổ chức và
xuất bản thông tin trên mạng nội bộ, Internet hay
Trang 6 Quá trình phát triển
Kết quả của Dự án Thư viện số New Zealand tại trường Đại
học Waikato, NZ
Được triển khai và phân phối với sự hợp tác của hai tổ chức
UNESCO và Human Info NGO
Mục đích
Hỗ trợ các tổ chức như trường đại học, viện nghiên cứu, trung tâm thông tin, tổ chức chính phủ, phi chính phủ, phi lợi nhuận
Trang 7 Ứng dụng
Tạo lập, tổ chức và quản trị thông tin trong bộ sưu tập số:
– Xây dựng kho tài liệu phục vụ nghiên cứu, học tập
– Đóng gói thông tin theo chuyên đề phục vụ dịch vụ cung cấp
thông tin chọn lọc (SDI)
– Lưu trữ và quản lý công văn, tài liệu nội bộ
– Xây dựng các bộ sưu tập của các bảo tàng, trung tâm lưu trữ
Trang 8 Được sử dụng rộng rãi tại nhiều quốc gia trên thế giới: Hoa
Kỳ, Australia, New Zealand, Nga
Sử dụng rộng rãi tại các trường đại học: University of
Chicago, Lehigh University, Đại học Quốc gia TP.HCM
Được dịch ra hơn 40 ngôn ngữ: Anh, Nga, Pháp, Tây Ban
Nha, Trung Quốc, Ả rập … trong đó có tiếng Việt
Trang 9Website sử dụng Greenstone
• Association of Indian Labour
Historians, Delhi
• Auburn University, Alabama
• California University at Riverside
• Chicago University Library
• Detroit Public Library
• Gresham College, London
• Hawaiian Electronic Library
• Illinois Wesleyan University
• Indian Institute of Management
• Kyrgyz Republic National
Library
• LeHigh University, Pennsylvania
• Mari El Republic, Russia
• National Centre for Science
Information, Bangalore, India
• Netherlands Institute for
Scientific Information Services
•
• Philippine Research Education
and Government Information Network
• Secretary of Human Rights of
Argentina
• Slavonski Brod Public Library,
Slovenia
• State Library of Tasmania
• Stuttgart University of Applied
Sciences
• Texas A&M University Center
for the Study of Digital Libraries
• University of Illinois
• University of North Carolina
ibiblio project
• Vietnam National University
• Vimercate Public Library, Milan,
Italy
• Washington Research Library
Consortium
Trang 10 Tính năng
– Yêu cầu phần mềm
– Giao diện
– Hỗ trợ đa ngôn ngữ
– Quy mô bộ sưu tập
– Khả năng tương thích các chuẩn
– Khả năng tìm kiếm
– Hỗ trợ đa phương tiện
Trang 11 Yêu cầu phần mềm
– Hệ điều hành: WINDOWS, LINUX
– Máy chủ Apache Web Server, IIS
– Trình duyệt Internet Explorer, hay FireFox
Trang 13Greenstone cung cấp giao diện thủ thư (GLI) cho phép thu thập, chỉnh sửa và tạo bộ sưu tập số
Trang 14 Hỗ trợ đa ngôn ngữ
Greenstone hỗ trợ nhiều ngôn ngữ khác nhau:
– 4 ngôn ngữ chính: Anh, Pháp, Nga, Tây Ban Nha
– Các ngôn ngữ đã hoàn chỉnh: Trung, Việt, Ba Lan, Bồ Đào
Nha, Thái Lan, v.v…
– Một số ngôn ngữ đang được biên dịch
Trang 18 Quy mô bộ sưu tập
Các bộ sưu tập có thể chứa hàng nghìn đến hàng triệu tài liệu
Thời gian tạo bộ sưu tập tùy thuộc vào quy mô, kích thước của
bộ sưu tập, có thể kéo dài từ vài phút đến vài ngày
Có thể nén bộ sưu tập để giảm kích thước tệp tin văn bản và
chỉ mục
Khả năng tương thích các chuẩn
Sử dụng metadata: Tạo các điểm truy cập từ metadata
Có thể gán metadata cho mỗi tài liệu hoặc một phần tài liệu
Trang 19 Khả năng tìm kiếm
Tìm kiếm toàn văn linh hoạt
Có thể tìm theo các điểm truy cập (trường)
Ví dụ: tác giả, chủ đề, ngày tháng, v.v…
Duyệt theo các danh mục tác giả, nhan đề tài liệu, đề mục,
ngày tháng
Duyệt theo cấu trúc phân cấp
Hỗ trợ đa phương tiện
Hỗ trợ nhiều định dạng tệp tin: doc, pdf, html, xml
Hỗ trợ nhiều loại hình tài liệu khác nhau: văn bản, hình ảnh,
âm thanh, video
Có khả năng tạo các bộ sưu tập theo loại hình xuất bản: tạp chí
Trang 20 Khả năng phát hành bộ sưu tập
Bộ sưu tập số có thể được phát hành trên mạng nội bộ,
Internet hoặc xuất ra đĩa CD-ROM tự khởi động cài đặt
Quá trình phát hành bộ sưu tập đơn giản và thuận tiện
Tùy biến bộ sưu tập
Greenstone là phần mềm mã nguồn mở cho phép người dùng
có thể tự do chỉnh sửa chương trình cho phù hợp với nhu cầu
sử dụng của mình
Có thể tùy biến giao diện, cấu hình các thuộc tính của bộ sưu
Trang 216.2 Cài đặt
Tải chương trình Greenstone
Truy cập vào địa chỉ:
http://www.greenstone.org hoặc http://www.nzdl.org
Nháy chuột vào mục Download
Trang 22Chän version Greentone download
Trang 23Chọn Save File để lưu tệp tin
Trang 24 Yêu cầu về hệ thống
Máy tính Pentium IV
RAM tối thiểu là 512 MB
Hệ điều hành: Windows XP , WIN7, WIN8
Phần mềm Microsoft Word
Phần mềm Acrobat Reader
Bộ Font tiếng Việt: Unikey hoặc Vietkey
Trang 25 Greenstone chạy trên nền Java Platform, có thể tải về từ
– Khi chương trình thông báo InstallShield Wizard với
Licence Agreement thì chọn YES
– Chương trình cho phép lựa chọn Setup Type: lựa chọn
TYPICAL
– Nháy chuột vào NEXT để cài đặt
– Chương trình tự động thực hiện.
Trang 26Chọn ngôn ngữ hiển thị:
Anh – Pháp – Nga – Trung – Đức – Tây ban nha – Arập
Chọn Next
Trang 27Chọn Accept Chọn Next
Trang 28Chọn thư mục cài đặt, sau đó nháy Next
Chọn Next
Trang 29Chọn Next
Trang 31Chọn Install
Trang 33Chọn Exit
Trang 34 Cấu trúc thư mục của Greenstone
Chương trình thông thường được cài đặt vào thư mục sau:
C:\Users\DOVINH\greenstone\
Đây là thư mục Home của CSDL
Có thể vào xem các thư mục của CSDL
bằng các trình duyệt Windows Explorer hoặc FireFox
Trang 35 Cấu trúc CSDL (Bộ sưu tập)
Archives Building etc Images Import Index Perllib
Tên CSDL
Trang 36 Các thư mục chương trình
Thư mục gốc: chứa tệp chương trình chính và tệp cấu hình thư
mục
_uninst: chứa chương trình uninstall.exe
bin: chứa các Java scripts
cgi-bin: chứa các Perl scripts
Collect: chứa các bộ sưu tập
etc: chứa tệp cấu hình chính (main.cfg)
gli: chứa chương trình của GLI
images: chứa ảnh của chương trình
macro: chứa các macro chương trình
Trang 37 Thư mục con của từng bộ sưu tập
Các bộ sưu tập (CSDL) được lưu trong thư mục collect
Mỗi bộ sưu tập là một thư mục
Trong mỗi thư mục sưu tập có nhiều thư mục con:
– archieves: lưu các tệp CSDL
– etc: tệp cấu hình của CSDL
– index: các tệp chỉ mục
– import: chứa các tệp tin nhập vào
– building: thư mục để xây dựng bộ sưu tập
– metadata: chứa các cấu trúc siêu dữ liệu
– images: ảnh của CSDL
Trang 38 Mở tệp tin cấu hình main.cfg trong thư mục
C:\Users\DOVINH\Greenstone\etc bằng Notepad/ Wordpad
Sửa lại dòng lệnh
Trang 39 Tệp cấu hình CSDL (bộ sưu tập)
Tên tệp: collect.cfg
Ghi các thông số liên quan đến từng bộ sưu tập:
– chứa thông tin về cấu hình
Trang 40 Khởi động chương trình
Trang 41Khi hộp thoại xuất hiện, nháy chuột
vào nút Enter Library
Trang 46 Giao diện thủ thư (GLI)
Phần mềm Greenstone cung cấp giao diện thủ thư (Greenstone
Librarian Interface - GLI) để giúp tạo ra các bộ sưu tập cho thư viện số
– Giao diện thân thiện người dùng.
– Tạo bộ sưu tập nhanh chóng, dễ dàng.
Trang 47Giao diện thủ thư (GLI)
Trang 48 Các chức năng cơ bản của GLI
Tải xuống (Download): tải tài liệu từ Internet về để đưa vào cơ
sở dữ liệu
Thu thập (Gather): Lựa chọn và tập hợp các tài liệu đưa vào cơ
sở dữ liệu
Nhập Siêu dữ liệu (Enrich): Gán siêu dữ liệu (metadata) mô tả
cho các tài liệu có trong cơ sở dữ liệu, để phục vụ cho việc tìm kiếm tài liệu
Thiết kế (Design): Thiết lập các tham biến của cơ sở dữ liệu
(tạo chỉ mục cho các trường, thiết lập thuộc tính duyệt bộ sưu tập)
Trang 49 Khởi động giao diện thủ thư (GLI)
Start\ All Programs\ Greenstone-3.05\ Greenstone Librarian
Interface (GLI)
Trang 50 Chọn ngôn ngữ giao diện của GLI
Trang 51 Chọn ngôn ngữ giao diện của GLI
Chọn File\Chọn Preferences … \General
Interface Language: chọn English - Tiếng Anh
Vietnamese - Tiếng Việt
Font
Chọn Apply: xuất hiện thông báo:
Chọn OK
Trang 526.3 Xây dựng cơ sở dữ liệu mới (bộ sưu tập)
− Chọn File\ New…
− Nhập tên bộ sưu tập vào ô Collection title (thí dụ: ISIS)
− Nhập mô tả bộ sưu tập vào ô Description of content (thông tin chung về cơ sở dữ liệu sẽ được xây dựng)
− Chọn kiểu bộ sưu tập: Base this collection on New Collection
− Nháy OK để tạo lập bộ sưu tập mới
Trang 53 Thu thập
− Chọn Gather
− Chọn các tài liệu đưa vào bộ sưu tập
Chọn ổ đĩa và thư mục chứa các tài liệu đưa vào bộ sưu tệp
Nếu là từ máy cục bộ, chọn Local Filespace
Trang 54 Chọn các tài liệu đưa vào bộ sưu tập
Documents in Greenstone Collections: Các tài liệu có sẵn
trong các bộ sưu tập khác trên máy tính
Files Localspace (Vùng làm việc cục bộ): Chọn tài liệu từ các
thư mục trong máy tính
Home Folder (DOVINH) (Thư mục chủ): Thư mục tài liệu
của người sử dụng máy tính
Download Files (Các tệp được tải xuống): Các tệp tin tải
xuống từ Internet để đưa vào bộ sưu tập (CSDL)
Chọn thư mục hoặc các tài liệu cần đưa vào bộ sưu tập
(CSDL)
Trang 55 Chọn các tài liệu đưa vào bộ sưu tập
Dùng kỹ thuật kéo thả (Drag-Drop) để đưa tài liệu vào Collection
Chọn tài liệu trong thư mục hoặc cả thư mục tại
Workspace
Trang 56Các tệp tin có
trong bộ sưu tập
Biểu tượng tạo thư mục mới trong bộ sưu tập
Trang 57 Tạo lập CSDL (bộ sưu tập)
− Chọn Create
− Nháy chuột vào Build Collection
− Xem kết quả nháy chuột vào Preview Collection
Trang 59 Chuẩn bị tài liệu trước khi đưa vào CSDL - tệp DOC
Trang 60 Chuẩn bị tài liệu trước khi đưa vào CSDL - tệp HTML
Chú ý:
+ Đối với tệp HTML: đưa nhan đề vào thẻ <title> </title>
+ Cách thực hiện:
– Mở tệp tin bằng trình duyệt IE
– Chọn View\Source điền/sửa nội dung của thẻ
<title> </title> trong vùng <head> </head>
– Lưu lại
Trang 61 Bổ sung Siêu dữ liệu cho bộ sưu tập
Siêu dữ liệu Metadata
− Thư viện truyền thống: Mô tả thư mục (ISBD, AACR2, MARC, )
− Thư viện số DL: Siêu dữ liệu metadata
− Dữ liệu về dữ liệu
− Bao gồm các yếu tố mô tả đặc trưng cho tài liệu số
− Dublin Core, TEI, METS, MODS, EAD
Trang 62 Siêu dữ liệu trong Greenstone
Trang 63 Chọn File\Open để mở một bộ siêu dữ liệu hiện có
Trang 64 Siêu dữ liệu trong Greenstone
Australian Government Locator Service Metadata
Development Library Subset Example Metadata
Dublin Core Metadata Element Set
Extracted Greenstone Metadata
Exploded Greenstone Metadata 1.0
Greenstone Metadata Set
NewZealand Government Locator Service Metadata
Trang 65 Extracted Greenstone Metadata
Tự động nhập các siêu dữ liệu đã nhúng sẵn trong tài liệu
Ex.Encoding - Bộ mã ký tự của văn bản
Ex.Language - Ngôn ngữ
Ex.Source - Nguồn tài liệu
Ex.Title - Nhan đề tài liệu
Trang 66 Dublin Core Metadata Set
15 yếu tố mô tả
dc.Title - Nhan đề tài liệu
dc.Creator - Người tạo ra tài liệu
Dc.Subject - Chủ đề tài liệu
Dc.Description - Mô tả tài liệu
Dc.Publisher - Thông tin về nhà xuất bản
Dc.Contributor - Thông tin về những người đóng góp vào tài
Trang 67 Dc.Type - Loại tài liệu
Dc.Format - Định dạng tệp tin
Dc.Identifier - Ký hiệu nhận dạng tài liệu
Dc.Source - Nguồn của tài liệu
Dc.Language - Ngôn ngữ của tài liệu
Dc.Relation - Thông tin về nguồn tài liệu tham khảo
Dc.Coverage - Phạm vi tài liệu (địa lý, thời gian)
Dc.Rights - Thông tin về quyền sở hữu trí tuệ, bản quyền,
quyền tác giả, và các quyền liên quan khác
Trang 68 Tạo bộ siêu dữ liệu mới
Chọn File\New, hộp thoại xuất hiện
Tên bộ siêu dữ liệu Tên viết tắt của bộ siêu dữ liệu
Mô tả chung về bộ siêu dữ liệu
Trang 69 Nhập siêu dữ liệu cho tài liệu
Mục đích:
– Mô tả tài liệu
– Tạo ra các điểm truy cập phục vụ cho tìm kiếm
– Cho phép duyệt tài liệu theo các đề mục, tác giả, v.v…
Chọn từng tài liệu và tiến hành nhập thông tin vào mỗi trường
tương ứng
Siêu dữ liệu tự động lưu vào CSDL
Nháy kép chuột vào tài liệu để xem nội dung của tài liệu đó.
Trang 70Khu vực hiển thị các yếu tố mô tả có sẵn
Trang 71− Sau khi chọn các tệp tin cho bộ sưu tập, chọn Enrich
− Nhập các yếu tố mô tả tài liệu (nhan đề, tác giả, chủ đề, từ khóa, tên tạp chí,
…)
Trang 72N
Trang 73 Thiết kế Design
Chọn Design
GLI-Design
− Document Plugins: Chương trình nhúng
− Search Indexes: Chỉ mục Tìm tin
− Partition Indexes: Chỉ mục phân đoạn
− Browsing classifiers: Bộ phân lớp Duyệt CSDL
Trang 75 GLI Design - Document Plugins
− Plugin là một chương trình con được dùng trong quá trình xây dựng bộ sưu tập
− Nhiều dạng tài liệu khác nhau: word, pdf, img, html, … cần plugin để chuyển về dạng thống nhất là XML
− Tùy thuộc nguồn tài liệu, cần plugin tương ứng
− Mỗi plugin được sử dụng để xử lý một nhiệm vụ
Trang 76 GLI Design - Search Indexes
− Có thể tạo chỉ mục cho từng trường mô tả
− Để tạo một chỉ mục mới, nháy nút New Index, sau đó chọn trường mô tả để tạo chỉ mục Chọn Add Index
− Để chỉnh sửa chỉ mục, chọn Edit Index
− Để xóa chỉ mục, chọn Remove Index
− Chọn Select All để tự động tạo chỉ mục cho mỗi trường
Trang 78 GLI Design - Partition Indexes
− Được sử dụng để tạo ra các chỉ mục theo từng phần, thông qua các bộ lọc được xác định sẵn, chẳng hạn như ngôn ngữ
− Chỉ có trong giao diện dành cho chuyên gia (Expert)
GLI Design - Browsing Classifiers
− Thiết lập các chế độ duyệt bộ sưu tập, ví dụ: theo nhan đề, tác giả, đề mục, cụm từ, …
− Để tạo một chế độ duyệt, chọn một chế độ từ hộp Select
Trang 80 GLI Design - Browsing Classifiers
− AZCompactList: Duyệt tên tài liệu sắp xếp theo vần chữ cái A – Z dưới dạng thu gọn
− AZCompactSectionList: Duyệt theo từng phần tài liệu, sắp xếp theo vần chữ cái
− AZList: tương tự AZCompactList nhưng dưới dạng đầy đủ
− Collage: Hiển thị các bộ sưu tập ảnh
− DateList: Sắp xếp tài liệu theo thứ tự ngày tháng
Trang 81− HTML: Liên kết tới một trang web.
− Hierarchy: Sắp xếp tài liệu trong bộ sưu tập dưới dạng hệ thống thứ bậc theo một hình thức nhất định (ví dụ: theo chủ đề)
− List: Sắp xếp tài liệu theo trật tự đơn giản
− Phind: Sắp xếp tài liệu theo các cụm từ có trong tài liệu theo hình thức hệ thống thứ bậc
− SectionList: Tương tự List nhưng sắp xếp tới từng phần của tài liệu
Trang 82 Định dạng GLI-Format
- Chọn Format
Trang 83 GLI-Format
− General: Phần chung
− Search: Tìm kiếm
− Format Features: Đặc tính định dạng
− Translate Text: Dịch văn bản
− Cross Collection Search: Tìm kiếm liên CSDL
− Collection Specific Macros: Macro riêng của bộ sưu tập
− Depositor Metadata: Bộ lưu chiểu siêu dữ liệu
Trang 84 GLI Format - General
Trang 85 GLI Format - General
− Cung cấp các thông tin chung về bộ sưu tập
− Creator’s email: thư điện tử của người tạo ra bộ sưu tập
− Maintainer’s email: thư điện tử của người bảo trì bộ sưu tập
− Collection Title: Tên của bộ sưu tập
− Collection folder: Thư mục chứa bộ sưu tập (không thay đổi được)
− URL to “about page” icon: đường liên kết tới trang chủ của bộ sưu tập
− URL to “home page” icon: đường liên kết tới trang chủ Greenstone
− Collection Description: Mô tả tóm tắt về bộ sưu tập
Trang 86 GLI Format - Search
− Item in search menu: Hiển thị các trường được tạo chỉ mục để phục vụ việc tìm kiếm
− Display text: Tên của chỉ mục hiện trên thanh thực đơn (menu) trong giao diện người dùng