BÀI GIẢNG THÝ VIỆN SỐ NỘI DUNG TỔNG QUAN VỀ THÝ VIỆN SỐ DL MÔ HÌNH HÌNH THỨC CHO THƯ VIỆN SỐ DL CHỈ MỤC TÀI LIỆU TÌM KIẾM THÔNG TIN CÁC CHUẨN SỬ DỤNG TRONG THÝ VIỆN SỐ THỰC HÀNH HỆ PHẦN MỀM THÝ VIỆN SỐ GREENSTONE
Trang 1THÝ VIỆN SỐ GREENSTONE
Trang 2VI THỰC HÀNH
Hệ phần mềm thý viện số Greenstone Greenstone Digital Library Software
Giới thiệu Greenstone
Cài đặt Greenstone
Xây dựng CSDL (bộ sýu tập)
Ghi CSDL trên CD/DVD
6.1 Giới thiệu Greenstone
– Greenstone không phải là thý viện số
– Greenstone là phần mềm dùng để xây dựng, phát hành và truy cập tới các bộ sýutập số của thý viện số
– Greenstone cung cấp một phýõng pháp mới để tổ chức và xuất bản thông tin trênmạng nội bộ, Internet hay
CD-ROM
Greenstone là phần mềm mã nguồn mở, có thể được sử dụng tự do và miễn phí
Tuân theo GNU General Public License
Website: http://www.greenstone.orgWebsite: http://www.greenstone.org
Quá trình phát triển
Kết quả của Dự án Thý viện số New Zealand tại trýờng Đại học Waikato, NZ
Đýợc triển khai và phân phối với sự hợp tác của hai tổ chức UNESCO và HumanInfo NGO
Mục đích
Hỗ trợ các tổ chức nhý trýờng đại học, viện nghiên cứu, trung tâm thông tin, tổ chứcchính phủ, phi chính phủ, phi lợi nhuận tạo ra các loại thông tin có thể đýợc truy cậptrực tuyến
Trang 3 Ứng dụng
Tạo lập, tổ chức và quản trị thông tin trong bộ sýu tập số:
– Xây dựng kho tài liệu phục vụ nghiên cứu, học tập
– Đóng gói thông tin theo chuyên đề phục vụ dịch vụ cung cấp thông tin chọn lọc(SDI)
– Lýu trữ và quản lý công văn, tài liệu nội bộ
– Xây dựng các bộ sýu tập của các bảo tàng, trung tâm lýu trữ
Đýợc sử dụng rộng rãi tại nhiều quốc gia trên thế giới: Hoa Kỳ, Australia, NewZealand, Nga
Sử dụng rộng rãi tại các trýờng đại học: University of Chicago, LehighUniversity, Đại học Quốc gia TP.HCM
Đýợc dịch ra hõn 40 ngôn ngữ: Anh, Nga, Pháp, Tây Ban Nha, Trung Quốc, Ả rập
… trong đó có tiếng Việt
Website sử dụng Greenstone
• Association of Indian Labour Historians, Delhi
• Auburn University, Alabama
• California University at Riverside
• Chicago University Library
• Detroit Public Library
• Gresham College, London
• Hawaiian Electronic Library
• Illinois Wesleyan University
• Indian Institute of Management
• Kyrgyz Republic National Library
• LeHigh University, Pennsylvania
• Mari El Republic, Russia
• National Centre for Science Information, Bangalore, India
• Netherlands Institute for Scientific Information Services
• New York Botanical Garden
• Peking University Digital Library
Trang 4• Philippine Research Education and Government Information Network
• Secretary of Human Rights of Argentina
• Slavonski Brod Public Library, Slovenia
• State Library of Tasmania
• Stuttgart University of Applied Sciences
• Texas A&M University Center for the Study of Digital Libraries
• University of Illinois
• University of North Carolina ibiblio project
• Vietnam National University
• Vimercate Public Library, Milan, Italy
• Washington Research Library Consortium
• Welsh Books Council
– Hệ điều hành: WINDOWS, LINUX
– Máy chủ Apache Web Server, IIS
– Trình duyệt Internet Explorer, hay FireFox
Giao diện
Trang 5Greenstone cung cấp khả năng truy cập rộng rãi vào các bộ sýu tập thông qua một giaodiện trình duyệt Web chuẩn
Greenstone cung cấp giao diện thủ thý (GLI) cho phép thu thập, chỉnh sửa và tạo bộsýu tập số
Hỗ trợ đa ngôn ngữ
Greenstone hỗ trợ nhiều ngôn ngữ khác nhau:
– 4 ngôn ngữ chính: Anh, Pháp, Nga, Tây Ban Nha
– Các ngôn ngữ đã hoàn chỉnh: Trung, Việt, Ba Lan, Bồ Đào Nha, Thái Lan, v.v…– Một số ngôn ngữ đang đýợc biên dịch
Unicode đýợc dùng để hỗ trợ chuyển đổi ngôn ngữ Có thể tạo chỉ mục cho cácngôn ngữ khác nhau
Quy mô bộ sýu tập
Các bộ sýu tập có thể chứa hàng nghìn đến hàng triệu tài liệu
Thời gian tạo bộ sýu tập tùy thuộc vào quy mô, kích thýớc của bộ sýu tập, có thểkéo dài từ vài phút đến vài ngày
Có thể nén bộ sýu tập để giảm kích thýớc tệp tin văn bản và chỉ mục
Khả năng týõng thích các chuẩn
Sử dụng metadata: Tạo các điểm truy cập từ metadata
Có thể gán metadata cho mỗi tài liệu hoặc một phần tài liệu
Týõng thích Z39.50 hỗ trợ việc truy cập máy chủ bên ngoài
Ngýời dùng bên ngoài cũng có thể truy cập vào Greenstone thông qua giao thứcZ39.50
Trang 6 Khả năng tìm kiếm
Tìm kiếm toàn văn linh hoạt
Có thể tìm theo các điểm truy cập (trường)
Ví dụ: tác giả, chủ đề, ngày tháng, v.v…
Duyệt theo các danh mục tác giả, nhan đề tài liệu, đề mục, ngày tháng
Duyệt theo cấu trúc phân cấp
Hỗ trợ đa phýõng tiện
Hỗ trợ nhiều định dạng tệp tin: doc, pdf, html, xml
Hỗ trợ nhiều loại hình tài liệu khác nhau: văn bản, hình ảnh, âm thanh, video
Có khả năng tạo các bộ sýu tập theo loại hình xuất bản: tạp chí điện tử, e-book
Khả năng phát hành bộ sýu tập
Bộ sýu tập số có thể đýợc phát hành trên mạng nội bộ, Internet hoặc xuất ra đĩaCD-ROM tự khởi động cài đặt
Quá trình phát hành bộ sýu tập đõn giản và thuận tiện
Tùy biến bộ sýu tập
Greenstone là phần mềm mã nguồn mở cho phép ngýời dùng có thể tự do chỉnhsửa chýõng trình cho phù hợp với nhu cầu sử dụng của mình
Có thể tùy biến giao diện, cấu hình các thuộc tính của bộ sýu tập
6.2 Cài đặt
Tải chýõng trình Greenstone
Truy cập vào địa chỉ:
http://www.greenstone.orghttp://www.greenstone.org hoặc hoặc http://www.nzdl.orghttp://www.nzdl.org
Nháy chuột vào mục Download
Yêu cầu về hệ thống
Máy tính Pentium IV
Trang 7 RAM tối thiểu là 512 MB
Hệ điều hành: Windows XP , WIN7, WIN8
– Chương trình cho phép lựa chọn Setup Type: lựa chọn TYPICAL
– Nháy chuột vào NEXT để cài đặt
– Chương trình tự động thực hiện
Chọn ngôn ngữ hiển thị:
Anh – Pháp – Nga – Trung – Đức – Tây ban nha – Arập
Chọn thý mục cài đặt, sau đó nháy Next
Trang 8 Cấu trúc thý mục của Greenstone
Chýõng trình thông thýờng đýợc cài đặt vào thý mục sau:
C:\Users\DOVINH\greenstone\
Đây là thý mục Home của CSDL
Có thể vào xem các thý mục của CSDL
bằng các trình duyệt Windows Explorer hoặc FireFox
Cấu trúc CSDL (Bộ sýu tập)
Các thý mục chýõng trình
Thý mục gốc: chứa tệp chýõng trình chính và tệp cấu hình thý mục
_uninst: chứa chýõng trình uninstall.exe
bin: chứa các Java scripts
cgi-bin: chứa các Perl scripts
Collect: chứa các bộ sýu tập
etc: chứa tệp cấu hình chính (main.cfg)
gli: chứa chýõng trình của GLI
images: chứa ảnh của chýõng trình
macro: chứa các macro chýõng trình
mappings: các file về mã bộ chữ
Perllib: thý viện ngôn ngữ perl
temp: các tệp tạm thời, tệp dữ liệu đýợc xuất ra
Thý mục con của từng bộ sýu tập
Các bộ sýu tập (CSDL) đýợc lýu trong thý mục collect
Trang 9– index: các tệp chỉ mục
– import: chứa các tệp tin nhập vào
– building: thý mục để xây dựng bộ sýu tập
– metadata: chứa các cấu trúc siêu dữ liệu
Ký hiệu #: thông báo, làm mất tác động của thuộc tính ghi trong dòng đó
Thiết lập tiếng Việt cho chýõng trình có giao diện bằng tiếng Việt
Mở tệp tin cấu hình main.cfg trong thý mục C:\Users\DOVINH\Greenstone\etcbằng Notepad/ Wordpad
Ghi các thông số liên quan đến từng bộ sýu tập:
– chứa thông tin về cấu hình
Trang 10 Giao diện thủ thý (GLI)
Phần mềm Greenstone cung cấp giao diện thủ thý (Greenstone Librarian Interface
- GLI) để giúp tạo ra các bộ sýu tập cho thý viện số
– Giao diện thân thiện ngýời dùng
– Tạo bộ sýu tập nhanh chóng, dễ dàng
Giao diện thủ thý (GLI)
Các chức năng cõ bản của GLI
Tải xuống (Download): tải tài liệu từ Internet về để đýa vào cõ sở dữ liệu
Thu thập (Gather): Lựa chọn và tập hợp các tài liệu đýa vào cõ sở dữ liệu
Nhập Siêu dữ liệu (Enrich): Gán siêu dữ liệu (metadata) mô tả cho các tài liệu
có trong cõ sở dữ liệu, để phục vụ cho việc tìm kiếm tài liệu
Thiết kế (Design): Thiết lập các tham biến của cõ sở dữ liệu (tạo chỉ mục cho các
trýờng, thiết lập thuộc tính duyệt bộ sýu tập)
Tạo lập (Create): Tạo bộ sýu tập
Định dạng (Format): Thiết lập các thuộc tính về trình bày bộ sýu tập trên
website
Khởi động giao diện thủ thý (GLI)
Start\ All Programs\ Greenstone-3.05\ Greenstone Librarian Interface (GLI)
Chọn ngôn ngữ giao diện của GLI
Chọn ngôn ngữ giao diện của GLI
Chọn File\Chọn Preferences … \General
Interface Language: chọn English - Tiếng Anh
Vietnamese - Tiếng Việt
Trang 11− Nhập tên bộ sýu tập vào ô Collection title (thí dụ: ISIS)
− Nhập mô tả bộ sýu tập vào ô Description of content (thông tin chung về cõ sở
dữ liệu sẽ đýợc xây dựng)
− Chọn kiểu bộ sýu tập: Base this collection on New Collection
− Nháy OK để tạo lập bộ sýu tập mới
− Chọn Gather
− Chọn các tài liệu đýa vào bộ sýu tập
Chọn các tài liệu đýa vào bộ sýu tập
Documents in Greenstone Collections: Các tài liệu có sẵn trong các bộ sýu tập
Trang 12 Sử dụng kỹ thuật drag – drop (kéo thả) để copy các tài liệu từ cửa sổ Workspace(vùng làm việc) bên trái sang cửa sổ Collection (bộ sýu tập) bên phải.
Chọn các tài liệu đýa vào bộ sýu tập
Tạo lập CSDL (bộ sýu tập)
− Chọn Create
− Nháy chuột vào Build Collection
− Xem kết quả nháy chuột vào Preview Collection
Chuẩn bị tài liệu trýớc khi đýa vào CSDL - tệp DOC
Chú ý:
− Phải chuẩn bị trýớc tất cả tài liệu trýớc khi đýa vào bộ sýu tập
− Đối với tệp DOC, gán tiêu đề (title) của tài liệu vào phần thuộc tính: Files\Properties\ Summary\ ghi vào mục Title
Chuẩn bị tài liệu trýớc khi đýa vào CSDL - tệp HTML
Trang 13 Bổ sung Siêu dữ liệu cho bộ sýu tập
Siêu dữ liệu Metadata
− Thý viện truyền thống: Mô tả thý mục (ISBD, AACR2, MARC, )
− Thý viện số DL: Siêu dữ liệu metadata
− Dữ liệu về dữ liệu
− Bao gồm các yếu tố mô tả đặc trýng cho tài liệu số
− Dublin Core, TEI, METS, MODS, EAD
Siêu dữ liệu trong Greenstone
Siêu dữ liệu trong Greenstone
Australian Government Locator Service Metadata
Development Library Subset Example Metadata
Dublin Core Metadata Element Set
Extracted Greenstone Metadata
Exploded Greenstone Metadata 1.0
Greenstone Metadata Set
NewZealand Government Locator Service Metadata
Qualified Dublin Core Metadata Element Set
RFC 1807 Metadata Element Set
Extracted Greenstone Metadata
Tự động nhập các siêu dữ liệu đã nhúng sẵn trong tài liệu
Ex.Encoding - Bộ mã ký tự của văn bản
Ex.Language - Ngôn ngữ
Ex.Source - Nguồn tài liệu
Ex.Title - Nhan đề tài liệu
Dublin Core Metadata Set
Trang 1415 yếu tố mô tả
dc.Title - Nhan đề tài liệu
dc.Creator - Ngýời tạo ra tài liệu
Dc.Subject - Chủ đề tài liệu
Dc.Description - Mô tả tài liệu
Dc.Publisher - Thông tin về nhà xuất bản
Dc.Contributor - Thông tin về những ngýời đóng góp vào tài liệu
Dc.Date - Ngày tài liệu đýợc tạo ra hoặc phát hành
Dc.Type - Loại tài liệu
Dc.Format - Định dạng tệp tin
Dc.Identifier - Ký hiệu nhận dạng tài liệu
Dc.Source - Nguồn của tài liệu
Dc.Language - Ngôn ngữ của tài liệu
Dc.Relation - Thông tin về nguồn tài liệu tham khảo
Dc.Coverage - Phạm vi tài liệu (địa lý, thời gian)
Dc.Rights - Thông tin về quyền sở hữu trí tuệ, bản quyền, quyền tác giả, và cácquyền liên quan khác
Tạo bộ siêu dữ liệu mới
Chọn File\New, hộp thoại xuất hiện
Nhập siêu dữ liệu cho tài liệu
Mục đích:
– Mô tả tài liệu
– Tạo ra các điểm truy cập phục vụ cho tìm kiếm
– Cho phép duyệt tài liệu theo các đề mục, tác giả, v.v…
Chọn từng tài liệu và tiến hành nhập thông tin vào mỗi trýờng týõng ứng
Siêu dữ liệu tự động lýu vào CSDL
Trang 15 Nháy kép chuột vào tài liệu để xem nội dung của tài liệu đó.
Thiết kế Design
Chọn Design
GLI-Design
− Document Plugins: Chýõng trình nhúng
− Search Indexes: Chỉ mục Tìm tin
− Partition Indexes: Chỉ mục phân đoạn
− Browsing classifiers: Bộ phân lớp Duyệt CSDL
GLI Design - Document Plugins
− Plugin là một chýõng trình con đýợc dùng trong quá trình xây dựng bộ sýu tập
− Nhiều dạng tài liệu khác nhau: word, pdf, img, html, … cần plugin để chuyển vềdạng thống nhất là XML
− Tùy thuộc nguồn tài liệu, cần plugin týõng ứng
− Mỗi plugin đýợc sử dụng để xử lý một nhiệm vụ
Ví dụ:
+ HTMLPlug - xử lý tệp tin HTML;
+ ImagePlug - xử lý hình ảnh;
+ PDFPlug - xử lý tệp tin Acrobat; …
− Có thể thêm, bớt hoặc tùy biến các plugin
GLI Design - Search Indexes
− Có thể tạo chỉ mục cho từng trýờng mô tả
− Để tạo một chỉ mục mới, nháy nút New Index, sau đó chọn trýờng mô tả để tạochỉ mục Chọn Add Index
Trang 16− Để chỉnh sửa chỉ mục, chọn Edit Index
− Để xóa chỉ mục, chọn Remove Index
− Chọn Select All để tự động tạo chỉ mục cho mỗi trýờng
GLI Design - Partition Indexes
− Đýợc sử dụng để tạo ra các chỉ mục theo từng phần, thông qua các bộ lọc đýợcxác định sẵn, chẳng hạn nhý ngôn ngữ
− Chỉ có trong giao diện dành cho chuyên gia (Expert)
GLI Design - Browsing Classifiers
− Thiết lập các chế độ duyệt bộ sýu tập, ví dụ: theo nhan đề, tác giả, đề mục, cụm
từ, …
− Để tạo một chế độ duyệt, chọn một chế độ từ hộp Select Classifier to add, sau đóchọn Add Classifier
GLI Design - Browsing Classifiers
− AZCompactList: Duyệt tên tài liệu sắp xếp theo vần chữ cái A – Z dýới dạng thugọn
− AZCompactSectionList: Duyệt theo từng phần tài liệu, sắp xếp theo vần chữ cái
− AZList: týõng tự AZCompactList nhýng dýới dạng đầy đủ
− Collage: Hiển thị các bộ sýu tập ảnh
− DateList: Sắp xếp tài liệu theo thứ tự ngày tháng
− HTML: Liên kết tới một trang web
− Hierarchy: Sắp xếp tài liệu trong bộ sýu tập dýới dạng hệ thống thứ bậc theo mộthình thức nhất định (ví dụ: theo chủ đề)
− List: Sắp xếp tài liệu theo trật tự đõn giản
− Phind: Sắp xếp tài liệu theo các cụm từ có trong tài liệu theo hình thức hệ thốngthứ bậc
Trang 17− SectionList: Týõng tự List nhýng sắp xếp tới từng phần của tài liệu.
− Translate Text: Dịch văn bản
− Cross Collection Search: Tìm kiếm liên CSDL
− Collection Specific Macros: Macro riêng của bộ sýu tập
− Depositor Metadata: Bộ lýu chiểu siêu dữ liệu
GLI Format - General
GLI Format - General
− Cung cấp các thông tin chung về bộ sýu tập
− Creator’s email: thý điện tử của ngýời tạo ra bộ sýu tập
− Maintainer’s email: thý điện tử của ngýời bảo trì bộ sýu tập
− Collection Title: Tên của bộ sýu tập
− Collection folder: Thý mục chứa bộ sýu tập (không thay đổi đýợc)
− URL to “about page” icon: đýờng liên kết tới trang chủ của bộ sýu tập
− URL to “home page” icon: đýờng liên kết tới trang chủ Greenstone
− Collection Description: Mô tả tóm tắt về bộ sýu tập
GLI Format - Search
− Item in search menu: Hiển thị các trýờng đýợc tạo chỉ mục để phục vụ việc tìmkiếm
− Display text: Tên của chỉ mục hiện trên thanh thực đõn (menu) trong giao diệnngýời dùng
Trang 18 GLI Format - Format Features
Tùy biến giao diện của bộ sýu tập
GLI Format - Cross-Collection Search
− Cung cấp khả năng tìm kiếm đồng thời trên nhiều bộ sýu tập khác nhau
− Đánh dấu vào các bộ sýu tập muốn tìm kiếm
− Chỉ có khả năng tìm kiếm trên các chỉ mục mà các bộ sýu tập cùng có chung
GLI Format - Translation Text
− Chuyển đổi ngôn ngữ trong một số phần của giao diện bộ sýu tập
− Chọn phần cần dịch từ hộp Features
− Chọn ngữ ngôn biên dịch từ hộp Language of Translation
− Nhập từ/cụm từ đã đýợc dịch vào ô Translated text
− Chọn Add translation
6.4 Ghi cõ sở dữ liệu trên CD/DVD
− Chọn File\Write CD/DVD Image
Hộp thoại xuất hiện
Khai báo các thông tin:
– CD/DVD name: tên đĩa CD-ROM
– Chọn CSDL cần ghi lên đĩa
– Chọn lệnh Write CD/DVD Image, xuất hiện thông báo
Thý mục chứa CSDL
C:\Users\DOVINH\Greenstone\tmp\exported_GreenstoneCSDL
Dùng các chýõng trình ghi CD/DVD để lýu CSDL lên đĩa CD/DVD
Đặc điểm của CSDL trên CD/DVD
− Chứa đủ phần mềm và CSDL
− Có thể cài đặt phần mềm và CSDL sang máy tính khác để sử dụng