tự động hóa - Thư viện số
Trang 1TỰ ĐỘNG HÓA - AUTOMATION
Chương 5:
THƯ VIỆN SỐ
Công nghệ web
Thư viện và Thư viện số
Bộ sưu tập thông tin
Xây dựng thư viện số
Sở hữu trí tuệ
Trang 2Cơng nghệ WEB (1)
Web là công nghệ IP-based (Sử dụng HTTP để
chuyển thông tin và HTML/XML để đóng gói thông tin)
Web là phương tiện giúp người sử dụng định vị một cách dễ dàng trên mạng Internet bằng cách sử dụng các siêu liên kết (hyperlinks)
Web do Tim Berners-Lee, một chuyên gia của viện
CERN, phát minh vào năm 1991 Internet có trước Web khá lâu, nhưng từ khi có giao diện đồ họa của Web, việc sử dụng Internet trở nên dễ dàng hơn rất nhiều, số người sử dụng Internet ngày càng gia tăng
Web là công nghệ hiện tại và tương lai của ngành thông tin thư viện
Trang 3Cơng nghệ WEB (2)
Tại sao cán bộ thông tin thư viện phải biết sử dụng Web ?
Nhu cầu truy cập thông tin ngày càng cao đặc biệt là
thông tin điện tử, Web trở thành phương tiện phổ biến
của tất cả mọi người
Là người quản lý thông tin, cán bộ thông tin thư viện
ngày nay phải biết sử dụng thành thạo Web như sử dụng ngoại ngữ vậy
Web trở thành phương tiện làm việc hàng ngày của cán bộ thông tin thư viện để: trình bày thông tin, tổ chức thư viện điện tử trên mạng, xuất bản điện tử, biên mục tài
liệu điện tử, vv
Librarian Webrarian
Trang 4Một số khái niệm về WEB
TEXT: văn bản thường hay tĩnh (Được lưu trữ và hiển thị như một file tĩnh)
HYPERTEXT: siêu văn bản hay văn bản động (Được lưu trữ và hiển thị như một
file động có đuôi là HTM hay HTML)
HTML - HyperText Markup Language: ngôn ngữ soạn thảo siêu văn bản
HTTP - HyperText Transfer Protocol: giao thức chuyển tải siêu văn bản
WWW: hệ thống client/server để chuyển tải siêu văn bản trên Internet
TRANG WEB: hay WEB: trang siêu văn bản hiển thị trên màn hình máy tính
Trang nhà/chủ - Homepage: trang siêu văn bản đầu tiên của một đơn vị hay cá nhân trên mạng từ đó được nối đến những trang siêu văn bản khác
WEB SERVER: máy chủ chứa và xử lý thông tin trên web
INTRANET: mạng cục bộ sử dụng công nghệ Internet
WEB BROWSER: công cụ dùng để hiển thị trang WEB: Hai Web Browser thông dụng nhất là NETSCAPE và EXPLORER
URL - Uniform Resource Locator: địa chỉ của một trang web
http://www.yahoo.com , http://www.oclc.org
http://www.whitehouse.gov , http://www.harvard.edu
http://www.hcmuns.edu.vn , http://www.brighton.edu.uk (ngoài nước Mỹ)
Trang 5INTERNET: Khái quát
Internet - kho thông tin đồ sộ và hấp dẫn:
Phong phú về nội dung, đa dạng về hình thức
Liên kết vô số kho thông tin trên toàn cầu
Internet - một xã hội thông tin sôi động:
Phương tiện trao đổi thông tin tiện lợi, nhanh chóng, và rẽ tiền
Góp phần thúc đẩy nghiên cứu khoa học và giáo dục đào tạo
Hoạt động kinh doanh
Giải trí
Internet - liên mạng máy tính toàn thế giới:
Nhu cầu truyền thông dữ liệu bằng máy tính
Mạng cục bộ LAN
Liên kết các mạng nhiều quốc gia Thống nhất ngôn ngữ chung là TCP/IP (Transmission Control Protocol - Bộ giao thức định nghĩa Internet)
Internet)
Trang 6INTERNET: Lịch sử
Thời kỳ phôi thai:
1969 Bộ Quốc phòng Mỹ xây dựng mạng ARPANET
1982 ARPANET sử dụng TCP/IP
1983 Ban điều hành Internet ra đời
1985 NSFnet (Mạng National Science Foundation liên kết 60 đại học Mỹ và 3 đại học Châu ÂU) gia nhập Internet
Thời kỳ bùng nổ lần 1 - kết nối:
Từ 1988 - 1990: EUnet (Mạng Châu Aâu), AUSSISBnet (Mạng Châu Uùc) và nhiều quốc gia khác ồ ạt gia nhập Internet và kết nối NSFnet Chủ yếu là dịch vụ Email và FTP phục vụ những nhà nghiên cứu
Thời kỳ bùng nổ lần 2 - world wide web:
1991 Tim Berners Lee phát minh www
1993 59 nước tham gia Internet, 15 triệu người dùng; 1995 có 84 nước với 42 triệu người dùng; năm 2000 có 300 triệu người dùng
Bắc Mỹ sẽ tổ chức Internet II chỉ phục vụ giáo dục và nghiên cứu
Trang 7INTERNET: Nội dung
Khai thác thông tin trực tuyến – Search Engine
Khai thác CSDL thương mại
Khai thác thông tin Thư viện số
Thương mại điện tử:
Trang 8Hai dạng thông tin
Thông tin trên giấy
Viết và in ấn – xuất bản thường
Tải xuống (Download) từ nguồn thông tin điện tử rồi in ra
Thông tin điện tử
Thông tin điện tử được lưu trữ, truy cập, truy hồi, và đọc trên máy vi tính và lưu thông trên mạng vi tính
Có thể được tải lên (Upload) hoặc số hóa từ thông tin trên giáy
Xuất bản điện tử
Trang 9CD-ROM và CSDL CD-ROM
CD-ROM là một công cụ lưu trữ thông tin tiện lợi
Dung lượng lớn trong một không gian nhỏ so với sách
Dễ dàng tra cứu và truy hồi thông tin
Dễ dàng di chuyển
CSDL CD-ROM
CSDL thư tịch,
Danh mục sách và CSDL mua bán sách,
CSDL nguồn, có thể truy hồi thông tin từ Internet
CSDL tham khảo nhanh,
CSDL multimedia, có thể tương tác với máy tính
Nhược điểm lớn
Mất dữ liệu khi hình thức vật lý bị hư hỏng Tuổi thọ tối đa của ROM khoảng 10-15 năm
CD- Định dang thông tin trong CD-ROM bị giới hạn bởi công nghệ được sử dụng tại thời điểm sản xuất
Công nghệ CD-ROM đã lạc hậu hơn 15 năm nay
Trang 10Tạp chí điện tử & CSDL trực tuyến
Mua quyền sử dụng
Truy cập vào máy chủ của cơ quan xuất bản hoăïc công ty phát
hành
Tài liệu được số hóa dưới dạng HTML và PDF
Tổ chức phục vụ dưới dạng Portal Tổ chức phục vụ dưới dạng Portal
Thông tin có thể được download, in ra, hay gởi email
Chia sẻ thông tin với các thư viện khác
Cho bao nhiêu thì sẽ nhận bấy nhiêu
Làm phong phú bộ sưu tập tài nguyên điện tử
CSDL trực tuyến dần dần thay thế CSDL CD-ROM
Vấn đề:
Cần phải được cải thiện đường truyền Internet cho thư viện
Khuyến khích độc giả học ngoại ngữ để tận dụng nguồn tài nguyên phong phú và đắt tiền này
Trang 11Sách điện tử (e-book)
Mua quyền sử dụng đối với e-book thương mãi
Miễn phí trên mạng
Khá phong phú
Có thể download và biên mục lại để phục vụ
Thư viện e-book
Đăng ký mượn/trả giống như thư viện thường
Có thể đọc và in ra nhưng không được download
Trang 12Quản lý thông tin điện tử
Quản lý thông tin = Lưu trữ + Tổ chức + Truy hồi
Lưu trữ: Xếp tài liệu theo môn loại: đề mục, đề tài, chuyên đề
Truy hồi (Retrieve): Truy cập + Tải xuống (Download)
Truy cập: Truy tìm, lướt tìm
Trang 13Hệ thống tra cứu
Trong thư viện: Hệ thống mục lục (Catalog System)
Trên Web: Bộ máy tra cứu (Search Engine)
Yahoo, Google, Altavista,
Công nghệ Agent
Thư viện số (Digital Library): Metadata
Tài liệu (Material)
Thư mục (Bibliography)
Biểu ghi Metadata (Metadata Record)
Thông tin trên web ‡ Thông tin thư viện (Có tổ chức cao)
Vai trò chủ đề trong truy cập
Điểm truy cập (Access point)
Tiêu đề (Heading): Tiêu đề tác giả, nhan đề, đề mục (Subject Heading)
Trang 14Ưu điểm tài nguyên điện tử
Đa truy (multi-access): nhiều điểm truy cập, mọi lúc
mọi nơi
Tốc độ cao: truy tìm, lướt tìm, truy hồi, hợp nhất, tham khảo chéo, vv…
Đa chức năng: dễ tiếp cận và phân tích tài liệu
Nội dung đa dạng và phong phú: chuyển tải đa
phương tiện
Trang 15Phát triển sưu tập điện tử
Tiêu chí đánh giá thông tin
Ai sử dụng?
Thông tin nào được sử dụng?
Thông tin sẽ được sử dụng như thế nào?
Chính sách phát triển sưu tập
Đánh giá mức độ sử dụng tài liệu in trước khi quyết định phát triển tài nguyên điện tử
Cân bằng ngân sách cho việc phát triển tài liệu in và điện tử
Nên chọn CSDL trực tuyến với phiên bản nào có thể sử dụng trong hiện tại và tương lai
Bao gồm nguồn tài nguyên miễn phí trên mạng với tài nguyên được số hóa của thư viện
Công đoạn phát triển sưu tập và liên kết bên ngoài không thể tiến hành riêng lẻ mà cần phải tiến hành song song và liên tục cập nhật
Trang 16Dịch vụ và cung cấp tài nguyên điện tử
Dịch vụ tài nguyên điện tử:
Trang 17Đa phương tiện - Multimedia
Multimedia có thể có nhiều định nghĩa:
dạng âm thanh, hình ảnh động, hoạt hình được thêm vào những phương tiện truyền thống (vd văn bản, đồ hoạ, tranh ảnh)
đồ họa, tranh vẽ, hình ảnh tĩnh và động (video), hoạt hình, âm thanh, và những phương tiện khác do máy tính điều khiển nơi mọi loại thông tin được trình bày, lưu trữ, chuyển tài và xử lý
số hóa
sưu tập những tài nguyên đa phương tiện dạng văn bản, đồ họa, tranh vẽ, hình ảnh tĩnh và động (video), hoạt hình, âm thanh,
Trang 18Tích hợp hệ thống đa phương tiện
Hệ thống đa phương tiện là một hệ thống có thể xử lý dữ liệu và
trình ứng dụng đa phương tiện
tác và biểu hiện thông tin đa phương tiện
Hệ thống đa phương tiện phải được điều khiển bằng máy tính.
Hệ thống đa phương tiện phải tích hợp
Thông tin được trình bày dưới dạng kỹ thuật số
Giao diện cuối cùng thường là tương tác
Tích hợp hệ thống đa phương tiện lên web
Trang 19Lịch sử hệ thống đa phương tiện
Báo chí là phương tiện truyền thông đại chúng đầu tiên đã
sử dụng văn bản, đồ họa và hình ảnh
Năm 1895, Gugliemo Marconi lần đầu tiên thực hiện việc phát thanh vô tuyến tại Pontecchio, Italy Ít năm sau (1901) ông ta phát hiện ra sóng vô tuyến đã truyền qua Đại Tây Dương Tiền đề cho việc phát minh điện báo, radio -
phương tiện truyền thanh quan trọng ngày nay
Vô tuyến truyền hình là phương tiện mới cho thế kỹ 20 Có thể chuyển tải được hình ảnh động, từ đó đã thay đổi thế giới truyền thông đại chúng
Trang 20Thư viện và Thư viện số (1)
Ngày nay vẫn còn nhiều người cho rằng thư viện là một nơi yên tĩnh
trong đó sách được cất giữ và người ta đánh giá thư viện theo tiêu chí số lượng sách được cất giữ nhiều hay ít
Đối với những người quản thủ thư viện có chuyên môn thì thư viện là
một cơ sở có tổ chức để bảo quản tài liệu, sưu tập và để truy cập đến những thư viện khác; không những chỉ sách mà còn có phim ảnh, băng đĩa âm thanh, mẫu vật thực vật, sản phẩm văn hoá, vv…
Đối với nhà nghiên cứu, thư viện là một mạng lưới cung cấp việc truy
cập đến tri thức nhân loại được lưu giữ khắp mọi nơi
Nhiều sinh viên khoa học và công nghệ ngày nay trên thế giới thì cho
rằng thư viện chính là World Wide Web Đây là một quan niệm không
đúng mặc dầu ngày nay Web là công nghệ quan trọng của thư viện
Sự khác nhau giữa thư viện số với World Wide Web thể hiện ở chổ Web thiếu hẵn những đặc điểm quan trọng của việc sưu tầm và tổ chức thông tin; trong khi thư viện số ngày càng hoàn thiện việc tổ chức để người sử dụng tự hình thành tri thức với phương châm "Thư viện số là nơi sử dụng công nghệ để chuyển câu hỏi thành câu trả lời"
Trang 21Thư viện và Thư viện số (2)
Xây dựng thư viện số là xây dựng phương thức mới, công nghệ mới trong việc xử lý thông tin - tri thức Đó là bảo quản, sưu tầm, tổ chức, quãng bá, và truy cập thông tin hay nói
chính xác hơn là tri thức, tức là thông tin có ý nghĩa và hữu ích
Đối với một thư viện truyền thống, điều quan trọng là việc bổ sung nguồn tài nguyên ngày càng nhiều trên giá kệ trong kho thư viện; nhưng ngày nay thông tin về những nguồn tài
nguyên đó chứa trong mục lục thư viện là quan trọng hơn
Những thông tin đó là metadata hay siêu dữ liệu - dữ liệu về
dữ liệu - và đây là khái niệm nổi bật nhất trong thư viện số
Trang 22Một định nghĩa Thư viện số
Theo Ian H Witten, chuyên gia Thư viện số ĐH
Waikato, New Zealand, Thư viện số là tập hợp
những bộ sưu tập thông tin của các đối tượng số hoặc đã được số hóa có tổ chức và tập trung Tập trung theo đề tài hay chủ đề và có tổ chức để thông tin dễ truy cập và lưu trữ theo những tiêu chuẩn
chuyên biệt cung cấp hai khả năng chính:
Phương thức truy cập, chọn lọc, hiển thị tài nguyên số
(dành cho người sử dụng);
Phương thức xây dựng, tổ chức và lưu hành (dành cho cán bộ thư viện)
Trang 23Bộ sưu tập thông tin (1)
Một bộ sưu tập thông tin bao gồm nhiều tài liệu dưới nhiều dạng thức khác nhau: văn bản, hình ảnh, âm thanh, hình ảnh động
Tài liệu là đơn vị căn bản từ đó sưu tập thông tin được xây
dựng Một bộ sưu tập có thể chứa nhiều loại tài liệu khác nhau
Ví dụ một bộ sưu tập về đề tài "Phố cổ Hội An" sẽ bao gồm
những tài liệu dạng văn bản về lịch sử, văn hoá, phong tục,
vv…; tài liệu dạng hình ảnh về những di tích, trang phục, các
bản thiết kế, vv…; tài liệu dạng âm thanh về những bài hát, dân
ca, vv…; tài liệu dạng phim về những lễ hội, sinh hoạt cộng
Trang 24Bộ sưu tập thông tin (2)
Một bộ sưu tập như thế trước khi trình bày phải qua một quá trình hình thành để tạo nên những cấu trúc hỗ trợ cho việc truy tìm và lướt tìm được dùng cho việc truy cập sưu tập
Khi xây dựng xong, bộ sưu tập có thể được xuất bản trên
Internet hoặc xuất ra CD-ROM một cách hoàn toàn tự động
Một khi sưu tầm thêm tài liệu mới, ta có thể dễ dàng bổ sung thêm vào bộ sưu tâp bằng cách tái xây dựng
Một thư viện nói chung bao gồm nhiều bộ sưu tập khác nhau, mỗi sưu tập tổ chức mỗi khác, tuy nhiên hoàn toàn giống nhau
Trang 25Bộ sưu tập thông tin (3)
Trang 26Phần mềm Thư viện số Greenstone (1)
Greenstone là một bộ phần mềm dùng để xây dựng và phân
phối các bộ sưu tập thư viện số Nó cung cấp một phương pháp mới để tổ chức và xuất bản thông tin trên Internet hoặc trên CD-ROM
Cung cấp phương tiện dễ dàng cho người sử dụng truy tìm toàn văn và lướt tìm dựa vào metadata
Greenstone là sản phẩm của dự án New Zealand Digital
Library của đại học Waikato, được phát triển và phân phối với
sự tham gia của UNESCO và Human Info NGO
Đây là phần mềm mã nguồn mở được cung cấp trên http://
greenstone.org/ theo thoả thuận của GNU General Public
License
Trang 27Phần mềm Thư viện số Greenstone (2)
Những bộ sưu tập thông tin được tạo ra bởi Greenston có thể chứa một số lượng lớn những tài liệu (hàng ngàn cho đến hàng triệu) với một giao diện đồng nhất
Hiện nay, Greenstone được dùng rộng rãi trong thư viện của các trường đại học trên thế giới để hình thành Thư viện số
Phần mềm Greenstone trên CD-ROM được Liên Hiệp Quốc và những cơ quan nhân đạo khác xuất bản và phân phối cho các quốc gia đang phát triển
Greenstone được dịch sang hơn 40 ngôn ngữ (đa ngôn ngữ)
bao gồm: Anh, Pháp, Đức, Nga, Tây Ban Nha, Bồ Đào Nha,
Italia, Hà Lan (Dutch), Ả-rập, Thổ Nhĩ Kỳ, Hebrew, Bosnia,
Armenia, Ukraina, Farsi, Croatia, Serbia, Hindi, Trung Hoa, Nhật Bản, Thái Lan, Indonesia, vv…
Phiên bản Greenstone Tiếng Việt cũng đã được phát hành và phổ biến trong hệ thống Greenstone trên thế giới
Trang 28Phần mềm Thư viện số Greenstone (3)
Trang 29Đặc điểm của Greenstone (1)
web chuẩn
Metadata có thể kết hợp với mỗi tài liệu hoặc một phần tài liệu
ngôn ngữ Chỉ mục riêng biệt có thể tạo ra cho những ngôn ngữ khác nhau
nhiều gigabytes có thể được tạo ra Truy tìm toàn văn nhanh
chóng Có thể nén để giảm kích thước văn bản
Trang 30Đặc điểm của Greenstone (2)
chủ bên ngoài cũng như giới thiệu bộ sưu tập Greenstone cho người sử dụng bên ngoài
liệu với những dẫn mục thích hợp
giả, danh mục nhan đề, danh mục đề mục, danh mục từ khoá, danh mục ngày tháng, những cấu trúc phân cấp, vv…
đoạn băng ghi âm và hình
khởi động
Trang 31Phần mềm nguồn mở
Theo Richard Stallman, chủ tịch FSF (Free Software Foundation), Phần mềm tự do và Phần mềm nguồn
mở là:
Chương trình ta có thể chạy với bất cứ mục đích nào
Có thể chỉnh sửa cho phù hợp với yêu cầu của mình
Có thể chỉnh sửa và tái phân phối bản sao, có hoặc không
có thu phí trên phần chỉnh sửa của mình
Phần mềm nguồn mở Greenstone có thể download
để sử dụng miễn phí tại http://greenstone.org
Nếu dùng phiên bản Tiếng Việt thì phải trả phí dịch sang Tiếng Việt
Trang 32Tại sao phải xây dựng Thư viện số?
Web thiếu những đặc điểm sưu tầm và tổ chức thông tin nhưng
nó chứa một lượng khổng lồ thông tin có ích Người ta sàng lọc thông tin đó và tổ chức lại để xây dựng những sưu tập trong
Xây dựng Thư viện số là bắt đầu giai đoạn Quản lý tri thức