Thư viện sốư viện số hay thư viện trực tuyến làthư việnmà ở đó các bộ sưu tập các văn bản, tài liệu hình ảnh, tài liệu âm thanh, tài liệu video được lưu trữ dưới dạng số tương phản với
Trang 1ể loại:ư viện số
Trang 21 ư viện số 1
1.1 Hoạt động 1
1.2 am khảo 2
2 arXiv 3 2.1 Lịch sử 3
2.2 á trình duyệt 3
2.3 Xem thêm 3
2.4 Chú thích 4
2.5 am khảo 4
2.6 Liên kết ngoài 4
3 ư viện âu Âu 5 3.1 am khảo 5
3.2 Liên kết ngoài 5
4 Dự án Gutenberg 6 4.1 Lịch sử 6
4.2 Chú thích 6
4.3 Xem thêm 6
4.4 Liên kết ngoài 6
5 Europeana 7 5.1 am khảo 7
5.2 Liên kết ngoài 7
6 Gallica 8 6.1 am khảo 8
6.2 Liên kết ngoài 8
7 Internet Arive 9 7.1 am khảo 9
7.2 Đọc thêm 9
7.3 Liên kết ngoài 9
Trang 3ii MỤC LỤC
8.1 Chú thích 11
9 Ro (định hướng) 12 9.0.1 Địa danh 12
9.0.2 Giải trí 12
9.0.3 Âm nhạc 12
9.0.4 Vi tính 12
9.0.5 Khác 12
9.0.6 Người 12
9.1 Xem thêm 13
10 Wikibooks 14 10.1 Dự án phụ 14
10.2 am khảo 14
10.3 Liên kết ngoài 14
10.4 Nguồn, người đóng góp, và giấy phép cho văn bản và hình ảnh 15
10.4.1 Văn bản 15
10.4.2 Hình ảnh 15
10.4.3 Giấy phép nội dung 16
Trang 4Thư viện số
ư viện số hay thư viện trực tuyến làthư việnmà
ở đó các bộ sưu tập các văn bản, tài liệu hình ảnh, tài
liệu âm thanh, tài liệu video được lưu trữ dưới dạng
số (tương phản với các định dạng in, vi dạng, hoặc các
phương tiện khác) cùng với các phương tiện để tổ chức,
lưu trữ và truy cập các tài liệu dưới dạng tập tin trong
bộ sưu tập của thư viện ư viện kỹ thuật số có thể
khác nhau rất nhiều về kích thước và phạm vi, và có
thể được duy trì bởi các cá nhân, tổ chức hoặc là một
phần được mới thành lập từ các thư viện thông thường
hoặc các viện, hoặc với các tổ chức học thuật.[1]Các nội
dung kỹ thuật số có thể được lưu trữ cục bộ, hoặc truy
cập từ xa thông qua mạng máy tính Một thư viện điện
tử là một loại hệ thống thông tin ư viện số là một
loại hệ thống truy hồi thông tin (Information Retrieval
System)
Các công nghệ hiện nay cho phép xử lý hiệu quả các
nguồn lưu trữ thông tin dưới dạng kỹ thuật số á
trình chuyển đổi nguồn thông tin ở dạngtín hiệutương
tự (analog) đến dạng tín hiệu số (digital) được gọi làsố
hóa
1.1 Hoạt động
Để hiểu hệ thống thư viện số vận hành như thế nào
trước hết chúng tôi đưa ra mô hình khái quát cấu trúc
dữ liệu của một hệ thống phần mềm thư viện số hiện
đại Các quan niệm về dữ liệu – đối tượng quản lý của
phần mềm sẽ quyết định kiến trúc của phần mềm và
các vấn đề mà hệ thống đó giải quyết Một hệ thống
phần mềm thư viện số thường có phải có cấu trúc dữ
liệu cơ bản như sau:
1 Các tệp tin tài liệu: Đây là đối tượng quản lý chính
của một hệ thống phần mềm thư viện số Mỗi một
tài liệu có thể là một hoặc nhiều tệp tin nằm trên
không gian lưu trữ web của hệ thống máy tính
của thư viện và như vậy mỗi tệp tin có địa chỉ web
riêng của nó, địa chỉ này chính là đầu mối để liên
kết tệp tin trong các siêu dữ liệu đối tượng số Sử
dụng web làm phương tiện xuất bản tài liệu số là
cách thức hiệu quả nhất vì tính phổ biến và năng
lực web đã hoàn toàn áp đảo các phương thức cá
biệt khác
2 Các biểu ghi thư mục: Tương tự như đối với các tài liệu truyền thống, mỗi tài liệu số cần có một biểu ghi thư mục mô tả làm cơ sở cho việc tìm kiếm qua OPAC và quản lý tài liệu đó Đối với các hệ thống thư viện số giản đơn biểu ghi thư mục chứa thông tin liên kết trực tiếp tới địa chỉ tệp tin tài liệu số
Ví dụ thông tin địa chỉ tài liệu điện tử được tham chiếu trong trường 856 với tiêu chuẩn MARC21
và DC.Identifier với Dublin Core Với tham chiếu giản đơn hệ thống thư viện số không cho phép thể hiện tường minh cấu trúc các tài liệu phức tạp kết hợp nhiều tệp tin và các thông tin mô tả như một tạp chí nhiều bài, một bài giảng nhiều thể loại tài liệu kết hợp… ngoài ra còn nhiều những giới hạn
về kỹ thuật khác
3 Các biểu ghi siêu dữ liệu đối tượng số: Lịch sử phát triển thư viện số trên thế giới đã trải qua nhiều dự
án với nhiều đề xuất các tiêu chuẩn thư viện số khác nhau mà không được phổ biến rộng rãi cho đến METS(Metadata Encoding and Transmission Standard) – tiêu chuẩn mã hóa và trao đổi siêu
dữ liệu METS là tiêu chuẩn để mã hóa siêu dữ liệu mô tả, quản trị, cấu trúc, bản quyền và các dữ liệu cần thiết cho thu thập, bảo trì và cung ứng các nguồn tài nguyên số ông tin chi tiết về tiêu chuẩn này có thể tìm thấy ởhttp://www.lcweb loc.gov/mets Số lượng các dự án thư viện số ứng dụng METS ngày càng nhiều cho thấy tính hiệu quả của tiêu chuẩn này, danh mục dự án có thể tìm thấy tại http://www.loc.gov/standards/mets/ mets-registry.html METS là một tiêu chuẩn lớn
và phức tạp về mặt kỹ thuật, không tĩnh như tiêu chuẩn MARC hay Dublin Core, việc vận dụng nó cần phải linh hoạt trong thực tế rất phụ thuộc vào nhà cung cấp giái pháp cũng như yêu cầu cụ thể của thư viện
4 Các biểu ghi bạn đọc: Đối tượng phục vụ của thư viện là các bạn đọc, mỗi bạn đọc cần được phân loại và lưu trữ các thông tin cần thiết liên quan đến họ để thư viện có thể thiết lập lên các chính sách truy cập tới tài liệu số, quản lý truy cập và thu phí
Trang 52 CHƯƠNG 1 THƯ VIỆN SỐ
1.2 Tham khảo
[1] Wien, Ian H., Bainbridge, David Nichols.Accessed
January 31, 2014
Trang 6Trang web arXiv (phát âma-kai từ chữarchive(nghĩa
là lưu trữ), nếu như “X” làchữ cái Hy Lạp Chi, χ) là
một cơ sở dữ liệu lưu trữ điện tử dạng tiền in ấn (hoặc
nháp) của các bài báo khoa học trong các lĩnh vựctoán
học,vật lý,khoa học máy tính,sinh họcđịnh lượng và
thống kêmà mọi người có thể truy cập miễn phí (phi
thương mại) trênworld wide web Trong nhiều ngành
của toán học và vật lý, hầu hết các bài báo khoa học đều
được lưu ở arXiv Ngày 3 tháng 10 năm 2008, arXiv.org
vượt qua mốc lưu trữ nửa triệu bài báo, với gần 5 nghìn
bản điện tử mới được thêm vào hàng tháng.[1]
2.1 Lịch sử
Trang arXiv được phát triển bởi Paul Ginsparg năm
1991 như là một kho lưu trữ cho các bản in trước trong
vật lývà sau đó mở rộng để bao gồmthiên văn học,
toán học,khoa học máy tính,khoa học phi tuyến,sinh
họcđịnh lượng và gần đây nhất,thống kê[2] Trang web
này rất nhanh chóng trở thành một nhu cầu cần thiết
để bảo quản lâu dài của bản in trước uật ngữe-print
được chấp nhận để mô tả các bài viết này Ginsparg đã
được traohọc bổng MacArthurnăm 2002 cho sự thành
lập của ông về arXiv
Ban đầu nó đượclưu ở máy chủtạiphòng thí nghiệm
quốc gia Los Alamos(ở xxx.lanl.gov, vì thế đây là tên
cũ của nó, lưu trữ các bản in trước LANL) và bây giờ
arXiv được tổ chức và điều hành bởiĐại học Cornell,
với nhiều máy chủ ở khắp nơi trên thế giới Trang web
đổi tên và địa chỉ thành arXiv.org vào năm 1999 để cho
linh hoạt hơn
Sự tồn tại của trang web là một trong những yếu tố tác
động dẫn đến sự chuyển động hiện tại trong việcxuất
bản khoa học, được gọi làtruy cập mở Cácnhà toán
họcvà cácnhà khoa họcthường xuyên tải lên các bài
viết của họ lên arXiv.org để có thể truy cập trên toàn
thế giới và đôi khi để đánh giá trước khi chúng được
công bố trên cáctạp chí phản biện ngang hàng
Các hoạt động của trang arXiv hiện đang được tài
trợ bởi Đại học Cornellvà bởi ỹ Khoa học ốc
gia(National Science Foundation).[3]Trong năm 2010,
trường Cornell đã tìm cách mở rộng các nguồn tài trợ
tài chính của dự án bằng cách kêu gọi các tổ chức, viện
nghiên cứu đóng góp tự nguyện hàng năm dựa trên số lượng file tải về của mỗi tổ chức, mỗi viện Đóng góp hàng năm sẽ thay đổi từ $ 2.300 đến $ 4.000, dựa vào cách sử dụng của mỗi tổ chức Tính đến 16 tháng 2 năm
2010, 27 tổ chức và viện nghiên cứu đã cam kết hỗ trợ ngân sách trên cơ sở đó.[4] Ngân sách hàng năm cho arXiv là $ 400.000 trong năm 2010.[4]
2.2 Quá trình duyệt
Mặc dù arXiv không có quá trình phản biện ngang hàng
(peer review), nó có một nhóm giám khảo cho mỗi lĩnh
vực để giám sát các bài viết được tải lên và họ có thể sửa đổi thể loại các bài viết mà họ cho là lạc đề Danh sách các giám khảo cho nhiều lĩnh vực được liệt kê công khai[5] nhưng các giám khảo cho hầu hết các lĩnh vực của vật lý vẫn không được công khai
Phần lớn các bài viết được đưa vào arXiv cũng đã được xuất bản trong các báo chí khoa học chuyên ngành, tuy nhiên có một số công trình, kể cả nhiều công trình có ảnh hưởng lớn, chỉ xuất bản ở dạng điện tử và chưa bao giờ được xuất bản trong các báo chí khoa học Một
ví dụ nổi tiếng là sơ lượcchứng minh giả thuyết hình học hóa của urston, trong đó cóGiả thuyết Poincaré, đượcGrigori Yakovlevich Perelmantải lên vào tháng 11 năm 2002[6] Perelman không chịu theo thủ tục phản biện ngang hàng, và nói rằng “Nếu ai muốn biết cách tôi giải bài, tất cả đều nằm đó [trên arXiv] - để họ lên
đó mà đọc.”[7]
Tuy arXiv vẫn có một số e-print không đáng tin cậy, như một số công trình bác lại các định lý nổi tiếng hay chứng minh một giả thuyết nào đó nhưĐịnh lý lớn Fermatmà lại sử dụng toán học trình độ cấp hai, những tài liệu kiểu này “hiếm gặp một cách đáng ngạc nhiên”[8]
2.3 Xem thêm
• MathWorld
• PlanetMath
Trang 74 CHƯƠNG 2 ARXIV
2.4 Chú thích
[1] Online Scientific Repository Hits Milestone - With
500,000 Articles, arXiv Established as Vital Library
Resource
[2] Paul Ginsparg “e global-village pioneers” Physics
Worldngày 1 tháng 10 năm 2008
[3] Computing Research repository FAQs, Cornell
University
[4] Landgraf, Greg (ngày 17 tháng 2 năm 2010).“Cornell
Seeks Sustainable arXiv Support” American Libraries
Truy cập ngày 3 tháng 3 năm 2010
[5] Computing Research Repository Subject Areas and
Moderators;Mathematics categories;Statistics archive;
antitative Biology archive;Physics archive
[6] Chris Philipp (ngày 28 tháng 9 năm 2006).“Reclusive
mathematician rejected honors for solving
100-year-old math problem, but he relied on Cornell’s arXiv to
publish” Đại học Cornell Truy cập ngày 14 tháng 11
năm 2010
[7] Nadejda Lobastova and Michael Hirst,“Maths genius
living in poverty”, Sydney Morning Herald, ngày 21
tháng 8 năm 2006
[8] Jackson, Allyn (2002).“From Preprints to E-prints: e
Rise of Electronic Preprint Servers in Mathematics”
(PDF) Notices of the American Mathematical Society 49
(1): 23–32
2.5 Tham khảo
• Butler, Declan (ngày 9 tháng 10 năm 2003).
“Biologists Join Physics Preprint Club”
Nature 425 (6958): 548. PMID 14534551
doi:10.1038/425548b
• Butler, Declan (ngày 5 tháng 7 năm 2001).
“Los Alamos Loses Physics Archive as Preprint
Pioneer Heads East” Nature 412 (6842): 3–4.PMID
11452262.doi:10.1038/35083708
• Choi, Charles Q (ngày 30 tháng 9 năm 2003).
“Biology’s New Online Archive” e Scientist.
• Giles, Jim (ngày 6 tháng 11 năm 2003).“Preprint
Server Seeks Way to Halt Plagiarists” Nature 426
(6962): 7.PMID 14603280.doi:10.1038/426007a
• Ginsparg, Paul (1997).“Winners and Losers in the
Global Research Village” e Serials Librarian 30
(3/4): 83–95.doi:10.1300/J123v30n03_13
• Halpern, Joseph Y (tháng 11 năm 1998). “A
Computing Research Repository” D-Lib Magazine
4.doi:10.1045/november98-halpern
• Halpern, Joseph Y (2000) “CoRR: A Computing Research Repository” Journal
of Computer Documentation 24 (2): 41–48.
arΧiv:cs.DL/0005003
• Luce, Richard E (2001). “E-Prints Intersect the Digital Library: Inside the Los Alamos arXiv”
Issues in Science and Technology Librarianship (29).
• McKiernan, Gerry (2000). “arXiv.org: e Los Alamos National Laboratory E-Print Server”
(PDF) e International Journal on Grey Literature
1 (3): 127–138.doi:10.1108/14666180010345564
• Pinfield, Stephen (2001) “How Do Physicists
Use an E-Print Archive? Implications for
Institutional E-Print Services” D-Lib Magazine 7
(12).doi:10.1045/december2001-pinfield
• igley, Brian (2000) “Physics Databases and the
Los Alamos e-Print Archive” EContent 23 (5): 22–
26
• Taubes, Gary (26 tháng 2 năm 1993) “Publication
by Electronic Mail Takes Physics by Storm”
Science Magazine: 1246–1248.
• Warner, Simeon (2001) “Open Archives Initiative
Protocol Development and Implementation at arXiv”.arΧiv:cs/0101027
• “What Is q-bio?” Open Access Now 2 tháng 8 năm
2004
2.6 Liên kết ngoài
• arXiv.org website
• Glanz, James (ngày 1 tháng 5 năm 2001). “e World of Science Becomes a Global Village; Archive Opens a New Realm of Research” New York Times.
• 'Creating a global knowledge network': a talk by Paul Ginsparg
• Open Access Overviewby Peter Suber
• Tragic loss or good riddance? e impending demise of traditional scholarly journals by Andrew Odlyzko
• Front: a portal to mathematics on arXiv.org through UC Davis
• Arxiv structure: Tool to view Arxiv articles in a structured way
• eprintweb.orgWeb front for Arxiv
• arXiv online scientific repository hits milestone
Trang 8Thư viện châu Âu
ư viện âu Âu (tiếng Anh: European Library) là một
trang web cho phép truy cập vào tài nguyên của 47 thư viện quốc gia châu Âu Những tài nguyên này bao gồm sách, tạp chí, báo, bản ghi âm thanh… có thể đã
số hóa hoặc không an lý chung của thư viện là một
Consortiumgồm 23 thư viện quốc gia
3.1 Tham khảo
3.2 Liên kết ngoài
• e European Library
Trang 9Chương 4
Dự án Gutenberg
Dự án Gutenberg (tiếng Anh: Project Gutenberg,
thường viết tắt PG) là dự án tình nguyện để số hóa,
lưu trữ, và phân phối tác phẩm văn hóa Vì được thành
lập năm 1971, nó làthư viện trực tuyếnđầu tiên Phần
nhiều thứ trong kho này là văn bản đầy đủ của những
sách thuộcphạm vi công cộng Dự án này cố gắng để
người khác sử dụng nótự dovà dễ dàng, bằng cách sử
dụng các định dạng lâu bền vàmởmà có thể truy cập
trên bất kỳmáy tínhnào
4.1 Lịch sử
Dự án Gutenberg doMichael Hartbắt đầu năm 1971
Hart, một sinh viên tạiĐại học Illinois, được phép truy
cậpmáy tính mẹ(mainframe) loạiXerox Sigma Vtại
Phòng í nghiệm Vật liệu của đại học Do những
người quản lý hệ thống thân thiện, ông được tài khoản
hầu như không giới hạn; về sau, giá trị của tài khoản
hồi đó được ước lượng bằng 100.000đô lahay cả 100
triệu đô la.[1]Hart nói là muốn “hoàn lại” quà tặng này
bằng cách làm công việc có giá trị cao
Máy tính này là một trong 15núttrênmạng máy tính
mà sắp trở thànhInternet Hart tin rằng công chúng sẽ
có thể truy cập máy tính vào tương lai và quyết định
làm sẵn các tác phẩm văn chương miễn phí dưới hình
thức điện tử Ông sử dụng văn bảnTuyên ngôn Độc lập
Hoa Kỳđể lưu trữ đầu tiên, và văn kiện này trở thành
sách điện tử(e-book) đầu tiên của Dự án Gutenberg.
Ông đặt tên dự án theo Johannes Gutenberg, thợ in
người Đức tiến hành cách mạngmáy invào thế kỷ 15
4.2 Chú thích
[1] “Lịch sử và Triết lý của Dự án Gutenberg” áng 8 năm
1992
4.3 Xem thêm
• Dự án Runeberg
• Google Book Search
• Open Content Alliance
4.4 Liên kết ngoài
• Trang chủ
• Distributed Proofreaders, nhóm người thu thập tình nguyện toàn cầu hiện là nguồn e-book chính của Dự án Gutenberg
6
Trang 10Europeana là một nền tìm kiếm trên những tài liệu của
cácthư viện châu Âu, gồm sách, tranh, phim và những tài liệu lưu trữ đượcsố hóa Đây là một dự án củaỦy ban châu Âu
ư viện ban đầu gồm khoảng 2 triệu tài liệu được số hóa, tất cả đều thuộcphạm vi công cộng Trong số này hơn 50% doPhápcung cấp, 10% từAnh, 1.4% từTây Ban Nha, 1% từĐức eo mục tiêu, thư viện số Europeana
sẽ có khoảng 10 triệu tài liệu vào năm 2010.[1]Giám đốc của dự án hiện nay là Jill Cousins
5.1 Tham khảo
[1] “EUROPEANA – Europe’s Digital Library: Frequently Asked estions” (ông cáo báo chí) European Commission Ngày 20 tháng 11 năm 2008 Truy cập ngày 26 tháng 11 năm 2008
5.2 Liên kết ngoài
• Official website(currently beta status)
• Development homepage– about the project and its development