công tác số hoá tài liệu tại Viện TTKHXH hiện nay đang trong quá trình thực hiện song song với việc tìm tòi, thử nghiệm, vẫn còn nhiều vấn đề tồn tại như chưa xây dựng được chính sách số
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO BỘ VĂN HÓA, THỂ THAO VÀ DU LỊCH
TRƯỜNG ĐẠI HỌC VĂN HOÁ HÀ NỘI
LUẬN VĂN THẠC SĨ KHOA HỌC THÔNG TIN - THƯ VIỆN
NGƯỜI HƯỚNG DẪN KHOA HỌC:
PGS.TS NGUYỄN THỊ LAN THANH
HÀ NỘI, 2013
Trang 2MỤC LỤC
MỤC LỤC 1
DANH MỤC TỪ VIẾT TẮT 3
DANH MỤC CÁC BẢNG BIỂU 4
DANH MỤC CÁC HÌNH MINH HỌA 5
MỞ ĐẦU 6
CHƯƠNG 1 NHỮNG VẤN ĐỀ CHUNG VỀ SỐ HÓA TÀI LIỆU VÀ VIỆN THÔNG TIN KHOA HỌC XÃ HỘI 11
1.1 NHỮNG VẤN ĐỀ CHUNG VỀ SỐ HÓA TÀI LIỆU 11
1.1.1.Khái niệm số hóa tài liệu và một số khái niệm liên quan 11
1.1.2.Đặc trưng của tài liệu số hóa 13
1.1.3.Các điều kiện đảm bảo số hóa tài liệu 15
1.1.4.Các tiêu chí cơ bản đối với số hóa tài liệu 18
1.2 KHÁI QUÁT VỀ VIỆN THÔNG TIN KHOA HỌC XÃ HỘI 20
1.2.1.Chức năng, nhiệm vụ 20
1.2.2.Nhân sự, vốn tài liệu và trang thiết bị 22
1.2.3.Đặc điểm người dùng tin và nhu cầu tin 27
1.3 VAI TRÒ VÀ YÊU CẦU SỐ HÓA TÀI LIỆU TẠI VIỆN THÔNG TIN KHOA HỌC XÃ HỘI 30
1.3.1.Vai trò của số hóa tài liệu đối với Viện Thông tin khoa học xã hội 30
1.3.2.Yêu cầu số hóa tài liệu tại Viện Thông tin khoa học xã hội 35
CHƯƠNG 2 THỰC TRẠNG SỐ HOÁ TÀI LIỆU TẠI VIỆN THÔNG TIN KHOA HỌC XÃ HỘI 37
2.1 TỔ CHỨC QUY TRÌNH SỐ HOÁ TÀI LIỆU TẠI VIỆN THÔNG TIN KHOA HỌC XÃ HỘI 37
2.1.1 Lựa chọn tài liệu số hóa và vấn đề bản quyền 38
2.1.2.Lập kế hoạch số hóa tài liệu 42
2.1.3 Tạo lập dữ liệu 46
2.1.4 Xử lý dữ liệu 50
Trang 32.1.5 Mô tả dữ liệu 53
2.1.6 Quản lý dữ liệu 57
2.2 CÁC ĐIỀU KIỆN ĐẢM BẢO CHO VIỆC SỐ HÓA TÀI LIỆU TẠI VIỆN THÔNG TIN KHOA HỌC XÃ HỘI 62
2.2.1 Cơ cấu tổ chức, nguồn nhân lực số hoá tài liệu tại Viện Thông tin khoa học xã hội 62
2.2.2 Cơ sở vật chất kỹ thuật cho số hoá tài liệu tại Viện Thông tin khoa học xã hội 63
2.3 NHẬN XÉT CÔNG TÁC SỐ HÓA TÀI LIỆU TẠI VIỆN THÔNG TIN KHOA HỌC XÃ HỘI 70
2.3.1 Điểm mạnh 70
2.3.2 Điểm yếu 73
2.3.3 Nguyên nhân 75
CHƯƠNG 3 GIẢI PHÁP NÂNG CAO CHẤT LƯỢNG SỐ HÓA TÀI LIỆU TẠI VIỆN THÔNG TIN KHOA HỌC XÃ HỘI 76
3.1 HOÀN THIỆN QUY TRÌNH SỐ HÓA TÀI LIỆU 76
3.1.1 Xây dựng chính sách số hóa tài liệu hợp lý 76
3.1.2 Nâng cao chất lượng tạo lập dữ liệu 77
3.1.3 Nâng cao chất lượng xử lý dữ liệu 79
3.1.4 Nâng cao chất lượng mô tả dữ liệu 80
3.1.5 Nâng cao hiệu quả quản lý dữ liệu 81
3.2 ĐẢM BẢO CHẤT LƯỢNG CHO CÁC ĐIỀU KIỆN SỐ HOÁ TÀI LIỆU 81
3.2.1 Phát huy nhân tố con người 81
3.2.2 Tăng cường cơ sở vật chất kỹ thuật cho việc số hoá tài liệu 83
KẾT LUẬN 87
DANH MỤC TÀI LIỆU THAM KHẢO 88
PHỤ LỤC 1 91
PHỤ LỤC 2 96
Trang 4DANH MỤC TỪ VIẾT TẮT
CD-ROM: Compact Disc Read Only Memory
Bộ nhớ chỉ đọc dùng cho đĩa compact
Trang 5DANH MỤC CÁC BẢNG BIỂU
Bảng 1.1: Bảng thống kê tài liệu truyền thống của Viện Viễn Đông Bác Cổ
bàn giao lại cho Viện TTKHXH 24
Bảng 1.2: Bảng thống kê sách từ năm 1975 đến 2012 25
Bảng 1.3: Bảng thống kê báo, tạp chí từ năm 1975 đến 2012 25
Bảng 1.4: Bảng thống kê tài liệu điện tử 26
Bảng 1.5: Bảng thống kê thành phần NDT của Viện TTKHXH từ năm 2009 đến 2012 28
Bảng 1.6: Bảng thống kê thành phần NDT theo trình độ học vấn 28
Bảng 2.1: Kế hoạch số hóa tài liệu 44
Trang 6DANH MỤC CÁC HÌNH MINH HỌA
Hình 1.1: Cơ cấu thành phần NDT năm 2012 29
Hình 2.1 Sơ đồ minh hoạ quá trình tạo lập dữ liệu 46
Hình 2.2: Giao diện phần mềm xử lý ảnh Adobe Photoshop Lightroom 52
Hình 2.3: Hình minh họa giao diện thư mục lưu trữ các tài liệu số hóa 58
Hình 2.4: Hình minh họa đường link file PDF tích hợp trên phần mềm CDS/ISIS 60
Hình 2.5: Mô hình tổng quan hệ thống số hóa tài liệu 61
Trang 7MỞ ĐẦU
1 Tính cấp thiết của đề tài
Cùng với sự phát triển của khoa học và công nghệ hiện đại trong công nghệ thông tin và truyền thông, xu hướng toàn cầu hóa, sự ra đời của máy tính điện tử và Internet đã và đang làm thay đổi mọi lĩnh vực trong hoạt động của con người, trong đó có hoạt động thông tin - thư viện Sự tác động này đã làm gia tăng nhanh chóng các loại hình tài liệu dẫn đến sự thay đổi cơ cấu kho tài liệu trong các cơ quan thông tin - thư viện Xuất phát từ nhu cầu thực tế, việc
sử dụng kỹ thuật số để biểu diễn thông tin đã dẫn đến sự xuất hiện của loại hình tài liệu mới, đó là tài liệu số hóa Nguồn tài liệu này đang góp phần làm thay đổi về chất trong hoạt động của cơ quan giao lưu thông tin trên thế giới
Xu thế liên kết hoạt động giữa các cơ quan thông tin - thư viện trên thế giới là một xu thế tất yếu Việt Nam cũng không nằm ngoài xu thế đó Hiện nay, kho tàng cho các tài liệu đang dần bị thu hẹp, trong khi đó các tài liệu gia tăng không ngừng, giải pháp được nhiều thư viện lựa chọn là bổ sung nguồn tài liệu ở dạng số hóa Đây cũng là nguyên nhân quan trọng để nhiều cơ quan thông tin - thư viện tiến hành số hóa tài liệu cho thư viện mình
Không nằm ngoài xu thế hội nhập và phát triển đó, Viện TTKHXH đang từng bước phát triển nguồn tài liệu số hóa của mình Viện TTKHXH là một kho tư liệu cổ có một không hai về phương Đông và Đông phương học ở Đông Nam Á có tiền thân là thư viện Viện Viễn Đông Bác cổ (EFEO) thuộc Pháp được thành lập từ năm 1901 Nguồn tài liệu quý giá này hiện nay mới chỉ được khai thác một phần, cùng với thời gian, nguồn tài liệu này đang dần
bị hư hỏng do nhiều nguyên nhân khác nhau Việc số hóa nguồn tài liệu này
là vấn đề cấp thiết, hơn nữa, đây là bước tiến quan trọng nhằm xây dựng kho thông tin số cho các tài liệu của Viện TTKHXH trong tương lai Tuy nhiên,
Trang 8công tác số hoá tài liệu tại Viện TTKHXH hiện nay đang trong quá trình thực hiện song song với việc tìm tòi, thử nghiệm, vẫn còn nhiều vấn đề tồn tại như chưa xây dựng được chính sách số hóa tài liệu, chưa có sự phối hợp hoạt động
và chia sẻ tài nguyên thông tin với các thư viện khác, cơ sở vật chất kỹ thuật cho số hóa tài liệu chưa đáp ứng nhu cầu, trình độ của một số cán bộ chưa đáp ứng yêu cầu và đặc biệt là chưa xây dựng được quy trình số hóa với các công đoạn hoàn chỉnh
Nhằm nâng cao chất lượng số hóa tài liệu tại Viện TTKHXH, tôi đã
chọn đề tài “Số hoá tài liệu tại Viện Thông tin khoa học xã hội: Thực trạng
và giải pháp” cho luận văn thạc sĩ Khoa học thông tin - thư viện của mình
2 Tình hình nghiên cứu đề tài
Vấn đề xây dựng và quản lý nguồn lực thông tin số, trong đó có vấn đề
số hóa tài liệu là vấn đề đã được quan tâm của nhiều cơ quan chức năng, các đơn vị kinh doanh cũng như các cơ quan thông tin - thư viện Đã có một số luận văn thạc sĩ nghiên cứu vấn đề phát triển nguồn lực thông tin số:
Luận văn thạc sĩ năm 2009 của Lê Thị Vân Nga với đề tài: “Phát triển nguồn tài liệu số hóa toàn văn tại Thư viện trường Đại học Hà Nội”
Nội dung chủ yếu tập trung nghiên cứu hiện trạng nguồn tài liệu số hóa toàn văn tại Thư viện Đại học Hà Nội từ năm 2003 và định hướng phát triển trong tương lai
Luận văn thạc sĩ năm 2009 của Vũ Văn Thường với đề tài: “Nghiên cứu khai thác và phát triển nguồn học liệu số tại trường Đại học Sư phạm Hà Nội trong giai đoạn đổi mới giáo dục” Luận văn tập trung nghiên cứu công
tác phát triển nguồn học liệu số tại Trường Đại học Sư phạm Hà Nội giai đoạn 2000-2009, đề xuất các giải pháp khai thác và phát triển nguồn học liệu số tại
Trang 9đây Luận văn có đề cập đến giải pháp xây dựng nguồn học liệu số bằng phương thức số hóa
Luận văn thạc sĩ năm 2010 của Lê Đức Thắng với đề tài: “Phát triển nguồn tài liệu số hóa toàn văn tại Thư viện Quốc gia Việt Nam” Nội
dung luận văn tập trung nghiên cứu hiện trạng phát triển nguồn tài liệu số hóa toàn văn tại Thư viện Quốc gia Việt Nam giai đoạn 2003 - 2010 và định hướng phát triển trong tương lai
Luận văn thạc sĩ năm 2010 của Nguyễn Thị Loan với đề tài: “Tìm hiểu phần mềm mã nguồn mở Greenstone và việc ứng dụng tại Viện Thông tin khoa học xã hội” Nội dung luận văn tập trung tìm hiểu phần mềm
Greenstone và ứng dụng của phần mềm này trong xây dựng cơ sở dữ liệu toàn văn tại Viện Thông tin Khoa học xã hội
Luận văn thạc sĩ năm 2011 của Hoàng Vũ với đề tài: “Phát triển nguồn lực thông tin số tại thư viện trường Đại học Ngoại Thương Hà Nội”
Luận văn đề cập đến vấn đề phát triển nguồn lực thông tin số tại thư viện trường Đại học Ngoại thương Hà Nội từ năm 2005 Một trong những giải pháp phát triển nguồn lực thông tin số được luận văn đề cập đến là vấn đề xây dựng quy trình số hóa và cách thức triển khai số hóa
Luận văn thạc sĩ năm 2011 của Phạm Thị Thu với đề tài: “Tài liệu
số tại trung tâm thông tin - thư viện Đại học Quốc gia Hà Nội” Luận văn tập
trung tìm hiểu quá trình xây dựng, phát triển và khai thác tài liệu số tại trung tâm thông tin - thư viện Đại học Quốc gia Hà Nội giai đoạn từ 1999 đến nay
và đề xuất một số giải pháp phát triển tài liệu số tại đây
Ngoài ra, còn có một số bài nghiên cứu được đăng tải trên nhiều tạp chí, website, đặc biệt là các tạp chí, ấn phẩm điện tử chuyên ngành thông tin - thư viện như:
Trang 10 Nguyễn Tiến Đức “Xây dựng thư viện điện tử và vấn đề số hóa tài
liệu ở Việt Nam”, Tạp chí Thông tin và Tư liệu, số 2/2005 Nội dung trình bày
tiếp cận xây dựng thư viện điện tử, xem xét khía cạnh cấu trúc, hạ tầng cơ sở
kĩ thuật và phát triển kho tư liệu số hóa của thư viện điện tử, đề cập vấn đề tổ chức số hóa tài liệu trong phạm vi mạng lưới của các tổ chức thông tin khoa học công nghệ ở Việt Nam
Nguyễn Hữu Hùng “Vấn đề phát triển và chia sẻ nguồn lực thông
tin số hóa tại Việt Nam” Tạp chí Thông tin và Tư liệu, số 1/2006 Tác giả
trình bày khái niệm và luận chứng vai trò trung tâm của tài nguyên thông tin
số trong hệ thống thông tin quốc gia Giới thiệu 3 kịch bản trong tạo lập tài nguyên số Đưa ra điều kiện và yếu tố cần thiết để thực hiện việc chia sẻ tài nguyên số trên quy mô hệ thống
Lê Đức Thắng “Quy trình tổ chức số hóa tài liệu thư viện” Tạp chí Thư viện Việt Nam, số 3/2009 Tác giả chia sẻ về số hóa tài liệu và quy trình
tổ chức số hóa các dạng tài liệu gồm những công đoạn phức tạp để tạo ra những bộ sưu tập tài liệu số nhằm bảo quản, tạo lập nguồn dữ liệu số cho tài liệu số hóa, có thể chia sẻ trong mạng nội bộ hay phục vụ trực tuyến
Đây cũng là chủ đề được nhiều tác giả trình bày trong nhiều Hội nghị, Hội thảo chuyên ngành về thư viện
Tuy nhiên, các đề tài trên mới chỉ đề cập đến nguồn lực thông tin số, một
số giải pháp khai thác và phát triển nguồn lực thông tin số mà chưa có đề tài nào nghiên cứu sâu về vấn đề số hóa tài liệu Viện TTKHXH có cũng chưa có
đề tài nào nghiên cứu sâu về vấn đề số hóa tài liệu cũng như giải pháp nâng cao chất lượng số hóa tài liệu
3 Mục tiêu nghiên cứu
Trên cơ sở phân tích thực trạng số hóa tài liệu tại Viện TTKHXH, đề tài đề xuất một số giải pháp nhằm nâng cao chất lượng số hóa tài liệu tại Viện TTKHXH
Trang 114 Đối tượng và phạm vi nghiên cứu
- Đối tượng nghiên cứu của đề tài là công tác số hóa tài liệu tại Viện TTKHXH
- Phạm vi nghiên cứu của đề tài: Đề tài nghiên cứu thực trạng số hóa tài liệu tại Viện TTKHXH từ năm 2009 đến nay
5 Phương pháp nghiên cứu
- Vận dụng phương pháp luận duy vật biện chứng và duy vật lịch sử và đường lối, chính sách của Đảng và Nhà nước về công tác thông tin và công nghệ thông tin
- Sử dụng các phương pháp nghiên cứu cụ thể:
+ Phương pháp phân tích, tổng hợp tài liệu
+ Phương pháp thống kê
6 Kết cấu của luận văn
Ngoài Mở đầu, Kết luận, Danh mục tài liệu tham khảo, luận văn gồm 3 chương:
Chương 1: Những vấn đề chung về số hóa tài liệu và Viện Thông tin khoa học xã hội
Chương 2: Thực trạng số hóa tài liệu tại Viện Thông tin khoa học xã hội Chương 3: Giải pháp nâng cao chất lượng số hóa tài liệu tại Viện Thông tin khoa học xã hội
Trang 12CHƯƠNG 1 NHỮNG VẤN ĐỀ CHUNG VỀ SỐ HÓA TÀI LIỆU
VÀ VIỆN THÔNG TIN KHOA HỌC XÃ HỘI
1.1 NHỮNG VẤN ĐỀ CHUNG VỀ SỐ HÓA TÀI LIỆU
1.1.1 Khái niệm số hóa tài liệu và một số khái niệm liên quan
Sự phát triển mạnh mẽ của công nghệ thông tin đã làm thay đổi đời sống xã hội trên phạm vi toàn thế giới, hoạt động thông tin - thư viện cũng không nằm ngoài sự phát triển đó Bên cạnh tài liệu, sản phẩm thông tin truyền thống, trong các trung tâm thông tin, thư viện xuất hiện các sản phẩm
và dịch vụ thông tin mới dựa trên ứng dụng công nghệ thông tin Một trong những hoạt động để hình thành và phát triển các sản phẩm, dịch vụ thông tin này là việc số hóa các tài liệu nhằm hình thành vốn tài liệu số
*Khái niệm số hoá tài liệu
Khái niệm số hóa tài liệu là khái niệm vẫn còn mới và chưa thống nhất trong cộng đồng những người làm công tác thông tin - thư viện Có nhiều khái niệm khác nhau:
- Số hoá là việc biến đổi các loại hình thông tin sang thông tin số [8]
- Số hoá là tiến trình chuyển tài liệu thư viện truyền thống, cụ thể là sách và văn bản sang dạng điện tử và lưu giữ trên máy tính [10]
- Số hóa (Tiếng Anh: Digitization) là quá trình tạo lập những thông tin trên những đối tượng thực sang dạng điện tử hay còn gọi là dạng số Những đối tượng thực chứa thông tin có thể là các tài liệu dạng văn bản, hình ảnh, bản đồ, băng ghi âm, ghi hình,… trên các vật mang tin vật lý (trên giấy, trên phim, giấy ảnh, vi hình, băng ghi âm, băng ghi hình…) Kết quả của số hóa là những đối tượng thực được chuyển sang đối tượng số dưới dạng tệp tin, những tệp tin này có thể được sử dụng rất nhiều trong xây dựng những CSDL
có liên kết với tệp toàn văn [4]
Trang 13- Số hoá tài liệu là quá trình chuyển các dạng dữ liệu/ tài liệu truyền thống như các bản viết tay, bản in trên giấy, hình ảnh, âm thanh, phim, dữ liệu toàn văn với nhiều định dạng khác nhau sang chuẩn dữ liệu trên máy tính và được máy tính nhận biết được như tài liệu ban đầu gọi là số hóa dữ liệu Hay nói cách khác, số hóa tài liệu là hình thức chuyển đổi các tài liệu truyền thống bên ngoài thành dạng tài liệu số mà máy tính có thể hiểu được [11]
Như vậy, có thể thấy các khái niệm trên đều có nội dung tương đối giống nhau Tác giả luận văn lựa chọn khái niệm số hóa tài liệu cuối cùng nêu trên làm khái niệm cho luận văn của mình
* Một số khái niệm liên quan
- Tài liệu số
Là những tài liệu được lưu giữ bằng máy tính Tài liệu số có thể được tạo lập bởi máy tính như việc xử lý các file văn bản, các bảng biểu hoặc chúng có thể được chuyển đổi sang dạng số từ những tài liệu dạng khác (scan, ghi âm,…)
- Thư viện số
Theo Liên đoàn TVS (Digital Libraries Federation - DLF): “Các TVS
là các tổ chức cung cấp nguồn lực, trong đó bao gồm các chuyên gia (những người có kiến thức và kỹ năng làm việc trong môi trường số), để lựa chọn thông tin, cấu trúc hóa, đưa ra các phương thức truy cập và phân phối thông tin hiệu quả, cũng như đảm bảo sự toàn vẹn của bộ sưu tập số, sao cho chúng luôn sẵn sàng và kinh tế để phục vụ một cộng đồng cụ thể hoặc một nhóm cộng đồng [12]
Theo Ian Witten, chuyên gia TVS của Đại học Waikato, New Zealand, chủ biên phần mềm nguồn mở TVS Greenstone: “TVS là tập hợp những bộ sưu tập thông tin của các đối tượng số hoặc đã được số hóa có tổ chức và tập trung Tập trung theo đề tài hay chủ đề và có tổ chức để thông tin dễ truy cập và lưu trữ
Trang 14theo những tiêu chuẩn chuyên biệt cung cấp hai khả năng chính: Phương thức truy cập, chọn lọc, hiển thị tài nguyên số (dành cho người sử dụng); Phương thức xây dựng, tổ chức và lưu hành (dành cho cán bộ thư viện)
- Bộ sưu tập số
Bộ sưu tập số là một tập hợp có tổ chức nhiều tài liệu đã được số hóa dưới nhiều hình thức khác nhau (văn bản, hình ảnh, audio, video…) về một chủ đề Mặc dù mỗi loại hình tài liệu có sự khác nhau về cách thể hiện, nhưng
nó đều cung cấp một giao diện đồng nhất mà qua đó các tài liệu có thể truy cập, tìm kiếm dễ dàng
1.1.2 Đặc trưng của tài liệu số hóa
Sự ra đời và phát triển nhanh chóng của các thiết bị điện tử chuyên dụng đã làm cho việc số hóa tài liệu phát triển nhanh chóng mà sản phẩm của
nó chính là các tài liệu số hóa Các tài liệu số hóa có các đặc trưng sau đây:
- Tài liệu số hóa có mật độ thông tin cao Những thành tựu của công nghệ thông tin, đặc biệt là công nghệ lưu trữ trên các vật mang tin hiện đại đã khiến cho tài liệu số hóa có khả năng chứa đựng một dung lượng thông tin khổng lồ Trong các vật mang tin này có thể kể đến đĩa CD-ROM CD-ROM
là một trong các loại đĩa quang, thường chế tạo bằng chất dẻo, dùng phương pháp ghi quang học để lưu trữ khoảng 80 phút âm thanh hoặc 700 MB dữ liệu máy tính đã được mã hóa theo kỹ thuật số
- Thông tin luôn mới vì có khả năng cập nhật nhanh, thường xuyên và kịp thời Ngày nay, con người có thể đổi mới nội dung thông tin của tài liệu
số hóa một cách nhanh chóng, nhất là đối với các thông tin số hóa có khả năng cập nhật tự động như trên các website Việc sử dụng công nghệ hiện đại
đã làm cho việc cập nhật này không tốn nhiều thời gian, công sức và chi phí cho cơ quan thông tin - thư viện chịu trách nhiệm quản lý thông tin đó
Trang 15- Thông tin có thể được lưu trữ ở nhiều dạng khác nhau như văn bản, âm thanh, hình ảnh, đồ thị, video… Sự đa dạng này mở ra khả năng phát triển các loại hình và sản phẩm dịch vụ thông tin trong thư viện
- Tài liệu số hóa có khả năng truy cập theo nhiều dấu hiệu khác nhau như tác giả, nhan đề, từ khóa, năm xuất bản…
- Có khả năng truy cập từ xa, không giới hạn về không gian, thời gian Cách làm này không những giúp tiết kiệm thời gian mà còn tiết kiệm cả chi phí, hơn nữa, NDT không phải lúc nào cũng có điều kiện đến thư viện Việc này cũng làm cho các tài nguyên có giá trị được chia sẻ, có ích với mọi người
mà không phụ thuộc vào khoảng cách địa lý
- Tài liệu số hóa có thể được truy cập đồng thời bởi nhiều người sử dụng Với sự hỗ trợ của máy tính điện tử và mạng máy tính, việc truy cập cùng một tài liệu, cùng thời điểm của nhiều NDT là điều dễ dàng thực hiện
- Tạo khả năng cho NDT có thể tiếp cận với tác giả thông qua kênh thông tin phản hồi bằng việc sử dụng các liên kết linh hoạt Người dùng có thể liên hệ được với tác giả thông qua thư điện tử hoặc các siêu liên kết có sẵn, có thể kết nối với nhau hoặc kết nối đến các nguồn tham khảo khác [12 tr.157]
Tuy nhiên, ngoài các ưu điểm trên, tài liệu số hóa cũng tồn tại một số hạn chế như sau:
- Tính ổn định không cao, độ bền vững không đồng nhất: Do đặc thù của từng loại hình thông tin, có những thông tin có thể tồn tại lâu dài như các thông tin ghi trên CD-ROM nhưng cũng có những thông có vòng đời rất ngắn như các bản tin, bài báo trên Internet
- Dễ bị vi phạm bản quyền do bị sao chép, sửa đổi, thậm chí bị hủy hoại
do những vi phạm cố tình Thời gian qua, tình hình an ninh thông tin trên Internet diễn biến phức tạp Theo khảo sát sơ bộ có tới 80% các trang tin điện
Trang 16tử còn nhiều sơ hở trong đảm bảo an ninh thông tin, nhiều hệ thống thông tin còn có khiếm khuyết chưa được cập nhật và quan tâm đúng mức nên đã gây
ra những sự cố đáng tiếc ảnh hưởng tới các dịch vụ hành chính điện tử, thương mại điện tử và các hình thức ứng dụng công nghệ thông tin khác Vì vậy, cần lưu tâm đến vấn đề bảo mật thông tin, biện pháp phòng, chống sự xâm nhập của các đối tượng bên ngoài [12, tr.158]
1.1.3 Các điều kiện đảm bảo số hóa tài liệu
- Máy móc, trang thiết bị và phần mềm
Để đảm bảo cho công tác số hóa tài liệu một cách nhanh chóng, hiệu quả thì không thể thiếu được các trang thiết bị chuyên dụng và phần mềm quản lý tài liệu số
Hiện nay, các thư viện không chỉ chú trọng về nhân lực mà còn chú trọng lựa chọn các trang thiết bị chuyên dụng nhằm đảm bảo chất lượng cho tài liệu số, đồng thời giảm chi phí cho việc số hóa tài liệu, giảm sức lực cho các cán bộ tham gia số hóa, từ đó nâng cao hiệu quả và chất lượng số hóa tài liệu Công nghệ để thực hiện phải đáp ứng các yêu cầu:
+ Là công cụ, môi trường để đảm bảo các tài liệu số hóa sau khi được tạo lập sẽ dễ dàng, thuận tiện cho người sử dụng tiếp cận;
+ Có đủ độ tin cậy cho người quản trị và kỹ thuật viên trong quá trình tạo lập, bảo quản và cung cấp dữ liệu trong quá trình hoạt động của bộ sưu tập;
+ Đáp ứng đầy đủ các yêu cầu về chuẩn nghiệp vụ thông tin - thư viện; + Dễ dàng trao đổi dữ liệu với các chuẩn khác, có công cụ sao lưu an toàn dữ liệu [23]
Các phần mềm quản lý tài liệu số đóng vai trò quan trọng trong việc xây dựng và quản trị tài liệu số Phần mềm quản lý tài liệu số cần phải đáp ứng được các yêu cầu như: Đảm bảo độ tin cậy, thuận tiện trong quá trình sử dụng, đáp ứng các yêu cầu về chuẩn nghiệp vụ thư viện, có khả năng trao đổi
Trang 17dữ liệu, khả năng phân quyền và bảo mật Ngoài ra cần có một số tính năng như sau:
+ Thu thập và bổ sung các tư liệu: cung cấp quy trình số hóa và xử lý các dạng tài liệu khác nhau như văn bản, hình ảnh, âm thanh, phim và các định dạng khác
+ Lưu trữ: Cho phép lưu trữ các tài liệu đã được số hóa ở nhiều dạng khác nhau
+ Biên mục theo chuẩn: có khả năng xây dựng các bộ sưu tập theo các
bộ nhãn trường cá biệt theo chuẩn nhất định cho mỗi loại tài liệu cần số hóa
+ Tự xác định các thuộc tính của các tệp dữ liệu số hóa được đưa vào
để cho phép tra cứu theo các thuộc tính đó như kích cỡ tệp, loại nén đối với hình ảnh, âm thanh, video, cỡ và độ sâu đối với ảnh, độ dài đối với âm thanh
số của ảnh, tìm kiếm thông tin theo nội dung: kích thước, độ lớn…
+ Quản lý: có khả năng quản lý dữ liệu, quản lý quyền truy cập đối với mỗi người sử dụng, phân quyền truy cập cho các đối tượng NDT khác nhau
và có khả năng báo cáo thống kê các truy cập lưu lại trong hệ thống [11]
- Con người
Nhân tố con người là một trong những nhân tố cần thiết hàng đầu, có tính chất quyết định đối với hiệu quả của mọi hoạt động Con người ở đây bao gồm cả người quản lý, người thực hiện và người sử dụng Để đảm bảo cho hoạt động thông tin - thư viện nói chung và số hóa tài liệu nói riêng thì việc quan tâm đến yếu tố con người là vấn đề hết sức cần thiết Nguồn nhân lực,
Trang 18chính sách phù hợp, công nghệ tiên tiến tạo nên hiệu quả công việc cao, nhưng quan trọng hơn hết là mọi chính sách, việc làm cần phù hợp, hướng đến người sử dụng Vì vậy, thư viện cần chú trọng lựa chọn cán bộ có khả năng tiếp nhận công nghệ, không ngừng học tập để phù hợp với công việc, đảm bảo số hóa tài liệu của thư viện đạt chất lượng tốt
- Quy trình
Số hóa tài liệu bao gồm những công đoạn phức tạp để tạo ra những bộ sưu tập số Đây không chỉ đơn thuần là việc sử dụng các trang thiết bị để tạo lập dữ liệu và lưu trữ mà mục đích là để có thể chia sẻ, phục vụ trong mạng nội bộ hoặc trực tuyến
Để đạt hiệu quả công việc cao, cán bộ tham gia số hoá tài liệu phải thực hiện quy trình số hóa một cách chặt chẽ, phù hợp với điều kiện cụ thể của thư viện Quy trình số hoá tài liệu thư viện gồm các bước cơ bản sau:
+ Đặt ra nhiều câu hỏi (về tài chính, nhân lực, thiết bị, mục tiêu,…) + Lựa chọn tài liệu
+ Thiết bị cho số hoá tài liệu
+ Quét ảnh
+ Nhận dạng quang học (Mã hoá văn bản)
+ Tạo siêu dữ liệu
+ Kiểm soát chất lượng
+ Đưa dữ liệu số lên mạng để phục vụ
+ Cách thức phục vụ và chính sách truy cập [16]
- Quản lý
Quản lý là một hoạt động thiết yếu nhằm thiết kế và duy trì môi trường làm việc bên trong và bên ngoài của tổ chức Đối với công tác số hóa tài liệu, quản lý bao gồm các nội dung như sau:
+ Quản lý nguồn nhân lực
Trang 19+ Quản lý máy móc, trang thiết bị
+ Quản lý nguồn tài nguyên thông tin được tạo lập
+ Xây dựng chính sách phù hợp, trong đó đáng chú ý là sự quan tâm thích đáng đến các yếu tố liên quan trực tiếp đến quá trình số hóa tài liệu như: Xác định mục tiêu số hóa, có kế hoạch chi tiết để thực hiện một cách khoa học, đảm bảo nguồn kinh phí hợp lý và giải quyết vấn đề bản quyền đối với các tài liệu được số hóa
1.1.4 Các tiêu chí cơ bản đối với số hóa tài liệu
Để số hóa nguồn tài liệu của mình, các thư viện không những phải xây dựng được kế hoạch hoạt động mà quan trọng là phải đặt ra các tiêu chí cơ bản để đảm bảo các định hướng, quy trình hoạt động luôn đi đúng mục đích yêu cầu Một số tiêu chí liên quan đến số hóa tài liệu cụ thể như sau:
+ Chuẩn kỹ thuật áp dụng cho việc truy cập, chuyển tải, lưu trữ, truy hồi, trao đổi, trình bày và phổ biến thông tin có chọn lọc:
TCP/IP: TCP (Tiếng Anh: Transmission Control Protocol - Giao thức điều khiển giao vận) và IP (Tiếng Anh: Internet Protocol - Giao thức liên
mạng), thường được kết hợp là TCP/IP (bộ giao thức liên mạng), là một bộ các giao thức truyền thông cài đặt chồng giao thức mà Internet và hầu hết các
Trang 20mạng máy tính thương mại đang chạy trên đó TCP phân chia và tích hợp các gói thông tin, IP đảm bảo các gói thông tin được đến đúng địa chỉ Phần mềm phải được hỗ trợ các giao thức TCP/IP để đảm bảo khả năng kết nối mạng toàn cầu và triển khai các dịch vụ liên quan đến chia sẻ và khai thác nguồn tin điện tử
Giao thức khách/chủ (Tiếng Anh: Client/Server): Ý tưởng của
mô hình này là máy con (đóng vài trò là máy khách) gửi một yêu cầu (request) để máy chủ (đóng vai trò người cung ứng dịch vụ), máy chủ sẽ xử lý
và trả kết quả về cho máy khách Như vậy, giữa các thư viện, nó cho phép trao đổi dữ liệu giữa các thư viện qua mạng Internet
HTTP (HyperText Transfer Protocol): là giao thức truyền thông thông tin trên web
HTML (HyperText Markup Language): là ngôn ngữ đánh dấu siêu văn bản được dùng để tạo lập văn bản trên web
Trang 21Dublin Core: Chuẩn biên mục, bao gồm 15 thành phần, chủ yếu dùng cho biên mục tài liệu điện tử
Hỗ trợ đa ngôn ngữ, trong đó có tiếng Việt trong giao diện và sử dụng, sử dụng bảng mã Unicode [25, tr19]
1.2 KHÁI QUÁT VỀ VIỆN THÔNG TIN KHOA HỌC XÃ HỘI 1.2.1 Chức năng, nhiệm vụ
Viện TTKHXH trực thuộc Ủy ban KHXH Việt Nam (nay là Viện Hàn lâm KHXH Việt Nam) được thành lập theo Quyết định số 93/CP ngày 08/5/1975 của Hội đồng Chính phủ, trên cơ sở thống nhất hai tổ chức có sẵn
là Thư viện KHXH và Ban TTKHXH, được khẳng định lại tại Nghị định số 23/CP ngày 22/5/1993 của Chính phủ
Viện có tên giao dịch quốc tế là Institute of Social Science Information
- Viện TTKHXH có các chức năng sau:
Thông tin khoa học cho các cấp lãnh đạo Đảng và Nhà nước, các cơ quan hoạch định chính sách, các tổ chức nghiên cứu và đào tạo, các doanh nghiệp về những vấn đề cơ bản và xu hướng phát triển của thế giới, khu vực
và Việt Nam, về KHXH thế giới và Việt Nam
Bảo tồn, khai thác và phát huy di sản truyền thống Thư viện KHXH Xây dựng và phát triển Thư viện là Thư viện Quốc gia về KHXH
Trang 22Chủ trì, điều phối và hỗ trợ các hoạt động nghiệp vụ thuộc lĩnh vực thông tin và thư viện trong toàn Viện KHXH Việt Nam
Đào tạo, xây dựng và phát triển nguồn nhân lực thông tin và thư viện KHXH
- Viện TTKHXH có những nhiệm vụ chính sau:
Trình Chủ tịch Viện KHXH Việt Nam phê duyệt Chiến lược, Quy hoạch và Kế hoạch 5 năm và hàng năm; tổ chức thực hiện Chiến lược, Quy hoạch và Kế hoạch đó khi được phê duyệt
Tổ chức nghiên cứu những vấn đề lý luận và thực tiễn về thông tin - thư viện KHXH
Dịch, biên soạn, xuất bản và cung cấp các sản phẩm TTKHXH (sách, tạp chí, chuyên đề, bản tin, tài liệu phục vụ lãnh đạo, tài liệu lý luận và nghiệp
vụ về thông tin - thư viện ); Xây dựng báo cáo thông tin thường niên về KHXH Việt Nam (Annual Report Vietnam Social Sciences)
Tổ chức phát triển nguồn TTKHXH Xây dựng Ngân hàng dữ liệu về thông tin cơ bản của KHXH Việt Nam Cập nhật sách, báo, tạp chí, phần mềm ứng dụng, các dạng thông tin số, ảnh, băng, đĩa các loại… Bảo quản, phục chế, số hoá, vi phim hoá sách, báo, tư liệu của Thư viện KHXH
Ứng dụng thành tựu công nghệ thông tin trong hoạt động thông tin - thư viện Tư vấn và hướng dẫn nghiệp vụ, điều phối hoạt động tin học hoá thư viện trong toàn Viện KHXH Việt Nam
Chủ trì, tổ chức các lớp đào tạo, bồi dưỡng, nâng cao trình độ nghiệp
vụ cho cán bộ Thông tin và Thư viện trong Viện KHXH Việt Nam Tham gia đào tạo sau đại học trong lĩnh vực Khoa học luận, các khoa học Thông tin - Thư viện
Hợp tác quốc tế về TTKHXH Phối hợp hoạt động thông tin và trao đổi
ấn phẩm với các thư viện trong và ngoài nước theo quy định của Pháp luật
Trang 23Quản lý đội ngũ công chức, viên chức của Viện TTKHXH; quản lý tài chính, tài sản của Viện TTKHXH theo quy định, chế độ của Nhà nước và của Viện KHXH Việt Nam
Thực hiện các nhiệm vụ khác theo sự phân công của Chủ tịch Viện KHXH Việt Nam
- Hợp tác quốc tế:
Cùng với quá trình đổi mới, mở rộng hợp tác và đa phương hóa các quan hệ quốc tế, trong những năm gần đây, Viện TTKHXH có quan hệ hợp tác và trao đổi tư liệu với hơn 80 cơ quan, công ty, tổ chức và thư viện của hơn 30 nước trên thế giới Việc trao đổi sách báo, tư liệu, nghiệp vụ và cán bộ vẫn được triển khai có hiệu quả
Viện TTKHXH hiện là hội viên của Liên đoàn Quốc tế các hiệp hội và
tổ chức thư viện (International Federation of Library Association and Institutions: IFLA), với mã số thành viên VN-1002; thành viên của Mạng TTKHXH Châu Á -Thái Bình Dương (APINESS)
1.2.2 Nhân sự, vốn tài liệu và trang thiết bị
*Về tổ chức nhân sự:
Ban lãnh đạo Viện TTKHXH gồm: Viện trưởng phụ trách chung, Tổng biên tập tạp chí TTKHXH; một phó Viện trưởng phụ trách khối thư viện, một phó Viện trưởng phụ trách khối thông tin
Viện TTKHXH được phân chia thành hai khối:
Khối TTKHXH bao gồm các phòng chức năng:
1 Phòng Thông tin Kinh tế
2 Phòng Thông tin Nhà nước và Pháp luật
3 Phòng Thông tin Chính trị và những vấn đề chiến lược phát triển
4 Phòng Thông tin Ngữ văn
5 Phòng Thông tin Lịch sử, Dân tộc và Tôn giáo
Trang 246 Phòng Thông tin Văn hóa và Phát triển
7 Phòng Thông tin Xã hội và Con người
8 Phòng Thông tin Toàn cầu và khu vực
Khối Thư viện KHXH bao gồm các phòng chức năng:
1 Phòng Nghiệp vụ thư viện
2 Phòng Bổ sung - Trao đổi
3 Phòng Phân loại - Biên mục
*Về vốn tài liệu:
Tài liệu truyền thống:
Tài liệu KHXH và nhân văn hiện có tại Thư viện của Viện được kế thừa và phát triển từ nguồn tài liệu của Thư viện Khoa học Trung ương, trong
đó có vốn tài liệu khoa học quý hiếm do Viện Viễn Đông Bác cổ Pháp bàn
Trang 25giao lại (1957), bao gồm sách Hán Nôm, Latin cổ, Trung Quốc cổ, Nhật Bản
cổ, bản đồ và tranh cổ, phim, ảnh về lịch sử - xã hội - văn hoá khu vực Đông Dương, Trung Quốc, Nhật Bản đồng thời được liên tục bổ sung hàng năm
STT Loại hình tài liệu Số bản Đơn vị
tính
Tỷ lệ % (Theo số bản)
Trang 26STT Loại hình tài liệu Số bản Đơn vị
tính
Tỷ lệ % (Theo số bản)
Trang 27STT Loại hình Loại tài liệu Số lượng Đơn vị tính
1 CSDL thư
mục
Sách Viện TTKHXH 132.551 Biểu ghi
14 Văn bản pháp luật Việt
Trang 28Viện TTKHXH hiện nay có hệ thống cơ sở hạ tầng khá vững chãi tại số
1 Liễu Giai với hệ thống phòng nghiệp vụ, kho tàng và hai phòng đọc tự chọn, các phòng thoáng mát, sạch sẽ, tạo điều kiện môi trường thuận lợi cho công tác chung, bảo quản cũng như khai thác tài liệu tại thư viện
Viện TTKHXH cũng đã trang bị một hạ tầng công nghệ thông tin tương đối hiện đại với 3 máy chủ và 120 máy tính nối mạng Internet, 20 máy in, 1 máy Scanrobot 2.0 MDS, 5 máy scanner, hệ thống mạng Internet và Wifi
Ngoài ra, để đáp ứng nhu cầu sao chụp tài liệu, công tác tập huấn, đào tạo, Viện TTKHXH có trang bị các loại máy in, máy photocopy, máy chiếu…
1.2.3 Đặc điểm người dùng tin và nhu cầu tin
*Các nhóm người dùng tin:
Viện TTKHXH có chức năng và nhiệm vụ nghiên cứu, thông báo, cung cấp tin tức và tư liệu về KHXH cho các cơ quan Đảng, Nhà nước và các tổ chức quần chúng có trách nhiệm với công tác KHXH và là cơ quan khoa học phụ trách công tác thư viện, tư liệu và thông tin Vì vậy, Viện TTKHXH đã tiếp nhận những thành tựu từ sự nghiệp đổi mới đất nước, xây dựng vốn tài liệu KHXH và nhân văn phong phú, có chất lượng khoa học cao Với đặc thù
là thư viện chuyên ngành về KHXH nên đối tượng NDT của Viện TTKHXH chủ yếu về lĩnh vực KHXH Có thể chia NDT của Viện TTKHXH thành 3 nhóm chính sau:
- Nhóm NDT là cán bộ làm công tác quản lý: Đây là nhóm NDT có số lượng ít, có nhiệm vụ xây dựng, hoạch định đường lối, chính sách, chủ trương của Đảng và Nhà nước Nhóm NDT này có quỹ thời gian rất ít, thời gian cho
họ đến thư viện tham khảo tài liệu không nhiều Nhóm NDT này cần thông tin mang tính chính xác, cô đọng và kịp thời Sản phẩm thông tin chủ yếu cho nhóm NDT này là các tài liệu dịch, tổng thuật, lược thuật, bản tin phục vụ lãnh đạo
Trang 29số thẻ)
Cán bộ quản lý
Cán bộ nghiên cứu, giảng dạy
Sinh viên, học viên cao học
Số thẻ Tỷ lệ%
Số thẻ Tỷ lệ%
Số thẻ Tỷ lệ%
Trang 30- Nhóm NDT là sinh viên, học viên cao học: Đây là nhóm NDT chiếm số lượng tương đối lớn trong thư viện và có nhiều thời gian đến thư viện để đọc tài liệu Nhóm NDT này cũng cần thông tin đa dạng, cả thông tin chung về văn hóa, khoa học, xã hội và đặc biệt là thông tin thuộc chuyên ngành học tập của họ, tuy nhiên thông tin họ cần nhiều khi chưa thật sự chuyên sâu do cần
có thời gian nghiên cứu và tích lũy kiến thức
Hình 1.1: Cơ cấu thành phần NDT năm 2012
Trang 31+ Phòng đọc mở sách: Kết hợp kho mở sách mới nhập về thư viện, sách tra cứu và đọc tài liệu mượn trong kho sách đóng
+ Phòng đọc mở báo - tạp chí: Kết hợp kho mở báo tạp chí và phục vụ báo, tạo chí tại kho đóng khi NDT có nhu cầu
- Cung cấp dịch vụ tra cứu thư mục qua mạng LAN thông qua phần mềm tích hợp quản trị thư viện CDS/ISIS
- Cung cấp dịch vụ sao chụp, in ấn tài liệu khi NDT có nhu cầu sử dụng dịch vụ này
- Cung cấp các sản phẩm thư viện: Biên soạn và cung cấp thư mục thông báo sách mới định kỳ hàng tháng đến NDT
- Mở lớp hướng dẫn sử dụng thư viện cho NDT, giúp NDT nắm được
kỹ năng tìm tin cơ bản trong thư viện
1.3 VAI TRÒ VÀ YÊU CẦU SỐ HÓA TÀI LIỆU TẠI VIỆN THÔNG TIN KHOA HỌC XÃ HỘI
1.3.1 Vai trò của số hóa tài liệu đối với Viện Thông tin khoa học xã hội
Số hóa tài liệu nghĩa là tạo ra tài liệu số, là cơ sở cho việc xây dựng các
bộ sưu tập số, từ đó đưa thư viện từng bước phát triển và hoàn thiện nhằm tiến tới xây dựng TVS Số hóa tài liệu có vai trò quan trọng với các thư viện nói chung và thư viện Viện TTKHXH nói riêng
- Đối với công tác quản lý tài liệu
Số hóa tài liệu là việc chuyển các dạng tài liệu truyền thống sang dạng điện tử Mật độ thông tin của tài liệu số hóa rất lớn do việc ứng dụng thành tựu của sự phát triển công nghệ thông tin, đặc biệt là công nghệ nén và lưu trữ, do đó, việc số hóa tài liệu sẽ làm giảm đáng kể diện tích kho lưu trữ trong thư viện Tài liệu số hóa sẽ được lưu giữ trên những thiết bị lưu trữ với dung lượng lớn như các ổ ghi, CD-ROM Đây là các thiết bị được sử dụng để lưu trữ dữ liệu ở nhiều định dạng khác nhau như âm thanh, hình ảnh, video…
Trang 32Việc số hóa tài liệu giúp thư viện bảo quản và duy trì tuổi thọ của tài liệu gốc tốt hơn Tài liệu gốc sau khi được số hóa sẽ chỉ được sử dụng khi có những nghiên cứu đặc biệt, việc phục vụ trên máy tính sẽ giảm tần suất sử dụng trực tiếp, từ đó giảm nguy cơ hư hỏng, cắt xén, hủy hoại cho tài liệu
Việc số hóa tài liệu cùng với chính sách sao lưu dữ liệu hợp lý giúp thư viện bảo quản, lưu trữ lâu dài các thông tin trong tài liệu truyền thống, hạn chế được rủi ro do những nguyên nhân khách quan như thời gian, thời tiết nóng ẩm của nước ta
Tài nguyên thông tin của các thư viện hiện nay khá phong phú về chủng loại, môn loại và chuyên ngành, bao gồm các kho tài nguyên là các tài liệu, sách, tạp chí, luận văn… dưới dạng tài liệu in, cùng rất nhiều tài liệu đã
và đang được số hóa, được lưu giữ trên các vật mang tin điện tử (dưới dạng tài liệu điện tử) Việc số hóa tài liệu làm giảm sức người và kinh phí so với việc quản lý nguồn tài liệu truyền thống do được lưu trữ, tìm kiếm và truy xuất dựa trên máy tính điện tử Khả năng kiểm soát tài nguyên thông tin dưới dạng tài liệu điện tử rất lớn, có thể kiểm soát ở nhiều cấp độ khác nhau Việc quản lý tài nguyên này không chỉ đơn thuần là việc thu hẹp diện tích kho lưu trữ mà còn giúp phân quyền và theo dõi quá trình sử dụng của NDT
- Đối với việc xây dựng thư viện số
Để tiến hành xây dựng TVS, cơ quan thông tin - thư viện cần quan tâm nhiều vấn đề, trong đó nổi bật là bốn khía cạnh chủ yếu:
+ Cấu trúc của TVS
+ Hạ tầng cơ sở kỹ thuật
+ Kho tư liệu số hoá
+ Các vấn đề bảo quản, khai thác và bản quyền
Kho tư liệu số hoá của bản thân cơ quan thông tin - thư viện chủ quản
là phần quan trọng nhất trong TVS, như vậy có thể coi hạt nhân của TVS là
Trang 33nguồn tài liệu số hóa Có thể coi TVS là một kho tài liệu số hóa khổng lồ được cấu trúc sao cho dễ dàng truy cập, ở đây diễn ra hoạt động thu thập, xử
lý, lưu trữ và phổ biến các tài liệu dưới dạng số hóa thông qua các phương tiện thông tin và truyền thông Nguồn tài liệu số hóa này có thể được tạo lập thông qua các cách khác nhau như:
+ Tự tiến hành số hóa nguồn tư liệu trên giấy của thư viện Tức là chuyển tài liệu hiện có sang dạng số bằng phương pháp quét hay nhập lại thông tin từ bàn phím…
+ Bổ sung/ tích hợp nguồn tin điện tử thông qua việc mua, trao đổi tài liệu điện tử đang được xuất bản (bản tin, tạp chí điện tử, các chế bản điện tử trước khi in ra giấy)
+ Xây dựng các liên kết (tạo khả năng truy cập) đến các nguồn tài liệu trên Internet, nhất là các nguồn của các cơ quan có cùng diện chuyên đề bao quát [1]
Tạo lập và phát triển kho tài liệu số của riêng mỗi cơ quan thông tin - thư viện là vấn đề lớn nhất trong xây dựng TVS Để có thể tạo lập và phát triển kho tài liệu số của thư viện mình, các thư viện không thể trông chờ vào việc bổ sung nguồn tin điện tử hoặc liên kết với các thư viện khác Phương án tốt nhất cho thư viện lúc này là chủ động số hoá nguồn tài liệu truyền thống của mình Số hoá tài liệu vừa là việc làm chủ động vừa đảm bảo được diện đề tài bao quát của thư viện, hơn nữa đây còn là việc làm nhằm phát huy thế mạnh của nguồn tài liệu sẵn có trong thư viện, vì vậy việc tạo lập và phát triển nguồn tài liệu này phải được diễn ra thường xuyên dựa trên kế hoạch thực hiện chi tiết và khoa học Các cơ quan thông tin - thư viện nhất thiết phải lập
kế hoạch và ưu tiên đầu tư cho việc thu thập, xử lý và số hoá nguồn tin cơ bản, nguồn tin tiềm năng của riêng mình, coi đây là nhiệm vụ trọng tâm, thậm chí phải triển khai mạnh trước khi bắt tay vào xây dựng TVS
Trang 34Nếu không có sự chuẩn bị trước, khi cơ quan thông tin - thư viện xây dựng xong hạ tầng mạng và có các phần mềm hệ thống, phần mềm TVS đầy
đủ nhưng đến lúc đó cơ quan vẫn không có hoặc có rất ít tài liệu số hoá của thư viện mình chắc chắn TVS đó không thể phát huy được hiệu quả
- Đối với việc chia sẻ tài nguyên thông tin
Ngày nay, việc chia sẻ tài nguyên thông tin, đặc biệt là nguồn tài liệu số hóa toàn văn ngày càng được mở rộng cả trên phạm vi quốc gia và thế giới Nhờ giao lưu, chia sẻ thông tin đã làm gia tăng lợi ích cho NDT và tạo thêm giá trị cho nguồn tài nguyên thông tin của các thư viện, tần suất, phạm vi sử dụng thông tin cũng ngày càng tăng
Tài liệu số được lưu giữ theo phần mềm phù hợp, theo chuẩn nhất định,
do đó việc tìm kiếm, truy xuất thông tin chính xác và nhanh chóng, dễ dàng Thông tin có thể được tìm kiếm theo nhiều dấu hiệu khác nhau hoặc tổ hợp dấu hiệu, có thể tìm kiếm và truy xuất ở bất cứ đâu, bất cứ thời gian nào
Bernard Shaw đã nói đến giá trị của việc chia sẻ thông tin: “Nếu mỗi người có một quả táo mà trao đổi với nhau thì kết cục mỗi người vẫn chỉ có một quả táo Nhưng nếu mỗi người có một ý tưởng và trao đổi với nhau thì kết quả mỗi người sẽ có hai ý tưởng” Như vậy có thể nói, chia sẻ tài nguyên thông tin trong thư viện là việc làm cần thiết Để có thể tiến hành chia sẻ tài nguyên thông tin này thì không thể thiếu việc số hóa tài liệu Việc liên kết, chia sẻ tài nguyên thông tin trong hệ thống giữa các nhóm người dùng tin và các hệ thống thông tin nhằm tránh sự lãng phí do tổ chức thiếu khoa học hoặc
do trùng lặp Đối với các thư viện, việc liên kết, chia sẻ tài nguyên thông tin giúp mỗi thư viện tăng nguồn tài nguyên thông tin của mình, đồng thời giảm được chi phí, công sức cho việc số hóa các tài liệu
Để việc chia sẻ nguồn tài nguyên thông tin giữa các thư viện đạt hiệu quả cao cần có sự phối hợp, phân công trong việc số hóa tài liệu, có thể do
Trang 35một cơ quan chức năng đứng ra phối hợp tổ chức và phân quyền cho các thư viện thực hiện số hóa nguồn tài nguyên của mình sao cho hợp lý Theo đó, các thư viện có thể tiến hành số hóa các tài liệu chuyên môn thuộc thế mạnh nguồn tài nguyên của thư viện mình, từ đó bao quát hết các lĩnh vực và tạo điều kiện thuận lợi cho các thư viện trao đổi tài nguyên thông tin
- Đối với việc phục vụ người dùng tin
Với sự phát triển của hạ tầng công nghệ, NDT sẽ dễ dàng truy cập, khai thác thông tin Tài liệu số có thể được truy cập theo nhiều dấu hiệu khác nhau như tác giả, nhan đề, từ khóa… Thông tin được cập nhật thường xuyên, được lưu giữ theo nhiều định dạng khác nhau như văn bản, âm thanh, hình ảnh…
đã làm cho thông tin trở nên sinh động và hấp dẫn hơn
Đối với nhóm NDT là cán bộ làm công tác quản lý, quỹ thời gian rất ít,
do đó việc đến thư viện để tham khảo tài liệu là điều rất khó khăn Thông tin ngày càng đa dạng, phong phú và gia tăng nhanh chóng, việc sử dụng tài liệu
ở dạng truyền thống là chưa đủ, họ cần những thông tin nhanh, đa chiều về các lĩnh vực mình quan tâm
Không chỉ đối với NDT là cán bộ làm công tác quản lý, các nhóm NDT khác cũng có nhu cầu đa dạng ở các lĩnh vực họ quan tâm, đặc biệt là thông tin ở dạng đa phương tiện như hình ảnh, âm thanh, video Điều đặc biệt của tài liệu số hóa là có thể đáp ứng được nhu cầu này của người sử dụng mà tài liệu ở dạng truyền thống không đáp ứng được
Tài liệu số có khả năng truy cập từ xa thông qua thiết bị và mạng viễn thông vì vậy nó không bị giới hạn bởi không gian và thời gian Tài liệu số có tính linh hoạt cao nên cho phép nhiều người cùng truy cập trong cùng một thời gian, tạo khả năng tiếp cận tri thức bình đẳng giữa các đối tượng NDT khác nhau
Trang 36Do đặc trưng của mình, tài liệu số hóa tạo ra một kênh thông tin phản hồi đa chiều, giúp NDT có thể liên hệ trực tiếp với tác giả hoặc người tổ chức nguồn tài nguyên thông tin, hỗ trợ NDT tham gia vào các diễn đàn học thuật Như vậy, mỗi tài liệu số hóa có thể ẩn chứa trong nó những nguồn tài nguyên thông tin tiềm năng khác, tạo không gian hữu ích cho NDT tìm kiếm, chia sẻ thông tin
1.3.2 Yêu cầu số hóa tài liệu tại Viện Thông tin khoa học xã hội NDT là thành phần quan trọng trong mọi cơ quan thông tin - thư viện Nghiên cứu NDT từ đó xác định NCT trong thư viện là việc làm cần thiết Qua việc thống kê số lượng NDT và phiếu điều tra NCT tại Viện TTKHXH
cho thấy (xem Phụ lục 2):
- NDT tại Viện TTKHXH đã và đang có nhu cầu sử dụng tài liệu số Qua kết quả tổng hợp phiếu khảo sát NCT, có tới 31,2% số người được hỏi khẳng định rất cần tài liệu số, 52,2% số người được hỏi khẳng định sự cần thiết của tài liệu số Trong số NDT có nhu cầu sử dụng tài liệu số đó, nhóm NDT là cán bộ nghiên cứu có số lượng lớn đồng thời cũng có nhu cầu sử dụng tài liệu số cao nhất, sau đó là nhóm NDT là sinh viên, học viên cao học
và nghiên cứu sinh
- Tài liệu số tại Viện TTKHXH hiện nay chưa đáp ứng nhu cầu sử dụng của NDT Có tới 42% số người được hỏi đánh giá mức độ đáp ứng tài liệu số của thư viện là không đầy đủ về nội dung và 50% đánh giá không đầy
Trang 37trung nhiều nhất vào nhóm NDT là cán bộ nghiên cứu Khả năng này ở đa số NDT chỉ ở mức trung bình, chiếm 73,9%, trong đó nhiều nhất vẫn là nhóm NDT là cán bộ nghiên cứu, tiếp theo là nhóm NDT là sinh viên, học viên cao học và nghiên cứu sinh
- NDT có nhu cầu sử dụng tài liệu số với nhiều ngôn ngữ khác nhau nhưng tài liệu bằng tiếng Việt vẫn được ưu tiên sử dụng
- Từ NCT của các nhóm người dùng tin, đa số ý kiến của người được hỏi cho rằng cần lựa chọn nhiều giải pháp để phát triển tài liệu số tại Viện TTKHXH, trong đó có vấn đề đầu tư kinh phí mua tài liệu số và số hoá tài liệu (81,9%)
Xuất phát từ đặc điểm NCT theo nghề nghiệp, trình độ chuyên môn của các nhóm NDT tại Viện TTKHXH và từ số liệu khảo sát thực tế trên cho thấy,
số hóa tài liệu đang là yêu cầu, đòi hỏi cấp thiết của NDT tại Viện TTKHXH Yêu cầu đó đòi hỏi Viện TTKHXH phải có kế hoạch, chính sách phù hợp nhằm số hóa nguồn tài liệu truyền thống của mình, tiến hành phục vụ nguồn tài nguyên số hóa đã tạo lập được để đáp ứng tốt NCT
Trang 38CHƯƠNG 2 THỰC TRẠNG SỐ HOÁ TÀI LIỆU TẠI VIỆN THÔNG TIN KHOA HỌC XÃ HỘI
2.1 TỔ CHỨC QUY TRÌNH SỐ HOÁ TÀI LIỆU TẠI VIỆN THÔNG TIN KHOA HỌC XÃ HỘI
Để tổ chức số hóa tài liệu một cách hợp lý, hiện tại Viện TTKHXH đang tiến hành thử nghiệm quy trình số hoá tài liệu So với quy trình số hoá
tài liệu cơ bản mà tác giả luận văn tham khảo được (xem mục 1.1.3) thì quy
trình số hoá tài liệu của Viện TTKHXH cũng tương đối giống nhau Tuy nhiên, trong quá trình thực hiện có một số khác biệt như :
+ Tài chính, nhân lực cũng như lựa chọn tài liệu, lập kế hoạch số hoá tài liệu được lãnh đạo Viện TTKHXH xem xét, quyết định theo từng đề tài,
dự án thư viện nhất định
+ Quy trình số hoá tài liệu được Viện TTKHXH cụ thể hóa thành 4 công đoạn: Tạo lập dữ liệu, xử lý dữ liệu, mô tả dữ liệu và quản lý dữ liệu; công đoạn kiểm soát chất lượng sẽ được tiến hành song song với các công đoạn trên
+ Một số công đoạn được ưu tiên thực hiện hoặc thực hiện một phần như ưu tiên quét ảnh hơn việc nhận dạng ký tự quang học cho dữ liệu được tạo lập
+ Một số công đoạn như: phục vụ NDT qua mạng Internet hoặc xây dựng chính sách truy cập cụ thể Viện TTKHXH chưa thực hiện được hoặc thực hiện với hiệu quả chưa cao
Như vậy, việc thực hiện quy trình số hoá tài liệu thử nghiệm tại Viện TTKHXH được giao cho 3 nhóm Mỗi nhóm gồm 6 người kết hợp với 2 phòng: phòng Cơ sở dữ liệu và phòng Tin học hóa Công việc được phân chia
cụ thể như sau:
Trang 39+ Công đoạn tạo lập dữ liệu và xử lý dữ liệu: được thực hiện ở tất cả 3 nhóm Trong đó, Nhóm 1 và Nhóm 2 thực hiện tất cả các bước trong hai công đoạn này, Nhóm còn lại (Nhóm 3) phân công cán bộ chuyên thực hiện công đoạn tạo lập dữ liệu hoặc công đoạn xử lý dữ liệu
+ Công đoạn mô tả dữ liệu: Được giao cho cán bộ thuộc phòng Cơ sở
dữ liệu, đồng thời là thành viên của nhóm số hoá
+ Công đoạn quản lý dữ liệu: Được giao đồng thời cho phòng Cơ sở dữ liệu và phòng Tin học hoá quản lý Phòng Cơ sở dữ liệu chịu trách nhiệm quản lý thư mục và phòng Tin học hoá chịu trách nhiệm về máy chủ của cơ quan vừa quản lý thư mục vừa tiến hành tích hợp dữ liệu vào phần mềm thư viện để đưa ra phục vụ NDT
2.1.1 Lựa chọn tài liệu số hóa và vấn đề bản quyền
*Lựa chọn tài liệu số hóa
Có lẽ không có thư viện nào có đủ khả năng để số hóa toàn bộ kho tài liệu của mình, vì vậy việc lựa chọn tài liệu để tiến hành số hóa là việc làm vô cùng cần thiết
Tại Viện TTKHXH, việc lựa chọn tài liệu số hóa dựa trên sự kết hợp của một số yếu tố, theo đó, Viện TTKHXH ưu tiên số hóa ở giai đoạn đầu một số loại tài liệu như sau:
+ Tài liệu quý hiếm (loại tài liệu số hoá 1)
+ Tài liệu đã tồn tại trong thời gian dài như các bưu ảnh, bản đồ cổ có giá
trị và đang có nguy cơ bị hư hỏng cần được bảo tồn (loại tài liệu số hoá 2)
+ Tài liệu phục vụ mục đích nghiên cứu khoa học của các nhà nghiên cứu như các công trình nghiên cứu chuyên sâu về chính trị, văn hóa và khoa học, phù hợp với chức năng, nhiệm vụ của thư viện về khoa học xã hội và
nhân văn (loại tài liệu số hoá 3)
Để lựa chọn các loại tài liệu trên trong công tác số hoá giai đoạn đầu của mình, Viện TTKHXH đã tiến hành lựa chọn theo một số tiêu chí sau:
Trang 40- Đối với loại tài liệu số hoá 1, Viện TTKHXH đã lựa chọn theo loại tài liệu, bao gồm các loại tài liệu đặc biệt như các tài liệu chép tay, tài liệu in bằng phương pháp khắc bản, các tài liệu in đầu tiên, tài liệu độc bản, tài liệu địa chí, tài liệu không thể tiếp cận với tài liệu gốc như các bản thảo, bản viết tay… như các tài liệu là Hương ước, Hương ước Nôm, Thần sắc Hán - Nôm Những tài liệu này được đóng quyển bằng chỉ, số lượng trang ít, bìa cứng Chất liệu giấy đa dạng: giấy dó dai và mỏng, giấy cũ giòn Một số tài liệu được đánh máy chữ, còn lại đa số là tài liệu viết tay Các tài liệu này qua thời gian chữ đã bị mờ nhòe, giấy nhăn, rách nát, cong vênh… Do đây là tài liệu viết tay theo kiểu tờ rời nên khi đóng quyển lề trang rất nhỏ, thậm chí sát vào chữ
Các loại tài liệu đặc biệt này tại Viện TTKHXH hiện nay chiếm số lượng tương đối lớn Giá trị nội dung của tài liệu được đánh giá cao, phù hợp với nhu cầu sử dụng của NDT tại thư viện
- Đối với loại tài liệu số hoá 2, Viện TTKHXH tiến hành lựa chọn
theo điều kiện bảo quản hiện tại Hiện nay loại tài liệu này được khai thác chưa nhiều, thư viện tiến hành số hóa thư mục và số hoá toàn văn một phần cho một số kho tài liệu như tài liệu làm bằng chất liệu khó bảo quản, tài liệu đang hư hỏng, mối mọt, tài liệu in trên giấy giòn, bưu ảnh, bản đồ… nhằm mục đích sử dụng và bảo tồn tài liệu gốc Đây cũng là một trong những tiêu chí hàng đầu được xem xét khi lựa chọn tài liệu để số hóa Các tài liệu này bao gồm:
+ Tài liệu Trung Quốc cổ, Nhật Bản cổ, tài liệu Hán - Nôm: Đây là những tài liệu chiếm phần lớn trong dự án số hóa từ năm 2009 đến nay của Viện Bao gồm các tài liệu được đóng quyển, khổ sách, chất lượng giấy không đồng đều: bong gáy, rách nát, giấy in cũ, giòn hoặc giấy dó Những tài liệu này thường là tài liệu chữ Hán, Nôm, Nhật Bản cổ được viết tay, in hoặc in bằng phương pháp khắc bản Riêng đối với một số tài liệu Hán - Nôm, giấy