‘Thu vién Quốc gia Việt Nam là Thư viện trung tâm của cả nước, lả thư viện đứng đầu trong hệ thống thư viện công cộng, đi đầu trong công tác tự dông hoá và ứng dụng những thành tựu cúa
Trang 1
PITAN MO DAT
1 Tính cấp thiết của đề tài
Ngày nay, nhân loại đang bước sang một kỷ nguyên mới kỷ nguyên của nên kinh tế thông tin và trí thức Cuộc cách mạng khoa học công nghệ đã
tác động mạnh mẽ tới mọi hoạt động của dời sống xã hôi trong đó có hoạt
động Thông tín Thư viện Đặc biệt, các thư viện trên thế giới đang có xu
hướng tự động hỏa nghiệp vụ hoặc chuyển sang các loại hình thư viên diện
tử, thư viên số nhằm đản ứng kịp thời nhu cầu tri thức và thông tin không
ngừng gia tăng nhanh chóng trong xã hội Giờ đây các tai liệu trong thư viện
không chỉ đơn thuẪn là các tải liệu truyền thống như sách báo, tạp chí ma còn
bao gồm các loại tài liệu dạng số như: Cơ sở đữ liệu (CSDL) trén mang, dia
CD, DVD Chinh vì vậy mà công tác số hóa tải liệu và tổ chức khai thác
nguẫn tải liêu số được các thư viên đặc biệt quan tâm và coi đây là vấn để
quan trong quyết định chất lượng và hiệu quả cung cấp thông tin tới người
dùng tin
‘Thu vién Quốc gia Việt Nam là Thư viện trung tâm của cả nước, lả thư viện đứng đầu trong hệ thống thư viện công cộng, đi đầu trong công tác
tự dông hoá và ứng dụng những thành tựu cúa công nghệ thông tin vào hoạt
động của mình, ngoài việc hoản thiện cơ sở vật chất, trang thiết bị, tăng
cường đảo tạo đội ngũ cán bộ thì công tá số hóa tài liệu vả tổ chứ khai thác nguồn tải liệu số cũng là một vẫn dé đang dược Thư viện đặc biết quan tâm
nhằm nâng cao khả năng đáp ứng nhu cầu tin ngày cảng tắng cao và đa dạng
Nhận thay dược tầm quan trọng dó tôi đã quyết định chọn để tải: “Số hóa tải liệu vả tổ chức khai thắc nguồn tải liệu số tại Thư viện Quốc gia Việt
Nam” làm đề tài nghiên cứu của khỏa luận nhằm tìm hiểu và bỗ sung những
kiển thức thực tế cho bãn thân vả góp một phần nhỏ bé vào việc tìm ra giải
pháp nhằm nâng cao hiểu quả của công tác số hóa tải liệu và tổ chức khai
thác nguồn tải liệu số Lại Thư viện, phục vụ cho công Lác nghiên gửu, giáo
Trang 2Khéa ledn tot nghi¢p Lê Thị Thủy
duc, dao tạo và các nhu cầu khác của người dùng tin góp phần vào sự nghiệp
Công nghiệp hóa — Hiện đại hóa đất nước
2 Mục đích và nhiệm vụ nghiền cứu của để tài
2.1 Mục dich nghiên cứu
Mục đích nghiên cửu của để tải là khảo sát thực trạng công tác số hóa tải liệu và tổ chức khai thác nguồn tài liệu số tại Thư viện Quốc gia Việt
Nam Qua việc khảo sát để tài sẽ phân tích, đánh giá, đưa ra một số nhận xét
và để xuất giải pháp nhằm nâng cao hiệu quả cho công tác số hóa tài liệu và
tổ chức khai thác nguồn tải liệu số tại Thư viện Quốc pia Việt Nam
2.2 Nhiệm vụ nghiên cứu
Đổ giái quyết được mục dịch để ra, nhiệm vụ của khóa luận là
- Nêu được vị trí và vai trò của nguồn tải liệu số đối với sự phát triển
của Thư viện Quốc gia Việt Nam
- Khảo sát thực trạng công tác số hóa tài liệu và tổ chức khai thác
nguồn tài liệu số tại Thư viện Quốc gia Việt Nam
- Nhận xét, đánh giá và để xuất giải pháp nhằm nâng cao hiệu quả công tác số hóa tải liệu và tố chức khai thác nguồn tài liệu số tại Thư viên Quốc gia Việt Nam
3 Tình hình nghiên cứu theo hướng để lãi
Cho đến nay đã có rất nhiều tác giả quan tâm nghiên cứu và tìm hiểu
về Thư viện Quốc gia Việt Nam với các đề tải như
- “Nghiên cửu hoạt động tra cứu thông tin tại Thư viên Quốc gia Việt
Nam trong thời kỳ Công nghiệp hỏa Hiện đại hóa đất nước” của Nguyễn
Thị Hoài Thu, khóa luận tốt nghiệp năm 2001
- “Công tác bảo quản vốn tải liệu ở Thư viện Quốc gia Việt Nam” của Ngõ Thị Hằng Nga, khỏa luận tốt nghiệp năm 2004
- “Thực trạng và giải pháp nắng cao hiệu quả hoạt động lưu chiểu ở
'thư viện Quốc gia Việt Nam” của Nguyễn Thị Hảo, khóa luận tốt nghiệp
Trang 3
- “Lich sit phan foai tài liệu tại 'Thư viện Quốc gia Việt Nam” của Vũ
Quỳnh Nhung, khóa luận tốt nghiệp năm 2005
- “Gông táu phát triển vốn tải liệu của Thư viện Quốc gia Việt Nam”
của Nguyễn Ihị Lhu Hiền, khóa luận tốt nghiệp năm 2006
- “Tìm hiểu công tác tổ chức và nhục vụ kho mở Lại Thư viện Quốc
gia Việt Nam” của Nguyễn Thị Tháo Hà, khỏa luận tắt nghiệp năm 2008
- “Công tác tổ chức và bảo quản vốn tải liệu quý hiểm tại Thư viện
Quốc gia Việt Nam” của Nghiêm Thị Bình, khóa luận tốt nghiệp năm 2008
Ngoài ra còn nhiều dé tai khác về Thư viện Quốc gìa Việt Nam như: Nguôn nhân lực tại Thư viện Quốc gia Việt Nam, tìm hiểu công tác xây dựng và phát triển vến tải liệu
‘Tuy nhiên, để tài về công tác số hóa tải liệu và tổ chức khai thác
nguồn tải liệu số tại Thư viện Quốc gia Việt Nam thi chưa được nghiên cứu
sâu và hoàn chỉnh Vì vậy, tôi dã quyết dịnh chọn dễ tài này nhằm tìm hiểu
thực trạng công tác số hóa tải liệu và tố chức khai thác nguén tài liệu số của
Thư viện và vận dụng những kiến thức đã học từ nhà trưởng áp dụng vào
một số hoạt động của Thư viện Từ đó, để xuất những giải pháp nhằm nâng
cao hiệu quả công tác số hóa tài liệu và tổ chức khai thác nguồn tải liệu số tại
“Thư viên Quốc gia Việt Nam
4, Dỗi tượng và phạm vi nghiên cứu
- Đi tượng nghiên cứu chính của đề tài được xác định là công tác số hóa tải liệu và tổ chức khai thác nguồn tài liệu số
- Phạm vi nghiên cứu của để tài được giới han về mặt không gian và
thời gian lả: “Công tác số hóa tải liệu và Lễ chức khai thác nguồn tải liệu số tại Thư viện Quốc pia Việt Nam trong piai doan hiện nay”
5 Cơ sử lý luận và phương pháp nghiên cứu
Co sé lp luận:
- Khóa luận được viết trên cơ sở phương pháp luận của chủ nghĩa duy
vật biện chứng và duy vật lịch sử của Triết học Mác Lê nin
KSI Thong tin —
we Viện
Trang 4Khéa ledn tot nghi¢p Lê Thị Thủy
Phương pháp nghiên cửu:
Để hoàn thành để tài tôi đã sử dụng một số phương pháp nghiên cứu
- Phương pháp điều tra khảo sát thực tế
- Phương pháp trao đổi với cán bộ thư viện và phỏng vấn người dùng
in
- Phương pháp thống kê
- Phương pháp thu thập, phân tích, tổng hợp tải hệu liên quan
6 Ý nghĩa khoa học của dễ tài
- Về lý luận: Khóa luận lâm rõ nội hàm các khái niệm liên quan đến
tải liệu số: số hóa tải liệu, thư viện số, tài liệu số, , Tầm quan trọng của công tác số hóa tải liệu và tổ chức khai thác nguồn tài liệu số đổi với thư
viện,
- VỀ thực tiễn: Đưa ra một số nhận xét và dễ xuất giải pháp phù hợp
nhằm nâng cao hiệu quả công tác số hóa tài liệu và tổ chức khai thắc nguồn
lài liệu số tại Thư viện Quốc gia Việt Nam
7 Kết cầu của khóa luận
Ngoài phần mở đầu, kết luận, đanh mục tải liệu tham khảo, danh mục
từ viết tắt, phụ lục thì bố cục chính của khóa luận được chia thánh 3 chương,
Chương 1: Thư viên Quốc gia Việt Nam và những van dé chưng về tải
liệu số
Chương 2: Thực trạng số hóa tải liệu và tổ chức khai thác nguồn tải liệu số tại Thư viện Quốc gia Việt Nam
Chương 3: Miệt số nhận xót và giải pháp nhằm nâng cao hiệu quả cho
công tác số hóa tải liệu va tố chức khai thác nguồn tài liêu số tai Thư viên
Quốc gia Việt Nam
KSI Thong tin —
Trang 5PIIAN NOT DUNG
CHƯƠNG 1 THU VIEN QUOC GIA VIET NAM VA
NHỮNG VĂN ĐÈ CHUNG VỀ TÀI LIỆU SỐ
Khải quát về Thư viện Quốc gia Việt Nam
1.1.1 Quá trình hình thành và phát triển
'tiền thân của Thư viện Quốc gia Việt Nam (VQGVN) là 'Thư viện
Trung ương Dồng Dương trực thuộc Nha lưu trữ và Thư viện Déng Duong,
được thánh lập theo Nghi Dinh cua toan quyền Pháp Anbc Xarô (AlerL
Sarraut) ký ngày 29/11/1917 lrụ sở Nha đặt tại đường Boocnhi l2êboocđơ (Borguis Deborders) Hả Nội, mà trước đỏ là khu vục trường thi tuyển chon
nhân tải thời phong kiến rỗi đến trụ sở Nha Kinh lược Bắc Kỷ, nay là số 31
phế Tràng Thị
Sau gan hai năm chuẩn bị, ngày 01/09/1919 Thư viện chỉnh thức mở
cửa phục vụ bạn đọc
Ngày 28/02/1935, Thư viên Trang ương Đông Dương dỗi tên là Thư
viện Pie Patxkiê (Pierre Pasquier), tên một viên Toàn quyền có nhiều đóng
gop cho Thư viên Cách mang tháng Tám năm 1945 thành cong, Chính phủ
lâm thời Việt Nam Lân chủ Công hỏa quyết dịnh đổi tên Thư viên Pie
Patxkie (Pierre Pasquire) thành Quốc gia Thư viện
Thang 02/1947 Phap chiếm lại Hà Nội Thư viện lại được đổi tên thành
Thư viện Irune ương trực thuộc Phủ cao ủy Pháp tại Sai Gon
Năm 1953, Thư viện Trung ương sát nhập vào Viện Đại học 1Ià Nội
và đổi tên là Tổng Thư viên Hà Nội Giữa năm 1954, trước khi rút chạy khỏi
miễn Bắc, thực dân Pháp đã dưa một phần kho sách của Tổng Thư viện vào Sai Gon
KSI Thong tin — Thu viện
Trang 6Khéa ledn tot nghi¢p Lê Thị Thủy
én thang 10/1954, Chính phủ Việt Nam I3ân chủ Công hỏa tiếp quan
114 Nội, tiếp quản thư viện, trên văn bản mang tên là Thư viện Trưng ương từ
Độ Giáo due sang Độ Tuyên truyền (sau là Bộ Văn hóa)
Ngay 29/06/1957, ‘Ina tướng Chính phủ Việt Nam cho phép đổi tên
Thư viện thành Thư viện Quốc gia Việt Nam
Ngày 28/11/1958, Thư viên chính thức mang lên Thư viên Quốc gia
do Bộ trưởng Bộ Văn hóa quyết định
Năm 1982, TVQGVN được Thư viện Liên hiệp quốc công nhận là
“Thư viện tảng trữ tài liệu T.iên Hiệp Quốc của khu vực Đồng Dương,
Năm 2000, Thư viện Quéc gia chinh thie gia nhap Iliép héi Thu vién
Quốc té IFLA (International Federation of Tibrary Association and
Institution)
Thu vién Quấc gia với bề dày hơn 90 năm xây đựng và phát triển, qua
nhiều giai đoạn lịch sử, từ Thư viện Irung ương đến Thư viện Quốc gia, bao
giờ cũng là Thư viện hàng đầu của nước ta Nó chỉnh là Thư viện Khoa học
“Tổng hợp lớn nhất trong cả nước, là Thư viện đứng đầu trong IIệ thống Thư viên Công công nhả nước, là '[hư viện tiêu biểu cho nên văn hóa của dân tộc,
là trung tâm giao lưu các mối quan hệ giữa các IIệ thống Thư viện trong cả nước và quan hệ quốc Lẻ
1.1.2 Đội ngũ cán bộ Thư viện Quốc gia Việt Nam
Như chủng ta dã biết, cán bộ thư viên là lĩnh hồn của thư viên Trong
hệ thống giao tiếp “ải liệu — 'Ihư viện — Người sử dụng”, cán bộ thư viện là
yếu tế cực kỳ quan trọng, vai trò của họ rất lớn Nhiệm vụ của người cán bộ
rất phức tạp
Trong mỗi quan hệ với tải liệu, cán bộ thư viên là người lựa chọn, xứ
lý, bảo quản sắp xếp chúng theo một trật tự nhất định, giới thiệu chúng với
người sử dựng thư viện
KSI Thong tin —
Trang 7
"trong mối quan hệ với cơ sở vật chất — kỹ thuật, cản bệ thư viện tiền
hành trang bị chuyên biệt cho các diện tích và luôn luôn giữ cho cơ sở vật
chất — kỹ thuật ở tỉnh trạng tốt nhất
'Irong mỗi quan hệ với bạn đọc, cán bộ thư viên là người môi giới
giữa sách và người đọc, là người lỗ chức mỗi quan hệ giữa sách và người
dục, làm trung gian giữa bạn đọc với bạn dọc, họ không chỉ tuyên truyền giới
thiệu một cách tích cực tải liệu mà còn nghiên cửu như cầu đọc, hướng dẫn
đọc phủ hợp với nhu cầu, đồng thời tạo ra các dịch vụ thỏa mãn các nhụ cầu
dé Cán bộ thư viện là người tổ chức, tạo điều kiện tối ưu cho việc phối hợp
thành công mối quan hệ giữa con người với thông tin, làm cho việc khai
thác, sử dụng thông tin có hiệu quá, lắm tăng giá trị thông tin
Như vậy, cán bộ thư viện không chỉ là cầu nối giữa sách và bạn đọc
mà còn là cầu nếi tài liệu với tài liệu, tài liệu với cơ sở vật chất — kỹ thuật, cơ
sở vật chất — kỹ thuật với người dọc
Theo số liệu thống kê về số lượng cán bệ tại TVQGVN năm 2010 có
tới 176 người Họ là những người cán bộ có trình độ về chuyên môn, nghiệp
vụ, ngoại ngữ, tin học có khả năng đáp ứng tốt yêu cầu, nhiệm vụ phát triển
của Thư viện Trong 176 cán bộ có: 1 cán bộ trình độ tién sỹ, gan 20 cán bộ
- Phòng Thông tin tư liệu: 8 cán bộ
- Phỏng Nghiên cứu khoa học: 5 cán bộ
Trang 8Khéa ledn tot nghi¢p Lê Thị Thủy
Ngoài ra còn có IGiám đốc và 3 Phó Giám đốc cùng các phòng ban
chức năng khác nhau nữa
1.2 Tầm quan trọng của nguồn lài hệu số đối với sự phát triển của
Thư viện Quốc gia Việt Nam
1.2.1 Một số khái niệm chung
Ngày nay, chúng la dang sống trong kỷ nguyên của sự bing nỗ thông
tin Trong thời gian gần đây có rất nhiều những khái niệm mới được ding
trong sách, báo, trên internet như thư viên điện tử, thư viên số, tải liệu điện
tử, tài liệu số, số hỏa Các khái niềm này hiện nay dang dược dùng chưa hoàn toàn thống nhất, do vậy, trong khóa luận cần lâm rõ nội hàm các khái
niệm nảy,
- Thư viện điện tử (ĐT):
Khái niệm về thư viện điện tử được định nghĩa như sau: “Một hệ
thống thông tín trong đó các nguồn thông tin đều có sẵn dưới dang có thể xử
lý được bằng máy tỉnh và trong đỏ tất cả các chức năng bổ sung, lưu trữ, bảo
quan, tim kiếm, truy cập và hiển thị đều sử dụng công nghệ thing tin”
Sự xuất hiện khải niệm này có liên quan trực tiếp tới sự bùng nổ thông
tin trên Internet và Web mang lại Khải niệm này đang được các chuyên gia
công nghệ thông tín sử dụng để chỉ toàn bộ hệ thông bất kế có dựa trên một
thu vién truyén thống hay không Môi trường kỹ thuật Internet hiện nay thậm
chi cho phớp một số người coi toàn thể nguồn thông tin trên mạng một lúc nao đỏ như một thư viện số ảo toàn cầu mà độc giã là toản thể những người
sử dụng mạng trên hảnh tỉnh và các công cụ tìm tin, sự hiện diện của Web
báo đảm các chức năng thư mục cho thư viện đó Tuy nhiên sự khác biệt
giữa Thư viện diện tử, Thư viện số với kho thông tin khổng lễ trên Internet
dé 1A World Wide Web (www) thiéu hin những đặc điểm quan trọng của việc sưu tầm có chọn lọc và tổ chức thông tin chặt chẽ như tronp thư viện
điện tử và thư viện số
KSI Thong tin —
Trang 9
"thư viện điện tử cũng có thể hiểu theo nghĩa tống quát: I.à một loại
hình thư viện đã tin học hóa toàn bộ hoặc một số địch vụ thư viện; Là nơi
người sứ dụng có thể tới để tra cứu, sử dụng các địch vụ thường làm như với
một thư viên truyền thống nhưng đã được tin hoc hóa Nguồn lực của Thư
viện điện tử bao gồm cả tải liệu in giấy và tải liệu đã được sổ hóa
- Thư viện số (TS):
Theo Michael Lesk 1997: “Các thư viên số là các bộ sưu tập thông
tin số hóa được tổ chức Chúng ban gồm việc cấu trúc và thu thập thông lin
là các công việc mà các thư viện truyền thống vẫn luôn phải làm và các máy
tính có nhiệm vụ trỉnh bảy các thông ti đó Một thư viện số thực sự cũng
tạo ra các nguyên tắc quản lý những yếu tố cầu thành thư viện vả các phương,
thức tổ chức thư viên”
Theo Gladney — 1994: “Một thư viện số phải là tập hợp các thiết bị
máy tính, lưu trở, truyền thông ủng với các nội dung số và phần mềm dễ tái
tạo, thúc đây 'và mở rộng các dịch vụ thông tin của các thư viện truyền thẳng
chứa các tải liệu trên giấy và các vật mang tin khác vẫn làm như thu thập,
biên mục, tìm kiếm, phân phát thông tin Một dịch vụ thư viên số đầy đủ trọn
ae Âm đảm bảo cá cả cá nh vấn của cả A
vẹn phải bao gồm đảm bảo có cả các dịch vụ chính yêu của các thư viện truyền thống và khai thác tối đa các Ích lợi của công nghệ lưu trữ số, tim
kiêm thông tin số và truyền thông số”
Tựu chưng lại, các thư viện số với mục đích đạt được các yêu cầu cao của xã hội dều phải
- Phục vụ một cách lý tưởng một cộng đồng hay một tập hợp cộng
đồng người dùng In xác định nào đó
- Không phải là một thực thể đơn dộc
- Được cấu tạo bởi cấu trúc thống nhất, logic va tổ chức
- Kết hợp giữa việc học tập, giảo dục với quá trình truy cập
- Tận dụng tối đa yếu tố con người (cán bộ thư viên) cũng như các yẩu
Trang 10Khéa ledn tot nghi¢p Lê Thị Thủy
- 'Tạo sự truy cập thông tin nhanh chóng vả hiệu quả cùng với một loạt
các phương thức truy cập da đạng, đa chiều
- Cung gấp truy cập miễn phí (oó thể đối với một cộng đồng người
dùng tin xác định)
- 8ở hữu và quan lý, kiểm soát được các nguồn tài nguyên thông tin
của mình (cũng có thể phải mua ở bên ngoài)
- Có một tập hợp nguẫn tải nguyên thêng tin với các đặc điểm sau:
— Lớn và ỗn định
~ Được tổ chức vả quẫn trị tốt
Có nhiều khé mu và khuôn đạng khác nhau
-_ Tài liệu điện tả:
Hiện nay khái niệm về tài liêu điện tử ở Việt nam vẫn còn rất mơ hồ,
chưa có một khái niệm 1õ rằng
Có thể xem tài liệu diện tử là tải liệu được trình bảy và lưu trữ trên các
vật mang tin điện tử và có thế truy cập được thông qua hệ thống máy tính
điện lử và mạng máy tỉnh Các vật mang tin ở đây có thể là băng từ, đĩa từ, các bộ phận lưu trữ thông tin của máy tính
Sự ra đời của tải liệu điện tử là kết quả tất yếu của bùng nề thông tin
và bùng nỗ sông nghệ
- Tài liệu số (TL):
Theo từ điển giải nghĩa của Mindwrap, “Tài liệu số” là những lải liệu được lưu giữ bằng máy tính TL8 có thể dược tạo lập bởi máy tính như việc
xử lý các file văn bản, các bảng biểu hoặc chúng có thể được chuyển đối
sang dạng số tử những tài liệu dạng khác TLS cũng được đề cập đến như là tải liệu diện tử
Từ định nghĩa trên cho thấy, TLS được xây dựng thông qua hai kênh:
- Kênh 1: Tạo lập tải liệu gốc bằng máy tính thông qua việc xử
lý các file văn bản, hình ảnh, bảng biểu,
KSI Thong tin —
Trang 11
- Kênh 2: Tạo Jap ‘ILS thông qua hình thức chuyển đổi định
đạng các tải liệu đã được tạo lập ở dạng khác như (Scan, ghi âm, )
Tóm lại có thể hiểu TL8 là tất cả những tài liệu được trình bảy dưới dang số mà máy tính có thế đọc được
Như vậy tài liệu số và tài liệu điện tử có thể xem như là hai khái niệm
có cùng nội hàm và cỏ thể được dùng thay thể cho nhau
- Số hán:
Thư viện Trường Đại học Cornell định nghĩa số hóa: “là quá trình tý
biến các tải liệu m ấn trên giấy được chuyển sann dạng số, cho phép các
trang thiết bị như máy tính để đọc, máy quét hình phẳng, camera số, camera
động và một loạt các thiết bị khác dược sử dụng để số hóa tải liệu”
"tóm lại: Số hóa là tiển trình chuyển tài liệu thư viện truyền thống, cụ
thể là sách và văn bản sang dạng điện tử và lưu trữ trên máy tính
- Siêu dữ liệu: (hỗng Anh “METADATA"”):
Để mô tả tài nguyên thông tin số người ta đủng siêu dữ liệu
(Meladata) Thuật ngữ “mela” xuất xứ là một từ Iĩy Lạp để chỉ một cái gì đó
26 ban chat cơ bản hoặc cao hơn Vì vậy có thể hiểu “metadata” là đữ liêu về
đữ liêu và được sử dụng thông thường nhất dễ mô tả tài nguyễn thông tin
trên web
'theo tiến sỹ Warwick Cathro, “siêu dữ liêu là những thành phan mô tả
tài nguyên thông tin hoặc hỗ trợ thông tin truy cập đến tải nguyên thông tin”
Siêu dữ liệu dược xác định là “dữ liệu mô tả các thuộc linh của dối tượng
thông tin và trao cho các thuộc tính này ý nghĩa, khung cánh vả tô chức Siêu
dữ liệu còn có thể định nghĩa là dữ hệu có cấu trúc về dữ liệu” Gail Hodgc
định nghĩa siêu dữ liệu là “thông tin cớ cấu trúc ma no mé ta, giải thích, dinh
vị, hoặc làm cho nguồn tin trở nên đễ tìm kiếm, sử đụng và quần lý hơn Siêu
dữ liệu được hiểu lá dữ liệu về đữ liệu hoặc thông tin về thông tin”
KSI Thong tin —
Trang 12Khéa ledn tot nghi¢p Lê Thị Thủy
'theo Iempsey và Heery, 1997: “siêu dữ liệu là dữ liệu đi kèm với đối tượng thông tin và nó cho phép những người sử đựng tiém năng có thể biết
trước sự Lồn Lại gũng như đặc điểm của đối tượng thong tin nay”
Nói tóm lại, siêu đữ liệu là thông tin mô tả tải nguyên thông tim
1.2.2 Vị Tò,
rí của nguồn tài liệu số đối với sự phát triển của
Thư viện Quốc gia Viel Nam
- Tai liệu số trong thư viện chính là di sản văn hóa của dân tộc Bởi
cũng giống như các loại tài liệu truyền thống khác tài liệu sể lưu giữ, truyền
bá và bảo quản những giá trị văn hóa truyền thống của nhân loại tử dời nảy
qua đời khác Đồng thời nỏ cỏn là cơ sở quan trọng để phục vụ bạn đọc;
phục vụ các nhiệm vụ kinh tế, chính trị, vẫn hóa, xã hội của dit nude
- Xây dựng và tổ chức khai thắc nguồn tài liệư số sẽ tạo khả năng truy
cập và bảo quân thông tin cho thư viện từ đó nâng cao hiệu quả hoạt động
của thư viện vả rồi người sử dụng sẽ trở nên năng đông hơn trong việc tìm
kiểm thông tỉn bởi bởi khả năng truy cập nhanh chóng và để đảng bằng cách
sử dụng cáo tiện ích tìm kiếm của máy tính điện tử
- Tài liệu số giúp thư viện tăng tính linh hoạt và khả năng đáp img nhu
cầu thông tin thể hiện ở chỗ một bản tài liệu số có thể cùng lúc phục vụ cho
nhiều đối tượng khác nhau, không phụ thuộc vào số lượng người dùng, thời
gian va vi tri dia ly của người học Từ đó họ chủ đông trong việc sắp xếp
thời gian học tập, họ có thể lẫy được tài liệu qua hệ thống mạng thông tin ở
mọi lúc, mọi nơi
- Tiết kiệm thời gian và kinh phí: Thư viện đỡ tổn kinh phí xây dựng
kho tàng, kinh phi bố sưng tài liệu, bảo quản và kinh phí trã lương cho người phục vụ Hơn thế nữa lá piúp cho người dùng tia dược dễ đảng thuận tiện,
tiết kiệm được thời gian, tiễn bạc trong việc tìm thông tin Ilo có thể ngồi ngay tai nha hay phòng lam việc cũng có thể truy cập dược tải liệu tử khắp nơi trên thể giới
KSI Thong tin —
Trang 13
- Đối với công tác bão quản trong thư viên thì nó giúp báo quân được
phiên bản gốc của tải liệu, giữ gìn và tăng tuổi thọ của tài liệu quý hiếm bằng việc giảm hao mòn, rách nát dù quá trình liếp xúc trực tiếp với tài liệu của
người sử dụng TLŠ ngăn chăn những rủi ro hủy hoại do thời gian, thiên tai,
khí hậu và tần suất sử dụng
- Nguồn tải liệu số giúp thư viện mở rộng dối tuợng phục vụ: Phạm vi
phục vụ các tài liệu của thư viện không bị bỏ hẹp trong khuôn viên của thư
viện mà nó vươm tới các vị trí địa lý khác như lại nhà, tại trường, tại nơi làm
việc Tài liệu số tạo ra môi trường vả cơ hội bình đẳng rộng mở cho tất cả
mọi người đều có cơ hội sử đụng nguồn tài liệu học tập bởi nguồn tài liệu số
không bị giới hạn về không gian và thời gian Loại b khodng cách trị thức giữa người giàu và người nghẻo, giữa thành thị và nông thôn, giữa các quốc
gia
-_ Tài liệu số giúp thư viên tăng khả năng da truy cập cho phép người
dùng có thể tra tìm tải liệu đồng thời theo nhiễu đấu hiệu khác nhau Vi du
như lim theo ắc yếu tố mô lả thư mục với các toán Lử tìm được xây dựng
dựa trên các toán tử Hoole, các toán tử thu gon, mở rộng, tỉm theo các liền
kết tới các nguồn tham khảo, trích dẫn Điều này cho phép người dùng tin có thể mớ rộng hay thu hẹp phạm vì tìm kiểm, rút ngắn thời gian và giám thiểu
nhiễu tin
- Tuyên truyền, phổ biến các tải liệu của nước ta với thế giới Tải liệu
số được lưu giữ trên hệ (hỗng máy tính do dé bạn đọc đủ ở bắt cứ dâu, không
gian và khoảng cách như thế nảo thì cũng có thể tiếp cận tới nguồn tải liệu
của thư viện thông qua máy tính kết nối mạng internct hay intrancL
1.3 Kguồn tài liệu số trong cơ cấu vốn tài liệu của Thư viện Quốc gia
Việt Nam
'thư viện Quốc gia Việt Nam là một trong những thư viện có nguồn
TLS lớn trong cả nước Trong đỏ, bên cạnh nguôn TLS mua từ bên ngoài,
KSI Thong tin — Thu viện
Trang 14Khéa ledn tot nghi¢p Lê Thị Thủy
các nguồn 'I1.8 do Thư viên tạo lập cũng rất phong phú về nội dung và đa
dạng về hình thức Trong phạm vi để tài này, tác giả phân chia chúng thành
hai loai CSDL chinh 14 CSDL thư mục và C8DL toàn văn
1.3.1 Cơ sử đữ liệu thư mục
Các CSDI, thư mục là một trang những nguồn tải liệu số lớn nhất hiện
có của 'Thư viện, chúng đóng vai trò quan trọng giúp người dùng tin có thể
tiếp cận tới nguồn tài nguyên truyền thống quý báu với hàng triệu bản mà
“Thư viện dang sở hữu Các cơ sở dữ liệu này bao gồm
- C§DL sách của Thư viện Quốc gia: 340.000 biểu ghi (sách tiếng
Việt xuất bản tử 1954 đến nay sách hệ chit Latinh thừ 1982 đến nay, sách tiếng Pháp kho Dồng đương
- C§DL Báo, tạp chí các ngôn ngữ: 6.272 biểu ghi
- CSDL Bao, tạp chí nghiên cứu các ngôn ngữ nhập về thư viện trước
năm 1954: 1.718 biểu ghỉ
- CSDI, Luận án tiến sỹ: 13.762 biểu ghi
- CSDL Bài trích từ hơn 60 tạp chỉ: 50.130 biểu ghi
1.5.2 Cư sử dữ liệu toàn văn
Là loại hình CSDL rất được chú ý trên thể giới nhưng mới chỉ xuất hiện trong hệ thống thư viện công cộng trong những năm gần đây với số
Trang 15lượng không nhiễu Hiện tại ở ''VQGVN có hai loại C8121 toàn văn chủ yếu
là: CSDL toàn văn do TVQGVN tạo lập và CSDL toản văn mưa từ bên
- Khoa học tự nhiên và ứng dung
- Khoa học xã hội vả nhân văn
- Kinh tế
- Nông, lâm nghiệp
- Mỹ thuật
- Bộ sưu tập vỗ vách Hân Nôm cỗ
Chit Ném là một trong những đi sản quý giá của nền văn hóa Việt Nam Độ sưu tập Hán Nồm cua Thy vii
ôn Quốc gia Việt Nam được thu thập,
gây đưng từ những năm 60 của thể kỷ trước, đến nay đã có 1.308 cuôn, 91.768 trang ảnh và 180.000 trang tải liệu với nhiều chủng loại phong phú và
có giá trị cao Kho sách này phản ánh xác thực các mặt trong dời sống xã
hội, lịch sử, giáo dục, khoa học địa lý của Việt Nam trong suốt tiến trình lịch
sử Do thời gian, khí hậu, sự hạn chế về cơ sở vật chất, kỹ thuật bảo quân
nên kho sách dang dần bị xuống cấp và hư hai
KSI Thong tin —
Trang 16Khóa luận tốt nghiệp Lê Thị Thúy -====ễ>ễ>-
Tài liệu Hán Nôm gốc
~ Bộ sưu tập số: sách, bảo Đông Dương
Sách Đông Dương: Bao gồm sách tiếng Pháp và tiếng Việt xuất bản ở
Đông Dương, viết về Đông Dương và Việt Nam Đây là hợp đồng giữa Thư
viên Quốc gia và Chính phủ Pháp từ dự án Valease: “Tổ chức và thực hiện
chương trình số hóa tài liệu tiếng Pháp thuộc vốn di sản cổ đã được công
nhận ở Việt Nam và Đông Dương” Thư viện Quốc gia đã tạo lập Ebook các
tài liệu viết về Việt Nam trước năm 1932 CSDL hiện có 758 tên sách, 89.512 trang, 175 bản đồ, trọn bộ tạp chí: Nam Phong; Tri Tan
~ Bộ sưu tập số: Thăng Long — Hà Nội:
Đao gồm
~ Bản đồ cổ Hà Nội vả vùng phụ cận
- Sách báo xuất bản sau năm 1954
- Sách báo xuất bản trước năm 1954
- Sách Hán - Nôm cổ
~ Luận án tiến sỹ về Hà Nội
Có thể nói, Thư viện Quốc Gia Việt Nam đã thu thập lưu trữ tương
đối đầy đủ bộ sưu tập tư liệu về dân tộc xưa và nay hết sức quý hiểm, trong
đó có tài liệu về Thăng Long - Hà Nội Đặc biết, bộ sưu tập bản đồ cổ Hà
KŠ1 Thông tin ~ Thư viện
Trang 17Nội và vùng phụ cận mà Thư viện Quốc gia trưng bày gồm 55 ban đồ, có
niên đại khác nhau từ năm 1873 đến năm 1965 Các bản đồ được phục chế
và số hoá trong khuôn khổ Quỹ đoàn kết ưu tiên phát huy hệ thống thư tịch
cổ của các nước Đông Nam Á đã cho thấy sự thay đổi đô thị của Thủ đô Việt
‘Nam trải qua trong hơn một thế kỷ
án Tiến sỹ cùng với một số tài liệu của Nhà xuất bản Hà Nội mới phát hành
trong Dự án Hành trình tìm kiếm Di sản văn hiến Thăng Long - Hà Nội, và
của Viện Nghiên cứu Hán Nôm Bộ sưu tập này sẽ được cập nhật thường
xuyên nhằm cung cấp thêm tư liêu quý về Thăng Long - Hà Nội nghìn năm
văn hiến
~ Bộ sưu tập số: Sách tiếng Anh về Việt Nam
Thuộc Dự án CONSAL: 92.520 trang (338 cuốn)
S1 Thông tin ~ Thư viện
Trang 18Khóa luận tốt nghiệp Lê Thị Thúy 1.3.2.2 Cơ sở dữ liệu toàn văn bổ sung từ bên ngoài
- CSDL Keesing:
Đây là CSDL tập hợp toàn diện, chính xác và súc tích tất cả các bài
báo trên thể giới về chính trị, kinh tế và xã hội, các sự kiên trên toàn thế giới
từ năm 1931 Được xuất bản bằng tiếng Anh, tiếng Pháp, tiếng Đức và tiếng
Hà Lan
- CSDL ProQuest:
Đây là CSDL toàn văn tổng hợp lớn nhất hiện nay, cho phép truy cập
tới hơn 11.700 tên tạp chí, với gan 8.800 tap chi toàn văn ProQuest còn sở
hữu gần 30.000 luận văn, luận văn toàn văn, hồ sơ doanh nghiệp, báo cáo thị trường, báo cáo quốc gia, cùng nhiều dang tài liêu tham khảo bao trùm hơn
160 chuyên ngành, lĩnh vực: Quản trị kinh doanh, Tài chính, Thương mại,
Ngân hàng, Kể toán,
- CSDL WILSON:
KŠ1 Thông tin ~ Thư viện
Trang 19Wilson cung cấp truy cập toàn văn, thông tin tóm tắt, trích dẫn, hình
ảnh từ 11 cơ sở đữ liệu con với khoảng 4.000 tạp chí điện tử có phạm ví
thông lin từ năm 1982 ~ nay
— Wilson Applied Science and ‘Technology Full ‘Text
Wilson Art Full Text
~ Wilson Business Full Text
— Education Full Text
— Humanities Full Text
~ Social science Full Text
Index to legal Periodicals Full Text
1.4 Dae điểm nhu câu tin và người dùng tin tại Thư viện Quốc gia
Việt Nam
1.4.1 Đặc điểm người ding tin
Người dùng tín là đổi tượng phục vụ của bất kỳ một cơ quan thông tỉn
— thư viên nảo Người đủng tin lả người sử dụng théng tin déng thời là người
sang lao và làm giàu nguồn tin Thỏa mãn nhu câu tin cho người dùng tín
cũng đồng nghĩa với việc phát triển nguồn tin của thư viện Sự thỏa mãn nhu
cầu tin cho người dung tin chỉnh là cơ sở để đảnh giả chất lượng hoạt động
thông lin trong thư viện
liện nay, người dùng tin của Thư viện Quốc gia phát triển nhanh chóng cả về số lượng và thành phẩn Trình độ của người đủng tin có nhiều
cấp độ khác nhau Dỗi tượng người dùng tin ma thu viện hướng tới là các
cấp, các ngành, cán bộ giáng dạy ở cảu lrường đại
học, cao đẳng, trung học chuyên nghiệp, các trường phố thông; cản bộ công
tác tại các đơn vị hành chính, sự nghiệp và sản xuất kinh doanh; sinh viên
các trường đại học, cao đẳng (Trước dây Thư viện chỉ làm thẻ dọc cho sinh
viên năm thứ 3, 4, nay Thư viên đã mé rộng đối tượng là sinh viên nim thir
KSI Thong tin —
Trang 20Khéa ledn tot nghi¢p Lê Thị Thủy
2) Qua khảo sát thực tế tôi chia đối tượng ngưởi đùng tin của TVQGVN
1.4.2 Đặc diễm như cầu tin
Cuộc cách mang khoa học công nghệ đang diễn ra một cách manh mẽ
trên toàn thế giới Nhiều thành tựu khoa học mới ra đời đã tạo nên một hiện tượng “bùng nổ thông tin” Lượng thông tin trong xã hội vô củng phong phú
và đa dạng Cũng từ đây thông tin trở thành động lực cho sự phát triển của xã
hội Nhu câu thông tin ngày cảng lớn và trở nên cấp thiết hơn bao giờ hết
hư cầu tin chỉnh lả dỏi hỏi khách quan của con người dối với việc tiếp nhận
và xử lý thông tin để duy tri va phat triển sự sống Nhu cầu tin xuất phát từ
nhu cầu nhận thức của của con người lăng lên cùng với sự gia lăng các mỗi
quan hệ trong xã hội và mang tỉnh chất chu kỳ Nếu nhu cầu tin được thỏa
mãn kịp thời, chính xác thi nhu cầu tin sẽ ngày cảng được phát triển Ngược
lại, nếu nhu cầu tin không thỏa mãn thường xuyên thỉ nhu cầu tin sẽ bị triệt
tiêu Càng thỏa mãn ở mức độ cao bao nhiêu thì chu kỳ cảng được rút ngắn
bấy nhiêu
Tưởi đây là nhu cau tin của các nhóm người dùng tin tai Thu viện
Quốc gia Việt Nam
1.4.2.1 Nhu cầu tin của cán bộ quản lý, lãnh đạo
Đây là nhóm người dùng tin chiếm số lượng rất ít (khoảng 5%) song,
ho lai 14 nhém người đùng tin rit quan trọng của Thư viện Dáp ứng nhu cầu tin của họ là việc mà thư viện hết sức quan tâm Bởi lẽ họ là những người
Trang 21
đưa ra các quyết định mang tính chiến lược và sách lược ở tầm vĩ mô hay vi
mô có ảnh hưởng trực tiếp đến sự phát triển của xã hội, họ có thể là những
người xây dựng, phác tháo đường lối, chỉnh sách của Đăng vá Nhà nước, của
các bộ, các ngành, các đơn vị sắn xuất kinh doanh Ngoài công tác quản lý,
một số cản bộ còn trực tiếp tham gia nghiên cứu khoa học Da đó, nhụ cầu tin của họ rất da dạng, phong phú và dõi hỏi tính kịp thời, dầy du và chính
xác cao Thông tin phải vừa rộng đồng thời cũng phải mang tỉnh chuyên sâu,
bão mật và hệ thống
1.4.2.2 Nhu cầu tin của cán bộ nghiên cứu, giảng dạy, cán bộ trong các
dơn vị hành chính, sự nghiệp và sán xuất kinh daanh
Nhóm người dùng tin nay chiếm tỷ lệ khá nhiễu tại Thư viên (khoảng,
27%) Họ có nhu cầu tài liệu khá cao Thông tin họ cần vừa mang tỉnh tổng
hợp lại vừa mang tính chuyên sâu Nhóm người dùng tín nảy có khả năng sử
dụng mọi loại hình tài liệu cả truyền thống lẫn hiện đại Tài liệu họ cần
thường là những tài liệu quý hiếm; tài liệu xám, lài liệu đã được số hóa, các
tài liệu chuyên sâu về một ngành, một lĩnh vực cụ thể mà họ quan tâm
1.4.2.3 Nhu cầu tìn cứa sình viên năm thứ hai trớ lên của các trường dai
học và cao đẳng
Dây là nhóm người dùng tin chiểm tỷ lễ lớn nhất tại Thư viên (gần 70%) Nhu cầu tin dủa họ rẤt cao và đa dạng, To mong muốn tham khảo Lài liệu để mở rộng kiến thức Đặc biệt, các sinh viên năm cuối có nhu cầu tài
liệu chuyên ngành rất cao như: giáo trình, tài liệu nghiên cứu, tái liệu chuyên
ngành, Bên cạnh tài liệu quốc văn, ngoại văn họ có nhu cầu sử dụng khá
cao các nguồn tải liệu sé olla ‘Thu viện
Như vậy việc nghiên cứu đặc điểm người đủng tin và nhu cầu tỉn tại Thư viện Quốc gia Việt Nam là giúp cho việc nhận dang được nhu cầu thông
tin và sử dụng các nguồn tải liệu số của họ, qua đó tim ra những biện pháp
KSI Thong tin —
Trang 22Khéa ledn tot nghi¢p Lê Thị Thủy
Trang 23
CHƯƠNG2
THỰC TRẠNG SỞ HÓA TÀI LIỆU VÀ
TO CHIC KHAI THAC NGUON TAI LIEU SO
TAT THU VIEN QUOC GIA VIET NAM
2.1 Hoạt động số hóa tài liệu tại Thw vién Quéc gia Viet Nam
Công tác số hóa tài liệu là bước đầu tiên của quá trình xây dựng bộ
sưu tập số Quá trình này quyết định đến:
- Định đạng của TL8 (Dạng text, dạng ảnh và dạng đa phương tiện)
- Chất lượng của TLL§ nói riêng và bộ sưu tập số nói chung
- 8ự đa dạng và mức độ bao quát nguồn thông tin
- Chất lượng TLS trong bệ sưu tập về mặt nội dung
Do ngudn tai nguyên của Thư viện rất phong phú và da dạng, bao pm
nhiều loại CSDL khác nhau nên việc tạo lập TL5 cũng liên quan đến nhiều
phương thức kỹ thuật Hiện nay, bên cạnh việc mua các CSDL khác ở bên
ngoài thì thư viên dang sir dung hình thức tao lap ‘TLS chủ yếu là số hoá tải
liệu
Trong phần nảy tôi xin lập trung vào quy trình số hóa tải liệu tại
TVQGVN được tiến hành thông qua 9 bước sau đây:
2.1.1 Khuôn khố pháp lý
'Thư viện Quốc gia Việt Nam lả Thư viện trung tâm của cả nước với
chức năng và nhiệm vụ được quy định theo Pháp lệnh thư viện được ủy ban
thường vụ Quốc hội Việt Nam thông qua ngày 28/12/2000 và được Chủ tịch
nước ký Sắc lệnh CNT ban hành ngày 11/01/2001, đằng thời là Thư viện
đứng đầu trong hệ thống Thư viện Công cộng, chịu sự nhỉ đạo trực tiếp của
Hộ Văn hóa, Thế thao và Du lich Trong đó, nguồn TLS đồng vai trỏ quan
trọng, quyết định đến hiện quả toàn bộ nguồn tin trong nước tại Thư viện, do
vậy vẫn để số hóa tải liệu và tổ chức khai thác nguồn TL§ là một nhiệm vụ
KSI Thong tin — Thu viện
Trang 24Khóa luận tốt nghiệp Lê Thị
tất yếu Tuy nhiên, trong quá trình triển khai xây dựng và phát triển nguồn
tài nguyên này, Thư viên cũng gặp phải một số khó khăn nhất định, trong đó
có vấn đề về bản quyền cho nguồn tải liệu số hoá
Vấn đề bản quyền thực sự đang là rào cản làm nhụt chí những người
có tâm huyết với công việc số hoá tài liêu thư viện Sở dĩ như vậy là vì chúng ta chưa thực sự nắm vững những quy định cụ thể của Luật bản quyền (Luật sở hữu trí tuệ) Các cơ quan chức năng nhà nước cũng chưa có những văn bản dưới luật để hướng dẫn thi hành
Van đề bản quyền đối với tài liệu trong Thư viên số chia làm 2 loại
~ Các tài liệu hết luật bản quyền
Theo Luật sở hữu trí tuệ Việt Nam 2005: Điều 27, khoản (a), (b) “Tac
phẩm không thuộc loại hình quy định tại điểm a khoản này có thời hạn bảo
hộ là suốt cuộc đời tác giả và 50 năm tiếp theo năm tác giả chết, trong trường,
hợp tác phẩm có đồng tác giả thì thời hạn bảo hộ chấm dứt vào năm thứ 50
sau năm đồng tác giả cuối củng chết.”
- Đối với tài liệu còn luật bản quyền
Theo Luật sở hữu trí tuệ Việt Nam 2005: Điều 25: Các trường hợp sử dụng tác phẩm đã công bố không phải xin phép, không phải trả tiền nhuận
Trang 25bản pháp quy, số liệu thống kệ, tải liệu thuậc lĩnh vực tư pháp (theo Luật sử
hữu trí tuệ Việt Nam, chương 1, muc 1, điều 15: Các đối tượng không thuộc
phạm vị bảo hộ quyền lác giả: “Tin tức thời sự thuần tuý đưa tin; văn bản
quy phạm pháp luật, văn bản hành chính, văn bản khác thuộc lĩnh vực tư
pháp và bản dịch chính thức của văn bản đó; quy trình hệ thống, phương
pháp hoạt dộng, khải niệm, nguyễn lý, số liệu”
¡ liệu được bảo hộ bản quyền nhưng số hoá để sử dụng với mục
đích phi thương mại trong phạm vi hạn chế của thư viện, trường học, viện
nghiên cứu Bản thân việc số hoá tài liêu không vị phạm bản quyền, việc vi
phạm hay không phụ thuộc vào mục đích sử dụng (chẳng hạn dùng với mục
đích thương mại làm ảnh hưởng đến lợi ích kinh tế của người nắm giữ bản quyền là vì phạm) và phạm vị sử dụng (như phố biến rộng rãi ra công chúng, ngoài phạm vi thư viện là vi phạm)
Vậy, công tác số hoá tải liệu lai Thư viện Quấu gas Việt Nam có vì
pham bản quyền hay không? Hiện có rẤt nhiều quan điểm giải thích cho vấn
đề này Tuy nhiên để có câu trả lời chính xác, cần xem xét và đổi chiếu các văn bán pháp lý vào trường hợp cụ thể của Thư viện Quốc gia Việt Nam Qua việc đối chiều với các văn bản trên cho thấy, việc số hoá tài liệu tại Thư
viên là đáp ứng được yêu cầu về mục đích (phục vụ nghiên cứu, giảng dạy,
học tập), song vẫn chưa đáp ứng dược những quy dịnh dã nêu tại khoản 3
Điều 20 và điểm đ khoản ] Điều 25 của Luật Sở hữu trí tuệ Việc số hoá tài
liệu khi chưa xm phép chủ sở hữu dã vĩ phạm khoăn ế Điều 28 Luật Sở hữu
trí tuệ về những hành vi xâm phạm quyền tác giá đó là "Sao chép tác phẩm
mà không được phép của tác giả, chủ sở hữu quyền tác giả"
Trang 26Khéa ledn tot nghi¢p Lê Thị Thủy
“tuy nhiên, cũng cần giải thích thêm rằng ở Việt Nam trong lúc luật
Ban quyén còn chưa được áp dụng một cách triệt để và hơn nữa công tác số
hoá tài liệu của Thư viện Quốc gia Việt Nam lại được tiễn hành tử khá sớm
thi những sai phạm như đã nêu là rit phổ biến va không thể tránh khỏi
2.1.2 Sưu tầm tài liệu
Sưu tầm tài liệu số hoá phụ thuộc rất lớn vào chỉnh sách của thư viện
xác định nguén tải liệu nào cần số hoá trước/ tru tiên trước (tải liệu quý hiếm,
tài liêu có nhiều như cầu dọc nhất, tài liệu có giá thành dắt )
Theo ké hoach bude dầu Thư viện sẽ số hóa 5 kho tải liệu sau
« — Kho sách (chủ yếu lả sách tiếng Anh viết về Việ Nam)
Kho bao — tap chi
Nồm, Việt, Anh, Pháp, Tây Ban Nha, hga, Irung, Quốc ya cùng, nhiều ngôn
ngữ khác, các tác phẩm in bằng mộc bản hoặc in ấn bằng phương pháp hiện
kại Những tác phẩm này được viết bằng chữ Hán, chữ Nôm, cả Hán lần
Nôm, cũng như Hán hoặc Nôm đã được chuyển qua quốc ngữ
Tài liệu viết tay: său phong, hồi ký, bắn thảo tác phẩm, hương ước,
tộc phả, liểu sử,
€ bài thí quan trường, kịch băn, lài liệu giáo khoa, đặc san,
gia phả, lịch sử, bản khắc, ngữ học, văn chương, thuốc nam, chuyện viết
hằng chữ Nôm, thi phủ, tôn giáo, Trung Quốc học, triều chỉnh, lệ làng, luật
Trang 27
— 'ài liêu điện tử: các đĩa Cl3-ROM, VCI3, 13VI có chứa đữ liên về
lịch sử Thăng Long 1000 năm văn hiến, về thư tịch lần Nôm
2.1.3 Phân loại tài liệu và bảo quán tài liệu
Tất cả các tải liệu được sưu tập trước khi số hóa phải trải qua giai đoạn
phân loại loại hình tài liệu (sách, báo, tạp chí, tài liệu chép tay, bản thảo, tranh ảnh, tải liệu nghe nhìn hoặc điện tử, ngôn ngữ tài liệu ), hiệu chỉnh về
mặt vật lý (lau bụi, tháo bìa, tháo rời tài liệu, kiểm tra số trang, hiệu chỉnh
kích cỡ) và cuối củng là báo cáo về tình trang của tài liệu Đây là khâu quan
trong góp phần trong việc lực chọn thiết bị và kỹ thuật Scan phủ hợp để có
sản phẩm số hóa đạt chất lượng cao: văn bản, âm thanh rõ ràng, hình ảnh, đầy đủ, sắc nét đúng như tải liệu gốc của nó
2.1.4 Số hóa tài liệu
"trước khi bắt tay vào việc số hóa chứng ta cần phải cân nhắc kỹ lưỡng
liệu có thật cần thiết để thực hiện không vì chuyển một thư viện thường sang
dạng số là một cách làm dầy tham vọng và dắt tiền với lại số hóa nội dung của một sưu tập in ấn thường là một công việc dé sô và chán nắn
* Các câu hỏi đặt ra trước khi chuẩn bị số hỏa:
- Mục đích xây dựng kho dữ liệu số là gì:
- Đối tượng phục vụ là ai?
- Quy mê thế nảo? tại chỗ, trong khu vục hay toàn cầu?
- Sễ lượng tài liệu sẽ số hóa?
~ Tài liêu có bao nhiêu trang?
- Có nhiều tranh ảnh không?
~ Tài liệu sẽ chia nhỏ thành nhiều phần hay không?
- Tài liêu này đã có ở dạng số chưa và đã phố biển chưa?
- Nếu có thì ở đạng fomat nào?
- Tình trạng bắn quyền của tải liệu?
KSI Thong tin —
Trang 28Khóa luận tốt nghiệp Lê Thị
- Ai sở hữu bản quyền?
~ Số hoá tài liệu như thể nào?
~_ Định dạng sản phẩm là gì? (ảnh/ văn bản)
~ Mô tả tài liêu như thể nảo/ dùng chuẩn biên mục gì?
- Sé ban hay miễn phí
Đề tiến hành số hóa Thư viên Quốc Gia Việt Nam đã chuẩn bị:
+ Lễ thiết bị
- May vi tinh: Dé dim bảo tốt cho công việc quét ảnh và các công tác
số hóa, Thư viện đã lựa chọn các loại máy tính có cấu hình RAM, dung
lượng ỗ cứng và Chip xử lý tốc độ cao nhất trong thời điểm hiện tại Thư
viên hiện có 18 máy chủ và hơn 250 máy tram
~ Thiết bị lưu trữ: CD-ROM, đĩa DVD, đĩa Bluray Ngoài ra còn có
các thiết bị khác phục vụ số hóa như: ỗ cứng di déng Store, 6 ghi CD - R/
DVD - R, ổ CD ~ ROM/DVD (để sao lưu dữ liệu trên CD)
- May quét anh: tai Thu vién dang str dung may Scaner d6 phan giai
300 dpi và máy ảnh kỹ thuật số để quét và chụp các trang của tải liệu
Trang 29công nghệ thông tin, Thư viện không ngừng đây nhanh quá trinh áp dựng các
phần mềm vào hoạt động
Xuất phát từ sự phong phú và da đạng của các nguồn (ai liệu số, hiện
tại thư viên đang sử dụng nhiễu phần mềm đề quản lý nguồn tải nguyên này
Tưới đây là một số phần mềm đã và đang được sử đụng:
- Phần mềm CDS/ISIS:
Tây là phần mềm đầu tiên được áp dụng tại thư viện dùng để quản lý
các CSDL dạng văn bản có cầu trúc đo UNESCO phát triển và phố biển từ năm 1985 và dược cung cấp miễn phí cho các thư viện Việt Nam Đây cũng,
là phần rằm đầu tiên được sử dụng phổ biến tại Việt Nam để quản lý thư viên truyền thẳng CDS/ISI§ có các đặc trưng sau:
~ Sử dụng giao điện I3OS để xây dựng CSII,
Sử dụng dang bién myc may doc duge CCF (Common
Communication Format)
La phan mém két hop I]é quân trị CSDL với Phin giao tiếp
Quản lý được đồng thời nhiều CSDL,
— Cho phép xây dựng các CSIÐI, lớn tới 16 triệu biểu ghi
Kích thước của trường không hạn chế (có thế tới 32.000 ký tự)
Cáo giai đoạn phát triển của CDS/ISIS Lor DOS
— Cuối những năm 60: Phiên bản chính
Thang 12/1985: Phiên bản 1.0 chạy én IBMPC/XT
~ Tháng 3/1989: Phiên bán 2.0
~ Tháng 6/1993: Phiên bắn 3.0
CDS/SIS for DOS cfing đã dược Thư viện Việt hoá vả triển khai áp dụng rộng rãi
Từ tháng 11 nim 1997 phién ban CDS/ISIS for WINDOWS 1.0
(WINISIS) ra dời, Thư viện đã áp dụng phần mềm nảy váo việc xây dựng và quản lý các CSDI WINISIS được phát triển từ phần mềm CDS/SIS for
KSI Thong tin —
Trang 30Khéa ledn tot nghi¢p Lê Thị Thủy
108 cho phép chạy trên mỗi trường Windows với nhiều tính năng ưu việt
như:
— Xây dựng cấu trúc CSDL dễ dàng nhờ có các phương tiên trợ giúp
trong việc tao biểu mẫu nhập tin và format hiện hình
liệu quả tìm tin tăng, nhờ nhiều phương tiện trợ giúp (cửa số từ diễn, nút toán tử, )
— Cho phép tìm tin theo nhiều phương thức: tìm tìn trình độ cao và tim
tin có trợ giúp
~ Có khá năng kết nổi CSDI, này với các OSDI, khác để mở rộng
chức năng quản lý nhờ các lệnh kết nếi siêu văn bản trong ngôn ngữ tạo
format
~ Cho phép quản lý các tệp toán văn nhờ những liên kết siêu văn bản
Có cãi tiến Phần giao tiếp từ DOS đến Web và kết nối thêm hệ quản
tri CSD Access,
Dé thao tac va str dung, phi hop với trình độ của mọi đối tương; khả
năng kếi nổi mạng LAN, liên kết với các Irang Web trên mạng Internet thuận
tiên
'WINISIS giúp toàn bệ hoạt động nghiệp vụ thư viện được tự động hoá
lối đa và tích hợp trong một hệ thống nhất đồng thời cho phép trao đổi, tương tác, hỗ trợ lẫn nhau tao ra một quy trình nghiệp vụ chuẩn của một thư viện hiện đại bao gồm:
~ Bỗ sưng: BỂ sung tải liệu qua don đặt, tra trùng tải liệu, tra cứu báo
cáo bố sung
— Biên mục: Xuất, nhập dữ liệu theo chuẩn MIARC 21, m phích mục lục, in nhãn tải liệu, in thư mục tài liệu mới, tài liệu chuyên d, tìm kiểm tra
cửu nhanh theo nhiều tiêu chỉ, thông kê báo cáo tải liệu,
~ Hỗi cố, hiệu dính, tái xứ lý tải Hệu kho dọc, kho mượn, tạo lập và tổ
chức quản lý kho theo yêu cầu của thư viện
KSI Thong tin —
Trang 31
— Quản lý lưu thông: Cấp thẻ bạn đọc, lưu thông đọc, mượn, trả, gia
hạn theo quy trình tra cứu, quản lý bạn đọc, báo cáo thống kê lượt người đọc,
lượt tài liệu luân chuyển
— Dữ liệu sử dụng trong WINISIS có thể tái sử dụng sau này nếu thư
viện nâng cấp sử dụng các chương trình phần mềm quản lý khác với tính
năng cao hơn như 1LIB, LIBOL,
Hiện nay, WINSIS đã phát triển đến phiên bản 1.5 nhưng do nhủ cầu
trong quản lý dữ liệu tại thư viện ngày càng cao do đó phần mềm WTNISIS
không thé dap img được nên thư viện đã triển khai thêm các phần mềm khác
- Phan mém Ilib:
Từ tháng 10-2003 dến nay, TVQGVN dã chuyển sang sử dụng phần mềm Ilib thay cho phần mềm C138/1818
+ Tỉnh năng của phần mềm lib
- Phần mềm hiện đại hoá thư viện một cách toàn diện, nâng cao năng
lực và vai trò của thư viện,
- Cho phép lưu trữ và khai thác các loại tài liệu đã được sẽ hoá âm
thanh, hình ảnh, phim, dữ liệu toàn văn với nhiều định dạng khác nhau,
- Hễ trợ xây dụng các giáo trỉnh, Sách điện tử, biến các loại tải liệu nay trở thành các dữ liệu cua thu vid
- Cho phép bạn đọc truy cập và khai thác thông tin trực tuyển,
- Hệ thống được xây đựng dựa trên các tiểu chuẩn mở, do do dé dang
nâng cấp, mở rộng cũng như tích hợp với các hệ thống khác
+ Điểm nỗi bại của phẫn mềm Llib
- Đáp ứng được các yêu cầu của phần mềm thư viện số
- Dap img được các yêu cầu kĩ thuật và thiết kế phần mềm
- 8ễ hoá và đáp ứng được việc thu thập, bố sưng các tư liệu cần số hoá
KSI Thong tin —
Trang 32Khóa luận tốt nghiệp Lê Thị
- Đáp ứng được việc biên mục, nhập vào CSDL, tạo các điểm truy cập
để tìm kiếm
+ Lợi ích khi sử dung Ilib
- Phần mềm đưa ra một phương pháp chung cho việc biên mục các tư liệu số, thư viên có thể xây dựng các bộ sưu tập số hoá theo ý mình khi có
nhu cầu và kinh phí;
~ Các bản ghi thư mục của các tư liệu số hoá sẵn sàng cung cấp cho bạn đọc qua các phương tiện OPAC hay Z39.50 Các thư viện, các cơ quan
có thể khai thác các bản ghi thư mực của nhau một cách dễ dàng tùy theo từng như cầu;
- Việc tuân theo chuẩn RDE - Dublin Core cho phép các bộ máy tìm
kiếm truy cập, tìm kiếm tin từ máy chủ của thư viên, khiến thư viện trở thành
nguồn cung cắp thông tin số hóa tại Việt Nam và trên thể giới
Hiện tại các CSDL do thư viện tạo lập như CSDL SACH, LA, IM đã
được tích hợp vào CSDL chung của TVQGVN và bạn đọc có thể tra tìm tài
liệu thông qua mạng Internet với địa chỉ trang Web: http://www nlv.gov.vn Với giao diện sau:
K51 Thông tin — Thư viện
Trang 33
- Phan mem Dlib:
Năm 2006, TVQGVN đã triển khai phần mềm thư viện số Dlib phục
vụ mạng LAN Phần mềm quản lý tài liệu số Dlib cho phép cán bộ thư viện
mô tả đữ liệu thư mục theo chuẩn Dublin Core, có gắn kết với tài liệu số các
loại hình tải liệu: văn bản, âm thanh, hình ảnh, nghe nhìn Phần mềm được
tích hợp trên trang Web của TVQGVN, cho phép bạn đọc ở bắt cứ đâu cũng
có thể tra cứu vào CSDL đữ liệu số Hiện tại, có các CSDL: Luận án tiền sĩ,
Sách Đông dương, sách Tiếng Anh viết về Việt Nam Tài liêu ở các dang
văn bản, âm thanh, hình ảnh, film ảnh
Dưới đây là giao diện tra cứu của phần mềm Dlib:
Phần mềm DLIB có các Module sau
- Module bé sung và lưu chiễu: Cán bộ TVQG cỏ thể tạo các đơn đặt
và đơn nhận dé kiểm soát việc thu nhận lưu chiều và bổ sung tài liệu, có thể
tự tạo các worsheet riêng cho từng bộ phân Thể hiện được nhiều trạng thái
biên mục như: chờ biên mục, đang biên mục, đã duyệt, không duyệt, thuận
tiên cho việc thông báo các công việc tiếp theo Chức năng này cũng cung
K51 Thông tin — Thư viện
Trang 34Khéa ledn tot nghi¢p Lê Thị Thủy
‘Tir chive nang nay có thể kiếm soát được lương tài liêu về thư viên, loại trùng
việc bổ sung thừa hoặc nộp lưu chiểu thiểu và in các báo cáo theo yêu cầu
- Module biên mục: Khả năng tìm kiểm theo nhiều tiêu chỉ đã trợ
giúp việc nhập thông tin tiếp tục từ biểu ghi từ phỏng Lưu chiều và BS sung,
thêm các thông tin phản ánh nội đúng của tài hệu như: từ khoá, phân loại,
tóm tat (những thông tin này sẽ giúp NIYL nhanh chóng tìm được tải liệu
thea một chủ để nhật định, nhanh chóng xác định được nội đụng phủ hợp
hay không
Chương trình tự phát sinh mã cutter thuận tiện cho việc in nhần kho
mở,
-_ Module quản lý bạn đọc: Quần lý các thông tin cá nhân và ảnh của
bạn đọc Từ đó có thể in ra các thông kê theo yêu cầu
- Module luu thong tai ligu (mượn trả): Quá trình lưu thông tài liệu
giữa thư viện và bạn dọc dược thực hiện trên 2 C8I2I là C81, bạn đọc va
CSDL thư mục Chương trình đã quản lý việc mượn đọc tại chỗ theo quy dinh cua TVQG
- Module quản lý xuất bản phẩm nhiều kỷ: Theo dõi việc nhận lưu
chiến hay đặt mua, thu nhận ấn phẩm định kì theo từng SỐ, theo ngày, tháng,
năm Quản lý các Ấn phẩm định kì hoặc không định kì,
Hỗ trợ nghiệp vụ đóng tập Quy định số đăng ký cá biệt cho tập;
Thống kô ấn phẩm nhận về là từ bổ sung hay lưu chiếu;
'từ việc xây dung mẫu phát hành, chương trình đã tự sinh số phát hành giúp cán bộ thư viện giảm thời gian lao động,
KSI Thong tin —
Trang 35
- Module quan lý kho: Quy định các cập cho kho tài liệu, có thể
chuyển đổi tài liệu giữa các kho,
Có thể thẳng kê, thanh lí tài liệu hốt nội dung phụo vụ;
Khi tải liêu được xếp lên kho và ở chế đô sẵn sang thỉ thông tin về tải
liệu mới xuất hiện trên chức năng Tra cứu trực tuyến OPAC,
Quần lý lượng lải liệu ra vàu kho Ta các báo cáo theo yêu cầu
- Module tra cứu liên thư vign qua céng Z39 50: Bạn đọc hoặc cán
bộ thư viện có thể tra cứu tải liệu tại các thư viện khác trên thể giới,
Giúp cán bộ thư viên giám thời gian biển mục và thống nhất biểu phi,
đặc biệt tài liệu ngoại Những sách ngoại được lấy theo định dạng biếu ghi
MARC 21 từ các thư viên lớn trên thế giới như thư viện Quốc hội Mỹ, thư viên Quốc gia Anh hay Pháp
- Module quén trị hệ thông: Chương trình quân trị người đùng, phân bào mật và thực hiện cáo chức năng sao lưu, hồi phục tài liệu
Cùng với sự phát triển của nội dung số là sự xuất hiện của cáo chuẩn
kẻm theo, trong đó có rất nhiều chuẩn cần được áp dụng như chuẩn về ngôn
ngữ, chuẩn mô tá đữ liệu, trao đổi đữ liệu
Chuẩn hiện đang được Thư viện áp dụng để biên mục tải liệu số là Dublin core
Dublin core 1a chuẩn đùng để mô tả nội dung của biểu ghi và đữ liệu
Nó đơn giản hơn MARC Fomai rất nhiều vì chí có 15 phần tử Mục dich
thiết kế metadata này là để sử đụng trên mạng internet, mô tả các tải liệu chuyên ngảnh trong các thư viện vả tài liệu tại các Website khác nhau Các
phần tử đữ liêu MARC và Dublin core có thể trao dỗi lẫn nhau theo một giản
đồ quy đinh khi hiển thị cho người dùng, Các phân tử này là:
1 Nhan dé (Title): tên gọi chính thức của tài liệu
2 Tác giả (Creator): tên của một hay một số tác giả chính
KSI Thong tin —
Trang 36Khéa ledn tot nghi¢p Lê Thị Thủy
„ Chi 48 (Subject): t8n cha 48 - d mục dùng để phân loại tài liệu
+ Mô ta (Description): m6 14 vắn tắt nội dung tải liệu
wa Xhà xuất bản (Publisher): tén gọi, nơi phát hành tải liệu
6, Tác giả phụ (Contributor): tên của những tác giả cộng tác
7 Ngày thang (Date): ngay tháng phát hảnh tải liệu
8 Loại (kiểu) tải liệu (Type): Kiểu tài liệu
9, Mô tả vật lý (Khổ mẫu)(Format): Thông tin về dạng vật lý
10 Dinh danh (Identificr): Thông tin định danh của tài liệu
11 Nguễn pốc (8ource): Thông tin về xuất xứ của tài liệu
12 Ngôn ngữ (Language}: Thông tin về ngôn ngữ
13 Lién két (Relation): Thông tin hiên kết của tải hệu
14 Bao quát (Coverage}: Thông tin liền quan điện bao quát
15 Bản quyền (Rights): Thông tin liên quan quyền tác giả
2.1.6 Giai đoạn thử nghiệm
Trude khi van hanh thal cdc công đoạn: scanning, biên mục tài liệu, tải tài liệu lên mạng, Thư viện sẽ thực hiện giai doạn thử nghiệm bằng cách
cho scan khoảng 10 đơn vị tai liệu với đủ các loại hình: sách, tạp chí, bản
thảo, lài liệu hành chính, tranh ảnh đủ các ngôn ngữ: Hán, Nôm, Anh,
Phản, Việt, và cho lưu trữ và vận hành thử trên Website để kiểm tra về chất
lượng Chất lượng dược đề cập ở đây bao gồm kích cỡ của hình ảnh, vẫn đề
xử lý chung, dạng tập tin, chiều sâu của bít, vùng sảng, vùng tối, giả trị âm
thanh, đô sáng, độ tương phản, độ phân giải, sự nhiễu, sự định hướng, tiếng
động, sự điều chỉnh kênh màu, sự mất văn ban, sự điều chỉnh hình ảnh, sựu
mắt đường truyền hay mắt hình ảnh, sự sối
ø động, chất lượng truy cập, hình
thức ngắn gon, rổ ràng của văn bản Dây là công việc vô cùng quan trong,
tránh những lỗi đã xảy ra và đảm bảo cho sản phẩm cuối cùng đạt chất lượng tốt nhất Với những dự án số hóa lớn thì giai đoạn thử nghiệm là võ củng cẦn
thiết Cần phải thử nghiệm và kiểm tra một cách kỹ lưỡng, đồng thời cần có
KSI Thong tin —