Giờ đây các tài liệu trong thư viện không chỉ đơn thuần là các tài liệu truyền thống như sách báo, tạp chí mà còn bao gồm các loại tài liệu dạng số như: Cơ sở dữ liệu CSDL trên mạng, đĩa
Trang 1PHẦN MỞ ĐẦU
1 Tính cấp thiết của đề tài
Ngày nay, nhân loại đang bước sang một kỷ nguyên mới kỷ nguyên của nền kinh tế thông tin và tri thức Cuộc cách mạng khoa học công nghệ đã tác động mạnh mẽ tới mọi hoạt động của đời sống xã hội trong đó có hoạt động Thông tin – Thư viện Đặc biệt, các thư viện trên thế giới đang có xu hướng tự động hóa nghiệp vụ hoặc chuyển sang các loại hình thư viện điện
tử, thư viện số nhằm đáp ứng kịp thời nhu cầu tri thức và thông tin không ngừng gia tăng nhanh chóng trong xã hội Giờ đây các tài liệu trong thư viện không chỉ đơn thuần là các tài liệu truyền thống như sách báo, tạp chí mà còn bao gồm các loại tài liệu dạng số như: Cơ sở dữ liệu (CSDL) trên mạng, đĩa
CD, DVD…Chính vì vậy mà công tác số hóa tài liệu và tổ chức khai thác nguồn tài liệu số được các thư viện đặc biệt quan tâm và coi đây là vấn đề quan trọng quyết định chất lượng và hiệu quả cung cấp thông tin tới người dùng tin
Thư viện Quốc gia Việt Nam là Thư viện trung tâm của cả nước, là thư viện đứng đầu trong hệ thống thư viện công cộng, đi đầu trong công tác
tự động hoá và ứng dụng những thành tựu của công nghệ thông tin vào hoạt động của mình, ngoài việc hoàn thiện cơ sở vật chất, trang thiết bị, tăng cường đào tạo đội ngũ cán bộ thì công tác số hóa tài liệu và tổ chức khai thác nguồn tài liệu số cũng là một vấn đề đang được Thư viện đặc biệt quan tâm nhằm nâng cao khả năng đáp ứng nhu cầu tin ngày càng tăng cao và đa dạng
Nhận thấy được tầm quan trọng đó tôi đã quyết định chọn đề tài: “Số hóa tài liệu và tổ chức khai thác nguồn tài liệu số tại Thư viện Quốc gia Việt Nam” làm đề tài nghiên cứu của khóa luận nhằm tìm hiểu và bổ sung những kiến thức thực tế cho bản thân và góp một phần nhỏ bé vào việc tìm ra giải pháp nhằm nâng cao hiệu quả của công tác số hóa tài liệu và tổ chức khai
Trang 2dục, đào tạo và các nhu cầu khác của người dùng tin góp phần vào sự nghiệp
Công nghiệp hóa – Hiện đại hóa đất nước
2 Mục đích và nhiệm vụ nghiên cứu của đề tài
2.1 Mục đích nghiên cứu
Mục đích nghiên cứu của đề tài là khảo sát thực trạng công tác số hóa tài liệu và tổ chức khai thác nguồn tài liệu số tại Thư viện Quốc gia Việt Nam Qua việc khảo sát đề tài sẽ phân tích, đánh giá, đưa ra một số nhận xét
và đề xuất giải pháp nhằm nâng cao hiệu quả cho công tác số hóa tài liệu và
tổ chức khai thác nguồn tài liệu số tại Thư viện Quốc gia Việt Nam
2.2 Nhiệm vụ nghiên cứu
Để giải quyết được mục đích đề ra, nhiệm vụ của khóa luận là:
- Nêu được vị trí và vai trò của nguồn tài liệu số đối với sự phát triển của Thư viện Quốc gia Việt Nam
- Khảo sát thực trạng công tác số hóa tài liệu và tổ chức khai thác nguồn tài liệu số tại Thư viện Quốc gia Việt Nam
- Nhận xét, đánh giá và đề xuất giải pháp nhằm nâng cao hiệu quả công tác số hóa tài liệu và tổ chức khai thác nguồn tài liệu số tại Thư viện Quốc gia Việt Nam
3 Tình hình nghiên cứu theo hướng đề tài
Cho đến nay đã có rất nhiều tác giả quan tâm nghiên cứu và tìm hiểu
về Thư viện Quốc gia Việt Nam với các đề tài như:
- “Nghiên cứu hoạt động tra cứu thông tin tại Thư viện Quốc gia Việt Nam trong thời kỳ Công nghiệp hóa – Hiện đại hóa đất nước” của Nguyễn Thị Hoài Thu, khóa luận tốt nghiệp năm 2001
- “Công tác bảo quản vốn tài liệu ở Thư viện Quốc gia Việt Nam” của Ngô Thị Hằng Nga, khóa luận tốt nghiệp năm 2004
- “Thực trạng và giải pháp nâng cao hiệu quả hoạt động lưu chiểu ở Thư viện Quốc gia Việt Nam” của Nguyễn Thị Hảo, khóa luận tốt nghiệp năm 2004
Trang 3- “Lịch sử phân loại tài liệu tại Thư viện Quốc gia Việt Nam” của Vũ Quỳnh Nhung, khóa luận tốt nghiệp năm 2005
- “Công tác phát triển vốn tài liệu của Thư viện Quốc gia Việt Nam” của Nguyễn Thị Thu Hiền, khóa luận tốt nghiệp năm 2006
- “Tìm hiểu công tác tổ chức và phục vụ kho mở tại Thư viện Quốc gia Việt Nam” của Nguyễn Thị Thảo Hà, khóa luận tốt nghiệp năm 2008
- “Công tác tổ chức và bảo quản vốn tài liệu quý hiếm tại Thư viện Quốc gia Việt Nam” của Nghiêm Thị Bình, khóa luận tốt nghiệp năm 2008
Ngoài ra còn nhiều đề tài khác về Thư viện Quốc gia Việt Nam như: Nguồn nhân lực tại Thư viện Quốc gia Việt Nam, tìm hiểu công tác xây
dựng và phát triển vốn tài liệu…
Tuy nhiên, đề tài về công tác số hóa tài liệu và tổ chức khai thác nguồn tài liệu số tại Thư viện Quốc gia Việt Nam thì chưa được nghiên cứu sâu và hoàn chỉnh Vì vậy, tôi đã quyết định chọn đề tài này nhằm tìm hiểu thực trạng công tác số hóa tài liệu và tổ chức khai thác nguồn tài liệu số của Thư viện và vận dụng những kiến thức đã học từ nhà trường áp dụng vào một số hoạt động của Thư viện Từ đó, đề xuất những giải pháp nhằm nâng cao hiệu quả công tác số hóa tài liệu và tổ chức khai thác nguồn tài liệu số tại Thư viện Quốc gia Việt Nam
4 Đối tượng và phạm vi nghiên cứu
- Đối tượng nghiên cứu chính của đề tài được xác định là công tác số hóa tài liệu và tổ chức khai thác nguồn tài liệu số
- Phạm vi nghiên cứu của đề tài được giới hạn về mặt không gian và thời gian là: “Công tác số hóa tài liệu và tổ chức khai thác nguồn tài liệu số tại Thư viện Quốc gia Việt Nam trong giai đoạn hiện nay”
5 Cơ sở lý luận và phương pháp nghiên cứu
Cơ sở lý luận:
- Khóa luận được viết trên cơ sở phương pháp luận của chủ nghĩa duy
Trang 4Phương pháp nghiên cứu:
Để hoàn thành đề tài tôi đã sử dụng một số phương pháp nghiên cứu sau:
- Phương pháp điều tra, khảo sát thực tế
- Phương pháp trao đổi với cán bộ thư viện và phỏng vấn người dùng tin
- Phương pháp thống kê
- Phương pháp thu thập, phân tích, tổng hợp tài liệu liên quan
6 Ý nghĩa khoa học của đề tài
- Về lý luận: Khóa luận làm rõ nội hàm các khái niệm liên quan đến tài liệu số: số hóa tài liệu, thư viện số, tài liệu số, ; Tầm quan trọng của công tác số hóa tài liệu và tổ chức khai thác nguồn tài liệu số đối với thư viện
- Về thực tiễn: Đưa ra một số nhận xét và đề xuất giải pháp phù hợp nhằm nâng cao hiệu quả công tác số hóa tài liệu và tổ chức khai thác nguồn tài liệu số tại Thư viện Quốc gia Việt Nam
7 Kết cấu của khóa luận
Ngoài phần mở đầu, kết luận, danh mục tài liệu tham khảo, danh mục
từ viết tắt, phụ lục thì bố cục chính của khóa luận được chia thành 3 chương:
Chương 1: Thư viện Quốc gia Việt Nam và những vấn đề chung về tài liệu số
Chương 2: Thực trạng số hóa tài liệu và tổ chức khai thác nguồn tài liệu số tại Thư viện Quốc gia Việt Nam
Chương 3: Một số nhận xét và giải pháp nhằm nâng cao hiệu quả cho công tác số hóa tài liệu và tổ chức khai thác nguồn tài liệu số tại Thư viện Quốc gia Việt Nam
Trang 5PHẦN NỘI DUNG
CHƯƠNG 1 THƯ VIỆN QUỐC GIA VIỆT NAM VÀ NHỮNG VẤN ĐỀ CHUNG VỀ TÀI LIỆU SỐ
Khái quát về Thư viện Quốc gia Việt Nam 1.1.1 Quá trình hình thành và phát triển
Tiền thân của Thư viện Quốc gia Việt Nam (TVQGVN) là Thư viện Trung ương Đông Dương trực thuộc Nha lưu trữ và Thư viện Đông Dương, được thành lập theo Nghị Định của toàn quyền Pháp Anbe Xarô (Alert Sarraut) ký ngày 29/11/1917 Trụ sở Nha đặt tại đường Boocnhi Đêboocđơ (Borguis Deborders) Hà Nội, mà trước đó là khu vực trường thi tuyển chọn nhân tài thời phong kiến rồi đến trụ sở Nha Kinh lược Bắc Kỳ, nay là số 31 phố Tràng Thi
Sau gần hai năm chuẩn bị, ngày 01/09/1919 Thư viện chính thức mở cửa phục vụ bạn đọc
Ngày 28/02/1935, Thư viện Trung ương Đông Dương đổi tên là Thư viện Pie Patxkiê (Pierre Pasquier), tên một viên Toàn quyền có nhiều đóng góp cho Thư viện Cách mạng tháng Tám năm 1945 thành công, Chính phủ lâm thời Việt Nam Dân chủ Cộng hòa quyết định đổi tên Thư viện Pie Patxkie (Pierre Pasquire) thành Quốc gia Thư viện
Tháng 02/1947 Pháp chiếm lại Hà Nội Thư viện lại được đổi tên thành Thư viện Trung ương trực thuộc Phủ cao ủy Pháp tại Sài Gòn
Năm 1953, Thư viện Trung ương sát nhập vào Viện Đại học Hà Nội
và đổi tên là Tổng Thư viện Hà Nội Giữa năm 1954, trước khi rút chạy khỏi miền Bắc, thực dân Pháp đã đưa một phần kho sách của Tổng Thư viện vào Sài Gòn
Trang 6Đến tháng 10/1954, Chính phủ Việt Nam Dân chủ Cộng hòa tiếp quản
Hà Nội, tiếp quản thư viện, trên văn bản mang tên là Thư viện Trung ương từ
Bộ Giáo dục sang Bộ Tuyên truyền (sau là Bộ Văn hóa)
Ngày 29/06/1957, Thủ tướng Chính phủ Việt Nam cho phép đổi tên Thư viện thành Thư viện Quốc gia Việt Nam
Ngày 28/11/1958, Thư viện chính thức mang tên Thư viện Quốc gia
do Bộ trưởng Bộ Văn hóa quyết định
Năm 1982, TVQGVN được Thư viện Liên hiệp quốc công nhận là
Thư viện tàng trữ tài liệu Liên Hiệp Quốc của khu vực Đông Dương
Năm 2000, Thư viện Quốc gia chính thức gia nhập Hiệp hội Thư viện Quốc tế IFLA (International Federation of Library Association and Institution)
Thư viện Quốc gia với bề dày hơn 90 năm xây dựng và phát triển, qua nhiều giai đoạn lịch sử, từ Thư viện Trung ương đến Thư viện Quốc gia, bao giờ cũng là Thư viện hàng đầu của nước ta Nó chính là Thư viện Khoa học
Tổng hợp lớn nhất trong cả nước, là Thư viện đứng đầu trong Hệ thống Thư viện Công cộng nhà nước, là Thư viện tiêu biểu cho nền văn hóa của dân tộc,
là trung tâm giao lưu các mối quan hệ giữa các Hệ thống Thư viện trong cả nước và quan hệ quốc tế
1.1.2 Đội ngũ cán bộ Thƣ viện Quốc gia Việt Nam
Như chúng ta đã biết, cán bộ thư viện là linh hồn của thư viện Trong
hệ thống giao tiếp “Tài liệu – Thư viện – Người sử dụng”, cán bộ thư viện là yếu tố cực kỳ quan trọng, vai trò của họ rất lớn Nhiệm vụ của người cán bộ rất phức tạp
Trong mối quan hệ với tài liệu, cán bộ thư viện là người lựa chọn, xử
lý, bảo quản, sắp xếp chúng theo một trật tự nhất định, giới thiệu chúng với người sử dụng thư viện
Trang 7Trong mối quan hệ với cơ sở vật chất – kỹ thuật, cán bộ thư viện tiến hành trang bị chuyên biệt cho các diện tích và luôn luôn giữ cho cơ sở vật chất – kỹ thuật ở tình trạng tốt nhất
Trong mối quan hệ với bạn đọc, cán bộ thư viện là người môi giới giữa sách và người đọc, là người tổ chức mối quan hệ giữa sách và người đọc, làm trung gian giữa bạn đọc với bạn đọc, họ không chỉ tuyên truyền giới thiệu một cách tích cực tài liệu mà còn nghiên cứu nhu cầu đọc, hướng dẫn đọc phù hợp với nhu cầu, đồng thời tạo ra các dịch vụ thỏa mãn các nhu cầu
đó Cán bộ thư viện là người tổ chức, tạo điều kiện tối ưu cho việc phối hợp thành công mối quan hệ giữa con người với thông tin, làm cho việc khai thác, sử dụng thông tin có hiệu quả, làm tăng giá trị thông tin
Như vậy, cán bộ thư viện không chỉ là cầu nối giữa sách và bạn đọc
mà còn là cầu nối tài liệu với tài liệu, tài liệu với cơ sở vật chất – kỹ thuật, cơ
sở vật chất – kỹ thuật với người đọc
Theo số liệu thống kê về số lượng cán bộ tại TVQGVN năm 2010 có tới 176 người Họ là những người cán bộ có trình độ về chuyên môn, nghiệp
vụ, ngoại ngữ, tin học có khả năng đáp ứng tốt yêu cầu, nhiệm vụ phát triển của Thư viện Trong 176 cán bộ có: 1 cán bộ trình độ tiến sỹ, gần 20 cán bộ trình độ thạc sỹ, 70% cán bộ có trình độ đại học
Số lượng cán bộ cụ thể ở các phòng ban như sau:
- Phòng Thông tin – tư liệu: 8 cán bộ
- Phòng Nghiên cứu khoa học: 5 cán bộ
- Phòng Quan hệ quốc tế: 4 cán bộ
Trang 8Ngoài ra còn có 1Giám đốc và 3 Phó Giám đốc cùng các phòng ban
chức năng khác nhau nữa
1.2 Tầm quan trọng của nguồn tài liệu số đối với sự phát triển của Thƣ viện Quốc gia Việt Nam
1.2.1 Một số khái niệm chung
Ngày nay, chúng ta đang sống trong kỷ nguyên của sự bùng nổ thông
tin Trong thời gian gần đây có rất nhiều những khái niệm mới được dùng
trong sách, báo, trên internet như thư viện điện tử, thư viện số, tài liệu điện
tử, tài liệu số, số hóa…Các khái niệm này hiện nay đang được dùng chưa
hoàn toàn thống nhất, do vậy, trong khóa luận cần làm rõ nội hàm các khái
niệm này
- Thư viện điện tử (TVĐT):
Khái niệm về thư viện điện tử được định nghĩa như sau: “Một hệ
thống thông tin trong đó các nguồn thông tin đều có sẵn dưới dạng có thể xử
lý được bằng máy tính và trong đó tất cả các chức năng bổ sung, lưu trữ, bảo
quản, tìm kiếm, truy cập và hiển thị đều sử dụng công nghệ thông tin”
Sự xuất hiện khái niệm này có liên quan trực tiếp tới sự bùng nổ thông
tin trên Internet và Web mang lại Khái niệm này đang được các chuyên gia
công nghệ thông tin sử dụng để chỉ toàn bộ hệ thống bất kể có dựa trên một
thư viện truyền thống hay không Môi trường kỹ thuật Internet hiện nay thậm
chí cho phép một số người coi toàn thể nguồn thông tin trên mạng một lúc
nào đó như một thư viện số ảo toàn cầu mà độc giả là toàn thể những người
sử dụng mạng trên hành tinh và các công cụ tìm tin, sự hiện diện của Web
bảo đảm các chức năng thư mục cho thư viện đó Tuy nhiên sự khác biệt
giữa Thư viện điện tử, Thư viện số với kho thông tin khổng lồ trên Internet
đó là World Wide Web (www) thiếu hẳn những đặc điểm quan trọng của
việc sưu tầm có chọn lọc và tổ chức thông tin chặt chẽ như trong thư viện
điện tử và thư viện số
Trang 9Thư viện điện tử cũng có thể hiểu theo nghĩa tổng quát: Là một loại hình thư viện đã tin học hóa toàn bộ hoặc một số dịch vụ thư viện; Là nơi người sử dụng có thể tới để tra cứu, sử dụng các dịch vụ thường làm như với
một thư viện truyền thống nhưng đã được tin học hóa Nguồn lực của Thư
viện điện tử bao gồm cả tài liệu in giấy và tài liệu đã được số hóa
tạo, thúc đẩy và mở rộng các dịch vụ thông tin của các thư viện truyền thống
chứa các tài liệu trên giấy và các vật mang tin khác vẫn làm như thu thập, biên mục, tìm kiếm, phân phát thông tin Một dịch vụ thư viện số đầy đủ trọn
vẹn phải bao gồm đảm bảo có cả các dịch vụ chính yếu của các thư viện truyền thống và khai thác tối đa các ích lợi của công nghệ lưu trữ số, tìm
kiếm thông tin số và truyền thông số”
Tựu chung lại, các thư viện số với mục đích đạt được các yêu cầu cao
của xã hội đều phải:
- Phục vụ một cách lý tưởng một cộng đồng hay một tập hợp cộng đồng người dùng tin xác định nào đó
- Không phải là một thực thể đơn độc
- Được cấu tạo bởi cấu trúc thống nhất, logic và tổ chức
- Kết hợp giữa việc học tập, giáo dục với quá trình truy cập
- Tận dụng tối đa yếu tố con người (cán bộ thư viện) cũng như các yếu
Trang 10- Tạo sự truy cập thông tin nhanh chóng và hiệu quả cùng với một loạt các phương thức truy cập đa dạng, đa chiều
- Cung cấp truy cập miễn phí (có thể đối với một cộng đồng người dùng tin xác định)
- Sở hữu và quản lý, kiểm soát được các nguồn tài nguyên thông tin
của mình (cũng có thể phải mua ở bên ngoài)
- Có một tập hợp nguồn tài nguyên thông tin với các đặc điểm sau: + Lớn và ổn định
+ Được tổ chức và quản trị tốt
+ Có nhiều khổ mẫu và khuôn dạng khác nhau…
- Tài liệu điện tử:
Hiện nay khái niệm về tài liệu điện tử ở Việt nam vẫn còn rất mơ hồ, chưa có một khái niệm rõ ràng
Có thể xem tài liệu điện tử là tài liệu được trình bày và lưu trữ trên các vật mang tin điện tử và có thể truy cập được thông qua hệ thống máy tính điện tử và mạng máy tính Các vật mang tin ở đây có thể là băng từ, đĩa từ, các bộ phận lưu trữ thông tin của máy tính
Sự ra đời của tài liệu điện tử là kết quả tất yếu của bùng nổ thông tin
Từ định nghĩa trên cho thấy, TLS được xây dựng thông qua hai kênh:
- Kênh 1: Tạo lập tài liệu gốc bằng máy tính thông qua việc xử
lý các file văn bản, hình ảnh, bảng biểu,…
Trang 11- Kênh 2: Tạo lập TLS thông qua hình thức chuyển đổi định dạng các tài liệu đã được tạo lập ở dạng khác như (Scan, ghi âm,…)
Tóm lại có thể hiểu TLS là tất cả những tài liệu được trình bày dưới dạng số mà máy tính có thể đọc được
Như vậy tài liệu số và tài liệu điện tử có thể xem như là hai khái niệm
có cùng nội hàm và có thể được dùng thay thế cho nhau
- Số hóa:
Thư viện Trường Đại học Cornell định nghĩa số hóa: “là quá trình tỷ biến các tài liệu in ấn trên giấy được chuyển sang dạng số, cho phép các trang thiết bị như máy tính để đọc, máy quét hình phẳng, camera số, camera động và một loạt các thiết bị khác được sử dụng để số hóa tài liệu”
Tóm lại: Số hóa là tiến trình chuyển tài liệu thư viện truyền thống, cụ
thể là sách và văn bản sang dạng điện tử và lưu trữ trên máy tính
- Siêu dữ liệu: (tiếng Anh “METADATA”):
Để mô tả tài nguyên thông tin số người ta dùng siêu dữ liệu (Metadata) Thuật ngữ “meta” xuất xứ là một từ Hy Lạp để chỉ một cái gì đó
có bản chất cơ bản hoặc cao hơn Vì vậy có thể hiểu “metadata” là dữ liệu về
dữ liệu và được sử dụng thông thường nhất để mô tả tài nguyên thông tin trên web
Theo tiến sỹ Warwick Cathro, “siêu dữ liệu là những thành phần mô tả tài nguyên thông tin hoặc hỗ trợ thông tin truy cập đến tài nguyên thông tin” Siêu dữ liệu được xác định là “dữ liệu mô tả các thuộc tính của đối tượng thông tin và trao cho các thuộc tính này ý nghĩa, khung cảnh và tổ chức Siêu
dữ liệu còn có thể định nghĩa là dữ liệu có cấu trúc về dữ liệu” Gail Hodge định nghĩa siêu dữ liệu là “thông tin có cấu trúc mà nó mô tả, giải thích, định
vị, hoặc làm cho nguồn tin trở nên dễ tìm kiếm, sử dụng và quản lý hơn Siêu
dữ liệu được hiểu là dữ liệu về dữ liệu hoặc thông tin về thông tin”
Trang 12Theo Dempsey và Heery, 1997: “siêu dữ liệu là dữ liệu đi kèm với đối
tượng thông tin và nó cho phép những người sử dụng tiềm năng có thể biết
trước sự tồn tại cũng như đặc điểm của đối tượng thông tin này”
Nói tóm lại, siêu dữ liệu là thông tin mô tả tài nguyên thông tin
1.2 2 Vai trò, vị trí của nguồn tài liệu số đối với sự phát triển của Thƣ viện Quốc gia Việt Nam
- Tài liệu số trong thư viện chính là di sản văn hóa của dân tộc Bởi
cũng giống như các loại tài liệu truyền thống khác tài liệu số lưu giữ, truyền
bá và bảo quản những giá trị văn hóa truyền thống của nhân loại từ đời này
qua đời khác Đồng thời nó còn là cơ sở quan trọng để phục vụ bạn đọc;
phục vụ các nhiệm vụ kinh tế, chính trị, văn hóa, xã hội…của đất nước
- Xây dựng và tổ chức khai thác nguồn tài liệu số sẽ tạo khả năng truy
cập và bảo quản thông tin cho thư viện từ đó nâng cao hiệu quả hoạt động
của thư viện và rồi người sử dụng sẽ trở nên năng động hơn trong việc tìm
kiếm thông tin bởi bởi khả năng truy cập nhanh chóng và dễ dàng bằng cách
sử dụng các tiện ích tìm kiếm của máy tính điện tử
- Tài liệu số giúp thư viện tăng tính linh hoạt và khả năng đáp ứng nhu
cầu thông tin thể hiện ở chỗ một bản tài liệu số có thể cùng lúc phục vụ cho
nhiều đối tượng khác nhau, không phụ thuộc vào số lượng người dùng, thời
gian và vị trí địa lý của người học Từ đó họ chủ động trong việc sắp xếp
thời gian học tập, họ có thể lấy được tài liệu qua hệ thống mạng thông tin ở
mọi lúc, mọi nơi
- Tiết kiệm thời gian và kinh phí: Thư viện đỡ tốn kinh phí xây dựng
kho tàng, kinh phí bổ sung tài liệu, bảo quản và kinh phí trả lương cho người
phục vụ Hơn thế nữa là giúp cho người dùng tin được dễ dàng thuận tiện,
tiết kiệm được thời gian, tiền bạc trong việc tìm thông tin Họ có thể ngồi
ngay tại nhà hay phòng làm việc cũng có thể truy cập được tài liệu từ khắp
nơi trên thế giới
Trang 13- Đối với công tác bảo quản trong thư viện thì nó giúp bảo quản được phiên bản gốc của tài liệu, giữ gìn và tăng tuổi thọ của tài liệu quý hiếm bằng việc giảm hao mòn, rách nát do quá trình tiếp xúc trực tiếp với tài liệu của người sử dụng TLS ngăn chặn những rủi ro hủy hoại do thời gian, thiên tai, khí hậu và tần suất sử dụng
- Nguồn tài liệu số giúp thư viện mở rộng đối tượng phục vụ: Phạm vi phục vụ các tài liệu của thư viện không bị bó hẹp trong khuôn viên của thư viện mà nó vươn tới các vị trí địa lý khác như tại nhà, tại trường, tại nơi làm việc Tài liệu số tạo ra môi trường và cơ hội bình đẳng rộng mở cho tất cả mọi người đều có cơ hội sử dụng nguồn tài liệu học tập bởi nguồn tài liệu số không bị giới hạn về không gian và thời gian Loại bỏ khoảng cách tri thức giữa người giàu và người nghèo, giữa thành thị và nông thôn, giữa các quốc gia
- Tài liệu số giúp thư viện tăng khả năng đa truy cập cho phép người dùng có thể tra tìm tài liệu đồng thời theo nhiều dấu hiệu khác nhau Ví dụ như tìm theo các yếu tố mô tả thư mục với các toán tử tìm được xây dựng dựa trên các toán tử Boole, các toán tử thu gon, mở rộng, tìm theo các liên kết tới các nguồn tham khảo, trích dẫn Điều này cho phép người dùng tin có thể mở rộng hay thu hẹp phạm vi tìm kiếm, rút ngắn thời gian và giảm thiểu nhiễu tin
- Tuyên truyền, phổ biến các tài liệu của nước ta với thế giới Tài liệu
số được lưu giữ trên hệ thống máy tính do đó bạn đọc dù ở bất cứ đâu, không gian và khoảng cách như thế nào thì cũng có thể tiếp cận tới nguồn tài liệu của thư viện thông qua máy tính kết nối mạng internet hay intranet
1.3 Nguồn tài liệu số trong cơ cấu vốn tài liệu của Thƣ viện Quốc gia Việt Nam
Thư viện Quốc gia Việt Nam là một trong những thư viện có nguồn lớn trong cả nước Trong đó, bên cạnh nguồn TLS mua từ bên ngoài,
Trang 14các nguồn TLS do Thư viện tạo lập cũng rất phong phú về nội dung và đa dạng về hình thức Trong phạm vi đề tài này, tác giả phân chia chúng thành hai loại CSDL chính là CSDL thư mục và CSDL toàn văn
1.3.1 Cơ sở dữ liệu thƣ mục
Các CSDL thư mục là một trong những nguồn tài liệu số lớn nhất hiện
có của Thư viện, chúng đóng vai trò quan trọng giúp người dùng tin có thể tiếp cận tới nguồn tài nguyên truyền thống quý báu với hàng triệu bản mà Thư viện đang sở hữu Các cơ sở dữ liệu này bao gồm:
- CSDL Báo, tạp chí các ngôn ngữ: 6.272 biểu ghi
- CSDL Báo, tạp chí nghiên cứu các ngôn ngữ nhập về thư viện trước năm 1954: 1.718 biểu ghi
- CSDL Luận án tiến sỹ: 13.762 biểu ghi
- CSDL Bài trích từ hơn 60 tạp chí: 50.130 biểu ghi
1.3.2 Cơ sở dữ liệu toàn văn
Là loại hình CSDL rất được chú ý trên thế giới nhưng mới chỉ xuất hiện trong hệ thống thư viện công cộng trong những năm gần đây với số
Trang 15lượng không nhiều Hiện tại ở TVQGVN có hai loại CSDL toàn văn chủ yếu là: CSDL toàn văn do TVQGVN tạo lập và CSDL toàn văn mua từ bên
ngoài
1.3.2.1 C ơ sở dữ liệu toàn văn do Thƣ viện Quốc gia Việt Nam tạo lập
- Luận án tiến sỹ
Thư viện Quốc gia là cơ quan duy nhất thu nhận các bản luận án tiến
sĩ trực tiếp từ các tác giả Việt Nam bảo vệ trong và ngoài nước và của các tác giả nước ngoài bảo vệ tại Việt Nam Đây là kho tài liệu quý và đặc biệt của thư viện Hiện tại Thư viện đã số hóa 6.402 bản tóm tắt tiếng Việt (172.002 trang) và gần 9.356 bản toàn văn (khoảng 1.812.000 trang)
có giá trị cao Kho sách này phản ánh xác thực các mặt trong đời sống xã hội, lịch sử, giáo dục, khoa học địa lý của Việt Nam trong suốt tiến trình lịch
sử Do thời gian, khí hậu, sự hạn chế về cơ sở vật chất, kỹ thuật bảo quản nên kho sách đang dần bị xuống cấp và hư hại
Trang 16
Tài liệu Hán Nôm gốc
- Bộ sưu tập số: sách, báo Đông Dương
Sách Đông Dương: Bao gồm sách tiếng Pháp và tiếng Việt xuất bản ở Đông Dương, viết về Đông Dương và Việt Nam Đây là hợp đồng giữa Thư viện Quốc gia và Chính phủ Pháp từ dự án Valease: “Tổ chức và thực hiện chương trình số hóa tài liệu tiếng Pháp thuộc vốn di sản cổ đã được công nhận ở Việt Nam và Đông Dương” Thư viện Quốc gia đã tạo lập Ebook các
tài liệu viết về Việt Nam trước năm 1932 CSDL hiện có 758 tên sách,
89.512 trang, 175 bản đồ, trọn bộ tạp chí: Nam Phong; Tri Tân
- Bộ sưu tập số: Thăng Long – Hà Nội:
Bao gồm:
- Bản đồ cổ Hà Nội và vùng phụ cận
- Sách báo xuất bản sau năm 1954
- Sách báo xuất bản trước năm 1954
- Sách Hán - Nôm cổ
- Luận án tiến sỹ về Hà Nội
Có thể nói, Thư viện Quốc Gia Việt Nam đã thu thập, lưu trữ tương đối đầy đủ bộ sưu tập tư liệu về dân tộc xưa và nay hết sức quý hiếm, trong
đó có tài liệu về Thăng Long – Hà Nội Đặc biệt, bộ sưu tập bản đồ cổ Hà
Trang 17Nội và vùng phụ cận mà Thư viện Quốc gia trưng bày gồm 55 bản đồ, có niên đại khác nhau từ năm 1873 đến năm 1965 Các bản đồ được phục chế
và số hoá trong khuôn khổ Quỹ đoàn kết ưu tiên phát huy hệ thống thư tịch
cổ của các nước Đông Nam Á đã cho thấy sự thay đổi đô thị của Thủ đô Việt Nam trải qua trong hơn một thế kỷ
Bản đồ Thành phố Hà Nội năm 1873 Bản đồ Hà Nội năm 1945
Những tài liệu trong bộ sưu tập mang những giá trị lịch sử và văn hóa được lựa chọn để chuyển dạng số nằm trong 5 kho tài liệu quý của Thư viện Quốc gia Việt Nam được xuất bản từ thế kỷ XVII đến nay, đang được lưu trữ tại các kho: sách, báo - tạp chí, bản đồ Đông Dương, kho Hán Nôm và Luận
án Tiến sỹ cùng với một số tài liệu của Nhà xuất bản Hà Nội mới phát hành trong Dự án Hành trình tìm kiếm Di sản văn hiến Thăng Long – Hà Nội, và của Viện Nghiên cứu Hán Nôm Bộ sưu tập này sẽ được cập nhật thường xuyên nhằm cung cấp thêm tư liệu quý về Thăng Long – Hà Nội nghìn năm văn hiến
- Bộ sưu tập số: Sách tiếng Anh về Việt Nam
Thuộc Dự án CONSAL: 92.520 trang (338 cuốn)
Trang 181.3.2.2 C ơ sở dữ liệu toàn văn bổ sung từ bên ngoài
160 chuyên ngành, lĩnh vực: Quản trị kinh doanh, Tài chính, Thương mại, Ngân hàng, Kế toán, …
Trang 19Wilson cung cấp truy cập toàn văn, thông tin tóm tắt, trích dẫn, hình ảnh từ 11 cơ sở dữ liệu con với khoảng 4.000 tạp chí điện tử có phạm vi thông tin từ năm 1982 – nay:
+ Wilson Applied Science and Technology Full Text
+ Wilson Art Full Text
+ Wilson Business Full Text
+ Education Full Text
+ Humanities Full Text
+ Social science Full Text
+ Index to legal Periodicals Full Text
1.4 Đặc điểm nhu cầu tin và người dùng tin tại Thư viện Quốc gia Việt Nam
1.4 1 Đặc điểm người dùng tin
Người dùng tin là đối tượng phục vụ của bất kỳ một cơ quan thông tin – thư viện nào Người dùng tin là người sử dụng thông tin đồng thời là người sáng tạo và làm giàu nguồn tin Thỏa mãn nhu cầu tin cho người dùng tin cũng đồng nghĩa với việc phát triển nguồn tin của thư viện Sự thỏa mãn nhu cầu tin cho người dùng tin chính là cơ sở để đánh giá chất lượng hoạt động thông tin trong thư viện
Hiện nay, người dùng tin của Thư viện Quốc gia phát triển nhanh chóng cả về số lượng và thành phần Trình độ của người dùng tin có nhiều cấp độ khác nhau Đối tượng người dùng tin mà thư viện hướng tới là các nhà quản lý, lãnh đạo các cấp, các ngành; cán bộ giảng dạy ở các trường đại học, cao đẳng, trung học chuyên nghiệp, các trường phổ thông; cán bộ công tác tại các đơn vị hành chính, sự nghiệp và sản xuất kinh doanh; sinh viên các trường đại học, cao đẳng (Trước đây Thư viện chỉ làm thẻ đọc cho sinh viên năm thứ 3, 4, nay Thư viện đã mở rộng đối tượng là sinh viên năm thứ
Trang 202) Qua khảo sát thực tế tôi chia đối tượng người dùng tin của TVQGVN thành 3 nhóm chính sau:
1.4 2 Đặc điểm nhu cầu tin
Cuộc cách mạng khoa học công nghệ đang diễn ra một cách mạnh mẽ trên toàn thế giới Nhiều thành tựu khoa học mới ra đời đã tạo nên một hiện tượng “bùng nổ thông tin” Lượng thông tin trong xã hội vô cùng phong phú
và đa dạng Cũng từ đây thông tin trở thành động lực cho sự phát triển của xã hội Nhu cầu thông tin ngày càng lớn và trở nên cấp thiết hơn bao giờ hết Nhu cầu tin chính là đòi hỏi khách quan của con người đối với việc tiếp nhận
và xử lý thông tin để duy trì và phát triển sự sống Nhu cầu tin xuất phát từ nhu cầu nhận thức của của con người tăng lên cùng với sự gia tăng các mối quan hệ trong xã hội và mang tính chất chu kỳ Nếu nhu cầu tin được thỏa mãn kịp thời, chính xác thì nhu cầu tin sẽ ngày càng được phát triển Ngược lại, nếu nhu cầu tin không thỏa mãn thường xuyên thì nhu cầu tin sẽ bị triệt tiêu Càng thỏa mãn ở mức độ cao bao nhiêu thì chu kỳ càng được rút ngắn bấy nhiêu
Dưới đây là nhu cầu tin của các nhóm người dùng tin tại Thư viện Quốc gia Việt Nam
1.4.2.1 Nhu cầu tin của cán bộ quản lý, lãnh đạo
Đây là nhóm người dùng tin chiếm số lượng rất ít (khoảng 5%) song
họ lại là nhóm người dùng tin rất quan trọng của Thư viện Đáp ứng nhu cầu tin của họ là việc mà thư viện hết sức quan tâm Bởi lẽ họ là những người
Trang 21đưa ra các quyết định mang tính chiến lược và sách lược ở tầm vĩ mô hay vi
mô có ảnh hưởng trực tiếp đến sự phát triển của xã hội; họ có thể là những người xây dựng, phác thảo đường lối, chính sách của Đảng và Nhà nước, của các bộ, các ngành, các đơn vị sản xuất kinh doanh Ngoài công tác quản lý, một số cán bộ còn trực tiếp tham gia nghiên cứu khoa học Do đó, nhu cầu tin của họ rất đa dạng, phong phú và đòi hỏi tính kịp thời, đầy đủ và chính xác cao Thông tin phải vừa rộng đồng thời cũng phải mang tính chuyên sâu, bảo mật và hệ thống
1.4.2.2 Nhu cầu tin của cán bộ nghiên cứu, giảng dạy, cán bộ trong các đơn vị hành chính, sự nghiệp và sản xuất kinh doanh
Nhóm người dùng tin này chiếm tỷ lệ khá nhiều tại Thư viện (khoảng
27%) Họ có nhu cầu tài liệu khá cao Thông tin họ cần vừa mang tính tổng hợp lại vừa mang tính chuyên sâu Nhóm người dùng tin này có khả năng sử dụng mọi loại hình tài liệu cả truyền thống lẫn hiện đại Tài liệu họ cần thường là những tài liệu quý hiếm; tài liệu xám, tài liệu đã được số hóa; các tài liệu chuyên sâu về một ngành, một lĩnh vực cụ thể mà họ quan tâm
1.4.2.3 Nhu cầu tin của sinh viên năm thứ hai trở lên của các trường đại học và cao đẳng
Đây là nhóm người dùng tin chiếm tỷ lệ lớn nhất tại Thư viện (gần 70%) Nhu cầu tin của họ rất cao và đa dạng Họ mong muốn tham khảo tài liệu để mở rộng kiến thức Đặc biệt, các sinh viên năm cuối có nhu cầu tài liệu chuyên ngành rất cao như: giáo trình, tài liệu nghiên cứu, tài liệu chuyên ngành,…Bên cạnh tài liệu quốc văn, ngoại văn họ có nhu cầu sử dụng khá cao các nguồn tài liệu số của Thư viện
Như vậy việc nghiên cứu đặc điểm người dùng tin và nhu cầu tin tại Thư viện Quốc gia Việt Nam là giúp cho việc nhận dạng được nhu cầu thông tin và sử dụng các nguồn tài liệu số của họ, qua đó tìm ra những biện pháp
Trang 22phù hợp để đáp ứng đúng với nhu cầu Điều này khẳng định vai trò của Thư viện ngày càng nâng cao
Trang 23CHƯƠNG 2 THỰC TRẠNG SỐ HÓA TÀI LIỆU VÀ
TỔ CHỨC KHAI THÁC NGUỒN TÀI LIỆU SỐ TẠI THƯ VIỆN QUỐC GIA VIỆT NAM 2.1 Hoạt động số hóa tài liệu tại Thư viện Quốc gia Việt Nam
Công tác số hóa tài liệu là bước đầu tiên của quá trình xây dựng bộ sưu tập số Quá trình này quyết định đến:
- Định dạng của TLS (Dạng text, dạng ảnh và dạng đa phương tiện)
- Chất lượng của TLS nói riêng và bộ sưu tập số nói chung
- Sự đa dạng và mức độ bao quát nguồn thông tin
- Chất lượng TLS trong bộ sưu tập về mặt nội dung
Do nguồn tài nguyên của Thư viện rất phong phú và đa dạng, bao gồm nhiều loại CSDL khác nhau nên việc tạo lập TLS cũng liên quan đến nhiều phương thức kỹ thuật Hiện nay, bên cạnh việc mua các CSDL khác ở bên ngoài thì thư viện đang sử dụng hình thức tạo lập TLS chủ yếu là số hoá tài liệu
Trong phần này tôi xin tập trung vào quy trình số hóa tài liệu tại TVQGVN được tiến hành thông qua 9 bước sau đây:
2.1 1 Khuôn khổ pháp lý
Thư viện Quốc gia Việt Nam là Thư viện trung tâm của cả nước với chức năng và nhiệm vụ được quy định theo Pháp lệnh thư viện được ủy ban thường vụ Quốc hội Việt Nam thông qua ngày 28/12/2000 và được Chủ tịch nước ký Sắc lệnh CNT ban hành ngày 11/01/2001, đồng thời là Thư viện đứng đầu trong hệ thống Thư viện Công cộng, chịu sự chỉ đạo trực tiếp của
Bộ Văn hóa, Thể thao và Du lịch Trong đó, nguồn TLS đóng vai trò quan trọng, quyết định đến hiệu quả toàn bộ nguồn tin trong nước tại Thư viện, do vậy vấn đề số hóa tài liệu và tổ chức khai thác nguồn TLS là một nhiệm vụ
Trang 24tất yếu Tuy nhiên, trong quá trình triển khai xây dựng và phát triển nguồn tài nguyên này, Thư viện cũng gặp phải một số khó khăn nhất định, trong đó
có vấn đề về bản quyền cho nguồn tài liệu số hoá
Vấn đề bản quyền thực sự đang là rào cản làm nhụt chí những người
có tâm huyết với công việc số hoá tài liệu thư viện Sở dĩ như vậy là vì chúng ta chưa thực sự nắm vững những quy định cụ thể của Luật bản quyền (Luật sở hữu trí tuệ) Các cơ quan chức năng nhà nước cũng chưa có những văn bản dưới luật để hướng dẫn thi hành
Vấn đề bản quyền đối với tài liệu trong Thư viện số chia làm 2 loại:
- Các tài liệu hết luật bản quyền
Theo Luật sở hữu trí tuệ Việt Nam 2005: Điều 27, khoản (a), (b) “Tác phẩm không thuộc loại hình quy định tại điểm a khoản này có thời hạn bảo
hộ là suốt cuộc đời tác giả và 50 năm tiếp theo năm tác giả chết; trong trường hợp tác phẩm có đồng tác giả thì thời hạn bảo hộ chấm dứt vào năm thứ 50 sau năm đồng tác giả cuối cùng chết.”
- Đối với tài liệu còn luật bản quyền
Theo Luật sở hữu trí tuệ Việt Nam 2005: Điều 25: Các trường hợp sử dụng tác phẩm đã công bố không phải xin phép, không phải trả tiền nhuận bút, thù lao cụ thể:
1, Tự sao chép một bản nhằm mục đích nghiên cứu khoa học, giảng
dạy cá nhân;
Trang 252, Sao chép tác phẩm để lưu trữ trong thư viện với mục đích nghiên cứu
Như vậy, việc số hoá tài liệu cho TVS/ TVĐT là không vi phạm bản quyền nếu:
- Tài liệu nằm ngoài bản quyền: Tài liệu xuất bản bởi chính phủ: văn bản pháp quy, số liệu thống kê, tài liệu thuộc lĩnh vực tư pháp (theo Luật sở hữu trí tuệ Việt Nam; chương 1, mục 1, điều 15: Các đối tượng không thuộc phạm vi bảo hộ quyền tác giả: “Tin tức thời sự thuần tuý đưa tin; văn bản quy phạm pháp luật, văn bản hành chính, văn bản khác thuộc lĩnh vực tư pháp và bản dịch chính thức của văn bản đó; quy trình hệ thống, phương pháp hoạt động, khái niệm, nguyên lý, số liệu”
- Tài liệu được bảo hộ bản quyền nhưng số hoá để sử dụng với mục đích phi thương mại trong phạm vi hạn chế của thư viện, trường học, viện nghiên cứu Bản thân việc số hoá tài liệu không vi phạm bản quyền, việc vi phạm hay không phụ thuộc vào mục đích sử dụng (chẳng hạn dùng với mục đích thương mại làm ảnh hưởng đến lợi ích kinh tế của người nắm giữ bản quyền là vi phạm) và phạm vi sử dụng (như phổ biến rộng rãi ra công chúng ngoài phạm vi thư viện là vi phạm)
Vậy, công tác số hoá tài liệu tại Thư viện Quốc gia Việt Nam có vi phạm bản quyền hay không? Hiện có rất nhiều quan điểm giải thích cho vấn
đề này Tuy nhiên để có câu trả lời chính xác, cần xem xét và đối chiếu các văn bản pháp lý vào trường hợp cụ thể của Thư viện Quốc gia Việt Nam Qua việc đối chiếu với các văn bản trên cho thấy, việc số hoá tài liệu tại Thư viện là đáp ứng được yêu cầu về mục đích (phục vụ nghiên cứu, giảng dạy, học tập), song vẫn chưa đáp ứng được những quy định đã nêu tại khoản 3 Điều 20 và điểm đ khoản 1 Điều 25 của Luật Sở hữu trí tuệ Việc số hoá tài liệu khi chưa xin phép chủ sở hữu đã vi phạm khoản 6 Điều 28 Luật Sở hữu trí tuệ về những hành vi xâm phạm quyền tác giả đó là "Sao chép tác phẩm
Trang 26Tuy nhiên, cũng cần giải thích thêm rằng ở Việt Nam trong lúc luật Bản quyền còn chưa được áp dụng một cách triệt để và hơn nữa công tác số hoá tài liệu của Thư viện Quốc gia Việt Nam lại được tiến hành từ khá sớm thì những sai phạm như đã nêu là rất phổ biến và không thể tránh khỏi
2.1.2 Sưu tầm tài liệu
Sưu tầm tài liệu số hoá phụ thuộc rất lớn vào chính sách của thư viện: xác định nguồn tài liệu nào cần số hoá trước/ ưu tiên trước (tài liệu quý hiếm, tài liệu có nhiều nhu cầu đọc nhất, tài liệu có giá thành đắt…)
Theo kế hoạch bước đầu Thư viện sẽ số hóa 5 kho tài liệu sau:
Kho sách (chủ yếu là sách tiếng Anh viết về Việt Nam)
Kho báo – tạp chí
Kho bản đồ Đông Dương
Kho luận án tiến sĩ
Kho Hán Nôm
Và song song với chúng là các loại hình tài liệu sau:
+ Tài liệu dạng in ấn: sách, báo, tạp chí thuộc các ngôn ngữ: Hán, Nôm, Việt, Anh, Pháp, Tây Ban Nha, Nga, Trung Quốc và cùng nhiều ngôn ngữ khác, các tác phẩm in bằng mộc bản hoặc in ấn bằng phương pháp hiện tại Những tác phẩm này được viết bằng chữ Hán, chữ Nôm, cả Hán lẫn Nôm, cũng như Hán hoặc Nôm đã được chuyển qua quốc ngữ
+ Tài liệu viết tay: sắc phong, hồi ký, bản thảo tác phẩm, hương ước, tộc phả, tiểu sử, các bài thi quan trường, kịch bản, tài liệu giáo khoa, đặc san, gia phả, lịch sử, bản khắc, ngữ học, văn chương, thuốc nam, chuyện viết bằng chữ Nôm, thi phú, tôn giáo, Trung Quốc học, triều chính, lệ làng, luật gia đình…
+ Tài liệu dạng nghe nhìn: tranh ảnh, bản nhạc, bản đồ, tác phẩm điêu khắc, văn bia, tác phẩm hội họa, băng ghi âm, ghi hình,…
Trang 27+ Tài liệu điện tử: các đĩa CD-ROM, VCD, DVD có chứa dữ liệu về lịch sử Thăng Long 1000 năm văn hiến, về thư tịch Hán Nôm …
2.1 3 Phân loại tài liệu và bảo quản tài liệu
Tất cả các tài liệu được sưu tập trước khi số hóa phải trải qua giai đoạn phân loại loại hình tài liệu (sách, báo, tạp chí, tài liệu chép tay, bản thảo, tranh ảnh, tài liệu nghe nhìn hoặc điện tử, ngôn ngữ tài liệu…), hiệu chỉnh về mặt vật lý (lau bụi, tháo bìa, tháo rời tài liệu, kiểm tra số trang, hiệu chỉnh kích cỡ) và cuối cùng là báo cáo về tình trạng của tài liệu Đây là khâu quan trọng góp phần trong việc lực chọn thiết bị và kỹ thuật Scan phù hợp để có sản phẩm số hóa đạt chất lượng cao: văn bản, âm thanh rõ ràng, hình ảnh,
đầy đủ, sắc nét…đúng như tài liệu gốc của nó
2.1 4 Số hóa tài liệu
Trước khi bắt tay vào việc số hóa chúng ta cần phải cân nhắc kỹ lưỡng liệu có thật cần thiết để thực hiện không vì chuyển một thư viện thường sang dạng số là một cách làm đầy tham vọng và đắt tiền với lại số hóa nội dung của một sưu tập in ấn thường là một công việc đồ sộ và chán nản
* Các câu hỏi đặt ra trước khi chuẩn bị số hóa:
- Mục đích xây dựng kho dữ liệu số là gì:
- Đối tượng phục vụ là ai?
- Quy mô thế nào? tại chỗ, trong khu vục hay toàn cầu?
- Số lượng tài liệu sẽ số hóa?
- Tài liệu có bao nhiêu trang?
- Có nhiều tranh ảnh không?
- Tài liệu sẽ chia nhỏ thành nhiều phần hay không?
- Tài liệu này đã có ở dạng số chưa và đã phổ biến chưa?
- Nếu có thì ở dạng fomat nào?
- Tình trạng bản quyền của tài liệu?
Trang 28- Máy vi tính: Để đảm bảo tốt cho công việc quét ảnh và các công tác
số hóa, Thư viện đã lựa chọn các loại máy tính có cấu hình RAM, dung lượng ổ cứng và Chip xử lý tốc độ cao nhất trong thời điểm hiện tại Thư viện hiện có 18 máy chủ và hơn 250 máy trạm
- Thiết bị lưu trữ: CD-ROM, đĩa DVD, đĩa Bluray… Ngoài ra còn có các thiết bị khác phục vụ số hóa như: ổ cứng di dộng Store, ổ ghi CD - R/ DVD - R, ổ CD – ROM/DVD (để sao lưu dữ liệu trên CD)
Ổ cứng Store Đĩa CD - ROM
- Máy quét ảnh: tại Thư viện đang sử dụng máy Scaner độ phân giải
300 dpi và máy ảnh kỹ thuật số để quét và chụp các trang của tài liệu
+ Về phần mềm
Thư viện Quốc gia Việt Nam là một trong những Thư viện đi đầu trong quá trình ứng dụng công nghệ thông tin Việc ứng dụng các phần mềm quản lý tài liệu được triển khai khá sớm Cùng với quá trình phát triển của
Trang 29công nghệ thông tin, Thư viện không ngừng đẩy nhanh quá trình áp dụng các phần mềm vào hoạt động
Xuất phát từ sự phong phú và đa dạng của các nguồn tài liệu số, hiện tại thư viện đang sử dụng nhiều phần mềm để quản lý nguồn tài nguyên này Dưới đây là một số phần mềm đã và đang được sử dụng:
- Phần mềm CDS/ISIS:
Đây là phần mềm đầu tiên được áp dụng tại thư viện dùng để quản lý các CSDL dạng văn bản có cấu trúc do UNESCO phát triển và phổ biến từ năm 1985 và được cung cấp miễn phí cho các thư viện Việt Nam Đây cũng
là phần mềm đầu tiên được sử dụng phổ biến tại Việt Nam để quản lý thư viện truyền thống CDS/ISIS có các đặc trưng sau:
+ Sử dụng giao diện DOS để xây dựng CSDL
+ Sử dụng dạng biên mục máy đọc được CCF (Common Communication Format)
+ Là phần mềm kết hợp Hệ quản trị CSDL với Phần giao tiếp
+ Quản lý được đồng thời nhiều CSDL
+ Cho phép xây dựng các CSDL lớn tới 16 triệu biểu ghi
+ Kích thước của trường không hạn chế (có thể tới 32.000 ký tự)
Các giai đoạn phát triển của CDS/ISIS for DOS
+ Cuối những năm 60: Phiên bản chính
+ Tháng 12/1985: Phiên bản 1.0 chạy trên IBM PC/XT
Trang 30DOS cho phép chạy trên môi trường Windows với nhiều tính năng ưu việt như:
+ Xây dựng cấu trúc CSDL dễ dàng nhờ có các phương tiện trợ giúp trong việc tạo biểu mẫu nhập tin và format hiện hình
+ Hiệu quả tìm tin tăng, nhờ nhiều phương tiện trợ giúp (cửa sổ từ điển, nút toán tử,…)
+ Cho phép tìm tin theo nhiều phương thức: tìm tin trình độ cao và tìm tin có trợ giúp
+ Có khả năng kết nối CSDL này với các CSDL khác để mở rộng chức năng quản lý nhờ các lệnh kết nối siêu văn bản trong ngôn ngữ tạo format
+ Cho phép quản lý các tệp toàn văn nhờ những liên kết siêu văn bản + Có cải tiến Phần giao tiếp từ DOS đến Web và kết nối thêm hệ quản trị CSDL Access
+ Dễ thao tác và sử dụng, phù hợp với trình độ của mọi đối tượng; khả năng kết nối mạng LAN, liên kết với các trang Web trên mạng Internet thuận tiện
WINISIS giúp toàn bộ hoạt động nghiệp vụ thư viện được tự động hoá tối đa và tích hợp trong một hệ thống nhất đồng thời cho phép trao đổi, tương tác, hỗ trợ lẫn nhau tạo ra một quy trình nghiệp vụ chuẩn của một thư viện hiện đại bao gồm:
+ Bổ sung: Bổ sung tài liệu qua đơn đặt, tra trùng tài liệu, tra cứu báo cáo bổ sung…
+ Biên mục: Xuất, nhập dữ liệu theo chuẩn MARC 21, in phích mục lục, in nhãn tài liệu, in thư mục tài liệu mới, tài liệu chuyên đề, tìm kiếm tra cứu nhanh theo nhiều tiêu chí, thống kê báo cáo tài liệu,…
+ Hồi cố, hiệu đính, tái xử lý tài liệu kho đọc, kho mượn, tạo lập và tổ
chức quản lý kho theo yêu cầu của thư viện
Trang 31+ Quản lý lưu thông: Cấp thẻ bạn đọc, lưu thông đọc, mượn, trả, gia hạn theo quy trình tra cứu, quản lý bạn đọc, báo cáo thống kê lượt người đọc, lượt tài liệu luân chuyển…
+ Dữ liệu sử dụng trong WINISIS có thể tái sử dụng sau này nếu thư viện nâng cấp sử dụng các chương trình phần mềm quản lý khác với tính năng cao hơn như ILIB, LIBOL,…
Hiện nay, WINSIS đã phát triển đến phiên bản 1.5 nhưng do nhu cầu trong quản lý dữ liệu tại thư viện ngày càng cao do đó phần mềm WINISIS không thể đáp ứng được nên thư viện đã triển khai thêm các phần mềm khác
- Phần mềm Ilib:
Từ tháng 10-2003 đến nay, TVQGVN đã chuyển sang sử dụng phần mềm Ilib thay cho phần mềm CDS/ISIS
+ Tính năng của phần mềm Ilib
- Phần mềm hiện đại hoá thư viện một cách toàn diện, nâng cao năng lực và vai trò của thư viện;
- Cho phép lưu trữ và khai thác các loại tài liệu đã được số hoá âm thanh, hình ảnh, phim, dữ liệu toàn văn với nhiều định dạng khác nhau;
- Hỗ trợ xây dựng các giáo trình, Sách điện tử, biến các loại tài liệu này trở thành các dữ liệu của thư viện;
- Cho phép bạn đọc truy cập và khai thác thông tin trực tuyến;
- Hệ thống được xây dựng dựa trên các tiêu chuẩn mở, do đó dễ dàng nâng cấp, mở rộng cũng như tích hợp với các hệ thống khác
+ Điểm nổi bật của phần mềm Ilib
- Đáp ứng được các yêu cầu của phần mềm thư viện số
- Đáp ứng được các yêu cầu kĩ thuật và thiết kế phần mềm
- Số hoá và đáp ứng được việc thu thập, bổ sung các tư liệu cần số hoá
Trang 32- Đáp ứng được việc biên mục, nhập vào CSDL, tạo các điểm truy cập
để tìm kiếm
+ Lợi ích khi sử dụng Ilib
- Phần mềm đưa ra một phương pháp chung cho việc biên mục các tư liệu số, thư viện có thể xây dựng các bộ sưu tập số hoá theo ý mình khi có nhu cầu và kinh phí;
- Các bản ghi thư mục của các tư liệu số hoá sẵn sàng cung cấp cho bạn đọc qua các phương tiện OPAC hay Z39.50 Các thư viện, các cơ quan
có thể khai thác các bản ghi thư mực của nhau một cách dễ dàng tùy theo từng nhu cầu;
- Việc tuân theo chuẩn RDF - Dublin Core cho phép các bộ máy tìm
kiếm truy cập, tìm kiếm tin từ máy chủ của thư viện, khiến thư viện trở thành nguồn cung cấp thông tin số hóa tại Việt Nam và trên thế giới
Hiện tại các CSDL do thư viện tạo lập như CSDL SACH, LA, JM đã được tích hợp vào CSDL chung của TVQGVN và bạn đọc có thể tra tìm tài liệu thông qua mạng Internet với địa chỉ trang Web: http://www.nlv.gov.vn Với giao diện sau:
Trang 33- Phần mềm Dlib:
Năm 2006, TVQGVN đã triển khai phần mềm thư viện số Dlib phục
vụ mạng LAN Phần mềm quản lý tài liệu số Dlib cho phép cán bộ thư viện
mô tả dữ liệu thư mục theo chuẩn Dublin Core, có gắn kết với tài liệu số các loại hình tài liệu: văn bản, âm thanh, hình ảnh, nghe nhìn…Phần mềm được tích hợp trên trang Web của TVQGVN, cho phép bạn đọc ở bất cứ đâu cũng
có thể tra cứu vào CSDL dữ liệu số Hiện tại, có các CSDL: Luận án tiến sĩ, Sách Đông dương, sách Tiếng Anh viết về Việt Nam Tài liệu ở các dạng văn bản, âm thanh, hình ảnh, film ảnh…
Dưới đây là giao diện tra cứu của phần mềm Dlib:
Phần mềm DLIB có các Module sau
- Module bổ sung và lưu chiểu: Cán bộ TVQG có thể tạo các đơn đặt
và đơn nhận để kiểm soát việc thu nhận lưu chiểu và bổ sung tài liệu, có thể
tự tạo các worsheet riêng cho từng bộ phận Thể hiện được nhiều trạng thái biên mục như: chờ biên mục, đang biên mục, đã duyệt, không duyệt, thuận tiện cho việc thông báo các công việc tiếp theo Chức năng này cũng cung
Trang 34cấp nhiều điểm tìm kiếm, dễ dàng cho cán bộ tìm chính xác tới một biểu ghi
- Module biên mục: Khả năng tìm kiếm theo nhiều tiêu chí đã trợ
giúp việc nhập thông tin tiếp tục từ biểu ghi từ phòng Lưu chiểu và Bổ sung, thêm các thông tin phản ánh nội dung của tài liệu như: từ khoá, phân loại, tóm tắt (những thông tin này sẽ giúp NDT nhanh chóng tìm được tài liệu theo một chủ đề nhât định, nhanh chóng xác định được nội dung phù hợp
hay không
Chương trình tự phát sinh mã cutter thuận tiện cho việc in nhãn kho mở;
- Module quản lý bạn đọc: Quản lý các thông tin cá nhân và ảnh của
bạn đọc Từ đó có thể in ra các thống kê theo yêu cầu
- Module lưu thông tài liệu (mượn trả): Quá trình lưu thông tài liệu
giữa thư viện và bạn đọc được thực hiện trên 2 CSDL là CSDL bạn đọc và CSDL thư mục Chương trình đã quản lý việc mượn đọc tại chỗ theo quy
định của TVQG
- Module quản lý xuất bản phẩm nhiều kỳ: Theo dõi việc nhận lưu
chiểu hay đặt mua, thu nhận ấn phẩm định kì theo từng số, theo ngày, tháng, năm Quản lý các ấn phẩm định kì hoặc không định kì;
Hỗ trợ nghiệp vụ đóng tập Quy định số đăng ký cá biệt cho tập;
Thống kê ấn phẩm nhận về là từ bổ sung hay lưu chiểu;
Từ việc xây dựng mẫu phát hành, chương trình đã tự sinh số phát hành giúp cán bộ thư viện giảm thời gian lao động;
Trang 35- Module quản lý kho: Quy định các cấp cho kho tài liệu, có thể
chuyển đổi tài liệu giữa các kho;
Có thể thống kê, thanh lí tài liệu hết nội dung phục vụ;
Khi tài liệu được xếp lên kho và ở chế độ sẵn sàng thì thông tin về tài liệu mới xuất hiện trên chức năng Tra cứu trực tuyến OPAC;
Quản lý lượng tài liệu ra vào kho In các báo cáo theo yêu cầu
- Module tra cứu liên thư viện qua cổng Z39.50: Bạn đọc hoặc cán
bộ thư viện có thể tra cứu tài liệu tại các thư viện khác trên thế giới;
Giúp cán bộ thư viện giảm thời gian biên mục và thống nhất biểu ghi, đặc biệt tài liệu ngoại Những sách ngoại được lấy theo định dạng biểu ghi MARC 21 từ các thư viện lớn trên thế giới như thư viện Quốc hội Mỹ, thư viện Quốc gia Anh hay Pháp…
- Module quản trị hệ thống: Chương trình quản trị người dùng, phân
quyền, bảo mật và thực hiện các chức năng sao lưu, hồi phục tài liệu…
2.1 5 Biên mục tài liệu số
Cùng với sự phát triển của nội dung số là sự xuất hiện của các chuẩn kèm theo, trong đó có rất nhiều chuẩn cần được áp dụng như chuẩn về ngôn ngữ, chuẩn mô tả dữ liệu, trao đổi dữ liệu…
Chuẩn hiện đang được Thư viện áp dụng để biên mục tài liệu số là Dublin core
Dublin core là chuẩn dùng để mô tả nội dung của biểu ghi và dữ liệu
Nó đơn giản hơn MARC Fomat rất nhiều vì chỉ có 15 phần tử Mục đích thiết kế metadata này là để sử dụng trên mạng internet, mô tả các tài liệu chuyên ngành trong các thư viện và tài liệu tại các Website khác nhau Các phần tử dữ liệu MARC và Dublin core có thể trao đổi lẫn nhau theo một giản
đồ quy định khi hiển thị cho người dùng, Các phần tử này là:
1 Nhan đề (Title): tên gọi chính thức của tài liệu
Trang 363 Chủ đề (Subject): tên chủ đề - đề mục dùng để phân loại tài liệu
4 Mô tả (Description): mô tả vắn tắt nội dung tài liệu
5 Nhà xuất bản (Publisher): tên gọi, nơi phát hành tài liệu
6 Tác giả phụ (Contributor): tên của những tác giả cộng tác
7 Ngày tháng (Date): ngày tháng phát hành tài liệu
8 Loại (kiểu) tài liệu (Type): Kiểu tài liệu
9 Mô tả vật lý (Khổ mẫu)(Format): Thông tin về dạng vật lý
10 Định danh (Identifier): Thông tin định danh của tài liệu
11 Nguồn gốc (Source): Thông tin về xuất xứ của tài liệu
12 Ngôn ngữ (Language): Thông tin về ngôn ngữ
13 Liên kết (Relation): Thông tin liên kết của tài liệu
14 Bao quát (Coverage): Thông tin liên quan diện bao quát
15 Bản quyền (Rights): Thông tin liên quan quyền tác giả
2.1 6 Giai đoạn thử nghiệm
Trước khi vận hành thật các công đoạn: scanning, biên mục tài liệu, tải tài liệu lên mạng,…Thư viện sẽ thực hiện giai đoạn thử nghiệm bằng cách cho scan khoảng 10 đơn vị tài liệu với đủ các loại hình: sách, tạp chí, bản thảo, tài liệu hành chính, tranh ảnh,…đủ các ngôn ngữ: Hán, Nôm, Anh, Pháp, Việt,…và cho lưu trữ và vận hành thử trên Website để kiểm tra về chất lượng Chất lượng được đề cập ở đây bao gồm kích cỡ của hình ảnh, vấn đề
xử lý chung, dạng tập tin, chiều sâu của bit, vùng sáng, vùng tối, giá trị âm thanh, độ sáng, độ tương phản, độ phân giải, sự nhiễu, sự định hướng, tiếng động, sự điều chỉnh kênh màu, sự mất văn bản, sự điều chỉnh hình ảnh, sựu mất đường truyền hay mất hình ảnh, sự sống động, chất lượng truy cập, hình thức ngắn gọn, rõ ràng của văn bản… Đây là công việc vô cùng quan trọng, tránh những lỗi đã xảy ra và đảm bảo cho sản phẩm cuối cùng đạt chất lượng tốt nhất Với những dự án số hóa lớn thì giai đoạn thử nghiệm là vô cùng cần thiết Cần phải thử nghiệm và kiểm tra một cách kỹ lưỡng, đồng thời cần có