Một trong những nhiệm vụ quan trọng của Trung tâm Thông tin Khoa học và Công nghệ Quốc gia là thu thập, quản lý và lưu giữ các nguồn tài liệunội sinh quan trọng như kết quả nghiên cứu, t
Trang 1ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC XÃ HỘI VÀ NHÂN VĂN
-PHẠM VĂN HÙNG
NGHIÊN CỨU XÂY DỰNG VÀ QUẢN LÝ NGUỒN TÀI NGUYÊN SỐ NỘI SINH TẠI TRUNG TÂM THÔNG TIN KHOA HỌC VÀ
CÔNG NGHỆ QUỐC GIA
LUẬN VĂN THẠC SĨ THÔNG TIN - THƯ VIỆN
Hà Nội – 2009
Trang 2ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC XÃ HỘI VÀ NHÂN VĂN
-PHẠM VĂN HÙNG
NGHIÊN CỨU XÂY DỰNG VÀ QUẢN LÝ NGUỒN TÀI NGUYÊN SỐ NỘI SINH TẠI TRUNG TÂM THÔNG TIN KHOA HỌC VÀ
CÔNG NGHỆ QUỐC GIA
Chuyên ngành Khoa học Thư viện
Mã số: 60 32 20
LUẬN VĂN THẠC SĨ THÔNG TIN - THƯ VIỆN
Người hướng dẫn khoa học: TS Nguyễn Viết Nghĩa
Hà Nội - 2009
Trang 3MỤC LỤC
MỞ ĐẦU……… ……… …… 3
Chương 1 VAI TRÒ CỦA NGUỒN TÀI NGUYÊN SỐ NỘI SINH ĐỐI VỚI SỰ PHÁT TRIỂN CỦA TRUNG TÂM THÔNG TIN KHOA HỌC VÀ CÔNG NGHỆ QUỐC GIA 8
1.1 Giới thiệu chung về Trung tâm Thông tin Khoa học và Công nghệ Quốc gia 8
1.2 Định hướng phát triển Trung tâm trong thời gian tới 16
1.3 Tầm quan trọng của nguồn tài nguyên số nội sinh đối với sự phát triển Trung tâm 18 1.3.1 Một số khái niệm 18
1.3.2 Tài nguyên số nội sinh trong sự phát triển của Trung tâm 21
Chương 2 THỰC TRẠNG CÔNG TÁC XÂY DỰNG VÀ QUẢN LÝ NGUỒN TÀI NGUYÊN SỐ NỘI SINH TẠI TRUNG TÂM 25
2.1 Nguồn tài nguyên số nội sinh trong cơ cấu vốn tài liệu của Trung tâm 25
2.1.1 Cơ sở dữ liệu thư mục 25
2.1.2 Cơ sở dữ liệu toàn văn 25
2.2 Hiện trạng công tác phát triển nguồn tài nguyên số nội sinh 26
2.2.1 Khung khổ pháp lý 26
2.2.2 Quy trình tạo lập tài liệu số 31
2.2.3 Xây dựng cơ sở dữ liệu 39
2.2.4 Tổ chức khai thác nguồn tài nguyên số nội sinh 59
2.2.5 Công tác tuyên truyền, giới thiệu nguồn tài nguyên số nội sinh 71
Chương 3 MỘT SỐ GIẢI PHÁP TỐI ƯU HOÁ CÔNG TÁC XÂY DỰNG VÀ QUẢN LÝ NGUỒN TÀI NGUYÊN SỐ NỘI SINH TẠI TRUNG TÂM 73
3.1 Đảm bảo tính pháp lý cho nguồn tài nguyên số nội sinh 73
3.2 Đảm bảo nguồn nguyên liệu đầu vào 78
3.3 Nâng cao chất lượng nguồn tài nguyên số nội sinh 80
3.3.1 Tối ưu hoá công tác số hoá tài liệu truyền thống 80
3.3.2 Hoàn thiện công tác biên mục 82
3.3.3 Tối ưu hoá quá trình trao đổi và lưu dữ liệu giữa các bộ phận 89
3.4 Tổ chức lại các bố sưu tập số 92
3.5 Hoàn thiện hệ thống phần mềm 95
3.6 Một số giải pháp khác 108
3.6.1 Tăng cường chia sẻ nguồn tài nguyên số nội sinh 108
3.6.2 Đảm bảo an toàn cho dữ liệu số 111
3.6.3 Xây dựng cơ chế truy cập phù hợp 113
3.6.4 Đẩy mạnh công tác tuyên truyền giới thiệu nguồn tài nguyên số nội sinh 114
3.6.5 Phát triển đội ngũ cán bộ 115
KẾT LUẬN……… ……… 117
TÀI LIỆU THAM KHẢO……….……….… 118
PHỤ LỤC……… ……121
Trang 4BẢNG CÁC CHỮ VIẾT TẮT
BSTS Bộ sưu tập số
CNTT Công nghệ thông tin
CSDL Cơ sở dữ liệu
KH&CN Khoa học và công nghệ
KQNC Kết quả nghiên cứu
STD Scientific and technological documents
TEIN Trans – Eurasia information network
TNSNS Tài nguyên số nội sinh
TTKH&CNQG Thông tin Khoa học và Công nghệ Quốc gia
TT-TV Thông tin – Thư viện
VINAREN Vietnam research and education network
Trang 5MỞ ĐẦU
Nhân loại đang bước vào kỷ nguyên mới – “kỷ nguyên thông tin”, trong đóthông tin là nhân tố quyết định mọi hoạt động kinh tế xã hội của con người Vì thếcác quốc gia phát triển đã sớm đề ra chính sách phát triển hạ tầng thông tin quốcgia, theo đó nhiều dự án phát triển nguồn tài nguyên số và xây dựng thư viện số đãđược triển khai Trong đó có nhiều dự án mang tính quốc gia như dự án “Digitallibraries initiative” ở Mỹ, dự án “Electronic Libraries Programme” ở Anh, dự án
“Digital Image Library” ở Úc,…Các dự án này đã mở đường cho chiến dịch pháttriển thư viện số trên thế giới
Ở Việt Nam, ngay từ đầu những năm 90 chúng ta đã ý thức được vai trò quantrọng của thông tin trong sự nghiệp xây dựng và phát triển đất nước cũng như tình trạnglạc hậu về thông tin của nước nhà Trên cơ sở đó, Chính phủ đã đặt mục tiêu "phổ cậpvăn hoá thông tin" trong xã hội nhằm tạo môi trường thuận lợi cho đất nước chuẩn bịhướng tới một "xã hội thông tin" [10]
Lý do chọn đề tài: Trung tâm Thông tin Khoa học và Công nghệ Quốc gia
với chức năng là cơ quan đứng đầu hệ thống thông tin khoa học và công nghệ trong
cả nước, thực hiện chức năng “thông tin, thư viện trung tâm của cả nước về khoa
học và công nghệ” Một trong những nhiệm vụ quan trọng của Trung tâm Thông tin
Khoa học và Công nghệ Quốc gia là thu thập, quản lý và lưu giữ các nguồn tài liệunội sinh quan trọng như kết quả nghiên cứu, tài liệu hội nghị, các tạp chí khoa họcv.v… Bên cạnh những lợi thế về cơ sở vật chất, trang thiết bị và đội ngũ cán bộ,Trung tâm Thông tin Khoa học và Công nghệ Quốc gia cũng gặp không ít khó khăntrong quá trình xây dựng và quản lý nguồn tài nguyên số như thu thập tài liệu, xâydựng quy trình số hóa, xây dựng công cụ tìm kiếm v.v Vấn đề xây dựng và pháttriển nguồn tài nguyên số đã từ lâu thu hút được sự quan tâm của nhiều nhà nghiêncứu Trong những năm qua, đã có một số công trình nghiên cứu liên quan đến
nguồn tài nguyên số tại Trung tâm như đề tài “Nghiên cứu xây dựng cơ chế tổ chức
và khai thác hiệu quả ngân hàng dữ liệu khoa học và công nghệ quốc gia tại Trung tâm Thông tin Tư liệu Khoa học và Công nghệ Quốc gia phục vụ sự nghiệp công nghiệp hoá - hiện đại hoá” ; một số bài nghiên cứu trên Tạp chí Thông tin & Tư
Trang 6liệu liên quan đến các hoạt động như số hoá tài liệu, đảm bảo chất lượng tài liệu số,xây dựng cơ sở dữ liệu, Tuy nhiên, các công trình trên mới chỉ dừng lại ở mứckhái quát hoặc nghiên cứu từng khía cạnh của vấn đề hoặc không còn phù hợp vớihoàn cảnh hiện tại Thấy được tầm quan trọng của vấn đề xây dựng và quản lýnguồn tài nguyên số nội sinh và sự thiếu vắng các nghiên cứu có tính hệ thống vềvấn đề này, tác giả đã mạnh dạn chọn đề tài “Nghiên cứu xây dựng và quản lýnguồn tài nguyên số nội sinh tại Trung tâm Thông tin Khoa học và Công nghệ Quốcgia” làm đề tài cho luận văn của mình.
Mục đích nghiên cứu của đề tài “Nghiên cứu xây dựng và quản lý nguồn
tài nguyên số nội sinh tại Trung tâm Thông tin Khoa học và Công nghệ Quốc gia”
là nhằm hoàn thiện các quy trình xây dựng và quản lý nguồn tài nguyên số nội sinhtại Trung tâm bao gồm:
- Quy trình xây dựng cơ sở dữ liệu
- Quy trình quản lý, tổ chức khai thác nguồn tài nguyên số nội sinh
Bên cạnh đó, tác giả cũng hy vọng những kinh nghiệm này có thể áp dụng chocác đơn vị khác trong hệ thống, đồng thời góp phần hoàn thiện về mặt lý luận chocông tác phát triển nguồn tài nguyên số trong các cơ quan thông tin – thư viện nóichung
Nhiệm vụ nghiên cứu của đề tài:
- Khảo sát toàn bộ quy trình số hoá tài liệu gồm (khung khổ pháp lý cho công tác số hoá, thiết bị và phương pháp số hoá)
- Nghiên cứu quy trình xây dựng các cơ sở dữ liệu gồm (các phần mềm, cácchuẩn và những công cụ được sử dụng và quy trình kỹ thuật trong xây dựng cơ sở dữliệu)
- Nghiên cứu công tác tổ chức khai thác nguồn tài nguyên số gồm (các hình thứccung cấp thông tin, cơ chế quản lý người dùng tin và hiệu quả khai thác nguồn tàinguyên số)
- Phân tích những thế mạnh, khả năng, thuận lợi, khó khăn và những hạn chế trong từng quy trình
- Xây dựng các mô hình và giải pháp giúp hoàn thiện các quy trình xây dựng và quản lý nguồn tài nguyên số nội sinh
Trang 7Đối tượng nghiên cứu của luận văn là toàn bộ hoạt động xây dựng, phát triển
nguồn tài nguyên số nội sinh tại Trung tâm, trong đó gồm các cơ sở dữ liệu thưmục, cơ sở dữ liệu toàn văn và các bản tin điện tử
Do đặc điểm của đề tài nghiên cứu chủ yếu liên quan đến nguồn tài nguyên sốnên phạm vi nghiên cứu của luận văn chỉ tập trung vào công tác xây dựng, pháttriển nguồn tài nguyên số nội sinh tại Trung tâm Thông tin Khoa học và Công nghệQuốc gia từ khi tiến hành xây các cơ sở dữ liệu (từ năm 1987 đến nay)
Phương pháp nghiên cứu: Trong quá trình làm luận văn này, tác giả đã sử
dụng phương pháp luận duy vật biện chứng và duy vật lịch sử để nghiên cứu toàn
bộ quá trình xây dựng, phát triển nguồn tài nguyên số nội sinh của Trung tâm, ngoài
ra tác giả còn vận dụng các phương pháp phân tích, tổng hợp tài liệu, quan sát vàphỏng vấn trực tiếp người dùng tin, cán bộ thông tin để tìm hiểu và đánh giá toàn
bộ những vấn đề có liên quan đến công tác xây dựng và phát triển nguồn tài nguyên
số nội sinh
Giả thuyết khoa học xuất phát từ thực tiễn phát triển Trung tâm Thông tinKhoa học và Công nghệ Quốc gia với mục tiêu trở thành một Trung tâm dữ liệu vềkhoa học và công nghệ của cả nước, vấn đề đầu tiên là cần phát triển một kho dữliệu số (trong đó bao gồm cả nguồn tài nguyên số nội sinh) có chất lượng tốt Bêncạnh đó, việc quản lý và phổ biến nguồn tài nguyên này cũng cần được nghiên cứutriệt để
Trên cơ sở tìm hiểu rõ từng quy trình, phát hiện những mặt hạn chế, đồng thờitham khảo kinh nghiệm và kỹ thuật tại các đơn vị trong và ngoài nước, luận vănđưa ra những giải pháp giúp hoàn thiện toàn bộ quy trình xây dựng và quản lýnguồn tài nguyên số nội sinh tại Trung tâm
Cấu trúc của luận văn gồm: Phần mở đầu, phần nội dung và kết luận, trong
đó phần nội dung gồm có 3 chương:
Chương 1 giới thiệu khái quát về Trung tâm Thông tin Khoa học và Côngnghệ Quốc gia; trình bày vị trí, vai trò của nguồn tài nguyên số nội sinh đối với sựphát triển của Trung tâm đồng thời đưa ra khái niệm tài nguyên số nội sinh và cáckhái niệm liên quan
Trang 8Chương 2 tập trung tìm hiểu và đánh giá toàn bộ quy trình phát triển nguồn tàinguyên số nội sinh tại Trung tâm bao gồm: Quy trình số hoá tài liệu, xây dựng các
cơ sở dữ liệu, lưu giữ tài liệu số và tổ chức khai thác, quảng bá nguồn tài nguyên sốnội sinh tại Trung tâm
Chương 3 đề xuất một số giải pháp tối ưu hoá công tác xây dựng và quản lýnguồn tài nguyên số nội sinh tại Trung tâm như giải pháp cho vấn đề bản quyềntrong công tác số hoá tài liệu; vấn đề đảm bảo nguồn nguyên liệu phục vụ số hoá;công tác tổ chức, lưu giữ và phổ biến nguồn tài nguyên số nội sinh…
Trang 9Chương 1 VAI TRÒ CỦA NGUỒN TÀI NGUYÊN SỐ NỘI SINH ĐỐI VỚI SỰ PHÁT TRIỂN CỦA TRUNG TÂM THÔNG TIN KHOA HỌC VÀ CÔNG NGHỆ QUỐC GIA
1.1 Giới thiệu chung về Trung tâm Thông tin Khoa học và Công nghệ Quốc gia
Lịch sử phát triển
Trung tâm TTKH&CNQG trực thuộc Bộ KH&CN được thành lập ngày 24tháng 9 năm 1990 theo Quyết định số 487/TCCB của Chủ nhiệm Uỷ ban Khoa họcNhà nước (nay là Bộ KH&CN) trên cơ sở hợp nhất hai đơn vị:
Thư viện Khoa học và Kỹ thuật Trung ương, 1960-1990
Viện Thông tin Khoa học và Kỹ thuật Trung ương, 1972-1990
Trong thời gian hoạt động, Trung tâm TTKH&CNQG đã thay đổi tên như sau:Trung tâm Thông tin Tư liệu KH&CN Quốc gia 1990-2004
Trung tâm TTKH&CNQG, 2004 – đến nay
Chức năng nhiệm vụ và cơ cấu tổ chức
Chức năng
Ngày 13/5/2004, Bộ KH&CN ban hành Quyết định số 11/2004/QĐ-BKHCNquy định điều lệ về tổ chức và hoạt động của Trung tâm TTKH&CNQG
Theo Điều lệ, Trung tâm TTKH&CNQG là đơn vị trực thuộc Bộ KH&CN, tổ
chức đứng đầu hệ thống các tổ chức thông tin KH&CN, thực hiện chức năng “thông
tin, thư viện trung tâm của cả nước về KH&CN”.
Nhiệm vụ
Tham gia xây dựng và tổ chức thực hiện các chủ trương, chiến lược, chínhsách, quy hoạch, kế hoạch, văn bản quy phạm pháp luật về hoạt động thông tinKH&CN; phát triển nguồn lực thông tin KH&CN của đất nước;
Thu thập, chọn lọc, xử lý, lưu trữ và phát triển nguồn tin KH&CN trongnước và thế giới, đặc biệt là nguồn tin về tài liệu điều tra cơ bản, luận án trên đạihọc, tài liệu hội nghị, hội thảo khoa học, các nhiệm vụ KH&CN đang tiến hành;
Trang 10Tổ chức và thực hiện đăng ký, lưu giữ kết quả nghiên cứu khoa học và phát triển công nghệ;
Thực hiện nhiệm vụ Thư viện trung tâm của cả nước về KH&CN; xây dựng thư viện điện tử quốc gia về KH&CN;
Tổ chức và thực hiện việc cung cấp thông tin phục vụ lãnh đạo, quản lý nghiên cứukhoa học, phát triển công nghệ, giáo dục, đào tạo, sản xuất, kinh doanh; Xuất bản
“Sách KH&CN Việt Nam”; Tạp chí “Thông tin và Tư liệu”, ấn phẩm thông tin;
công bố danh mục các nhiệm vụ KH&CN trong nước đang tiếnhành và kết quả thực hiện các nhiệm vụ KH&CN nói trên;
Phát triển Mạng thông tin KH&CN Việt Nam (VISTA), Chợ ảo Công nghệ
và Thiết bị Việt Nam;
Tổ chức và thực hiện công tác thông tin tuyên truyền KH&CN, đưa tri thứckhoa học đến với mọi người, đặc biệt là thông tin KH&CN phục vụ phát triển kinh
tế - xã hội nông thôn, miền núi, phục vụ các doanh nghiệp nhỏ và vừa;
Nghiên cứu khoa học và phát triển công nghệ, áp dụng các chuẩn trong lĩnhvực thông tin, thư viện KH&CN;
Phối hợp tổ chức đào tạo, bồi dưỡng, nâng cao trình độ nghiệp vụ thông tinKH&CN;
Phối hợp thực hiện các nhiệm vụ hợp tác quốc tế trong lĩnh vực thông tinKH&CN;
Được thực hiện các dịch vụ trong lĩnh vực thông tin KH&CN theo quy địnhcủa pháp luật;
Thực hiện các nhiệm vụ khác do Bộ trưởng Bộ KH&CN giao
Cơ cấu tổ chức
Theo Điều lệ, cơ cấu tổ chức của Trung tâm có Ban Giám đốc và 15 đơn vịtrực thuộc:
1 Phòng Phát triển hoạt động thông tin KH&CN
2 Phòng Phát triển nguồn tin
3 Phòng Cơ sở dữ liệu
4 Phòng Đọc sách
5 Phòng Đọc tạp chí
Trang 116 Phòng Tra cứu và cung cấp tài liệu điện tử
7 Phòng Phân tích thông tin
8 Phòng Thông tin thị trường KH&CN
9 Phòng Thông tin nông thôn, miền núi
- Các CSDL do Trung tâm xây dựng
Hiện Trung tâm có trên 10 CSDL, trong đó có các CSDL lớn được xây dựng
từ nhiều năm trước như STD (Tài liệu KH&CN Việt Nam) được xây dựng từ năm
Trang 121987; Book (Sách tại Thư viện Khoa học Kỹ thuật Trung ương); KQNC (Báo cáo kết quả nghiên cứu khoa học),…
- Các CSDL KH&CN thế giới:
Trên 10 CSDL, trong đó có các CSDL nổi tiếng như IEEE/IEE Fulltext (Thưviện điện tử về CNTT, điện và điện tử) Chemical Abstracts (Tạp chí tóm tắt về hoáhọc); PASCAL (CSDL đa ngành về KH&CN), đặc biệt là các CSDL trực tuyến nhưScienceDirect, EBSCO, WEB OF SCIENCE, EBRARY,…
+ Quảng cáo trên mạng VISTA
- Chợ Công nghệ và Thiết bị Việt Nam trên mạng (Techmart ảo)
Chợ công nghệ ảo có chức năng giới thiệu công nghệ, thiết bị cần mua và chàobán trong và ngoài nước đồng thời là sàn giao dịch về công nghệ, thiết bị và tư vấnKH&CN
Hiện Trung tâm có hàng chục xuất bản phẩm dạng in như Sách KH&CN ViệtNam; Tạp chí Thông tin & Tư liệu; Tổng luận Khoa học - Công nghệ - Kinh tế vàhàng chục bản tin điện tử như Nông thôn đổi mới; Khoa học công nghệ và môitrường; Vietnam infoterra newsletter,…
- Các chương trình phim KHCN
Các phim KH&CN trong nước và nước ngoài được cung cấp cho NDT dưới dạng các đĩa VCD, DVD theo yêu cầu
Trang 13Các dịch vụ chủ yếu
+ Dịch vụ phục vụ bạn đọc
+ Thông tin phục vụ cho công tác hoạch định chính sách, xây dựng chiến lược
và dự báo về kinh tế, KH&CN
+ Cung cấp thông tin về thị trường công nghệ, chuyển giao công nghệ, các cơ hội liên doanh với bạn hàng trong và ngoài nước
+ Tổ chức các hội thảo, hội nghị khách hàng, triển lãm, chợ công nghệ nhằm giới thiệu công nghệ và sản phẩm mới
+ Tra cứu và chỉ dẫn theo các yêu cầu thông tin của các cá nhân, tổ chức, cơquan
+ Dịch vụ phổ biến thông tin có chọn lọc
+ Cung cấp nội dung thông tin trực tuyến trên Internet
+ Tổ chức các khoá đào tạo nghiệp vụ theo yêu cầu
+ Tư vấn về công tác xây dựng, tổ chức, điều hành thư viện, cơ quan thông tin+ Tổ chức các đoàn nghiên cứu, khảo sát và học tập ở nước ngoài về thông tinKH&CN
Công tác nghiên cứu và đào tạo
Công tác nghiên cứu được đẩy mạnh theo hướng gắn kết với những yêu cầuthực tiễn, góp phần nâng cao chất lượng hoạt động chuyên môn, nghiệp vụ củaTrung tâm TTKH&CNQG Trong đó tập trung vào hiện đại hoá hệ thống thông tinKH&CN, xây dựng thư viện điện tử, xây dựng và áp dụng các tiêu chuẩn quốc gia,quốc tế vào hoạt động thông tin, thư viện
Hàng năm Trung tâm tổ chức trên 20 khoá đào tạo cho cán bộ thông tinKH&CN trong mạng lưới Đặc biệt, nội dung đào tạo, bồi dưỡng nghiệp vụ đượcchú trọng hướng vào các vấn đề ứng dụng CNTT và các tiêu chuẩn quốc tế vàohoạt động TT-TV
Hợp tác quốc tế
Trung tâm TTKH&CNQG trao đổi thông tin, tài liệu với hơn 50 tổ chức của
35 nước trên thế giới; hợp tác song phương, đa phương với các thư viện và cáctrung tâm thông tin của hơn 70 nước trên thế giới
- Trung tâm TTKH&CNQG là thành viên của
Trang 14+ UNESCO/IFA, Chương trình Thông tin cho mọi người (Trụ sở tại Paris, Pháp)
+ IFLA - Hiệp hội Thư viện Quốc tế (Trụ sở tại Hague, Hà Lan)
+ ICSTI - Trung tâm Thông tin KH&CN Quốc tế
- Trung tâm TTKH&CNQG là đầu mối quốc gia của:
+ INFOTERRA- Mạng Thông tin Môi trường Toàn cầu
+ APIN - Mạng Thông tin châu Á - Thái Bình Dương (Trụ sở tại New Delhi,
ấn Độ)
+ Trung tâm ISSN Quốc tế (Trụ sở tại Pari, Pháp)
+ Mạng thông tin khoa học công nghệ ASEAN
+ Mạng Nghiên cứu và đào tạo Á-Âu (TEIN2, TEIN3)
Quá trình ứng dụng công nghệ thông tin và những thành tựu đạt được
Trung tâm TTKH&CNQG là một trong những đơn vị đi tiên phong và đạtđược nhiều thành quả trong việc ứng dụng CNTT Từ những năm 80 của thế kỷ XXTrung tâm đã triển khai nghiên cứu áp dụng CNTT vào hoạt động Quá trình nàyđược chia thành những giai đoạn sau:
Giai đoạn mở đầu bằng việc sử dụng các máy tính IBM 360, họ máy tính ES
để tổ chức và phục vụ thông tin Viện thông tin Khoa học và Kỹ thuật Trung Ương( tiền thân của Trung tâm TTKH&CNQG) đã khai thác các băng từ thông tinKH&CN của Trung tâm Thông tin Khoa học Kỹ thuật Quốc Tế để phục vụ thôngtin chọn lọc cho NDT trong nước bằng cách tận dụng công nghệ truyền tin mạngviễn thông quốc tế, Viện đã tiến hành các đợt thử nghiệm truy cập từ xa -Teledostup" vào các CSDL của Trung tâm Thông tin Khoa học Kỹ thuật Quốc TếVới tốc độ 8 bít/giây Các ứng dụng CNTT thời kỳ này mới chỉ mang tính thửnghiệm, rất ít sản phẩm được áp dụng trên quy mô công nghiệp Phần mềm được
sử dụng để xây dưng CSDL và số hoá các nguồn tin chủ yếu là Dbase
Giai đoạn tiếp theo từ 1990-1997, với sự đầu tư của nhà nước việc số hoá cácnguồn tài liệu được triển khai bằng việc xây dựng các CSDL thư mục do các cơquan thông tin thư viện trong nước đảm nhiệm Hệ thống quản lý thư điện tửTOOLNET do Hà Lan hỗ trợ, Mạng Thông tin Kinh tế, KH&CN Việt Nam (mạngVESTENET) với hàng chục CSDL của Trung tâm TTKH&CNQG và các CSDL
Trang 15thư mục khác do các cơ quan thông tin trong mạng lưới xây dựng là cơ sở để tiếnhành việc tổ chức phục vụ thông tin trực tuyến trong cả nước Các CSDL này có thểlàm việc được trên mạng, sử dụng phần mềm quản trị CDS/ISIS Dbase, Foxpro, bộ
mã tiêu chuẩn TCVN 5712 đã được đưa vào áp dụng Ở giai đoạn này, NDT có thểkhai thác các dịch vụ và sản phẩm thông tin bằng phương thức truy cập từ xa vàocác CSDL trên (được cài đặt trên máy chủ) tra cứu trên CD-ROM (on-line), hoặcmạng nội bộ hay đặt hàng theo phương thức dịch vụ thông tin có chọn lọc Tháng11/1997 cùng với mốc Việt Nam chính thức hoà mạng Intemet, Trung tâmTTKH&CNQG là một trong những cơ quan đầu tiên đã kết nối mạng Internet vàđưa mạng của mình (lúc này đã đổi tên thành Mạng Thông tin KHCN Việt Nam-VISTA chạy trên hệ điều hành Windows NT) lên phạm vi toàn cầu
Giai đoạn 1998-2002, việc số hoá các nguồn tài liêu của Trung tâmTTKH&CNQG được nâng lên một bước về chất lượng nhờ ứng dụng công nghệInternet và phát triển CSDL tích hợp Trung tâm đã tập trung xây dựng mạngVISTA trên cơ sở công nghệ Web tĩnh với hệ điều hành là Windows NT, địa chiURL là: http://www.vista.gov.vn Cũng trong thời gian này các hệ quản trị CSDL
như SQL server, Oracle đã được triển khai nghiên cứu nhưng chưa đưa vào sửdụng
Ciai đoạn 2003 đến nay được đánh dấu bằng việc áp dụng công nghệ mới(công nghệ Portal) để xây dựng và tổ chức mạng thông tin tích hợp dữ liệu KH&CNvới trang web động có khả năng liên kết dữ liệu với hệ điều hành Windows 2000 vàWindows 2003, hệ quản trị CSDL là MSQL server, Oracle, Đặc biệt, từ đầu năm
2004 Trung tâm tiến hành xây dựng CSDL toàn văn Tài liệu KH&CN Việt Namtrên cơ sở số hoá các bài trích trong các tạp chí khoa học và những tài liệu hội nghịhội thảo khoa học Cũng trong năm 2004, Trung tâm tiến hành xây dựng thư việnđiện tử với phần mềm Libol của Công ty Tinh Vân và triển khai các CSDL thư mục
về tài liệu KH&CN Việt Nam Do vậy phương thức truy cập mở được triển khai và
áp dụng mạnh mẽ giúp cho NDT khai thác các sản phẩm và dịch vụ thông tin mộtcách dễ dàng và thuận tiện hơn
Một trong những sự kiện đánh dấu một bước phát triền mới trong quá trình ứng dụng CNTT tại Trung tâm là Dự án TEIN 2 (Dự án nhằm hỗ trợ các nước đang
Trang 16phát triển trong ASEM thông qua việc cung cấp và củng cố đường trục (backbone)tốc độ cao lên tới 155 Mbps cho liên khu vực Âu -Á ) Dự án này được bắt đầu từđầu năm 2004 và đã mở ra cơ hội lớn đối với cộng đồng NDT Việt Nam nói chung
và đối với Trung tâm TTKH&CNQG nói riêng Tháng 4 năm 2006 Trung tâmTTKH&CNQG được Bộ KH&CN giao cho nhiệm vụ làm đầu mối và chủ trì thamgia dự án TEIN2 Đây là một sự kiện quan trọng đánh mở đầu cho sự ra đời và pháttriển của mạng VINAREN
Mạng VINAREN là mạng Nghiên cứu và Đào tạo quốc gia hoạt động phi lợinhuận, chính thức khai trương trên toàn quốc ngày 27/3/2008, do Trung tâm pháttriển và quản lý Mục tiêu của VINAREN là xây dựng và phát triển Mạng nghiêncứu và đào tạo Việt nam kết nối với các mạng nghiên cứu và đào tạo của các nướctrong khu vực và trên thế giới nhằm nâng cao hiệu quả, thúc đẩy hợp tác và hộinhập quốc tế trong lĩnh vực nghiên cứu và đào tạo thông qua TEIN2, TEIN3 với tốc
độ từ 45 đến 155 Mbps Thành viên VINAREN bao gồm các viện nghiên cứu,trường đại học, bệnh viện và trung tâm thông tin hàng đầu trong nước VINARENkết nối các nhà nghiên cứu và đào tạo Việt Nam với cộng đồng 30 triệu nhà khoahọc ở khu vực châu Á-Thái Bình Dương, châu Âu và các khu vực khác
Sau một năm hoạt động, đến năm 2008 quy mô của VINAREN đã vươn tớihơn 50 trung tâm nghiên cứu và đào tạo quan trọng của đất nước thuộc 11 tỉnh,thành phố Năm 2008 cũng là năm thử nghiệm việc truy cập, khai thác các nguồn tin
số hoá, trực tuyến trong nước và quốc tế giữa các thành viên của VINAREN ở cảtrong và ngoài nước Lần đầu tiên các CSDL KH&CN trong nước do Trung tâmThông tin KH&CN Quốc gia xây dựng được đưa lên mạng VINAREN để truy cập
và khai thác theo chế độ mạng
Tóm lại, có thể thấy quá trình ứng dụng CNTT tại Trung tâm TTKH&CNQG
đã diễn ra rất sớm, nhanh chóng và hiệu quả Tuy nhiên, các giai đoạn phát triểnphụ thuộc vào sự phát triển chung trong lĩnh vực CNTT Để có được những thànhquả trên là nhờ có sự quan tâm ngày càng tăng của Nhà nước đến lĩnh vực TT-TV.Bên cạnh đó cũng phải kể đến những nỗ lực không mệt mỏi của các thế hệ cán bộcủa Trung tâm trong việc thúc đẩy phát triển ứng dụng CNTT vào hoạt động Vớinhững điều kiện về công nghệ hiện nay, trong một thời gian không xa nữa Trung
Trang 17tâm TTKH&CNQG có thể trở thành một Trung tâm thông tin/TVS tầm cỡ quốc tế.
Để nắm bắt những cơ hội này, đòi hỏi phải có những nghiên cứu mang tính toàndiện và tuân theo xu hướng chung của thế giới, đó là tập trung nghiên cứu pháttriển và quản lý nguồn TNS
1.2 Định hướng phát triển Trung tâm trong thời gian tới
Để phấn đấu xây dựng Trung tâm trở thành tập đoàn dịch vụ công về thông tinKHCN, Trung tâm TTKH&CNQG đã đưa ra 10 định hướng phát triển giai đoạn2006-2010 và tầm nhìn đến 2015, trong đó hầu hết các nội dung đều liên quan đếnviệc xây dựng và quản lý nguồn TNSNS đó là:
- Xúc tiến và phát triển thị trường công nghệ trong đó tập trung vào xây dựng CSDL đa phương tiện "Hồ sơ công nghệ" nhằm tư liệu hoá và giới thiệu, phổ biến thông tin về:
+ Kết quả nổi bật của các chương trình, đề tài, dự án KHCN trọng điểm cấp Nhà nước qua các giai đoạn
+ Hồ sơ các công nghệ sẵn sàng cho chuyển giao, nhân rộng
+ Phim tư liệu KHCN
+ Hồ sơ các phát minh, sáng chế có tính đột phá của KHCN thế giới
- Phát triển hệ thống thông tin KHCN nông thôn thông qua việc tăng cường cung cấp thông tin KHCN phục vụ phát triển kinh tế - xã hội nông thôn, miền núi, theo hướng:
+ Hỗ trợ các địa phương nhân rộng mô hình cung cấp thông tin KHCN phục
vụ phát triển kinh tế - xã hội tại cơ sở (xã, phường)
+ Xây dựng và phát triển mô hình phổ biến tri thức khoa học và thông tin chuyển giao công nghệ tuyến quận, huyện
+ Hình thành và phát triển Mạng thông tin KHCN nông thôn, miền núi hoạt động trên quy mô toàn quốc (từ Trung ương tới cơ sở)
- Phát triển dịch vụ thông tin KHCN phục vụ các doanh nghiệp theo hướng:
+ Phát triển Ngân hàng cung cấp thông tin KHCN phục vụ các doanh nghiệp, nhất là các doanh nghiệp vừa và nhỏ
Trang 18+ Triển khai dịch vụ thông tin cảnh báo cạnh tranh và cảnh báo chiến lược nhằm hỗ trợ phát triển các ngành hàng chủ lực của Việt Nam.
+ Triển khai các dịch vụ tra cứu - chỉ dẫn thông tin theo yêu cầu của các doanhnghiệp
+ Hình thành và phát triển Mạng thông tin KHCN phục vụ các doanh nghiệp
- Hiện đại hoá và nâng cao chất lượng hoạt động của Thư viện Trung ương của
cả nước về KHCN với các nội dung:
+ Tổ chức và triển khai Dịch vụ cung cấp tài liệu theo yêu cầu
+ Phát triển liên kết bổ sung và chia sẻ nguồn tin KHCN (Vietnam Consortium
+ Phát triển các nội dung số hoá theo hướng chuyên nghiệp và hiện đại
+ Thường xuyên nâng cấp năng lực truy cập, lưu giữ, xử lý, an ninh và phổ biến thông tin trên mạng
- Triển khai Trung tâm đăng ký, lưu giữ và phổ biến các kết quả nhiệm vụ KHCN trong đó tập trung vào việc:
+ Xây dựng và vận hành CSDL toàn văn về các đề tài, dự án
+ Tổ chức phổ biến, cung cấp thông tin kịp thời, đầy đủ về các đề tài, dự án KHCN đang tiến hành và thông tin về kết quả các nhiệm vụ KHCN đã hoàn thành
- Đẩy mạnh công tác nghiên cứu và phân tích thông tin phục vụ lãnh đạo, quản lý với các nội dung:
+ Thực hiện tốt nhiệm vụ đầu mối cung cấp thông tin phân tích cho các cơ quan lãnh đạo Đảng và Nhà nước
+ Thực hiện tốt nhiệm vụ cung cấp nội dung về KHCN trên Website của Chính phủ
- Xây dựng Thư viện điện tử quốc gia về KHCN trong đó tập trung vào việc xây dựng và triển khai bước đầu dự án Thư viện điện tử quốc gia về KH&CN tại khuôn
Trang 19viên 24-26 Lý Thường Kiệt, Hà Nội theo hướng một Tổ hợp dịch vụ công về thông tin KHCN, bao gồm:
+ Thư viện điện tử Trung ương của cả nước về KHCN với vai trò đầu mốiliên kết trung tâm (Central Hub) của Hệ thống thông tin quốc gia về KHCN, đủ sức phục
vụ hàng vạn người tại chỗ và hàng triệu người qua mạng
+ Trung tâm giao dịch quốc gia về công nghệ - trung tâm thúc đẩy thương mại hoá sản phẩm KHCN và cầu nối các nhà khoa học và các doanh nghiệp
+ Trung tâm giao lưu, hội nghị, hội thảo khoa học quốc gia và quốc tế
+ Bảo tàng Trung ương về KHCN của Việt Nam
Tầm nhìn đến năm 2015
Tới năm 2015, Trung tâm Thông tin KHCN Quốc gia phấn đấu trở thành Tập đoàn dịch vụ công về thông tin KHCN, trong đó có:
- Thư viện điện tử quốc gia về KHCN đạt trình độ tiên tiến trong khu vực;
- Ngân hàng dữ liệu quốc gia cung cấp thông tin KHCN cần thiết cho các doanh nghiệp, các tổ chức KHCN;
- Trung tâm xúc tiến thị trường công nghệ, bao hàm Sàn giao dịch điện tử về công nghệ, Techmart Việt Nam, Techmart khu vực, ;
- Mạng thông tin KHCN Việt Nam - mạng nòng cốt của Hệ thống thông tin quốcgia về KHCN
- Trung tâm nghiên cứu và đào tạo nguồn nhân lực về thông tin KHCN;
- Bảo tàng quốc gia về KHCN góp phần giáo dục truyền thống và nâng cao nhận thức của xã hội về KHCN
1.3 Tầm quan trọng của nguồn tài nguyên số nội sinh đối với sự phát triển Trung tâm
1.3.1 Một số khái niệm
Để tìm hiểu khái niệm nguồn TNSNS, cần có cách hiểu đúng đắn về TNS, TLS và BSTS Trong đó cần phân biệt rõ khái niệm TLS và TNS
Tài nguyên số
Hiện tại vẫn chưa có khái niệm rõ ràng về TNS Tuy nhiên, TNS được hiểu
là toàn bộ thông tin do con người tạo ra dưới hình thức số hoá nhằm mục đích phục
Trang 20vụ cho những lợi ích của con người Nguồn TNS có thể tồn tại dưới nhiều dạngkhác nhau (dạng văn bản, dạng hình ảnh và âm thanh hoặc kết hợp hai hay ba dạngtrên) Nguồn TNS cũng có thể tồn tại dưới dạng thư mục hay dạng toàn văn.
Tài liệu số
Theo từ điển giải nghĩa của Mindwrap, “Tài liệu số” là những tài liệu đượclưu giữ bằng máy tính TLS có thể được tạo lập bởi máy tính như việc xử lý cácfile văn bản, các bảng biểu hoặc chúng có thể được chuyển đổi sang dạng số từnhững tài liệu dạng khác TLS cũng được đề cập đến như là tài liệu điện tử
Từ định nghĩa trên cho thấy, TLS được xây dựng thông qua hai kênh:
- Kênh 1: Tạo lập tài liệu gốc bằng máy tính thông qua việc xử lý các file văn bản,hình ảnh, bảng biểu,…
- Kênh 2: Tạo lập TLS thông qua hình thức chuyển đổi định dạng các tài liệu đã được tạo lập ở dạng khác như (Scan, ghi âm,…)
Tóm lại có thể hiểu TLS là tất cả những tài liệu được trình bày dưới dạng số
mà máy tính có thể đọc được
Phân biệt giữa tài nguyên số và tài liệu số
Hiện nay, vẫn chưa có sự lý giải xác đáng nào về sự phân biệt hai khái niệm trên Tuy nhiên có thể khẳng định rằng:
Theo từ điển giải nghĩa các thuật ngữ khoa học của trường Đại học Bay Lor,
“bộ sưu tập số là bộ sưu tập của thư viện hoặc các tài liệu lưu trữ được chuyển đổi sang định dạng thuật ngữ máy tính nhằm mục đích bảo quản hoặc phục vụ truy cập
điện tử”
Trang 21Tóm lại, bộ sưu tập số được hiểu là “ một tập hợp có tổ chức nhiều tài liệu đã
được số hoá dưới nhiều hình thức khác nhau (văn bản, hình ảnh, Audio, Video…)
về một chủ đề Mặc dù mỗi loại hình tài liệu có sự khác nhau về cách thể hiện, nhưng nó đều cung cấp một giao diện đồng nhất mà qua đó các tài liệu có thể truy cập dễ dàng” [5]
Ví dụ:
Bộ sưu tập số về chủ tịch Hồ Chí Minh gồm các văn bản, các tác phẩm vănhọc, các văn kiện chính trị do Bác viết và do người khác viết về Bác; những bài hát,bản nhạc viết về Hồ Chí Minh; những đoạn phim, những băng video phản ánh cuộcđời và sự nghiệp hoạt động cách mạng của Người Trên thế giới đã có những bộsưu tập lớn được xây dựng nhằm phục vụ khai thác trên web như Bộ sưu tập các
tin tức truyền hình Vanderbilt Television News Archive do trường đại học
Vanderbilt xây dựng, bộ sưu tập này tập hợp các tin tức đã được phát trên truyềnhình từ tháng 8 năm 1968 của các kênh truyền hình ABC, CBS, NBC, CNN, FoxNews và tin tức từ một số mạng truyền hình khác [30]
Như vậy, một TVS có thể bao gồm nhiều bộ sưu tập theo các chủ đề khácnhau, có thể do tập thể hoặc cá nhân tự xây dựng hoặc trao đổi, mua bán Các BSTS
có thể được lưu giữ tại thư viện nhưng cũng có thể nằm ngoài thư viện thông quamột kênh cung cấp từ phía đối tác (ví dụ: CSDL toàn văn mua quyền truy cập theothời gian như Science direct, Ebrary,…)
Phân biệt giữa BSTS và CSDL
Hiện nay, có nhiều quan niệm khác nhau về BSTS, có những quan niệm chorằng, CSDL cũng chính là BSTS Điều này theo chúng tôi là chưa chính xác bởi lẽ:
Theo khái niệm về tài liệu và TLS thì một biểu ghi thư mục không phải là
TLS Trong khi đó, BSTS được định nghĩa là “một tập hợp có tổ chức nhiều tài liệu
đã được số hoá…” Như vậy, một CSDL thư mục không thể gọi là BSTS.
Nguồn tài nguyên số nội sinh
Như trên đã trình bày, nguồn TNS có thể bao gồm nhiều BSTS/CSDL khácnhau, trong đó có những BSTS/CSDL do chính cơ quan, tổ chức tự thiết kế xâydựng và những bộ sưu tập được mua hoặc trao đổi từ bên ngoài Như vậy, chúng ta
Trang 22có thể coi nguồn TNSNS là nguồn tài nguyên do cơ quan/tổ chức, tự xây dựng dướidạng bộ sưu tập.
Nguồn TNSNS gồm một số đặc trưng sau:
+ Do cơ quan/đơn vị tạo ra hoặc tự thu thập, xử lý và xây dựng
+ Phải được xử lý bởi cơ quan/đơn vị sở hữu
+ Có thể được sản sinh ra trong quá trình hoạt động của cơ quan, tổ chức (các báo cáo, thống kê, bản tin hoạt động,…)
+ Lưu giữ cục bộ trên máy tính, server riêng
+ Có thể bao gồm những tài liệu từ bên ngoài được xử lý và tổ chức lại theo một cơ chế thống nhất
+ Có thể truy cập từ xa thông qua mạng máy tính
Thí dụ, nguồn TNSNS tại Trung tâm TTKH&CNQG là toàn bộ những sảnphẩm do Trung tâm làm ra dưới dạng số hoá như biểu ghi thư mục, biểu ghi toànvăn, các bản tin điện tử,…
Tóm lại, nguồn TNSNS là nguồn tài nguyên được sản sinh ra ngay trong cơquan/đơn vị chứ không phải những nguồn tài nguyên được mua hay trao đổi từ bênngoài mà chưa được xử lý hay biên soạn lại
1.3.2 Tài nguyên số nội sinh trong sự phát triển của Trung tâm
Trong 10 định hướng phát triển và tầm nhìn chiến lược đến năm 2015 củaTrung tâm, nguồn TNSNS giữ vị trí quan trọng hàng đầu thể hiện ở một số điểmchính sau:
- Nguồn TNSNS đóng vai trò quan trọng giúp thực hiện chức năng lưu giữ và quản lý kho tài liệu truyền thống tại Trung tâm.
Một trong những nhiệm vụ quan trọng của Trung tâm được quy định trongĐiều 16 Nghị định số 159/2004/NĐ-CP ngày 31/8/2004 của Chính phủ về hoạtđộng thông tin khoa học và công nghệ và Điều 25 Luật Khoa học công nghệ là
“Đăng ký, hiến tặng và lưu giữ kết quả thực hiện nhiệm vụ khoa học và côngnghệ” Bên cạnh đó, quá trình lưu giữ toàn bộ nguồn tài liệu truyền thống tại Trungtâm cũng phụ thuộc rất nhiều vào nguồn TNSNS (giúp thực hiện chức năng thống
kê, quản lý tài liệu truyền thống)
Trang 23- Nguồn TNSNS là cơ sở để Trung tâm phổ biến nguồn tài liệu truyền thống hiện có.
Trong điều kiện hiện nay, hầu hết các cơ quan TT-TV đã ứng dụng CNTT vàohoạt động và cho phép tra cứu bằng máy tính, đặc biệt là tra cứu thông qua mạngInternet Do đó, nguồn TNSNS được coi là phương tiện duy nhất giúp NDT có thểtiếp cận đến nguồn tài liệu truyền thống
Trung tâm TTKH&CNQG là một trong những cơ quan lưu giữ kho tài liệutruyền thống lớn nhất cả nước và giá trị khoa học cao bao gồm sách, tạp chí khoahọc kỹ thuật, báo cáo các đề tài đang tiến hành, kết quả nghiên cứu,… Do vậy, việctạo lập các điểm truy cập tới kho dữ liệu quý này thông qua nguồn TNSNS có ýnghĩa quyết định hiệu quả khai thác kho dữ liệu truyền thống
- Nguồn TNSNS giúp đẩy nhanh quá trình hiện đại hoá Thư viện Trung ương
Theo số liệu thống kê của Trung tâm năm 2007 và 2008 cho thấy, lượng bạn
đọc đến khai thác tài liệu dạng truyền thống tại Tung tâm ngày càng giảm đi Nếunhư năm 2007, Trung tâm phục vụ 70.725 lượt bạn đọc thì năm 2008 con số nàygiảm xuống còn 67.824 lượt, thay vào đó, số lượng NDT truy cập vào các CSDLcủa Trung tâm để khai thác dữ liệu ngày càng tăng lên Chỉ tính riêng dịch vụ “Bạnđọc đặc biệt” trong 6 tháng đầu năm 2009 đã thu hút 28.998 lượt người truy cậpvới khối lượng bài toàn văn được download lên tới 28.074 bài Điều đó cho thấy,trong bối cảnh hiện nay, hình thức phục vụ tài liệu dạng truyền thống đã và đangnhường chỗ cho phương thức cung cấp tài liệu trực tuyến Do vậy, để đẩy nhanhquá trình hiện đại hoá và nâng cao chất lượng hoạt động của Thư viện Trung ương,Trung tâm cần xây dựng được các BSTS đủ mạnh về khối lượng và chất lượng –
đó chính là nguồn TNSNS
- Phát triển nguồn TNSNS giúp Trung tâm thực hiện và hoàn thành các chức năng, nhiệm vụ, định hướng và mục tiêu đã đề ra
+ Trong việc xây dựng CSDL đa phương tiện "Hồ sơ công nghệ" phục vụ cho
việc xúc tiến và phát triển thị trường công nghệ, nguồn TNSNS là nhân tố quyết địnhtoàn bộ CSDL này Nguồn TNSNS càng lớn, chất lượng càng cao, Trung tâm càng thuhút được nhiều NDT đặc biệt là các nhà doanh nghiệp và nhà khoa học
Trang 24+ Tăng cường cung cấp thông tin phục vụ phát triển nông thôn miền núi lànhiệm vụ mang tính chiến lược của Trung tâm Xuất phát từ nhu cầu sử dụng thông tinngày càng cao và mở rộng tới các vùng nông thôn, Trung tâm đã có nhiều dự án triểnkhai cung cấp thông tin tới các vùng sâu, vùng xa Tuy nhiên, nhu cầu thông tin ở khuvực này đang ngày một gia tăng Vì thể, trong những năm tới, nhu cầu phát triển nguồnTNSNS ở Trung tâm đặc biệt là những tài liệu hướng dẫn kỹ thuật ( trong đó có phimkhoa học) nhằm cung cấp thông tin, đáp ứng cho nhu cầu phát triển nông thôn, đặc biệt làvùng sâu vùng xa là rất lớn.
+ Để thực hiện tốt nhiệm vụ cung cấp thông tin phục vụ lãnh đạo và quản lýđược giao, đòi hỏi Trung tâm phải xây dựng được một hệ thống cung cấp thông tin đủmạnh luôn sẵn sàng đảm bảo những thông tin cần thiết một cách nhanh nhất và chính xácnhất dựa trên nguồn TNSNS hiện có
Từ những phân tích trên cho thấy, nhu cầu phát triển nội dung số tại Trungtâm trong thời gian tới là rất lớn Để đáp ứng được nhu cầu này, Trung tâm cần huyđộng toàn bộ lực lượng và điều kiện hiện có để phục vụ cho công tác phát triểnnguồn TNSNS
Khả năng phát triển nguồn TNSNS tại Trung tâm
Trong những năm gần đây, được sự quan tâm đầu tư của Nhà Nước, đặcbiệt là Bộ KH&CN, Trung tâm TTKH&CNQG có điều kiện để phát triển về mọimặt Trong đó, phát triển nguồn TNSNS là một trong những vấn đề được Trungtâm quan tâm hàng đầu
Phát triển nguồn TNSNS và đưa ra phục vụ hiệu quả nguồn tài nguyên đó lànhiệm vụ đòi hỏi rất nhiều điều kiện về nhân lực và vật lực Trung tâmTTKH&CNQG có đầy đủ mọi điều kiện để phát triển và đưa vào khai thác nguồnTNSNS một cách hiệu quả dựa trên những điều kiện sau:
- Trung tâm có nguồn tài liệu làm nguyên liệu đầu vào đủ lớn để phục vụ chocông tác tạo lập nguồn TNS gồm: (Kho sách, tạp chí tiếng Việt và ngoại văn với khốilượng lớn; nguồn thông tin đa dạng và cập nhật được cung cấp từ các nhà khoa học,doanh nghiệp…)
- Trung tâm có đội ngũ cán bộ đông đủ về số lượng, có trình độ và được đào tạo đầy đủ các kỹ năng nghiệp vụ cho nhiệm vụ phát triển TNSNS với khối lượng lớn
Trang 25- Hệ thống máy tính với khoảng 150 máy (đại đa số từ Pentium IV trở lên) và gần
20 máy chủ tốc độ cao, dung lượng lớn là cơ sở cho phép Trung tâm tiến hành xử
lý, lưu giữ và phục vụ một khối lượng TNSNS lớn mà ít đơn vị có khả năng thựchiện được
- Máy scanner Kirtas tốc độ 1200 trang/giờ, và hơn 10 máy scanner tốc độ caocùng với các thiết bị ghi đĩa CD, VCD cho phép Trung tâm số hoá tài liệu với khối lượnglớn (hàng triệu trang tài liệu và hàng trăm bộ phim KHCN / năm)
- Hệ thống phần mềm đa dạng, linh hoạt (Zope, Libol, Win ISIS, SQL Server,Oracle portal, ) là cơ sở quan trọng cho phép Trung tâm tiến hành quản lý và khai thácnguồn TNSNS hiện có và trong tương lai
- Mạng VINAREN với tốc độ từ 40 đến 155 Mps là điều kiện thuận lợi để Trungtâm triển khai phục vụ trực tuyến nguồn TNSNS trên phạm vi rộng (trong nước và quốctế)
- Ngoài ra, nguồn kinh phí khoảng 50 tỷ đồng của Nhà Nước mỗi năm là tiền đềquan trọng để phát triển Trung tâm nói chung và phát triển nguồn TNSNS nói riêng
Những điều kiện trên đây cho phép Trung tâm phát triển nguồn TNSNS vớitốc độ nhanh, khối lượng lớn và chất lượng cao, đáp ứng được nhu cầu khai thácTNS ngày một cao
Trang 26Chương 2 THỰC TRẠNG CÔNG TÁC XÂY DỰNG VÀ QUẢN
LÝ NGUỒN TÀI NGUYÊN SỐ NỘI SINH TẠI TRUNG TÂM
2.1 Nguồn tài nguyên số nội sinh trong cơ cấu vốn tài liệu của Trung tâm
Trung tâm TTKH&CNQG là một trong những đơn vị có nguồn tài ngyên sốlớn nhất cả nước Trong đó, bên cạnh nguồn TNS mua từ bên ngoài, Trung tâmcũng là đơn vị đứng đầu cả nước về nguồn TNSNS
Nguồn TNSNS của Trung tâm rất phong phú về nội dung và đa dạng về hìnhthức Trong phạm vi đề tài này, tác giả phân chia chúng thành hai loại CSDL chính
là CSDL thư mục và CSDL toàn văn
2.1.1 Cơ sở dữ liệu thư mục
Các CSDL thư mục là một trong những nguồn TNSNS lớn nhất hiện có củaTrung tâm, chúng đóng vai trò quan trọng giúp NDT có thể tiếp cận tới nguồn tàinguyên truyền thống quý báu với hàng triệu bản mà Trung tâm đang sở hữu CácCSDL này bao gồm:
- Sách ở Thư viện khoa học và kỹ thuật Trung ương 143.969 biểu ghi
- Tạp chí ở Thư viện khoa học và kỹ thuật Trung ương 6.938 biểu ghi
- Tài liệu KH&CN nước ngoài (345.323 biểu ghi)
- Báo cáo kết quả nghiên cứu (9.851 biểu ghi)
- Tài liệu KHCN Việt Nam trước 2004 ( 73.259 biểu ghi)
- Đề tài đang tiến hành (3.706 biểu ghi)
- Mục lục liên hợp tạp chí (3.808 biểu ghi)
2.1.2 Cơ sở dữ liệu toàn văn
Các CSDL toàn văn của Trung tâm hầu hết được xây dựng từ năm 2004 đến nay bao gồm:
- Tài liệu KH&CN Việt Nam STD (gần 55.000 biểu ghi)
Trang 27- Thư viện điện tử khoa học và công nghệ phục vụ nông thôn (112.000 biểu ghi)
- Công nghệ chào bán (hơn 7.600 biểu ghi)
- Dịch vụ KH&CN (856 biểu ghi)
- Báo cáo kết quả nghiên cứu (trên 6.500 biểu ghi)
- Văn bản pháp quy về KH&CN
- Giải pháp phần mềm (2288 biểu ghi)
- Tiêu chuẩn Việt Nam
- Nhãn hiệu hàng hoá
- Các bản tin điện tử (gồm Nông thôn đổi mới, Tri thức và phát triển, Tổng luậnKH&CN, Khoa học Công nghệ Môi trường, Môi trường và phát triển bền vững, VietNam Infoterra Newsletter, Thông tin & tư liệu,…)
- Thư viện phim KHCN ( hơn 265 phim KH&CN được lưu trữ trên 145 đĩa ROM )
CD-Ngoài ra, Trung tâm còn lưu giữ nhiều CSDL trước năm 2004 như:
Khoa học Công nghệ Môi trường, Vietnam Development News Tạp chí Hoạt độngKhoa học, Communication Physics Acta Mathematica Vietnamica, Báo cáo khoahọc công nghệ, Tổng quan về khoa học công nghệ và môi trường,…
Với hàng triệu biểu ghi thuộc nhiều CSDL quý như Book, STD, Kết quảnghiên cứu…, nguồn TNSNS đã và đang là nguồn lực thông tin chủ yếu trong cơcấu nguồn tin của Trung tâm
2.2 Hiện trạng công tác phát triển nguồn tài nguyên số nội sinh
2.2.1 Khung khổ pháp lý
Để hoàn thành chức năng nhiệm vụ được quy định trong Luật Khoa học côngnghệ, Nghị định số 159/2004/NĐ-CP ngày 31/8/2004 của Chính phủ về hoạt độngthông tin khoa học và công nghệ và Quyết định số 11/2004/QĐ-BKHCN quy địnhđiều lệ về tổ chức và hoạt động của Trung tâm TTKH&CNQG, Trung tâmTTKH&CNQG cần đẩy nhanh quá trình hiện đại hoá công tác lưu giữ, phát triển vàphổ biến các nguồn tin KH&CN
Nguồn TNSNS đóng vai trò quan trọng, quyết định đến hiệu quả toàn bộnguồn tin trong nước tại Trung tâm, do vậy vấn đề xây dựng và phát triển nguồn
Trang 28TNSNS là một nhiệm vụ tất yếu Tuy nhiên, trong quá trình triển khai xây dựng vàphát triển nguồn tài nguyên này, Trung tâm cũng gặp phải một số khó khăn nhấtđịnh, trong đó có vấn đề về bản quyền cho nguồn tài liệu số hoá.
Vấn đề bản quyền được coi là vấn đề chung của nhiều quốc gia và nhiều lĩnh vực,đặc biệt là trong lĩnh vực TT-TV Đã có nhiều trường hợp vi phạm bản quyền xảy ranhư trường hợp nhà cung cấp dịch vụ tìm kiếm thông tin Google đã quét và số hóakhoảng hơn 4.000 tác phẩm của các tác giả Việt Nam cho dự án Thư viện số GoogleBooks mà chưa được sự đồng ý của chủ sở hữu Theo đó, Trung tâm Quyền tác giảvăn học Việt Nam đã và đang nỗ lực yêu cầu Google thực hiện Luật bản quyền đối vớitác giả Việt Nam Tại các cơ quan Thông tin và thư viện của Việt Nam, trong đó cóTrung tâm TTKH&CNQG cũng không tránh khỏi hiện tượng này
Hiện tại, Trung tâm đã tiến hành số hoá gần 200.000 tài liệu, trong đó có55.000 bài trích tạp chí khoa học trong nước, 112 tài liệu dạng sách kỹ thuật, giáotrình và 6.500 báo cáo kết quả nghiên cứu Tuy nhiên, công tác số hoá vẫn chưa tìmkiếm được sự sáng tỏ và thuyết phục trong vấn đề bản quyền
Điểm đ, khoản 1 Điều 25 Luật Sở hữu trí tuệ và điểm đ điều 761 mục 2chương 1 Bộ luật Dân sự về quyền tác giả quy định các trường hợp sử dụng tácphẩm đã công bố không phải xin phép, không phải trả tiền nhuận bút, thù lao cho
phép “sao chép tác phẩm để lưu trữ trong thư viện với mục đích nghiên cứu”[7].
Tuy nhiên, trong khoản 2 Điều 25 Nghị định 100/2006/NĐ-CP Quy định chi tiết vàhướng dẫn thi hành một số điều của Bộ luật Dân sự, Luật Sở hữu trí tuệ về quyền
tác giả và quyền liên quan cũng quy định rõ "Sao chép tác phẩm để lưu trữ trong
thư viện với mục đích nghiên cứu quy định tại điểm đ khoản 1 Điều 25 của Luật Sở hữu trí tuệ là việc sao chép không quá một bản Thư viện không được sao chép và phân phối bản sao tác phẩm tới công chúng, kể cả bản sao kỹ thuật số"[9].
Vậy, công tác số hoá tài liệu tại Trung tâm có vi phạm bản quyền hay không?.Hiện đang có hai quan điểm trái ngược nhau cho vấn đề này Quan điểm thứ nhấtcho rằng việc số hoá là hoàn toàn hợp pháp trong khi quan điểm thứ hai cho rằngviệc làm này đang vi phạm tới quyền tác giả được nêu trong các văn bản pháp luật
Để có thể đưa ra câu trả lời chính xác cho vấn đề này, cần xem xét và đốichiếu các văn bản pháp lý vào trường hợp cụ thể của Trung tâm
Trang 29Vấn đề quyền tác giả và quyền sở hữu được quy định rõ trong một số văn kiệntrong nước và quốc tế, trong đó có Công ước quôc tế Berne (1986), Bộ luật Dân sự,Luật Sở hữu trí tuệ Việt Nam (2005) và Nghị định 100/2006/NĐ-CP Quy định chitiết và hướng dẫn thi hành một số điều của Bộ luật Dân sự Các văn kiện này đềuquy định rõ đối tượng được bảo hộ quyền tác giả, thời gian bảo hộ, các trường hợp
vi phạm và không vi phạm quyền tác giả Để có những luận cứ chính xác, đảm bảođầy đủ tính pháp lý cho công tác số hoá cần tìm hiểu rõ những quy định nêu trong cácvăn kiện này
- Về đối tượng được bảo hộ quyền tác giả, khoản 1 Điều 2 Công ước Berne quy
định về tác phẩm được bảo hộ nêu rõ "Các tác phẩm văn học và nghệ thuật bao gồm
tất cả các sản phẩm trong lĩnh vực văn học, khoa học và nghệ thuật, bất kỳ được biểu hiện theo phương thức hay dưới hình thức nào, chẳng hạn như sách, tập in nhỏ
và các bản viết khác, các bài giảng, bài phát biểu, bài thuyết giáo và các tác phẩm cùng loại…” [29].
Ở Việt Nam, đối tượng được bảo hộ quyền tác giả được quy định cụ thể trong
Điều 737 của Bộ Luật Dân sự là “mọi sản phẩm sáng tạo trong các lĩnh vực văn học,
nghệ thuật, khoa học được thể hiện dưới bất kỳ hình thức và bằng bất kỳ phương tiện nào, không phân biệt nội dung, giá trị và không phụ thuộc vào bất kỳ thủ tục nào”[1].
Khoản 1 Điều 14 của Luật Sở hữu trí tuệ cũng quy định rõ các đối tượng sau:
b) Tác phẩm văn học, khoa học, sách giáo khoa, giáo trình và tác phẩm khác được thể hiện dưới dạng chữ viết hoặc ký tự khác;
c) Bài giảng, bài phát biểu và bài nói khác;
Trang 30k) Bản họa đồ, sơ đồ, bản đồ, bản vẽ liên quan đến địa hình, công trình khoahọc;
l) Tác phẩm văn học, nghệ thuật dân gian;
m) Chương trình máy tính, sưu tập dữ liệu
Như vậy, có thể khẳng định rằng, các đối tượng số hoá của Trung tâm (Sách, bài trích, kết quả nghiên cứu,…) thuộc diện bảo hộ của quyền tác giả
- Về nội dung quyền tác giả, Điều 750, 751, 752 trong Bộ luật Dân sự và Điều
18 Luật Sở hữu trí tuệ quy định “Quyền tác giả đối với tác phẩm quy định tại Luật
này bao gồm quyền nhân thân và quyền tài sản” [7].
Quyền nhân thân được quy định trong Điều 19 của Luật Sở hữu trí tuệ gồm các quyền sau:
1 Đặt tên cho tác phẩm;
2 Đứng tên thật hoặc bút danh trên tác phẩm; được nêu tên thật hoặc bút danh khi tác phẩm được công bố, sử dụng;
3 Công bố tác phẩm hoặc cho phép người khác công bố tác phẩm;
4 Bảo vệ sự toàn vẹn của tác phẩm, không cho người khác sửa chữa, cắt xénhoặc xuyên tạc tác phẩm dưới bất kỳ hình thức nào gây phương hại đến danh dự và uytín của tác giả
Quyền tài sản được quy định trong khoản 1 Điều 20 bao gồm các quyền sau đây:
a) Làm tác phẩm phái sinh;
b) Biểu diễn tác phẩm trước công chúng;
c) Sao chép tác phẩm;
d) Phân phối, nhập khẩu bản gốc hoặc bản sao tác phẩm;
đ) Truyền đạt tác phẩm đến công chúng bằng phương tiện hữu tuyến, vô tuyến, mạng thông tin điện tử hoặc bất kỳ phương tiện kỹ thuật nào khác;e) Cho thuê bản gốc hoặc bản sao tác phẩm điện ảnh, chương trình máy tính
- Về thời gian bảo hộ, theo khoản 1 Điều 7 Công ước Berne quy định là “suốt
cuộc đời của tác giả và năm mươi năm sau khi tác giả chết” Bên cạnh đó, khoản 8 của
điều này cũng quy định thêm “Trong bất kỳ trường hợp nào thời hạn bảo hộ sẽ do quy
định của Luật pháp của nước nơi sự bảo hộ được áp dụng Tuy nhiên, trừ
Trang 31trường hợp Luật pháp của nước đó quy định khác đi, còn không thì thời hạn bảo hộ
sẽ không quá thời hạn được quy định ở quốc gia gốc của tác phẩm”.[29]
Ở Việt Nam, thời gian bảo hộ quyền tác giả đƣợc quy định tại Điều 27 Luật
Sở hữu trí tuệ và Điều 766 Bộ luật Dân sự nhƣ sau:
+ Quyền nhân thân của tác giả đƣợc bảo hộ vô thời hạn”
+ Quyền tài sản là “suốt cuộc đời tác giả và năm mươi năm tiếp theo năm tác
giả chết; trong trường hợp tác phẩm có đồng tác giả thì thời hạn bảo hộ chấm dứt vào năm thứ năm mươi sau năm đồng tác giả cuối cùng chết”[1].
- Về Các trường hợp vi phạm quyền tác giả đƣợc quy định rõ trong khoản 3
Điều 20 của Luật Sở hữu trí tuệ nhƣ sau: “Tổ chức, cá nhân khi khai thác, sử dụng một,
một số hoặc toàn bộ các quyền quy định tại khoản 1 Điều này và khoản 3 Điều 19 của Luật này phải xin phép và trả tiền nhuận bút, thù lao, các quyền lợi vật chất khác cho chủ sở hữu quyền tác giả”[7].
Mặt khác, khoản 2 Điều 25 Nghị định 100/2006/NĐ-CP cũng chỉ rõ: "Sao
chép tác phẩm để lưu trữ trong thư viện với mục đích nghiên cứu quy định tại điểm
đ khoản 1 Điều 25 của Luật Sở hữu trí tuệ là việc sao chép không quá một bản Thư viện không được sao chép và phân phối bản sao tác phẩm tới công chúng, kể cả bản sao
kỹ thuật số"[9] Trong đó, bản sao tác phẩm đƣợc giải thích rõ trong Khoản 4 Điều 4 của
Nghị định này “là bản sao chép trực tiếp hoặc gián tiếp một phần hoặc toàn bộ tác
đã vi phạm khoản 6 Điều 28 Luật Sở hữu trí tuệ về những hành vi xâm phạm quyền
tác giả đó là "Sao chép tác phẩm mà không được phép của tác giả, chủ sở hữu
quyền tác giả" [7].
Tuy nhiên, cũng cần giải thích thêm rằng ở Việt Nam trong lúc luật Bản quyềncòn chƣa đƣợc áp dụng triệt để thì những sai phạm nhƣ đã nêu là rất phổ biến và
Trang 32không thể tránh khỏi Hơn nữa, công tác số hoá tài liệu của Trung tâm được tiếnhành từ khá sớm (trước khi Việt Nam trở thành thành viên của Công ước Berne vàtrước khi ban hành Bộ luật Dân sự và Luật Sở hữu trí tuệ).
2.2.2 Quy trình tạo lập tài liệu số
Tạo lập TLS là bước đầu tiên của quá trình xây dựng BSTS Sự phong phú,
đa dạng và chất lượng của các BSTS phụ thuộc rất lớn vào quá trình tạo lập TLS.Quá trình tạo lập TLS quyết định đến:
- Định dạng của TLS (Dạng text, dạng ảnh và dạng đa phương tiện)
- Chất lượng của TLS nói riêng và BSTS nói chung (Sự chuẩn xác về ngôn ngữ
và chính tả, chất lượng các file ảnh, video…)
- Sự đa dạng và mức độ bao quát nguồn thông tin
- Chất lượng TLS trong bộ sưu tập về mặt nội dung
Quá trình tạo lập nguồn TNS diễn ra ở hầu hết các bộ phận chức năng củaTrung tâm trong đó tập trung vào một số bộ phận chủ yếu là:
- Phòng Phát triển nguồn tin
- Phòng CSDL
- Phòng Phân tích thông tin
- Phòng Thông tin Thị trường KH&CN
- Phòng Phát triển hoạt động thông tin
- Phòng Thông tin nông thôn, miền núi
- Trung tâm Inforterra Việt Nam
Do nguồn TNSNS của Trung tâm rất phong phú và đa dạng, bao gồm nhiềuloại CSDL khác nhau nên việc tạo lập TLS cũng liên quan đến nhiều phương thức
kỹ thuật Hiện nay, Trung tâm đang sử dụng ba hình thức tạo lập TLS chủ yếu đó là:
- Số hoá tài liệu bằng máy scanner
- Tạo các file TLS dạng đa phương tiện (các phim khoa học)
- Tạo lập TLS thông qua xử lý các file văn bản
Trong phần này tác giả tập trung chủ yếu vào phương thức tạo lập nguồn TNSthông qua phương thức số hoá tài liệu truyền thống bằng máy scanner cho CSDLđiển hình là STD
Trang 33Quy trình số hoá tài liệu gồm ba công đoạn chủ yếu là: Lựa chọn nguồn tàiliệu để số hoá; quét tài liệu và xử lý kỹ thuật; lưu giữ các file dữ liệu đầu ra Bacông đoạn này quyết định đến chất lượng tài liệu cả về nội dung và hình thức.
a Lựa chọn tài liệu cần số hoá
Việc lựa chọn nguồn tài liệu để tiến hành số hoá là khâu đầu tiên và cũng làkhâu quyết định nội dung nguồn tài nguyên được số hoá Hiện nay, công tác số hoátài liệu tốn kém khá nhiều thời gian và công sức nên việc lựa chọn tài liệu để số hoárất quan trọng, nó góp phần giảm thiểu chi phí cho công tác số hoá và cũng gópphần làm tăng chất lượng về nội dung nguồn TNS Quá trình lựa chọn và số hoáđược thực hiện theo sơ đồ sau:
Tạp chí khoa học
tiếng Việt và tài liệu
hội nghị, hội thảo
Scan File toàn văn dạng Lựa chọn Các file bài trích
tạp chí
H 2.1 Sơ đồ quá trình lựa chọn và số hoá tài liệu
Quá trình lựa chọn bài trích để số hoá:
Hàng năm, các tạp chí khoa học tiếng Việt và tài liệu hội nghị, hội thảo sau khiđược bổ sung về sẽ được giao cho bộ phận chức năng là Phòng CSDL, bộ phận này
sẽ tiến hành phân loại và xử lý theo sự phân công từng lĩnh vực chuyên môn Nhữngchuyên gia có kiến thức và kinh nghiệm trong lĩnh vực nào thì được giao nhiệm vụlựa chọn bài trích trong các tài liệu thuộc lĩnh vực đó Quá trình lựa chọn cũng đượctiến hành khoa học và tuân thủ những nguyên tắc chặt chẽ đối với tài liệu khoa họcnhư: Nội dung đề cập, giá trị khoa học, khối lượng bài viết,…Sau khi nhận tài liệu
từ bộ phận Bổ sung, cán bộ chuyên môn nhận tài liệu thuộc diện quản lý của mình
và chuyển sang bộ phận số hoá Sau khi tài liệu được số hoá, cán bộ xử lý nhận filetoàn văn của toàn bộ số tạp chí, tài liệu hội thảo,…và tiến hành lựa chọn bài trích để
số hoá, sau đó gửi cán bộ phụ trách bộ phận duyệt lại những bài đã
Trang 34chọn, nếu bài trích không đủ tiêu chuẩn sẽ không được tiếp tục xử lý để đưa vàoCSDL.
Qua quá trình tìm hiểu nhu cầu từ bộ phận xử lý tài liệu cho CSDL này chothấy, vẫn còn một số bất cập trong quá trình cung cấp nguồn thông tin phục vụ chocông tác số hoá tài liệu truyền thống Những bất cập này được thể hiện ở các điểmchính sau:
+ Thiếu một số tài liệu khoa học đã được bổ sung từ những năm trước
+ Chưa cập nhật được đầy đủ các tài liệu khoa học địa phương (các tạp chí khoa học của các sở KH&CN các tỉnh/thành phố)
+ Nguồn tài liệu bổ sung chưa đáp ứng kịp thời về thời gian ( một số tạp chí khoa học bị trễ từ một đến vài tháng)
+ Nguồn tài liệu dạng kỷ yếu hội nghị, hội thảo còn hạn chế về số lượng và chưa được cập nhật kịp thời
Để đảm bảo nguồn nguyên liệu cho công tác số hoá, những tồn tại trên cầnsớm được khắc phục Các biện pháp cụ thể để khắc phục những hiện tượng trên sẽđược trình bày cụ thể trong chương 3 của luận văn
b Quét tài liệu và xử lý file quét
Quét tài liệu là khâu quan trọng phụ thuộc nhiều vào các thiết bị, kỹ thuật vậnhành thiết bị và kỹ năng xử lý hình ảnh
Về thiết bị:
Trước đây, thiết bị được sử dụng để số hoá tài liệu chủ yếu là máy scanner thủcông Trung tâm đã đầu tư 06 máy scanner hiệu HP 5590 (H 2.2) cho bộ phận xâydựng CSDL STD Đến đầu năm 2009, Trung tâm đã đầu tư mua 01 máy scannercông nghiệp APT BookScan 1200 (H 2.3) để số hoá tài liệu cho CSDL STD và một
số CSDL khác Sau đây là những mô tả chi tiết về thông số của hai loại máy trên:
- Máy Scanner HP 5590
Đây là loại máy scan máy scan phẳng hiện đại có thông số kỹ thuật như sau:+ Độ phân giải scan từ 12 dpi đến 999999 dpi
+ Độ phân giải scan, phần cứng 2400 x 2400 dpi
+ Bit depth 48 bit
Trang 35+ Tốc độ thực hiện dưới 24 giây: hình 4 x 6 trong Microsoft Word; dưới 36giây
+ OCR nguyên trang văn bản với Microsoft Word; dưới 18 giây (dùng để email hình)
+ Bộ phận cung cấp nguyên liệu tự động tiêu chuẩn, 50 tờ
+ Kích cỡ scan tối đa 8.5 x 11 inch
+ Giao diện kết nối USB 2.0
+ Kích thước (w x d x h) 19.21 x 13.39 x 6.38 inch
+ Hệ điều hành tương thích Microsoft Windows XP , Microsoft Windows 98,Microsoft Windows 2000 , Microsoft Windows ME , Apple MacOS
H 2.2: Máy scanner HP 5590 dùng cho số hoá tài liệu
- Máy scanner công nghiệp APT BookScan
Đây là loại máy scanner tự động tốc độ cao có các thông số kỹ thuật đạt tiêu chuẩn công nghiệp:
Trang 36+ Bộ phận nâng sách với công nghệ SmartCradle đƣợc thiết kế hình nôi theochữ V có góc mở 110 độ đỡ lấy sách nhẹ nhàng theo mọi kích cỡ và độ dày khác nhau.
H 2.3: Máy APT BookScan 1200 được trang bị để số hoá tài liệu
- Các bước chính trong quy trình số hoá tài liệu trên máy APT BookScan 1200 gồm:
Trang 37+ Nhận tài liệu từ các bộ phận, xây dựng bảng danh sách các sách, kiểm tralại số lượng, phân loại sách theo độ ưu tiên cho việc quét và phân loại các sách cần xử lýtrước khi quét Tất cả kết quả được lưu vào bảng quản lý sách (được xây dựng bằngmẫu định dạng Excel)
+ Xử lý sách trước khi quét (Pre-scan): Làm sạch sách đối với sách bẩn; chỉnhlại mép sách nếu cong, quăn; mở những trang sách bị gấp; rọc những trang sách bị dínhliền
+ Thực hiện quét sách bằng máy APT (Image Capture, Scan)
+ Thực hiện xử lý ảnh và nâng cao chất lượng hình ảnh (Image Processing)+ Thực hiện kiểm tra chất lượng (Quality Check) bằng cách review sản phẩmtheo check list và chỉnh sửa lại sản phẩm nếu chưa đạt chất lượng (Image Correction).Đây là điểm khởi đầu của quá trình Kiểm tra chất lượng, và chủ yếu tập trung vào chấtlượng hình ảnh
+ Thực hiện nhận dạng (OCR) và tạo file PDF
+ Thực hiện review và chỉnh sửa tài liệu sau OCR
- Những thao tác chính khi sử dụng máy APT BookScan 1200:
+ Điều chỉnh góc chụp và vị trí chụp thông qua giá nâng và kẹp sách
Trang 38+ Thao tác trên màn hình Scan setting để điều chỉnh: Độ rộng sách
Tốc độ scan
Độ kẹp mạnh/yếu của kẹp sách
Độ hút mạnh/yếu của Cánh tay giở trang Độ thổi mạnh/yếu của Ống thổiChế độ chụp là tự động hay lật giở bằng tayChế độ chụp cả hai trang hoặc chỉ trang phải hoặc chỉ trang trái+ Sử dụng màn hình điều khiển thông số camera (Hình 2.5) để điều chỉnh: Tốc độ đóng/mở cửa trập
Độ mở ống kính
Độ nhạy sáng Kích thước ảnh Chất lượng ảnh
H 2.5: Màn hình file management
Trang 39H 2.6: Màn hình điều chỉnh các thông số cho camera
- Xử lý các file pdf và file ảnh sau khi scan
Đây là khâu cuối cùng để tạo nên một file pdf hoàn chỉnh Những công việc phải thực hiện bao gồm:
+ Kiểm tra toàn bộ file quét để phát hiện những chỗ bị mất chữ
+ Kiểm tra độ phân giải (phát hiện những trang bị mờ để tiến hành quét lại)+ Kiểm tra độ nghiêng (nếu trang bị nghiêng thì chỉnh lại hoặc quét lại)
+ Thực hiện việc crop các trang quét để loại bỏ phần lề có màu đen và căn lề cho trang quét
+ Tối ưu hoá file pdf bằng công cụ PDF Optimizer để tạo ra file pdf có dung lượng nhỏ và chất lượng tốt
Đối với máy APT BookScan 1200, công việc xử lý file ảnh có các công cụriêng là phần mềm “BookScan Editor” (BSE) Công cụ này có 2 hệ thống chức năngchính sau:
+ Xử lý hình ảnh cho template và chạy theo bó (run batch) Các chức năng ở đây chủ yếu để tạo ra template để sau đó áp dụng cho tất cả các trang tài liệu
+ Xử lý tinh từng hình ảnh sau khi đã xử lý theo bó
- Lưu giữ các file dữ liệu đầu ra
Sau khi thực hiện đầy đủ các thao tác kỹ thuật để cho ra các file dạng pdf, các file này được lưu giữ trên một server đặt tại bộ phận số hoá
Trang 40Thông qua việc khảo sát một số bài toàn văn đã quét trước đây (trên máy HP5590) và theo phản ánh của Bộ phận xây dựng CSDL sau khi triển khai quét tài liệutrên máy APT BookScan 1200 cho thấy, các kỹ thuật quét tài liệu cũng tồn tại một
số hạn chế nhất định chưa được khắc phục Một số lỗi vẫn tồn tại trên bài toàn vănnhư lỗi lệch trang, đen lề, mờ không đọc được… Những lỗi này cần sớm đượckhắc phục triệt để khi sử dụng máy scanner APT BookScan 1200
2.2.3 Xây dựng cơ sở dữ liệu
Xây dựng các CSDL đòi hỏi nhiều yếu tố liên quan như phần mềm, các công
cụ biên mục, các chuẩn dùng trong công tác biên mục, phương thức lưu giữ filetoàn văn, Trong đó việc sử dụng phần mềm đóng vai trò quan trọng, quyết địnhđến cấu trúc của CSDL Trong phần này, tác giả sẽ tập trung tìm hiểu các phần mềmdùng cho việc xây dựng các CSDL nội sinh và phương pháp xây dựng một sốCSDL như BOOK, STD và KQNC
a Phần mềm và các chuẩn
Phần mềm
Trung tâm TTKH&CNQG là một trong những cơ quan đi đầu trong quá trìnhứng dụng CNTT Việc ứng dụng các phần mềm quản lý tài liệu được triển khai khásớm (từ đầu thập niên 80) Cùng với quá trình phát triển của CNTT, Trung tâmkhông ngừng đẩy nhanh quá trình áp dụng các phần mềm vào hoạt động
Xuất phát từ sự phong phú và đa dạng của các nguồn TNS, hiện tại Trung tâmđang sử dụng đồng thời nhiều phần mềm để quản lý nguồn tài nguyên này Dướiđây là một số phần mềm đã và đang được sử dụng:
- CDS/ISIS for DOS và WINISIS
Phần mềm đầu tiên được áp dụng tại Trung tâm là CDS/ISIS for DOS Đây làphần mềm tư liệu dùng để quản lý các CSDL dạng văn bản có cấu trúc doUNESCO phát triển và phổ biến từ năm 1985 và được cung cấp miễn phí cho cácthư viện Việt Nam Đây cũng là phần mềm đầu tiên được sử dụng phổ biến tại ViệtNam để quản lý thư viện truyền thống CDS/ISIS có các đặc trưng sau:
+ Sử dụng giao diện DOS để xây dựng CSDL
+ Sử dụng dạng biên mục máy đọc được CCF (Common CommunicationFormat)