1. Trang chủ
  2. » Luận Văn - Báo Cáo

Xây dựng kho báo cáo kết quả nghiên cứu số hóa ở Cục Thông tin Khoa học và Công nghệ Quốc gia

11 429 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 11
Dung lượng 489,47 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Số hoá các báo cáo KQNC gắn liền với việc phát triển những CSDL thư mục về báo cáo KQNC trở thành CSDL toàn văn với biểu ghi thư mục được đính kèm với tệp toàn văn, cũng như tạo ra kho b

Trang 1

XÂY DỰG KHO BÁO CÁO KẾT QUẢ GHIÊ CỨU SỐ HOÁ Ở CỤC THÔG TI KHOA HỌC VÀ

Cao Minh Kiểm - Phó Cục trưởng,

Cục Thông tin Khoa học và Công nghệ Quốc gia

Số hoá (tiếng Anh là Digitization) là quá trình chuyển đổi những thông tin trên những đối tượng thực sang dạng điện tử hay còn gọi là dạng số Những đối tượng thực chứa thông tin có thể là các tài liệu dạng văn bản, hình ảnh, bản đồ, băng ghi âm, ghi hình, trên các vật mang tin vật lý (trên giấy, trên phim, giấy ảnh, vi hình, băng ghi

âm băng ghi hình, v.v ) Kết quả của số hoá là những đối tượng thực được chuyển sang đối tượng số dưới hình thức tệp tin Những tệp tin này có thể được sử dụng rất nhiều trong xây dựng những cơ sở dữ liệu có liên kết với tệp toàn văn Mục đích của

số hoá có thể là: Tăng cường sự truy cập đến tài nguyên thông tin; Cải thiện chất lượng dịch vụ cho những người dùng tin thông qua khả năng truy cập được cải thiện; Giảm việc tiếp xúc trực tiếp đến những tài nguyên quý, hiếm, cổ hoặc được sử dụng nhiều; Tạo ra bản sao lưu trữ; cho phép cơ quan, đơn vị phát triển hạ tầng kỹ thuật và

kỹ năng của nhân viên; Phát triển khả năng chia sẻ tài nguyên thông tin [IFLA, 2002]

Nhằm tăng cường khả năng truy cập đến tài nguyên thông tin, nâng cao chất lượng dịch vụ, tăng cường chia sẻ tài nguyên thông tin, Cục thông tin đã xác định xây dựng cơ sở dữ liệu (CSDL) toàn văn là một trong những hướng công tác quan trọng của Cục Thông tin Khoa học và Công nghệ từ những năm đầu tiên của thế kỷ 21 Số hoá tài liệu là một hoạt động rất quan trọng trong việc xây dựng những CSDL toàn văn

và đã được Cục Thông tin KH&CN Quốc gia triển khai từ năm 2004 [Phan Huy Quế

2004, 2006; Nguyễn Đức Trị, 2005] Báo cáo kết quả nghiên cứu (KQNC) là một dạng tài liệu xám rất có giá trị Số hoá các báo cáo KQNC gắn liền với việc phát triển những CSDL thư mục về báo cáo KQNC trở thành CSDL toàn văn với biểu ghi thư mục được đính kèm với tệp toàn văn, cũng như tạo ra kho báo cáo KQNC dạng số hoá để phục vụ lưu giữ, phổ biến, sử dụng hiệu quả hơn Năm 2011, Cục Thông tin KH&CN Quốc gia được Bộ Khoa học và Công nghệ giao nhiệm vụ chủ trì triển khai xây dựng

hệ thống thông tin nghiên cứu và phát triển (NC&PT) trong đó có việc số hoá các báo cáo KQNC của các đề tài NC&PT cấp tỉnh và thành phố trực thuộc Trung ương, hình thành kho báo cáo số hoá tập trung, xây dựng CSDL thư mục về các báo cáo KQNC

Trang 2

Hiện nay, để triển khai công tác số hoá tài liệu, Cục Thông tin KH&CN Quốc gia xây dựng được một dây truyền số hoá hiện đại với hệ thống thiết bị số hoá Kirtas dựa trên công nghệ hiện đại [Đỗ Như Thơ, 2011] Báo cáo này trình bày một số nét về công tác số hoá và xây dựng CSDL toàn văn về KQNC của Cục Thông tin KH&CN Quốc gia

I CƠ SỞ DỮ LIỆU KQC VÀ VIỆC HÌH THÀH KHO BÁO CÁO KQC SỐ HOÁ

1 Cơ sở dữ liệu KQC

Theo quy định của pháp luật, kết quả nghiên cứu khoa học và phát triển công nghệ (thường gọi tắt là nghiên cứu và phát triển 9) (gọi tắt là KQNC) có sử dụng ngân sách nhà nước, sau khi kết thúc, phải đăng ký, giao nộp và lưu giữ tại cơ quan nhà nước có thNm quyền [UBKHKTN N , 1980, Bộ KH&CN , 2007] Theo các quy định hiện hành về đăng ký và giao nộp KQN C, Cục Thông tin KH&CN Quốc gia là cơ quan nhà nước có thNm quyền cấp đăng ký KQN C của các nhiệm vụ KH&CN cấp nhà nước và cấp Bộ Các Sở KH&CN của tỉnh, thành phố trực thuộc Trung ương là cơ quan nhà nước có thNm quyền cấp đăng ký KQN C của các nhiệm vụ KH&CN cấp tỉnh

và cấp cơ sở tại địa phương

Trên cơ sở thực hiện chức năng cơ quan nhà nước có thNm quyền về đăng ký, lưu giữ báo cáo KQN C, Cục Thông tin KH&CN Quốc gia đã thu nhận, lưu giữ trên trên 10.000 báo cáo KQN C của các đề tài N C&PT các cấp Cục đã CSDL đặc biệt về các báo cáo này và gọi là CSDL KQN C Đây là CSDL quý, quy mô quốc gia về một dạng tài liệu xám Để phổ biến thông tin về nguồn tài liệu quý nàu từ những cuối những 80's của thế kỷ trước, Viện Thông tin KHKT Trung ương (nay là Cục Thông tin KH&CN Quốc gia) đã tiến hành xây dựng CSDL thư mục về báo cáo KQN C Đến hết năm 2010, CSDL KQN C đã có trên 10.000 biểu ghi thư mục

Từ năm 2004, Cục Thông tin KH&CN Quốc gia đã tiến hành số hoá các báo cáo KQN C và thử nghiệm liên kết tập toàn văn báo cáo KQN C với cơ sở dữ liệu KQN C Dữ liệu số lúc đầu được lưu trên đĩa CDROM và bạn đọc sau khi tra cứu thông tin thư mục, căn cứ thông tin về đĩa CDROM chứa tệp tin toàn văn, bạn đọc có thể yêu cầu đặt đĩa CDROM chứa dữ liệu vào và đọc tệp tin đó N hư vậy bạn đọc có thể không cần yêu cầu tìm tài liệu gốc dạng giấy trong kho báo cáo KQN C

Gần đây, các tệp tin báo cáo kết quả nghiên cứu được đặt trên ổ cứng máy tính

và người dùng tin có thể truy cập ngay tệp tin báo cáo KQN C mà không cần yêu cầu mượn đĩa CDROM Tuy nhiên, do quy định không được đưa báo cáo KQN C lên mạng máy tính, Cục Thông tin KH&CN Quốc gia mới tạo lập CSDL thư mục về báo cáo KQN C và đưa lên mạng VISTA để người dùng tin tra cứu thông tin thư mục N hững báo cáo KQN C số hoá được lưu giữ tách biệt, không đưa lên mạng Internet N gười dùng tin có thể yêu cầu cung cấp báo cáo số hoá theo quy định Với việc số hoá báo

9

Tiếng Anh là Research and Development (thường viết tắt R&D)

Trang 3

cáo KQN C, Cục Thông tin KH&CN Quốc gia đã tạo lập được một kho báo cáo KQN C

số hoá với trên 10.000 tệp báo cáo KQN C

2 Cơ sở dữ liệu ghiên cứu và Phát triển

Theo quy định, Cục Thông tin KH&CN Quốc gia chỉ thực hiện đăng ký và lưu giữ những báo cáo KQN C thuộc các nhiệm vụ KH&CN cấp nhà nước và cấp bộ có sử dụng ngân sách nhà nước Báo cáo KQN C của những nhiệm vụ KH&CN cấp tỉnh có

sử dụng ngân sách nhà nước được đăng ký và giao nộp tại các Sở KH&CN các tỉnh và thành phố trực thuộc Trung ương [Bộ KH&CN , 2011] Việc này dẫn đến sự phân tán trong lưu giữ báo cáo KQN C ở các địa phương Để tạo điều kiện cho người dùng tin

có thể tra cứu thông tin về nhiệm vụ KH&CN cấp địa phương cũng như khai thác thông tin của các báo cáo KQN C của các nhiệm vụ KH&CN cấp tỉnh nói trên, năm

2011, Bộ KH&CN giao Cục Thông tin KH&CN Quốc gia triển khai nhiệm vụ xây dựng hệ thống thông tin nghiên cứu và phát triển, mà nội dung chính là xây dựng CSDL thư mục về đề tài và báo cáo KQN C của các nhiệm vụ KH&CN cấp tỉnh, số hoá báo cáo KQN C và hình thành kho lưu giữ tập trung các báo cáo số hoá

Để thực hiện nhiệm vụ này, Cục đã xây dựng được phần mềm quản lý thông tin

về đề tài và báo cáo KQN C để cung cấp cho các địa phương sử dụng, tổ chức tập huấn

sử dụng phần mềm, xử lý thông tin, trao đổi thông tin, v.v

Theo kế hoạch được giao, đến hết năm 2011, Cục phải thu thập và số hoá khoảng 6.000 đề cương đề tài và báo cáo KQN C của các địa phương Trên cơ sở số hoá sẽ xây dựng được sưu tập báo cáo KQN C được số hoá tại Cục Thông tin KH&CN Quốc gia, đảm bảo bảo quản lâu dài và phục vụ hiệu quả theo những quy định cụ thể

II SỐ HOÁ BÁO CÁO KQC TẠI CỤC THÔG TI KHOA HỌC VÀ CÔG GHỆ QUỐC GIA

Công tác số hoá tài liệu KH&CN ở Cục Thông tin KH&CN Quốc gia có thể được chia thành hai thời kỳ:

- Thời kỳ 2004-2009: Số hoá phân tán, sử dụng máy quét thông thường (scanner)

- Thời kỳ 2010-đến nay: Số hoá tập trung, sử dụng hệ thống số hoá KIRTAS

1 Công tác số hoá báo cáo KQC thời kỳ 2004-2009

Trong giai đoạn này, công tác số hoá tài liệu được giao trực tiếp cho những đơn

vị chịu trách nhiệm xây dựng CSDL KQN C, đó là Bộ phận Đăng ký KQN C, đồng thời

là nơi lưu giữ các báo cáo KQN C của các nhiệm vụ KH&CN

Thiết bị số hoá là máy quét văn phòng, chủ yếu là máy quét của HP

Mặc dù có sự khác nhau nhất định về đối tượng cần số hoá (bài báo hoặc cả quyển báo cáo KQN C), nhưng những vấn đề lựa chọn khổ mẫu tài liệu số là cơ bản như nhau

Trang 4

a) Lựa chọn khổ mẫu dữ liệu số và phần mềm số hoá

Trên cơ sở những tìm hiểu về khổ mẫu dữ liệu trong lưu trữ và trao đổi thông tin, Cục Thông tin KH&CN Quốc gia đã đề xuất lựa chọn khổ mẫu dữ liệu số PDF – Portable Document Format [Cao Minh Kiểm và Lê Xuân Định, 2002; Cao Minh Kiểm, 2005] Khổ mẫu dữ liệu PDF do Hãng Adobe phát triển và sử dụng cùng với chương trình quét Adobe Acrobat

Lý do chọn khổ mẫu PDF là:

- PDF được sử dụng rất rộng rãi như một khổ mẫu không phụ thuộc nền (platform-independent) trong việc phổ biến tài liệu theo trang Phần mềm Adobe Reader để đọc tệp PDF được cung cấp miễn phí và có trong hầu hết các máy tính

- Có thể tạo liên kết giữa các tài liệu và bên trong tài liệu;

- Có chú giải và mã đánh dấu (bookmark) làm mục lục (cho phép chuyển đến trang cần đọc dễ dàng);

- Có ảnh nhỏ (thumbnail) để xem tổng thể;

- Có tiện ích đánh chỉ số và tìm kiếm;

- PDF có khả năng lồng vào trong tài liệu những siêu dữ liệu để phục vụ quản lý;

- Khổ mẫu PDF có một số dạng bảo vệ kỹ thuật, bao gồm cả mã hoá và việc này có thể hạn chế người bảo quản tệp đảm bảo sự truy cập lâu dài trong tương lai khi

có những thay đổi môi trường công nghệ

- Khổ mẫu PDF cho phép người tạo dữ liệu theo khổ mẫu PDF quyết định hạn chế việc rút dữ liệu (copy-paste) ra để sử dụng cho mục đích khác

Phần mềm ADOBE ACROBAT được sử dụng để tạo lập tệp PDF cho CSDL STD và KQN C Lý do lựa chọn phần mềm ADOPE ACROBAT là:

- Adobe Acrobat được sử dụng rất phổ biến ở Việt N am; dễ sử dụng ;

- Phần mềm xử lý ảnh quét nên những thông tin được số hoá sẽ đảm bảo tuyệt đối trung thành với bản gốc;

- Có khả năng nhận dạng đồng thời nhiều trang tài liệu trong cùng một thời điểm;

- Có khả năng tạo Bookmark, link, header, footer, …;

- So với các phần mềm cùng chức năng xử lý ảnh quét khác như: Photoshop, PaintshopPro, FineReader, Fireworks thì các tệp Acrobat (phần mở rộng là.pdf) có dung lượng nhỏ hơn, thao tác xử lý nhanh hơn Đồng thời, Acrobat cũng thích hợp với nhiều loại máy quét hơn;

- Phần mềm đọc tài liệu theo khổ mẫu PDF là Acrobat Reader là miễn phí, có sẵn trên hầu hết tất cả máy tính

b) Yêu cầu kỹ thuật đối với file số hoá

Để đảm bảo chất lượng tài liệu số hoá nhưng đồng thời duy trì kích thước tệp tin hợp lý, Cục Thông tin KH&CN Quốc gia lúc đã quy định như sau:

Trang 5

- Mật độ điểm ảnh tối đa 300 dpi và tối thiểu 200 dpi

- Mỗi tài liệu trên giấy sẽ tương ứng với 1 tệp tin

Với CSDL KQN C, đối tượng cần số hoá là các tập báo cáo KQN C Trên thực tế các tài liệu này có độ lớn khác nhau, có thể từ một vài chục trang đến vài trăm trang

Do báo báo cáo KQN C khá dày nên khi quét phải tháo bìa để có thể quét từng trang

c) Xử lý tệp tin sau khi quét

Tệp tin sau khi quét được xử lý lại bằng phần mềm Adobe Acrobat Các thao tác gồm:

- Kiểm tra số trang;

- Cắt riềm (Cropping);

- Làm Bookmark

- Đặt lại tên tệp

Do báo cáo KQN C là tài liệu dày, khó khăn cho người dùng tin tìm đọc phần tài liệu mà họ quan tâm nên Cục Thông tin KH&CN Quốc gia đã thực hiện việc làm Bookmark cho tệp tin toàn văn BOOKMARK chính là việc lập một trang mục lục cho phép chuyển đến mục được đánh dấu một cách dễ dàng và tiện lợi

d) Đặt tên tệp

Một nguyên tắc được đề ra khi đặt tên tệp tin là làm sao dễ xác định được tài liệu gốc của tệp tin số hoá, dễ nhận biết, dễ tìm lại khi cần Trên cơ sở nguyên tắc đó, chúng tôi đã đề xuất cách đặt tên tệp tin số hoá

Đối với báo cáo kết quả nghiên cứu, tên tệp tin sẽ trùng với số đăng ký cá biệt

(ký hiệu kho) của báo cáo gốc Phần mở rộng là PDF Thí dụ:

7000.pdf ; 7001.pdf

trong đó: 7000 và 7001 là số đăng ký cá biệt/ký hiệu kho của báo cáo

N ếu một đề tài có nhiều tập báo cáo (chuyên đề, báo cáo đề tài nhánh, ) được giao nộp, thì số đăng ký cá biệt của báo cáo đi kèm sẽ có thêm một hậu tố, thí dụ: 7000-1, 7001-2 Phần đầu của tên tệp tin trước phần mở rộng (pdf) của báo cáo đi kèm vẫn sẽ được đặt đúng như của nhưng số đăng ký cá biệt: 7000-1.pdf, 7000-2.pdf,

2 Giai đoạn số hoá tập trung bằng hệ thống KIRTAS

Giai đoạn này được đặt trưng với việc hình thành bộ phận chuyên trách số hoá tài liệu của Cục trên cơ sở hệ thống thiết bị số hoá của hãng KIRTAS Hiện nay Cục Thông tin KH&CN Quốc gia được trang bị hai máy số hoá chuyên nghiệp: Kirtas APT1600

và Kabis (Hình 1)

Trang 6

a) Giới thiệu sơ bộ hệ thống số hoá KIRTAS

Hình 1 Thiết bị Kirtas APT1600 và Kabis

Đây là những thiết bị được thiết kế phù hợp vớt những đòi hỏi về số hóa tài liệu đóng tập Về cơ bản, hệ thống vận hành và công suất thiết bị của Kirtas APT1600 và Kabis không khác nhau nhiều Toàn bộ hệ thống số hóa của hãng Kirtas đều sử dụng máy ảnh kỹ thuật số chất lượng cao, khác với công nghệ máy quét phẳng truyền thống

để sao chụp hình ảnh Một máy ảnh kỹ thuật số Canon EOS-1Ds Mark II, 16,7 triệu điểm ảnh, cho phép chụp liên tục mỗi trang trái và trang phải của cuốn sách nhờ sử dụng một gương phản chiếu qua ống kính camera EF tiêu cự 24-70 mm Độ phân giải

có thể cài đặt ở mức 300 ppi (pixel per inch) và có khả năng tăng đến 600 ppi

Hệ thống sử dụng công nghệ lật trang tự động SureTurn™ giúp giảm bớt thao tác lật trang bằng tay Với cánh tay rôbốt được điều khiển bằng máy tính sử dụng một

hệ thống hút chân không (hệ thống page luffers) cho phép nhẹ nhàng lật chỉ một trang duy nhất tại một thời điểm Cùng thời điểm đó, cuốn sách nhờ bộ phận nâng sách được thiết kế theo công nghệ SmartCradle được nhẹ nhàng nâng lên, tự động dịch chuyển để

bù vào việc giảm số lượng trang sách bên phải khi chúng được lật giở và sao chụp Công nghệ SmartCradle giữ sách mở một góc đúng bằng 110 độ trong suốt quá trình vận hành, tạo ra một môi trường áp suất thấp để xử lý những sách quý hiếm và dễ hỏng rách Để đảm bảo việc chỉ lật duy nhất một trang, thiết bị số hóa được thiết kế với bộ cảm biến Page Edge Sensor và thiết bị chia tách trang Page Separator Thiết bị Page Separator giúp chia tách trang khi bộ cảm biến Page Edge Sensor giám sát việc vận hành máy với độ chính xác cao và điều chỉnh đầu trang sách khi cần Đồng thời,

nó liên tục kiểm tra nhằm đảm bảo cánh tay rôbốt chỉ lật một trang duy nhất tại một thời điểm, và kiểm soát từ xa khi có trang bị bỏ sót, khi đó, bộ cảm biến Page Edge Sensor sẽ tạm ngừng vận hành máy để con người thực hiện thao tác điều chỉnh Kirtas APT 1600 và Kabis có thể sao chụp đến 1600 trang một giờ

Thông số kỹ thuật của thiết bị Kirtas và KABIS cơ bản như sau:

Trang 7

- Tốc độ quét: 1600 trang/giờ

- Hình ảnh: màu, đen/trắng

- Định dạng đầu ra: TIFF, JPEG, RAW,…

- Sao chụp: máy ảnh kỹ thật số 16.7 triệu điểm ảnh, độ sâu 24 bit RGB, 4.992 x 3.228 điểm ảnh

- Độ phân giải 300 ppi có thể tăng lên đến 600 ppi

- Kích cỡ trang giấy: 11,4 cm x 17,8 cm đến 27,9 cm x 35,5 cm

- Độ dày trang giấy: 20 g/m2 đến 300 g/m2

- Độ dày đóng tập: 10,16 cm

- Kích cỡ máy (Rộng x Dài x Cao): 84 cm x 76 cm x 122 cm

- Tính chính xác: Bộ cảm biến Page Edge Sensor

- Thiết bị chia tách trang Page Seperator

- Trọng lượng: 73 Kg

- N guồn điện: 110-240 VAC, 50/60 Hz, 15 A

- Trạm xử lý: Máy chủ Kirtas Image Server

N goài ra, hệ thống số hóa Kirtas còn tích hợp phần mềm BookScan Editor cho phép căn chỉnh trang tự động theo khối dữ liệu với năng suất cao và phần mềm nhận dạng ký tự quang học (OCR) cho 189 ngôn ngữ

b) Khổ mẫu dữ liệu số và phần mềm xử lý

Khác với việc quét bằng máy quét văn phòng, định dạng dữ liệu số mà hệ thống Kirtas tạo ra gồm 2 loại:

- Dữ liệu gốc: dạng tệp ảnh (TIFF, JPEG, RAW,…): do máy ảnh số tạo ra; mỗi

trang được quét tương ứng với 1 ảnh

- Dữ liệu đầu ra: Do phần mềm BookScan Editor xử lý các tệp ảnh gốc và tạo

ra sau khi xử lý

Toàn bộ dữ liệu gốc được lưu trên Máy chủ Kirtas Image Server và được xử lý bằng phần mềm BookScan Editor Có thể nói, hệ thống số hóa Kirtas thực sự là lý tưởng cho những ấn phNm đạt tiêu chuNn thông thường Đối với một số tài liệu in trên giấy quá mỏng như giấy Pơluya, thì việc số hóa sẽ được tiến hành thông qua chức năng chụp bằng tay cho từng trang và việc căn chỉnh sau đó sẽ được thực hiện như thông thường bằng phần mềm BookScan Editor (như đã nói ở trên) Hệ thống số hóa này cho phép phục hồi phần nào những tài liệu sử dụng giấy quá mỏng hay quá ngả màu theo thời gian (Hình 2)

Trang 8

Hình 2 Trang tài liệu gốc trước số hoá và trang tài liệu đã được số

hoá

Cục tiếp tục chọn dữ liệu đầu ra cuối cùng là định dạng PDF

c) Xử lý tệp tin đầu ra cuối cùng

Đối với báo cáo KQN C, đầu ra cuối cùng vẫn là một tệp tin cho một báo cáo Tệp tin này được sao và chuyển về bộ phận quản lý kho báo cáo số hoá Đơn vị này có trách nhiệm thực hiện các bước xử lý tiếp theo gồm:

- Làm Bookmark

- Đặt/đổi tên tệp cho phù hợp

d) Đặt tên tệp tin

Việc đặt tên tệp được quy định cụ thể đối với báo cáo KQN C do Cục Thông tin KH&CN Quốc gia lưu giữ (theo quy định của pháp luật) và với tệp tin báo cáo KQN C

do các Sở KH&CN đưa Cục số hoá (theo nhiệm vụ xây dựng CSDL N ghiên cứu và phát triển) Đối với các báo cáo KQN C do Cục cấp đăng ký và lưu giữ, việc đặt tên vẫn giữ như quy định đã nêu ở trên

Đối với báo cáo KQN C do các Sở KH&CN cấp đăng ký và lưu giữ, để đảm bảo không bị trùng lặp, tên tệp tin được quy định gồm những yếu tố sau như sau:

Mã tỉnh-KQ + 4 số năm hoàn thành báo cáo-5 chữ của số thứ tự

trong đó Mã tỉnh là mã 3 ký tự tên tỉnh theo tiêu chuNn TCVN 7587-2007

Thí dụ, tệp tin là của báo cáo KQN C lưu tại Sở KH&CN Hà N ội, báo cáo viết năm 2005, số thứ tự là 3, tên tệp tin sẽ là:

HNI-KQ2005-00003.pdf trong đó:

Trang 9

HN I : Mã địa phương cho Hà N ội

KQ : Tệp tin về KQN C

2005: N ăm 2005

00003: Báo cáo có số thứ tự 3

Thí dụ, tệp tin là của báo cáo KQN C của Tp Hồ Chí Minh, năm viết báo cáo

2010, số thứ tự là 201

HCM-KQ2010-00201.pdf

đ) Một số nhận xét và kinh nghiệm khi sử dụng hệ thống số hoá tập trung

Từ khi chuyển đổi sang sử dụng hệ thống số hoá tập trung, có thể thấy những

ưu điểm quan trọng như sau:

- Ưu điểm đầu tiên đối với số hoá KQN C bằng hệ thống này là các báo cáo KQN C không phải tháo bìa đảm bảo sự nguyên vẹn của tài liệu gốc (trong giai đoạn trước, các báo cáo KQN C phải tháo bìa và số hoá từng trang, có nguy cơ gây hỏng tải liệu gốc);

- Khả năng xử lý tệp tin số hoá rất tốt, thậm chí giúp làm tăng chất lượng trang

dữ so với bản gốc (Hình 2);

- Chất lượng số hoá đồng đều;

- Tốc độ số hoá nhanh;

- Dữ liệu gốc (dạng JPEG, TIFF, hoặc SAW) có thể được sử dụng như đầu vào việc xây dựng những hệ thống quản lý tài liệu số trong tương lai (có thể quản lý đến từng trang tài liệu)

Sau một số năm sử dụng thiết bị Kirtas để số hóa tài liệu tại Cục Thông tin KH&CN Quốc gia (N ASATI), chúng tôi rút ra một số kinh nghiệm sau đây (Đỗ N hư Thơ và Trần Đức Trung, 2011):

- Kirtas được thiết kế với độ rộng của gáy sách hay độ dày đóng tập ở mức tiêu chuNn để phù hợp và tương ứng với hệ thống hơi thổi từ phía thành máy, để trong quá trình số hóa, từng trang sách được thổi tơi giúp cho cánh tay lật trang hoạt động dễ dàng Do đó, nếu sách cần số hóa quá mỏng thì nó phải được đặt trên một quyển sách khác ở bên phải trang sách để tăng độ dày đóng tập đến mức cho phép hệ thống hơi thổi và cánh tay lật trang hoạt động;

- Trong quá trình số hóa, người vận hành cần quan sát và theo dõi sự liên tục theo trật tự của số trang (tránh bị đúp trang) Khi thấy trang sách quá phồng, cần dùng tay vuốt nhẹ để hai trang sách trải đều sang hai phía, như vậy việc số hóa sẽ đạt chất lượng tốt nhất

Trang 10

- Đối với sách có độ dày gáy lớn, sau khoảng 50 - 60 trang sách, cần dừng máy

ở chế độ tạm thời để máy tự động căn chỉnh tâm của gáy sách vào chính giữa hai khe

đỡ giá sách

- Cần quan tâm đến độ rộng của tài liệu số hóa để điều chỉnh máy cho hợp lý và chính xác Việc này nên được làm ngay từ đầu cho các tài liệu có cùng độ rộng trong cùng một thời gian máy hoạt động để tiết kiệm thời gian căn chỉnh máy

KẾT LUẬ

Xây dựng thư viện điện tử/thư viện số là một trong những xu thế quan trọng trong hoạt động thông tin-thư viện Số hoá là một hoạt động không thể thiếu để tạo lập

ra nguồn tài nguyên thông tin số hoá

Báo cáo KQN C của các nhiệm vụ KH&CN các cấp là một dạng tài nguyên thông tin rất có giá trị, cần được lưu giữ, sử dụng hiệu quả Số hoá các báo cáo KQN C góp phần tăng cường khả năng lưu giữ, phổ biến và sử dụng nguồn tài nguyên giá trị này Cục Thông tin KH&CN Quốc gia hiện nay đang triển khai hoạt động số hoá các báo cáo KQN C bằng hệ thống số hoá hiện đại của hãng Kirtas

Công tác số đã tạo ra một kho lưu giữ báo cáo KQN C với gần 16.000 báo cáo KQN C Đây là một tài nguyên thông tin giá trị, phục vụ cho công tác quản lý nhà nước

về KH&CN cũng như đảm bảo thông tin cho hoạt động nghiên cứu và phát triển

TÀI LIỆU THAM KHẢO

1 Bộ KH&CN , 2007 Quyết định số 03/2007/QĐ-BKHCN ngày 16/3/2007 của Bộ trưởng Bộ KH&CN về việc ban hành Quy chế đăng ký, lưu giữ và sử dụng kết quả thực hiện nhiệm vụ KH&CN

2 Bộ KH&CN , 2011 Thông tư số 04/2011/TT-BKHCN ngày 20/4/2011 của Bộ trưởng Bộ KH&CN về việc sửa đổi, bổ sung một số điều của Quy chế đăng ký, lưu giữ và sử dụng kết quả nhiệm vụ KH&CN ban hành kèm theo Quyết định số 03/2007/QĐ-BKHCN

3 Cao Minh Kiểm (2005) Về khổ mẫu dữ liệu văn bản trong xây dựng và phát triển thư viện điện tử Báo cáo trình bày tại Hội nghị Thư viện điện tử, tổ chức tại Trung tâm thông tin Khoa học và Công nghệ Quốc gia, Hà N ội, ngày 4/3//2005

4 Cao Minh Kiểm (2006) Tìm hiểu một số vấn đề về chuNn khổ mẫu dữ liệu cho thư viện điện tử Kỷ yếu hội thảo Tăng cường công tác tiêu chuNn hóa trong hoạt động Thông tin - tư liệu Hà N ội: Trung tâm Thông tin KH&CN Quốc gia,

2006 tr 27-40

5 Cao Minh Kiểm (2008) Một số vấn đề phát triển sản phNm và dịch vụ của Trung tâm Thông tin Khoa học và Công nghệ Quốc gia Báo cáo trình bày tại Hội thảo "N âng cao chất lượng sản phNm và dịch vụ thông tin phục vụ công tác

Ngày đăng: 11/03/2015, 08:04

HÌNH ẢNH LIÊN QUAN

Hình 1. Thiết bị  Kirtas APT1600 và Kabis - Xây dựng kho báo cáo kết quả nghiên cứu số hóa ở Cục Thông tin Khoa học và Công nghệ Quốc gia
Hình 1. Thiết bị Kirtas APT1600 và Kabis (Trang 6)
Hình 2. Trang tài liệu gốc trước số hoá và trang tài liệu đã được số - Xây dựng kho báo cáo kết quả nghiên cứu số hóa ở Cục Thông tin Khoa học và Công nghệ Quốc gia
Hình 2. Trang tài liệu gốc trước số hoá và trang tài liệu đã được số (Trang 8)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm