Các nhà quản lý, những người có trách nhiệm chọn lựa các hệ thống chuyển dạng tài liệu và khả năng truy cập chúng lâu dài, đòi hỏi một sự cam kết cụ thể và nhất quán của đơn vị đối với[r]
Trang 1BẢO QUẢN TÀI LIỆU SỐ
Nguyễn Thị Lan Hương * Nguyễn Thị Ngọc Lan **
Tóm tắt: Cùng với sự phát triển của công nghệ hiện đại việc bảo quản tài liệu số sẽ là
một giải pháp bảo quản tối ưu đối với các tài liệu ở dạng số; sự cần thiết của việc bảo quản tài liệu số; các nguyên tắc cơ bản trong bảo quản tài liệu số
Từ khóa: Bảo quản tài liệu số; Thư viện số
Khái niệm bảo quản không chỉ dành cho các tài liệu giấy Trong kỷ nguyên thông tin bảo quản tài liệu số (Digital preservation) là việc cần thiết Bảo quản tài liệu số (bao gồm tài liệu dạng phim ảnh (born digital) và tài liệu dạng được số hóa(reformatted digital content), nhằm mục đích duy trì khả năng truy c ập vào nội dung số trong tương lai Công tác bảo quản tài liệu số cần được xây dựng đồng thời với việc xây dựng các kho tài liệu
số
Công tác bảo quản tài liệu số dựa trên các nguyên tắc cơ bản của công tác bảo quản truyền thống: lựa chọn, lưu trữ, đảm bảo tuổi thọ tài liệu, chất lượng, sự toàn vẹn, quản lý
và truy cập Ngoài ra việc bảo quản tài liệu số còn phải đảm bảo khả năng truy cập thông tin liên tục, phù hợp với các công nghệ tiên tiến…
Cùng với sự phát triển của Internet và các công nghệ hiện đại, bảo quản tài liệu số là một nhiệm vụ mà cán bộ thủ thư sẽ phải đối mặt trong những năm sắp tới Bảo quản tài liệu số, giải pháp bảo quản tối ưu đối với các tài liệu ở dạng số, phụ thuộc nhiều vào sự thay đổi của công nghệ, các phần mềm nhanh chóng bị lỗi thời, hình thức và phương tiện lưu trữ tài liệu số liên tục thay đổi theo thời gian
Công nghệ số liên quan đến sự chuyển đổi chính khái niệm về định dạng, không chỉ đơn giản là tạo bản sao trung thực của một cuốn sách, một tài liệu, một bức ảnh, một bản đồ… lên một phương tiện lưu trữ khác Sức mạnh của việc nâng cao chất lượng số, các khả năng tạo ra các chỉ mục có cấu trúc, những thuật toán nén và truyền dữ liệu làm thay đổi quan niệm về bảo quản trong thế giới số Bảo quản tài liệu số phụ thuộc vào tuổi thọ phương tiện lưu trữ và hệ thống truy cập, vì thế cán bộ thư viện cần xác định được những vấn đề liên quan đến tuổi thọ của phương tiện lưu giữ Ngày nay những phương tiện lưu
*
Phòng Hành chính – Tổ chức, Trung tâm Thông tin – Thư viện, Đại học Quốc gia Hà Nội
** Phòng Quản trị Công nghệ thông tin, Trung tâm Thông tin – Thư viện, Đại học Quốc gia Hà Nội
Trang 2trữ đã có tuổi thọ cao hơn và việc truy xuất dữ liệu được lưu giữ trên các phương tiện đó cũng nhanh hơn
Những chuyển đổi này đặt ra cho chúng ta, những cán bộ thư viện, phải chuyển đổi các khái niệm về bảo quản và lưu trữ phù hợp với tài liệu số
1 Sự chuyển đổi của tính vẹn toàn
Trong bảo quản truyền thống, khái niệm tính toàn vẹn vật lý đa phần liên quan tới tài liệu cổ, những bằng chứng lịch sử cần được bảo tồn và thường diễn ra trực tiếp tại các phòng bảo quản Bảo quản tính toàn vẹn về mặt học thuật cũng dựa trên mối quan tâm về chứng tích Cốt lõi tính toàn vẹn còn thể hiện khía c ạnh trung thực của nội dung thông tin của một tài liệu được duy trì thông qua việc ghi lại cả nguồn gốc - sở hữu - và xử lý Trong công tác bảo quản truyền thống, cái khái niệm chất lượng và tính toàn vẹn của tài liệu bổ trợ lẫn nhau
Đối với tài liệu số, việc duy trì tính toàn vẹn của tài liệu liên quan đến phương tiện lưu trữ Các tài liệu số được gắn cùng biểu ghi thư mục hoặc được mô tả dưới dạng thông tin hỗ trợ tìm kiếm, được đánh chỉ mục (index), các thông tin thư mục được bảo quản cùng với chính những tài liệu đó Bảo trì tính toàn vẹn về mặt học thuật để đảm bảo các tệp tin không bị thay đổi một cách vô tính hay hữu ý Có thể nói công nghệ số đã làm biến đổi những nguyên tắc bảo quản truyền thống từ đảm bảo tính toàn vẹn về vật lý của một tài liệu
Trong khía cạnh trong an toàn điện tử thì tính toàn vẹn dữ liệu (Data Integrity) được định nghĩa là dữ liệu thông tin không bị thay đổi, mất mát trong khi lưu trữ hay truyền tải Nói cách khác tính toàn vẹn là tính không bị hiệu chỉnh của dữ liệu
Một số yếu tố kiểm soát tính toàn vẹn của các tài liệu số:
- Xác thực các bước truy cập và ghi lại những sửa đổi liên tiếp đối với tài liệu đó;
- Có thể tạo ra và duy trì những chỉ mục về cấu trúc và những liên kết về thư mục;
- Sử dung các công c ụ xây dựng tiêu chuẩn trao đổi siêu dữ liệu phù hợp với nhiều nền công nghệ, nhiều hệ thống, nhiều quốc gia;
Cán bộ thư viện cần phải cập nhật thường xuyên sự phát triển nhanh chóng c ủa các giao thức mạng, băng thông hoặc các kỹ thuật an toàn dữ liệu, hệ thống lưu trữ
Trang 32 Sự chuyển đổi của nguyên tắc truy cập
Với việc bảo quản tài liệu số, yếu tố truy cập và sử dụng là điều quan trọng Các tài liệu số được biên mục, tổ chức thành các bộ sưu tập và được quản trị bởi hệ quản trị cơ
sở dữ Cơ chế truy cập là một phần không thể tách rời khỏi việc bảo quản tài liệu số Kiểm soát được các yêu cầu truy cập trong bảo quản tài liệu số, đặc biệt là khả năng chuyển đổi các dạng tài liệu số sang các thế hệ công nghệ tương lai, việc này có thể được thực hiện thông qua phần cứng và phần mềm quản trị Trong bối cảnh hiện nay, kho tài liệu số là động lực để những nhà thiết kế hệ thống phần mềm cũng như công nghệ phần cứng xây dựng phát triển công c ụ truy c ập giúp cho việc truy cập ngày càng dễ dàng, kiểu như “cắm là chạy" (plug-and-play) Ngoài ra, cán bộ thư viện có thể yêu cầu nhà cung cấp và nhà s ản xuất để họ cung c ấp những thiết bị mới “tương thích ngược” với các hệ thống đang sử dụng Khả năng này giúp cho hệ thống tài liệu số chuyển đổi giống như các phần xử lý văn bản vẫn cho phép truy cập tài liệu được tạo ra bằng những phiên bản trước đó Mặc dù không mong muốn, nhưng tuổi thọ của một hệ thống công nghệ và sự đòi hỏi phải vứt bỏ hệ thống trước đó là những vấn đề chúng ta cần kiểm soát Thật là khó khi bắt nhà cung cấp hỗ trợ và bảo trì một hệ thống cũ vì nó đi ngược với khả năng cung cấp một hệ thống mới của họ
3 Sự chuyển đổi trong quan hệ giữa bảo quản và truy cập
Trước đây các cơ quan lưu trữ chỉ thực hiện nhiệm vụ sưu tập, nhưviệc thu thập một
bộ sưu tập tài liệu viết tay và bảo quản trong một toà nhà khô ráo hoặc được giữ cẩn thận
đã đủ để hoàn thành nhiệm vụ cơ bản của công tác bảo quản của đơn vị Trong hoàn cảnh
đó, bảo quản và truy cập hoàn toàn tách biệt với nhau Việc sử dụng tài liệu có nguy cơ mất trộm, hư hỏng ho ặc bị sao chép nội dung Cách an toàn nhất để giữ một cuốn sách được lưu trữ lâu dài là khoá nó lại hoặc chụp một bản sao để sử dụng
Hiện nay các chiến lược bảo quản hiện đại thừa nhận rằng bảo quản và truy cập là các khái niệm bổ trợ lẫn nhau Tiến hành bảo quản một tài liệu là nhằm để nó sử dụng được Theo quan điểm này, việc tạo một bản sao một tài liệu mà không tạo khả năng tìm
ra bản sao đó thì chỉ lãng phí tiền của Việc lưu trữ các tài liệu số đôi khi đã làm cho cán
bộ thư viện coi bảo quản và truy cập là hai danh từ có thể thay thế cho nhau, bảo quản là truy cập Bảo quản giúp cho truy c ập có thể thực hiện được Việc đánh đồng bảo quản với truy cập hàm ý rằng bảo quản được xác định bởi khả năng sẵn sàng của tài liệu Khi đó bảo quản và truy c ập chẳng khác nhau bao nhiêu về ý nghĩa, nhưng không vì thế chuyển trọng tâm từ bảo quản sang truy cập, coi nhẹ bảo quản bản chất của "vật" đang được bảo quản
Trang 4Ngoài ra trong thế giới số, khả năng truy cập cũng được coi là đối tượng cần được bảo quản Một cách diễn đạt chính xác hơn đơn giản là "bảo quản truy cập" Khi chuyển đổi theo hướng như vậy, một loạt vấn đề hoàn toàn mới nổi lên Bảo quản truy cập đối với cái gì? Đó có thể là một phiên bản mới có chất lượng và giá trị cao, được bảo vệ tốt, đảm bảo tính toàn vẹn đầy đủ của một tài liệu gốc Nội dung sự toàn vẹn của đối tượng tài liệu số là điều quan trọng nhưng khả năng của hệ thống chuyển tải và thể hiện thông tin đó trở thành kết quả cuối cùng của hành động bảo quản
Gắn liền với bảo quản tài liệu số làviệc lựa chọn,làm chủ công nghệ và "áp dụng” công nghệ đó vào công việc quản lý thông tin
Lựa chọn máy scan:
Hiện nay, trên thị trường có nhiều loại máy scan có thể sử dụng trong quá trình số hóa tài liệu từ công nghệ đơn giản đến hiện đại Các thiết bị số hóa (Scanner) hiện đại đa chức năng giúp đơn giản cho hầu hết các yêu c ầu của công tác số hóa Đối với các máy scan hiện đại này có thể sử dụng scan tài liệu đóng gáy dày, báo, tạp chí, tài liệu khổ lớn,
có chức năng lật giở tự động ngoài ra, còn có các phần mềm đi kèm hỗ trợ đắc lực trong quá trình xử lý hình ảnh, chuyển dạng, quản lí
Lựa chọn phần mềm quản lí tài liệu số để nâng cao khả năng truy cập:
- Phần mềm mã nguồn mở như Greenstone, Dspace
- Phần mềm bản quyền thương mại chuyên nghiệp của các nhà cung c ấp trong và ngoài nước
Các hệ thống phần mềm quản trị tài liệu số hiện nay đều đáp ứng được việc quản lý được các tài liệu số với nhiều định dạng khác nhau (PDF, Doc, AV, JPEG…) Hệ thống
có một tập hợp các phân hệ quản trị (A Set of Administrative Mudules) cho cán bộ thư viện có thể quản lý quy trình nhập đối tượng số vào kho số, biên mục và làm giàu siêu dữ liệu ở các cấp độ, phân chia thành các bộ sưu tập, tạo lập chính sách cụ thể tới từng bộ sưu tập và từng người dùng Ngoài ra các phần còn hoạt động trên kiến trúc tiêu chuẩn OAIS (Open ArchiveInformation System) với quy trình xây dựng và quản lý các gói thông tin: Nhập liệu (SIP), lưu trữ (AIP), chuyển giao (DIP)… và quan trọng hơn cả là hệ thống đó phải cho phép lựa chọn cấu hình, mở rộng thiết bị lưu trữ và di trú các ứng dụng Ngoài ra thư viện cần phải có hệ thống sao lưu sẵn sàng để chuyển đổi những dữ liệu có giá trị, dữ liệu chỉ mục và phần mềm
Trang 54 Vai trò quản lý thư viện trong quá trình chuyển đổi công tác bảo quản tài liệu số
Công tác bảo quản tài liệu số phải trở thành mục tiêu chung mà nhà quản lý và cán
bộ thư viện cùng nhau đưa ra Đó là trách nhiệm chung của người thực hiện những vai trò khác nhau Người làm công tác bảo quản tài liệu số cần kiểm soát được vai trò tác động của công nghệ và xác định những xu hướng phát triển mới của công nghệ số
Các nhà quản lý, những người có trách nhiệm chọn lựa các hệ thống chuyển dạng tài liệu và khả năng truy cập chúng lâu dài, đòi hỏi một sự cam kết cụ thể và nhất quán của đơn vị đối với công tác bảo quản, một sự tích hợp toàn diện của công nghệ số vào các quy trình và quá trình quản lý thông tin, s ự chỉ đạo chặt chẽ trong việc xây dựng các định nghĩa và tiêu chuẩn phù hợp đối với công tác bảo quản tài liệu số
Các tài liệu được bảo quản gồm các dạng và định dạng khác nhau Những người làm công tác bảo quản cần biết thu thập, tổ chức bảo quản những tài liệu có giá trị nghiên cứu Cán bộ thư viện có thể kiểm soát được tuổi thọ của các tài liệu số thông qua việc lựa chọn, xử lý kỹ thuật và lưu trữ trên trên những phương tiện lưu trữ đã được kiểm nghiệm
Kết luận
Xây dựng hệ thống bảo quản, khai thác sử dụng tài liệu số cùng với việc bảo quản tài liệu giấy hiện nay đã trở thành mối quan tâm của nhiều quốc gia Trong báo cáo c ủa Hội đồng Thư viện và Thông tin Hoa Kỳ đã chỉ ra rằng Bảo quản tài liệu số chỉ các phương pháp khác nhau nhằm giữ cho các tài liệu dạng số tồn tại đến mai sau Sự phát triển mạnh mẽ của khoa học và công nghệ cùng với xu thế hội nhập là những đòi hỏi và thách thức cho ngành Thông tin - Thư viện nói chung và cho thư viện đại học nói riêng cần phải có những đổi mới hoạt động, bắt kịp những tiến bộ của thời đại phục vụ đắc lực cho sự nghiệp CNH, HĐH đất nước Bảo quản tài liệu số là sự kết hợp giữa chính sách, chiến lược và hành động nhằm đảm bảo nội dung tài liệu số được bảo quản dài lâu, c ho
dù có những thay đổi về công nghệ và tuổi thọ của các phương tiện lưu trữ
TÀI LIỆU THAM KHẢO
3 http://www.ted.com.vn/index.php?option=com_content&view=category&layout
=blog&id=112&Itemid=601