CCO (Lập danh mục các đối tượng văn hóa) được tài trợ bởi Hiệp hội tài nguyên hình ảnh, sổ tay này được nhân viên chuyên nghiệp sử dụng trong các bộ sưu tập bảo[r]
Trang 1Ở THƯ VIỆN SỐ
Hoàng Yến* - Nguyễn Thị Hòa1
**
Tóm tắt: Môi trường kinh tế và thông tin đang thay đổi nhanh
chóng hàng ngày Tổ chức tri thức đã trở thành một công cụ
mạnh mẽ để thúc đẩy và hiện thực hóa các ý tưởng đổi mới trong
nhiều tầng lớp khác nhau của thư viện Do đó, chuẩn hóa nghiệp
vụ thư viện dựa trên các tiêu chuẩn đóng vai trò quan trọng nhất
đối với việc sử dụng hiệu quả thông tin nối mạng cũng như sự
phát triển của thư viện số Bài viết trình bày các khái niệm, vai trò
của tiêu chuẩn hóa nói chung và tiêu chuẩn hóa hoạt động thư
viện nói riêng, đồng thời tập trung phân tích các tiêu chuẩn siêu
dữ liệu trong tổ chức tri thức ở thư viện số.
Từ khóa: Thư viện số; Tri thức; Tổ chức tri thức; Tiêu chuẩn nghiệp
vụ; Siêu dữ liệu; Tiêu chuẩn siêu dữ liệu.
MỞ ĐẦU
Đại văn hào Victor Hugo đã từng nói: “Ngày tháng cho chúng
ta kinh nghiệm, đọc sách cho chúng ta kiến thức”, trong những năm gần đây, vai trò của thư viện đại học Việt Nam đã và đang được nhìn nhận như là một bộ phận cấu thành quan trọng của trường đại học, góp phần thiết thực vào nâng cao chất lượng của trường đại học, và trở thành một tiêu chí đánh giá chất lượng trường đại học Việc áp dụng tiêu chuẩn đảm bảo chất lượng trong hoạt động thư viện đại học cũng trở nên phổ biến trong những năm qua Chuẩn hóa đã và đang trở
* Thạc sĩ, Trung tâm Thông tin – Thư viện, Đại học Quốc gia Hà Nội
** Trung tâm Thông tin – Thư viện, Đại học Quốc gia Hà Nội.
Trang 2thành một yêu cầu khách quan của bất cứ ngành nghề và hoạt động nào trong xã hội Thư viện là một trong những thiết chế văn hóa có vai trò đặc biệt quan trọng trong công cuộc xây dựng và phát triển nền kinh tế tri thức góp phần đặc biệt trong việc nâng cao dân trí giúp cho mỗi cá nhân có thể không ngừng mở mang hiểu biết thực hiện việc học suốt đời Để hướng tới việc hội nhập quốc tế cũng như phục vụ và cung cấp cho người đọc, người dùng tin một cách có hiệu quả và chất lượng, các thư viện không thể không quan tâm đến việc chuẩn hóa
1 KHÁI QUÁT VỀ TIÊU CHUẨN HÓA HOẠT ĐỘNG THƯ VIỆN
1.1 Tiêu chuẩn hóa
Tiêu chuẩn là hướng dẫn hoặc quy tắc đối với sản phẩm, quy trình, phương pháp thử nghiệm hoặc vật liệu Chúng được tạo ra để đánh giá mức độ đồng nhất, khả năng thay thế cho nhau, độ tin cậy hoặc phương tiện so sánh
Tiêu chuẩn hóa công việc hay chuẩn hóa quy trình làm việc là các quy trình và hướng dẫn sản xuất được quy định và truyền đạt rõ ràng đến mức chi tiết nhằm tránh sự thiếu nhất quán và tự suy diễn cách thức thực hiện công việc Qua đó, mỗi một công việc được bố trí thực hiện theo cách hiệu quả nhất và bất cứ ai là người thực hiện chất lượng công việc đó luôn được đảm bảo
1.2 Tiêu chuẩn hóa trong hoạt động thư viện
Trong lĩnh vực thư viện thông tin, theo định nghĩa của Từ điển trực tuyến về thư viện và thông tin học (ODLIS): “Tiêu chuẩn là các tiêu chí do các hội nghề nghiệp, các cơ quan có thẩm quyền về đánh giá, kiểm định, hoặc các cơ quan chính phủ xây dựng nhằm đo lường
và đánh giá các dịch vụ thư viện, vốn tài liệu, và các chương trình hoạt động” TS Vũ Dương Thuý Ngà đã khái quát: “Chuẩn hoá trong lĩnh vực thông tin - thư viện là việc xác lập và áp dụng chuẩn mực nhằm kiểm soát, đánh giá các hoạt động thông tin - thư viện, đảm bảo cho hoạt động thông tin - thư viện có thể tiến hành đạt chất lượng, hiệu quả, thực hiện và duy trì các mục tiêu đã đặt ra Tiêu chuẩn, quy định
Trang 3kỹ thuật, quy phạm thực hành và văn bản pháp quy là các công cụ đảm bảo sự chuẩn hoá trong lĩnh vực thông tin - thư viện được thực hiện Phổ biến, triển khai áp dụng và có kiểm tra, đánh giá là những biện pháp thực hiện chuẩn hoá” [3]
Các thư viện ở một vị trí độc nhất để tận dụng các tiêu chuẩn so với nhiều tổ chức khác Không giống như các ngân hàng, nhà sản xuất hoặc doanh nghiệp bán lẻ, các thư viện không cạnh tranh với nhau Và không giống như các trường học, chính quyền thành phố, hoặc các tổ chức phi lợi nhuận nói chung, các thư viện có mối liên hệ chuyên môn chặt chẽ để ban hành các tiêu chuẩn
Các tiêu chuẩn tạo ra hiệu quả cho cả thư viện và các nhà cung cấp phục vụ chúng Chúng giúp tất cả các thư viện có thể là khách hàng của cùng một thiết kế hệ thống thư viện Chúng cũng giúp các thư viện
có thể chia sẻ dữ liệu
Các tiêu chuẩn không chỉ tạo ra hiệu quả về mặt thời gian và chi phí, mà còn mang lại sự đồng nhất của sản phẩm, điều quan trọng đối với khách hàng Nhiều tiêu chuẩn trong khu vực sản xuất đảm bảo với khách hàng rằng thực sự một bóng đèn mới sẽ phù hợp với bóng đèn
cũ và ít nhất trong một quốc gia, tất cả các mặt hàng điện được mua sẽ
có phích cắm phù hợp với ổ cắm trên tường của các tòa nhà
Thư viện có lịch sử lâu dài trong việc sử dụng các tiêu chuẩn và công cụ được chia sẻ trong các cộng đồng thư viện Quy tắc đầu tiên được xuất bản và phát triển vào năm 1852 bởi một thủ thư người Mỹ: Smithsonian Charles Coffin Jewett (Jewett, 1852) Đến năm 1908, Hiệp hội Thư viện Hoa Kỳ và Hiệp hội Thư viện đã hợp tác với nhau về mã biên mục quốc tế đầu tiên, được xuất bản ở Hoa Kỳ với tên gọi: Quy tắc Danh mục, tác giả và tên sách Tiếp đó là sự ra đời của Quy tắc biên mục Anh-Mỹ (AACR) được xuất bản vào năm 1967 AACR được duy trì bởi một cam kết quốc tế và sửa đổi vào các năm 1988, 1998 và 2002 Năm 2004, công việc bắt đầu sửa đổi toàn diện và đúc kết lại các quy tắc, RDA: Mô tả và Truy cập Tài nguyên RDA đã được xuất bản trong
Bộ công cụ RDA vào tháng 6 năm 2010 Nguồn chính của các giá trị từ
Trang 4vựng hoặc dữ liệu được kiểm tra là Hệ thống tiêu đề chủ đề của Thư viện Quốc hội Hoa Kỳ (LCSH) Sự kiện ra đời của MARC (Machine-readable cataloging) vào những năm 1960 cũng tạo điều kiện thuận lợi cho việc trao đổi mục tiêu chuẩn hóa dữ liệu giữa các thư viện cho phép họ chia sẻ thông tin của mình trên nhiều hệ thống Sự phát triển của lược đồ MARC XML trong những năm 1990 cho phép thư viện tổng hợp tận dụng các hệ thống mạng hiện đại như giao thức Z39.50 / SRU (Search / Truy xuất thông qua URL) và SRW (Dịch vụ Web Truy xuất tìm kiếm) và OAI
Trong phạm vi bài viết này chúng tôi tập trung phân tích tiêu chuẩn siêu dữ liệu áp dụng trong tổ chức tri thức ở thư viện số
2 VAI TRÒ CỦA SIÊU DỮ LIỆU TRONG TỔ CHỨC TRI THỨC Ở THƯ VIỆN SỐ
2.1 Khái niệm siêu dữ liệu và tổ chức tri thức
Siêu dữ liệu là bất kỳ loại mô tả chính thức nào của tài nguyên, bất kể định dạng nào Siêu dữ liệu phục vụ nhiều mục đích quan trọng như mô tả dữ liệu, duyệt dữ liệu, truyền dữ liệu, siêu dữ liệu có vai trò quan trọng trong quản lý tài nguyên số
Tổ chức tri thức là các hoạt động liên quan đến việc mô tả tài liệu, lập chỉ mục và lập danh mục, phân loại và tổ chức các tài nguyên tri thức như cơ sở dữ liệu, lưu trữ, bản đồ và các nguồn kiến thức khác theo các định dạng khác nhau Nó được thực hiện bởi các chuyên gia thông tin, nhà lưu trữ, chuyên gia môn học, cũng như các thuật toán máy tính
Kiến thức bắt đầu dưới dạng dữ liệu sự kiện thô và thông tin số là
dữ liệu được đưa vào ngữ cảnh Thông tin được thu thập trong tài liệu hoặc cơ sở dữ liệu khi thông tin được kết hợp với kinh nghiệm sự hiểu biết, nó sẽ trở thành tri thức
Tổ chức tri thức đóng vai trò là cầu nối giữa nhu cầu thông tin của người dùng và tài liệu trong bộ sưu tập Dữ liệu được xử lý mới thành thông tin Thông tin được xử lý mới thành tri thức
Trang 5Sơ đồ: Dữ liệu - Thông tin - Tri thức
2.2 Vai trò của siêu dữ liệu trong tổ chức tri thức
Trong thư viện số đối tượng để mô tả là các siêu dữ liệu Phát triển
dữ liệu tiêu chuẩn để mô tả các thư mục tài liệu chứng minh rằng bằng cách sử dụng các công cụ và tiêu chuẩn chung, thông tin có thể được phân phối rộng rãi và hệ thống có thể được thiết kế để nâng cao mục tiêu chia sẻ tài nguyên, giảm chi phí và tăng khả năng truy cập
Siêu dữ liệu được sử dụng để mô tả kiến thức theo các thuộc tính của nó và để cung cấp bối cảnh, chất lượng, tình trạng hoặc các đặc điểm khác của tài sản kiến thức
Trong các thư viện và kho lưu trữ, việc tạo siêu dữ liệu là một nhiệm vụ được thể chế hóa Biên mục viên, lưu trữ viên và các chuyên gia thông tin được giao trách nhiệm tạo siêu dữ liệu Tạo siêu dữ liệu cũng là trách nhiệm chính đối với những người làm việc với tư cách là người quản lý dữ liệu trong kho dữ liệu
Biên mục là một tập hợp con của lĩnh vực lớn hơn được gọi là tổ chức thông tin Nó có thể được định nghĩa là, “Quá trình tạo siêu dữ liệu cho tài nguyên bằng cách mô tả tài nguyên, chọn điểm truy cập tên
và tiêu đề, tiến hành phân tích chủ đề, gán tiêu đề chủ đề và số phân loại, và duy trì hệ thống thông qua đó dữ liệu danh mục được cung cấp ”[7]
Trang 6Hệ thống tri thức được cấu trúc trên siêu dữ liệu và phân loại để
có thể truy cập và sử dụng được Siêu dữ liệu để gắn thẻ và phân loại dựa trên các tiêu chuẩn Một dạng siêu dữ liệu thông thường là danh mục trực tuyến của thư viện Trong lĩnh vực điện tử, siêu dữ liệu về nội dung được thu thập bởi các công cụ tìm kiếm, được điều chỉnh bởi các tiêu chuẩn, chẳng hạn như Sáng kiến siêu dữ liệu lõi Dublin, Mô tả lưu trữ được mã hóa và giao thức Z39.50 để phân phối và chia sẻ siêu
dữ liệu Đây là những công cụ để khám phá tài nguyên Thủ thư tạo các nhãn và thẻ cho phép tìm thấy tài liệu Người dùng trong tương lai dự kiến sẽ sử dụng cùng một ngôn ngữ gắn thẻ thông thường và cùng một kỹ thuật tìm kiếm và truy xuất mà họ sử dụng trong cuộc sống hàng ngày Họ sẽ sử dụng các phương pháp gắn thẻ, chẳng hạn như phương pháp dân gian, để mô tả việc phân loại thông tin mà họ sử dụng Một lần nữa, phân loại là lĩnh vực chuyên môn của các chuyên gia thông tin Do đó, tri thức có tổ chức dễ dàng được truy cập và sử dụng bởi bất kỳ ai khác ngoài người tạo ra tri thức
2.3 Các tiêu chuẩn siêu dữ liệu trong tổ chức tri thức
Tiêu chuẩn mô tả dữ liệu là việc định ra một trật tự nhất định cho các yếu tố mô tả và cách thức quy ước ghi ký hiệu dấu cho từng yếu tố
mô tả đó
Tiêu chuẩn siêu dữ liệu bao gồm: tiêu chuẩn cấu trúc dữ liệu, tiêu chuẩn nội dung dữ liệu, tiêu chuẩn giá trị dữ liệu, định dạng dữ liệu (tiêu chuẩn trao đổi) và lược đồ phân loại
Trang 7Nội dung dữ liệu AACR2, RDA
Định dạng dữ liệu Dublin Core
Trao đổi dữ liệu Z.39.50
Bảng 1 Các tiêu chuẩn cơ bản được nhiều cộng đồng thư viện sử dụng
2.3.1 Tiêu chuẩn cấu trúc dữ liệu
“Cấu trúc dữ liệu” là tổ chức hoặc nhóm các trường dữ liệu Cấu trúc dữ liệu trả lời câu hỏi, các trường dữ liệu được sắp xếp như thế nào thành một bản ghi? Có nghĩa là, các trường dữ liệu là các đơn vị thông tin mà một tiêu chuẩn cung cấp cho dữ liệu chiếm lấy Trường dữ liệu
là các đơn vị thông tin được đặt tên, thường còn được gọi là “phần tử” hoặc “danh mục”, được tổ chức thành một bản ghi theo cấu trúc
dữ liệu Về mặt ẩn dụ, các trường dữ liệu và tiêu chuẩn cấu trúc giống như những cái chai đang chờ được lấp đầy Tiêu chuẩn cấu trúc dữ liệu thường được gọi là lược đồ siêu dữ liệu Một lược đồ siêu dữ liệu xác định cấu trúc và ý nghĩa (ngữ nghĩa) của các phần tử
Bộ yếu tố siêu dữ liệu lõi Dublin (DCMES) là một tiêu chuẩn siêu dữ liệu được quốc tế công nhận, bao gồm 15 yếu tố cơ bản được
sử dụng để mô tả nhiều loại tài nguyên kỹ thuật số MARC - Biên mục đọc máy (Machine Readable Cataloguing): chủ yếu được sử dụng
Trang 8bởi cộng đồng thư viện, MARC là một cấu trúc dữ liệu số để mô tả thư mục, thẩm quyền, phân loại và dữ liệu lưu giữ, MARC được sử dụng
để mô tả tài liệu thư mục nhằm tạo điều kiện hợp tác biên mục và trao đổi dữ liệu giữa các hệ thống thư viện tích hợp
VRA Core (Danh mục cốt lõi của Hiệp hội tài nguyên trực quan) ban đầu được xây dựng dựa trên Dublin Core, bổ sung các yếu tố và cấu trúc cần thiết cho việc mô tả và quản lý tài nguyên trực quan Nó cho phép mô tả riêng biệt hình ảnh, tác phẩm và bộ sưu tập, tạo sự phân biệt giữa tác phẩm và hình ảnh của những tác phẩm đó, với các bản ghi riêng biệt cho từng tác phẩm được liên kết với nhau Chủ yếu cộng đồng bảo tàng sử dụng VRA Core, nhưng đôi khi nó được sử dụng để mô tả các tài nguyên trực quan trong các bộ sưu tập bên ngoài bảo tàng
2.3.2 Tiêu chuẩn nội dung dữ liệu
Tiêu chuẩn nội dung dữ liệu là các hướng dẫn nhân viên cách nhập
dữ liệu vào các phần tử của lược đồ siêu dữ liệu Ví dụ, một tiêu chuẩn nội dung có thể hướng dẫn cách soạn một tiêu đề gốc, hoặc cách sử dụng hoặc không sử dụng các chữ viết tắt Sử dụng một tiêu chuẩn nội dung đảm bảo tính nhất quán trong việc nhập dữ liệu Dưới đây là danh sách các tiêu chuẩn nội dung dữ liệu thường được sử dụng với các liên kết để biết thêm thông tin về từng tiêu chuẩn Các phương pháp hay nhất về siêu dữ liệu cốt lõi của CDP Dublin Phiên bản 2.1
CCO (Lập danh mục các đối tượng văn hóa) được tài trợ bởi Hiệp hội tài nguyên hình ảnh, sổ tay này được nhân viên chuyên nghiệp sử dụng trong các bộ sưu tập bảo tàng, bộ sưu tập tài nguyên hình ảnh, kho lưu trữ và thư viện nghệ thuật và kiến trúc để mô tả các tác phẩm văn hóa và các tác phẩm thay thế hình ảnh của chúng (ví dụ: tranh, tác phẩm điêu khắc , bản in, bản thảo, ảnh và các phương tiện trực quan khác)
DACS (Mô tả tài liệu lưu trữ) được sử dụng để mô tả tài liệu lưu trữ, giấy tờ cá nhân và bộ sưu tập bản thảo và có thể được áp dụng cho tất cả các loại tài liệu
Trang 9Quy tắc biên mục Anh Mỹ - AACR2 (Anglo-American Cataloguing Rules), là mã biên mục quốc tế thiết yếu được sử dụng để biên mục mô
tả các loại tài nguyên thông tin khác nhau của các thư viện ở Hoa Kỳ, Anh, Canada và Úc cũng như ở nhiều quốc gia khác Các quy tắc bao gồm mô tả tiêu chuẩn về các lĩnh vực như: tiêu đề, nhà xuất bản, ấn bản,
bộ truyện, cũng như cung cấp sự lựa chọn và hình thức điểm truy cập (đề mục) cho tất cả các tài liệu mà thư viện có thể chứa hoặc có thể truy cập, bao gồm sách, loạt bài, tài liệu bản đồ, tài nguyên điện tử, AACR2 cũng cung cấp các quy tắc cho xây dựng các dạng tiêu chuẩn của tên và chức danh để cung cấp quyền truy cập và nhóm các mô tả đó
RDA (Mô tả và truy cập tài nguyên) RDA được phát triển như một
bộ hướng dẫn mới để mô tả và cung cấp quyền truy cập vào các tài nguyên bao gồm tất cả các loại nội dung và phương tiện Nó thay thế
ấn bản thứ hai của Quy tắc biên mục Anh-Mỹ (AACR2) làm tiêu chuẩn cho việc biên mục Nó cung cấp một khuôn khổ linh hoạt để mô tả tất
cả các tài nguyên (in ấn, kỹ thuật số), dữ liệu tương thích với các bản ghi hiện có trong danh mục thư viện trực tuyến RDA là một gói phần
tử dữ liệu, hướng dẫn để tạo siêu dữ liệu tài nguyên thư viện và di sản văn hóa được hình thành tốt theo mô hình quốc tế cho các ứng dụng
dữ liệu liên kết tập trung vào người dùng
2.3.3 Tiêu chuẩn giá trị dữ liệu
Tiêu chuẩn giá trị dữ liệu là danh sách các thuật ngữ hoặc mã tiêu chuẩn được sử dụng khi nhập các phần tử dữ liệu Ví dụ bao gồm các tệp thẩm quyền cho tên, tiêu đề chủ đề cho các thuật ngữ chủ đề và tên địa lý, và các thuật ngữ loại tài nguyên Sử dụng danh sách thuật ngữ đã thiết lập (từ vựng được kiểm soát) đảm bảo tính nhất quán khi
mô tả tài liệu vật lý hoặc đối tượng kỹ thuật số và có thể cải thiện chất lượng tìm kiếm và duyệt kết quả của người dùng cuối
Từ điển nghệ thuật và kiến trúc (AAT) do Viện nghiên cứu Getty tạo ra và duy trì, danh sách này bao gồm các thuật ngữ liên quan đến
mỹ thuật, kiến trúc, nghệ thuật trang trí, tài liệu lưu trữ và văn hóa vật chất Nó được sử dụng bởi các nhà biên mục và / hoặc các nhà lập chỉ
Trang 10mục để mô tả các tác phẩm nghệ thuật, kiến trúc, văn hóa vật chất, tài liệu lưu trữ, đại diện hình ảnh hoặc tài liệu thư mục
Từ vựng loại siêu dữ liệu Dublin Core danh sách thuật ngữ đa miền chung có thể được sử dụng làm giá trị cho phần tử Dublin Core Type để xác định thể loại của tài nguyên Ví dụ về các thuật ngữ bao gồm ảnh tĩnh, văn bản và ảnh chuyển động
Ứng dụng nhiều mặt của thuật ngữ chủ đề (FAST) được phỏng theo Tiêu đề chủ đề của Thư viện Quốc hội Hoa Kỳ, FAST là một từ vựng được kiểm soát đơn giản mà từ đó các thuật ngữ có thể được chỉ định và
sử dụng bởi các nhà biên mục và/ hoặc chỉ mục không chuyên nghiệp
Cơ sở dữ liệu từ vựng Getty cung cấp thuật ngữ về các địa điểm quan trọng đối với các lĩnh vực khác nhau chuyên về nghệ thuật, kiến trúc và văn hóa vật chất
Hệ thống tiêu đề chủ đề của Thư viện Quốc hội Hoa Kỳ: Library
Of Congress Subject Headings-LCSH là hệ thống từ vựng đa ngành bao gồm các tiêu đề trong tất cả các chủ đề, từ khoa học đến tôn giáo, lịch sử, khoa học xã hội, giáo dục, văn học và triết học Nó cũng bao gồm các tiêu đề cho các đối tượng địa lý, dân tộc, sự kiện lịch sử, tên tòa nhà, LCSH hệ thống từ vựng chủ đề được sử dụng rộng rãi nhất trên thế giới Nó là mô hình cho nhiều từ vựng khác bằng tiếng Anh và các ngôn ngữ khác và đã được dịch sang nhiều thứ tiếng Điểm mạnh nhất của LCSH là nó đại diện cho các tiêu đề chủ đề của Thư viện Quốc hội Hoa Kỳ, thư viện quốc gia của Hoa Kỳ, một trong những thư viện quốc gia phong phú nhất trên thế giới
Tệp Cơ quan Tên của Thư viện Quốc hội Sau khi nhấp vào liên kết ở trên, hãy giới hạn tìm kiếm của bạn bằng cách chọn “Tiêu đề Cơ quan Tên” từ trình đơn thả xuống
Thư viện Nông nghiệp Quốc gia, Từ điển Nông nghiệp Hơn 110.000 thuật ngữ nông nghiệp do Thư viện Nông nghiệp Quốc gia cung cấp
Từ điển đồng nghĩa dành cho tài liệu đồ họa do Thư viện Quốc hội Hoa Kỳ biên soạn và duy trì, từ điển đồng nghĩa này chứa hơn