1. Trang chủ
  2. » Luận Văn - Báo Cáo

Nghiên cứu một số mô hình và giao thức thư viện điện tử

63 486 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 63
Dung lượng 1,26 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Trong những năm gần đây, tại Việt Nam một số hệ thống thư viện điện tử đã được Nhà nước và các tổ chức quốc tế…đầu tư khá nhiều kinh phí để trang bị cơ sở vật chất, máy móc thiết bị công

Trang 1

ĐẠI HỌC QUỐC GIA HÀ NỘI

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ

Trang 2

PHẦN MỞ ĐẦU

Sự phát triển của khoa học công nghệ đặc biệt là công nghệ thông tin và viễn thông trong những năm gần đây đã và đang tác động đến mọi mặt của ngành Thư viện Chính vì vậy thư viện điện tử là xu hướng tất yếu trong quá trình phát triển của ngành thư viện ở trên thế giới nói chung và ở Việt Nam nói riêng

Thư viện điện tử chính là quá trình mà mọi hoạt động nghiệp vụ thư viện truyền thống từng bước hiện đại hoá Quá trình ứng dụng khoa học công nghệ thông tin từng bước tự động hoá mọi hoạt động thông tin thư viện nhằm tăng cường và nâng cao năng suất, hiệu quả hoạt động và kiểm soát nguồn nhân lực thông tin cũng như tăng cường khả năng đáp ứng nhu cầu tin của người dung một cách hiệu quả nhất

Trong những năm gần đây, tại Việt Nam một số hệ thống thư viện điện tử

đã được Nhà nước và các tổ chức quốc tế…đầu tư khá nhiều kinh phí để trang bị

cơ sở vật chất, máy móc thiết bị công nghệ thông tin hiện đại, đào tạo đội ngũ chuyên gia và người dùng tin…để từng bước tự động hoá thư viện điện tử

Xuất phát trong hoàn cảnh đó, luận văn lựa chọn đề tài “Nghiên cứu một

số mô hình và giao thức thư viện điện tử” cấu trúc luận văn gồm phần mở đầu,

phần kết luận và ba chương cụ thể như sau:

Chương 1: Khái quát về thư viện và tra cứu

Tìm hiểu chung về thư viện truyền thống, thư viện điện tử, thư viện số, thư viện

ảo, thư viện lai và tra cứu

Chương 2: Các chuẩn trong thư viện điện tử

Giới thiệu các chuẩn biên mục và siêu dữ liệu, chuẩn trao đổi dữ liệu, chuẩn tra cứu liên thư viện và chuẩn mượn liên thư viện trong thư viện điện tử

Chương 3: Chương trình thử nghiệm

Nêu bài toán, thiết kế chương trình, viết chương trình thử nghiệm

Trang 3

DANH MỤC HÌNH

Hình 1 Thành phần MARC21 .155

Bảng 1: Một số địa chỉ Z39.50 trên Inter 27

Hình 2 Chuẩn trao đổi dữ liệu 25

Hình 3: Mô phỏng mƣợn liên thƣ viện 36

Hình 4: Mô hình lớp 43

Hình 5: Giao diện tìm kiếm đơn giản 55

Hình 6: Giao diện tìm kiếm nâng cao 56

Hình 7: Kết quả tìm kiếm qua Z39.50 57

Hình 8: Các biểu ghi đƣợc chọn 57

Hình 9: Thông tin cơ sở dữ liệu 58

Trang 4

BẢNG KÝ HIỆU CÁC TỪ VIẾT TẮT

OPAC Open Public Access Catalog

MARC Machine Readable Cataloguning

XML eXtennsible Markup Language

BITS Banking Industry Technology Secretariat

IFX Financial Exchange

BIPS Banking Internet Payment System

TIM Telecommunicaton Interchange Markup

FIX Fixed – Length Fields

CML Chemical Markup Language

OCLC Ohio Cumputer Libray Center

NCSA National Center for Suppercomputing Application

CEN/ISSS

European Committee for Standarization / Information Sociecty Standard System

HTML Hyper Text Markup Language

BDF Biliogarphic Description Format

ADF Authority Description Format

CDF Community Description Format

HDF Holading Description Format

CMDF Communities Description Format

ISBD International Standard Book Description

AACR2 AACR2 là Anglo American Cataloguing Rules

Trang 5

Mục Lục

PHẦN MỞ ĐẦU 1

DANH MỤC HÌNH 2

Chương 1: KHÁI QUÁT VỀ THƯ VIỆN VÀ TRA CỨU 6

1.1 Khái niệm về thư viện và tra cứu 6

1.1.1 Thư viện truyền thống: 6

1.1.2 Thư viện điện tử: 7

1.1.3 Thư viện số: 9

1.1.4 Quy tắc xây dựng và phát triển thư viện số và thư viện điện tử 11

1.1.5 Quá trình hình thành thư viện điện tử và thư viện số 11

1.1.6 Sự phát triển Thư viện điện tử và Thư viện số ở nước ta trong những năm hiện nay .12

1.1.4 Thư viện ảo 13

1.2 Tra cứu trực tuyến OPAC 14

Chương 2: CÁC CHUẨN TRONG THƯ VIỆN ĐIỆN TỬ 15

2.1 Chuẩn biên mục và siêu dữ liệu: 15

2.1.1 Khổ mẫu biên mục – MARC 15

2.1.2 Siêu dữ liệu: 17

2.1.3 Ngôn ngữ đánh giá mở rộng XML 20

2.1.4 Khổ mẫu MARCXML 22

2.2 Chuẩn trao đổi dữ liệu 24

2.3 Chuẩn tra cứu liên thư viện Z39.50 26

2.3.1 Khái niệm về Z39.50 27

2.3.2 Giải pháp và lợi ích của Z39.50 28

2.3.3 Tóm lược lịch sử phát triển của Z39.50 29

2.3.4 Một số tính năng chính của Z39.50 31

2.4 Chuẩn mượn liên thư viện 35

2.4.1 Chuẩn ISO10160, 10161 35

2.4.2 Chuẩn IPIG v2.0 36

Chương 3: CHƯƠNG TRÌNH THỬ NGHIỆM 38

3.1 Bài toán 38

3.2 Thiết kế chương trình 38

3.2.1 Công cụ lập trình YAZ của IndexData 38

3.2.2 Xây dựng ứng dụng đa luồng với Microsoft.Net 39

3.2.2.1 Khái niệm về luồng(thread) 39

3.2.2.2 Căn bản về mô hình luồng 40

Trang 6

3.2.3 Cấu trúc và Giải thuật 41

3.2.4 Sơ đồ lớp và mã nguồn chính 43

3.2.4.1 Class Diagram 43

3.2.4.2 Lớp ThreadHelper 43

3.2.4.3 Lớp ZetThread 44

3.2.4.4 Lớp ZetMonitor 47

3.3 Thử nghiệm 54

3.3.1 Cấu hình 54

3.3.2 Giao diện và kết quả thử nghiệm 55

PHẦN KẾT LUẬN 59

TÀI LIỆU THAM KHẢO 61

Trang 7

Chương 1: KHÁI QUÁT VỀ THƯ VIỆN VÀ TRA CỨU

1.1 Khái niệm về thư viện và tra cứu

1.1.1 Thư viện truyền thống:

Ngày nay vẫn còn nhiều người cho rằng thư viện là một nơi yên tĩnh trong

đó sách được cất giữ và người ta đánh giá thư viện theo tiêu chí số lượng sách được cất giữ nhiều hay ít Đối với những người quản thủ thư viện có chuyên môn thì thư viện là một cơ sở có tổ chức để bảo quản tài liệu, sưu tập và để truy cập đến những thư viện khác; không những chỉ sách mà còn có phim ảnh, băng đĩa âm thanh, mẫu vật thực vật, sản phẩm văn hoá, vv… Đối với nhà nghiên cứu, thư viện là một mạng lưới cung cấp việc truy cập đến tri thức nhân loại được lưu giữ khắp mọi nơi

Đối với một thư viện truyền thống, điều quan trọng là việc bổ sung nguồn tài nguyên ngày càng nhiều trên giá kệ trong kho thư viện Sự thay đổi bộ mặt thư viện là kho tri thức của xã hội; có người còn cho rằng thư viện là đền đài của văn hoá và sự uyên thâm Được hình thành trong thời kỳ nông nghiệp thống trị trong tư duy của nhân loại, thư viện đã trải nghiệm qua một cuộc hồi sinh với việc phát minh ngành in trong thời kỳ Phục hưng, và thực sự bắt đầu khởi sắc khi cuộc cách mạng công nghiệp bùng phát với hàng loạt những phát minh cơ giới hoá quy trình in ấn

Lịch sử thư viện đã trải qua hơn 25 thế kỷ Hình ảnh thư viện của thời xa xưa được hình dung như là một cơ sở vững chắc trong đó chứa hàng ngàn phiến

đá khổng lồ được khắc chữ - thường được gọi là "rừng bia" [6] Qua nhiều năm cùng với sự tiến hoá của nhân loại, con người càng tiến bộ trong nhận thức và

thư viện ngày càng được phát triển Giai đoạn Quản lý tư liệu đã trải qua một

thời gian dài theo sự phát triển đó Cho đến một lúc, cũng xuất phát từ ý định ban đầu là làm tốt công việc lưu trữ và bảo quản, thư viện đã chú trọng đến việc xem người sử dụng là trung tâm, với sự nhấn mạnh đến việc trao đổi thông tin Điều này cũng đồng thời để đáp ứng yêu cầu thông tin ngày càng gia tăng Thư viện cổ đại chỉ hữu ích đối với một thiểu số những người biết chữ và bị giới hạn trong một tầng lớp, giai cấp theo điều kiện xã hội Hoạt động thư viện công cộng được bắt đầu phát triển trong thế kỷ 19 Nhưng vẫn là những thư viện đóng: sách được xếp theo kích cỡ trong những kho kín trong thư viện, độc giả chỉ tiếp cận với thủ thư ở quầy để yêu cầu mượn sách Hầu hết những thư viện trong lục địa châu Âu đã áp dụng phương thức này trong một thời gian dài Đến thế kỷ 20 một số quản thủ thư viện nhận thức được tiện ích của việc cho độc giả tiếp cận với kho sách đã đề xuất phương thức phục vụ kho mở với tài liệu được xếp theo

Trang 8

môn loại Phương thức này được bắt đầu áp dụng và nhanh chóng phát triển trong những quốc gia nói tiếng Anh hồi đó

1.1.2 Thư viện điện tử:

Thư viện điện tử có thể được hiểu theo nghĩa tổng quát nhất cho mọi loại hình thư viện đã tin học hoá toàn bộ hoặc một số dịch vụ, và các hoạt động của ngành thư viện Thư viện điện tử có thể được coi như là nơi người sử dụng có thể tới để thực hiện những công việc mà họ vẫn thường làm với thư viện truyền thống như là mượn trả sách hoặc tài liệu, nhưng đã được tự động hoá các hoạt động này Theo tiến sĩ Ching-chih Chen, người đã có sáng kiến tổ chức một loạt hội nghị quốc tế về công nghệ thông tin mới (NIT) [6] hơn mười năm gần đây (từ 1987) thì hiện không có một tiêu chuẩn cố định, chính thức nào cho thư viện điện tử Ta có thể nhận biết một số đặc điểm của thư viện điện tử lý tưởng như sau:

- Thư viện phải có vốn tư liệu điện tử Tư liệu điện tử là những tư liệu được lưu trữ dưới dạng số sao cho có thể truy nhập được bằng các thiết bị xử lý

dữ liệu

- Phải được tin học hoá trong thư viện Phải có một hệ quản trị thư viện tích hợp như bổ sung, biên mục, quản trị xuất bản phẩm định kỳ, kiểm soát lưu thông tư liệu, tổ chức mục lục truy nhập công cộng trực tuyến, Thư viện phải được kết nối mạng, tối thiểu cũng phải là mạng cục bộ hoặc Internet

- Phải cung cấp và tạo điều kiện cho người dùng sử dụng các dịch vụ điện

tử như yêu cầu và gia hạn mượn qua mạng, tìm tin trong các cơ sở dữ liệu, truy nhập và khai thác các nguồn tin tại chỗ và với tới các nguồn tin

ở nơi khác,

Tóm lại, thư viện điện tử phải sử dụng các phương tiện điện tử trong thu thập, lưu trữ, xử lý, tìm kiếm thông tin Thư viện điện tử ra đời là kết quả của sự hợp tác giữa các chuyên gia thư viện, nhà xuất bản, các nhà khoa học và công nghệ thông tin hướng về mục tiêu tiếp cận tới đầy đủ thông tin, ở mọi nơi và mọi lúc

Thư viện điện tử là cổng vào thông tin

Thư viện có thể chỉ chọn phương án tạo lập những kết nối với các nguồn lực trên Internet, chứ không tổ chức cung cấp tư liệu đọc tại chỗ và điện tử hoá các dịch vụ truyền thống Những Thư viện như vậy dồn sức để thực hiện chức năng của một cổng vào thông tin và chỉ giới thiệu thư viện như một kho tư liệu

ảo Xu hướng hiện nay là xây dựng các thư viện điện tử dưới hình thức các trang web trên mạng thông tin toàn cầu

Trước khi lập một Website tức làđịa chỉ cung cấp tin trên mạng, cần phải xác định loại thông tin và dịch vụ nào cần đưa lên mạng, liệu thư viện có xuất bản các tư liệu riêng của mình hay sẽ xây dựng một sưu tập từ các nguồn lực của nơi khác hoặc kết hợp cả hai, liệu thư viện có tạo lập rất nhiều mối liên kết để

Trang 9

bao quát một phạm vi chủ đề rộng hay chỉ tập trung vào một số lĩnh vực chuyên ngành hay thậm chí chỉ một chuyên ngành sau đó chia thành những mục hẹp hơn, những vấn đề gì đang được người dùng quan tâm và đối tượng sử dụng là

ai , nguyên tắc nhóm hợp tài liệu nào đối với người dùng là thích hợp và dễ tìm nhất trong quá trình tra cứu các trang web, thời gian và kinh phí phải mất thêm khi thiết lập và duy trì thư viện điện tử

Những dịch vụ có thể đưa lên mạng là:

- Truy nhập các cơ sở dữ liệu do thư viện xây dựng hoặc do nơi khác làm,

có thu hoặc không thu lệ phí

- Cung cấp tư liệu: cách này tiết kiệm được thời gian biên chế và người dùng cũng như cuớc phí bưu điện Hiện nay phổ biến dùng e-mail để chuyển yêu cầu, dùng e-mail hoặc fax để cung cấp tư liệu

- Gia hạn mượn

- Gửi các thông báo của thư viện qua e-mail: về sách đặt đã tới lượt hoặc đòi sách

- Tra cứu điện tử

- Dịch vụ trả lời bạn đọc ( trong vòng 24 giờ )

Nhiều thư viện đã có dạng điện tử (thư viện ảo) trên Internet, có nhiều phương

án sử dụng công nghệ mới để đáp ứng nhu cầu và yêu cầu của bạn đọc Có nhiều

ý kiến tán thành nhưng cũng có không ít ý kiến hoài nghi, thậm chí phản bác việc xây dựng thư viện số ở các nước đang phát triển Nhiều vấn đề còn phải cân nhắc và giải quyết trước khi các thư viện đó hoạt động như một bộ phận thông tin ổn định

Về phương diện kinh tế:

Bước đầu tiên và khó khăn nhất trong việc phát triển thư viện số là chuyển đổi các xuất bản phẩm truyền thống trên giấy sang dạng số Vấn đề giá thành / hiệu quả của quá trình số hoá khó thuyết phục do chi phí công nghệ và

sự cần thiết phải đầu tư liên tục vào công nghệ mới: Số hoá một trang tài liệu giá thành khoảng 0,1 - 0,5 đôla (cách đây 10 năm là 2 đôla) Một thư viện lớn có hàng triệu đơn vị tài liệu khó có thể số hoá toàn bộ kho tài liệu Thiết bị cũng rất tốn kém vì các dự án đòi hỏi những siêu máy tính có trang bị các bộ vi xử lý cực mạnh, bộ nhớ và khối lượng lưu trữ trong ổ cứng cực lớn Kể cả trường hợp chuyển đổi số hoá toàn bộ ấn phẩm vào thư viện (số) truy nhập toàn cầu, thì chắc chắn phần lớn các tư liệu này sẽ lại in ra từ máy để đọc trên giấy

Về phương diện kỹ thuật:

Mặc dầu vấn đề chất lượng sao lại chính xác dữ liệu trong quá trình số hoá đã từng đặt ra và đến nay hầu như đã được giải quyết được bằng các máy quét hiện đại chất lượng cao, nhưng vấn đề vật liệu lưu trữ vẫn không thể bền được bằng các giấy không có axit

Vấn đề bản quyền:

Bản quyền là một trở ngại đối với việc phát triển thư viện số, bởi vì thư viện số bị ràng buộc bởi những điều khoản của luật bản quyền có liên quan đến việc xuất bản lại các tư liệu dưới hình thức mới, không có phép Một thư viện phải dung hoà giữa quyền sở hữu trí tuệ và quyền lợi của công chúng Một mặt

Trang 10

tính chất công cộng của các thư viện xuất phát từ nguyên tắc phục vụ không lấy tiền và không vụ lợi và bình đẳng trong truy nhập thông tin và tri thức Khi chuyển sang thư viện số thì chức năng này cũng không thể thay đổi Mặt khác, truy nhập toàn cầu tới thư viện số là điều kiện tiên quyết để phát triển thị trường

số, như vậy việc truy nhập công cộng miễn phí khó có thể dung hoà với cơ chế thị trường của việc phổ biến thông tin trong một nền kinh tế mà thông tin được coi là hàng hoá

1.1.3 Thư viện số:

Thư viện số là một bước tiến xa hơn của thư viện điện tử hay có thể nói cách khác, là thư viện điện tử cấp cao, cho phép đọc được thông tin toàn văn sau khi đã số hoá hầu hết tư liệu, đặc biệt là các tư liệu dưới dạng đồ hoạ như tranh ảnh, bản đồ, và các tư liệu đa phương tiện (multimedia)

Philip Baker cũng phân biệt thư viện điện tử và thư viện số theo một kiểu khác Ông cho rằng thư viện điện tử lưu trữ và phục vụ cả ấn phẩm lẫn tư liệu điện tử hoặc tư liệu đã được số hoá, trong khi đó thư viện số chỉ lưu trữ các tư liệu điện tử mà thôi [6] Một thư viện điện tử có thiên hướng sử dụng linh hoạt

và phổ biến các nguồn tin điện tử nhưng đồng thời cũng tham gia vào việc tạo ra các nguồn tin đó Các thư viện số cũng có nhiều định nghĩa khác nhau và nhiều công trình nghiên cứu với quan điểm khác nhau

Thư viện số là hình thức kết hợp giữa thiết bị tính toán, lưu trữ và truyền thông số với nội dung và phần mềm cần thiết để tái tạo, thúc đẩy và mở rộng các dịch vụ của các thư viện truyền thống vốn dựa trên các biện pháp thu thập, biên mục [9] và phổ biến thông tin trên giấy và các vật liệu khác

Thư viện số là tập hợp của các thiết bị tính toán, lưu trữ và truyền thông

số với nội dung và phần mềm để tái tạo, thúc đẩy và mở rộng các dịch vụ của thư viện truyền thống như thu thập, biên mục, tìm kiếm và phổ biến thông tin Một thư viện số hoàn chỉnh phải thực hiện tất cả các dịch vụ cơ bản của thư viện truyền thống kết hợp với việc khai thác các lợi thế của công nghệ lưu trữ, tìm kiếm và truyền thông số Nghiên cứu về thư viện số bao gồm một loạt các vấn

đề kỹ thuật, xã hội và chính trị quyện lẫn vào nhau Khái niệm thư viện số không chỉ tương đương với một sưu tập số hoá và các công cụ quản trị thông tin Đúng

ra đó là một môi trường tập hợp các sưu tập, dịch vụ và con người để hỗ trợ cho một chu trình hoàn chỉnh của việc sáng tạo, phổ biến, sử dụng và bảo quản dữ liệu, thông tin và tri thức ( Hội thảo Santa Fe về môi trường làm việc phổ biến tri thức) và có hàm ý về một môi trường mạng cung cấp nội dung

Ngày nay người ta đang nghiên cứu thế hệ tiếp theo của các thư viện số nhằm thúc đẩy việc sử dụng và nâng cao tính khả dụng của các nguồn tin được nối mạng và phổ biến trên phạm vi toàn cầu, đồng thời cũng nhằm động viên

Trang 11

khuyến khích các dự án phát triển các công cụ phát hiện, quản trị, tìm và phân tích thông tin hướng về các lĩnh vực ứng dụng và cải tiến đổi mới Người ta cũng tập trung nghiên cứu định nghĩa thư viện số và quan hệ của nó với thư viện truyền thống cũng như quan hệ với các hệ thống rộng hơn có liên quan đến xuất bản khoa học và thương mại

Thư viện số được xem như là các hệ thống cung cấp cho cộng đồng người

sử dụng cách tiếp cận lôgíc tới một kho tin và tri thức lớn, có tổ chức Kỹ thuật

số đã làm tăng khả năng cho người sử dụng tiếp cận, tổ chức lại và sử dụng kho tin Một số người cho rằng trong một tương lai không xa, thư viện số cần phải liên kết cả ấn phẩm và tư liệu số và vấn đề chính yếu là phải cho phép bao quát được một kho tin cực lớn Theo ý kiến này nếu chỉ nhấn mạnh đến nội dung tư liệu dưới dạng số thì chưa đủ Lúc này, vô hình chung đã đề cập tới thư viện điện tử Có thể nói thư viện điện tử là thư viện lai giữa thư viện truyền thống và thư viện số

Trong thực tế hiện nay, mục tiêu là phải phát triển được các hệ thống công nghệ thông tin cho phép tiếp cận được các kho tư liệu được số hoá ngày một nhiều và khai thác được đầy đủ các tư liệu dưới dạng số hoá Như vậy, tính chất đầy đủ và giá trị của vốn tư liệu có thể được gia tăng do khả năng tích hợp tư liệu dưới dạng số hoá và phương pháp truy nhập thông tin dễ dàng hơn

Thực tế có một sự kế thừa giữa vai trò, chức năng của thư viện truyền thống và các mục tiêu của hệ thống thư viện số, nghĩa là chức năng phát triển, tổ chức vốn tư liệu, tạo phương tiện truy nhập và bảo quản của thư viện truyền thống phải được mở rộng sang môi trường thư viện số Thư viện số sẽ là một bộ phận của hệ thống dịch vụ thư viện rộng lớn trong tương lai và các cán bộ thư viện sẽ đóng một vai trò trung tâm trong phát triển và quản trị thư viện số

Một thư viện số phải bao quát được các kho tư liệu số hoá, nghĩa là sẽ phải tiến tới chỉ có một hệ thống thư viện số duy nhất nơi mà người sử dụng ngày càng có khả năng truy nhập tới các loại hình sưu tập số và hệ thống thông tin số khác nhau: các nguồn tin của cá nhân, tập thể, cơ quan tổ chức, các môi trường hợp tác và các thư viện số công cộng

Ưu điểm của thư viện điện tử và thư viện số so với thư viện truyền thống cũng giống như những lợi thế của cơ sở dữ liệu so với hệ thống mục lục và thư mục thủ công: bổ sung vào sưu tập nhanh hơn với sự kiểm soát về chất lượng tốt hơn, các chức năng tìm kiếm thông tin được cải thiện, người sử dụng được truy nhập nhanh hơn tới thông tin tìm được

Các chức năng chính và dịch vụ của Thư viện số

Chức năng và dịch vụ của Thư viện số bao gồm ba chức năng sau:

- Người dùng có thể với tới được các dạng nguồn tri thức, thông tin

Trang 12

- Tạo cơ chế phát hiện nguồn, cho phép người dùng nhận dạng, xác định được các nguồn tin cần tìm và vị trí lưu giữ các nguồn tin ấy

- Cung cấp cơ chế chuyển giao các nguồn tin riêng biệt tới người dùng, kể cả quá trình nhận các nguồn tin ở nơi khác và chuyển cho người dùng

Một số dịch vụ cơ bản của thư viện số:

- Dịch vụ tàng trữ, nơi các đối tượng số được ký gửi và lưu giữ

- Dịch vụ định danh đảm bảo cho mỗi đối tượng số có một tên duy nhất và có

1.1.4 Quy tắc xây dựng và phát triển thư viện số và thư viện điện tử

- Cần phải có những dạng tư liệu tiêu biểu Các thành phần tư liệu phải được trình bày dưới hình thức tự nhiên, cụ thể là những đối tượng có thể được vận hành bởi người dùng quen thuộc với chúng

- Kết hợp ba lĩnh vực :

+ Xã hội: như kỹ năng và kiến thức thông tin của người sử dụng, ảnh hưởng xã hội đối với dây chuyền chuyển giao công nghệ thông tin, luật pháp và chính sách

+ Thông tin: tổ chức, phát hiện nguồn, vai trò của siêu dữ liệu,

+ Hệ thống: tương tác người - máy, phần mềm và cấu trúc, qui mô và tương tác

- Các đường liên kết phải được ghi lại, giữ gìn, tổ chức và tổng quát hoá

- Phải có sự phân tách giữa thư viện số và giao diện người dùng cho thư viện đó Đối tượng của thư viện số được sử dụng khác với đối tượng được lưu trữ Người dùng tin cần nội dung trí tuệ của tư liệu chứ không phải là đối tượng số

- Sử dụng những phương pháp tìm kiếm tiên tiến như tìm kiếm liên thư viện Z39.50

- Phải phát triển các hệ thống mở, bao gồm người dùng và địa điểm nơi mà một

số chức năng của cán bộ thư viện sẽ được tự động hoá do máy tính thực hiện

- Phải hỗ trợ việc truy nhập theo nhiệm vụ tới các nguồn lưu trữ điện tử

- Phải có quan điểm phát triển lấy người dùng làm trung tâm Người dùng phải làm việc với những đối tượng ở mức tổng quát hoá thích hợp

1.1.5 Quá trình hình thành thư viện điện tử và thư viện số

Ngày nay công nghệ thông tin đã và đang phát triển mạnh trong tất cả các lĩnh vực như ngành kinh tế, khoa học, giao dục,…trong đó ngành thư viện đã và đang từng bước tự động hoá những hoạt động trong ngành thư viện Những

Trang 13

thành tựu của Công nghệ thông tin như công nghệ máy tính và truyền thông, xuất bản điện tử, công nghệ truyên thông đa phương tiện, Internet và mạng toàn cầu, giúp cho các thư viện và cơ quan thông tin – thư viện đưa ra những dịch vụ

và phương pháp quản trị thông tin, cơ sơ dữ liệu hữu hiệu cũng như việc truy nhập thông tin và chia sẻ nguồn lực, tạo điều kiện cho việc xây dựng thư viện điện tử hay thư viện số

Thư viện điện tử và thư viện số đã được xây dựng ở các nước phát triển như Mỹ, Anh, Canada, Úc… Thư viện Quốc hội Hoa kỳ đã tiến hành một chương trình thư viện số khổng lồ nhằm chuyển đổi vốn tư liệu in truyền thống sang các nguồn tin điện tử linh hoạt và nếu công việc thực hiện đúng tiến độ kế hoạch thì độc giả và những người dùng tin ở khắp nơi trên thế giới trong thế kỷ

21 sẽ có thể bật máy tính, tìm đến cơ sở dữ liệu và truy nhập tới kho tư liệu số hoá của Thư viện Quốc hội Hoa kỳ, ngoài ra nhiều thư viện đại học Mỹ cũng đang tìm cách để đưa các sưu tập thư viện vào máy tính và đưa lên mạng để bạn đọc truy nhập sử dụng rộng rãi, các chuyên gia cũng có tham vọng tập hợp tư liệu số từ nhiều nơi và thậm chí trên phạm vi toàn cầu, xây dựng thư viện toàn cầu để thông qua Internet, mọi người ở bất cứ nơi nào cũng có thể truy nhập

Các vấn đề thường gặp khi xây dựng thư viện điện tử và thư viện số

- Khó tìm do thiếu công cụ hoặc do bộ máy tìm kiếm tổ chức kém

- Thiếu các tham chiếu qua lại và mối liên kết với các tư liệu khác

- Quá nhiều đường liên kết không hợp lý hoặc dẫn tới các thông tin vô dụng

- Thường xuyên nâng cấp khiến người dùng nhiều khi phải phán đoán mò mẫm nơi có các thông tin đã được định vị trước đây

- Thiếu sự nhất quán trong khi trình bày những thông tin tương tự

- Thông tin lạc hậu, không cập nhật, sai ngữ pháp và chính tả

- Khổ mẫu không thống nhất nên gặp rắc rối khi tham chiếu trực tuyến và

2010, 2020, trước xu thế của sự chuyển hướng toàn cầu sang xã hội thông tin và

sự xuất hiện của thời đại công nghệ thông tin Ngoài ra, vấn đề không gian lưu trữ các tư liệu truyền thống dưới dạng ấn phẩm trong phần lớn các thư viện Việt

Trang 14

Nam đã trở nên cấp bách khiến cho nhiều người đã mơ ước thực hiện giải pháp cứu cánh: số hoá kho tư liệu, ngoài xu hướng vi hình hoá nay đã lỗi thời, hi vọng rằng bằng cách phát triển các thư viện điện tử và thư viện số, sẽ không phải xây thêm kho tàng, nhà cửa, mặc dầu động cơ chính của việc thành lập các thư viện số là nhằm để chia sẻ nguồn lực với tác dụng chẳng những tăng khả năng truy nhập thông tin, sử dụng hợp lý và tiết kiệm nguồn kinh phí mua sách báo trước tình hình giá xuất bản phẩm trên thị trường sách thế giới tăng vọt, mà còn khắc phục tình trạng trùng lặp, dư thừa trong các kho tư liệu

Trong trào lưu toàn cầu hướng về các thư viện điện tử và thư viện số, khó khăn nhất cho nước ta, trong việc xây dựng các loại hình thư viện này theo đúng nghĩa của nó, là vấn đề kinh tế Xây dựng những thư viện điện tử "lý tưởng", độc lập, với vốn tư liệu hoàn toàn số hoá, với toàn bộ dịch vụ chuyển sang phương thức điện tử, sẽ không khả thi, mà xu hướng sẽ xuất hiện nhiều thư viện điện tử (theo ý nghĩa tương đối) như là kết quả của quá trình tin học hoá, như là các cổng vào thông tin và như một bộ phận của các thư viện lớn truyền thống ở Việt Nam

Trong chừng mực nào đó, có thể nói chúng ta đã đang tiến trên con đường xây dựng thư viện điện tử hoặc ở trong giai đoạn quá độ xây dựng thư viện điện tử Mặc dầu vậy, có lẽ tốt hơn hết là đừng quá vội sử dụng các thuật ngữ nói trên (thư viện điện tử, thư viện số và thư viện ảo) trong lúc khái niệm và thuật ngữ còn chưa thống nhất và ổn định, để gọi tên một thư viện Tạo nên sự chuyển biến về chất trong vốn tư liệu, dịch vụ và người sử dụng là điều quan trọng hơn

để minh chứng cho việc đặt tên Bao giờ lượng đổi thành chất trong quá trình số hoá vốn tư liệu, điện tử hoá dịch vụ và chuyển đổi phương cách sử dụng thư viện sẽ là lúc chúng ta có thể nói về một thư viện điện tử thực thụ Con đường

mà đại bộ phận thư viện chúng ta sẽ đi là: kết hợp các nguồn tin truyền thống với hiện đại, bổ sung thêm các tạp chí điện tử toàn văn trên CD-ROM ( hiện còn quá ít), đặt mua ( trả tiền thuê bao truy nhập) các tạp chí điện tử toàn văn trên mạng ( hầu như chưa nơi nào làm); số hoá một phần vốn tư liệu ( đặc biệt là các sưu tập quí hiếm và nơi khác không có, những sưu tập là thế mạnh của mình, ), điện tử hoá một phần dịch vụ và tạo điều kiện cho người sử dụng chủ động khai thác các mạng diện rộng, kể cả truy nhập Internet

1.1.4 Thư viện ảo

Thư viện ảo là một dạng của thực tế ảo (virtual reality), được xây dựng trên cơ

sở công nghệ ảo ( đôi khi phối hợp với kỹ thuật âm thanh nổi và hình ảnh nổi để tạo ảo giác như thực), nhấn mạnh đến tính chất "phi không gian" của loại hình thư viện này về phương diện vốn tư liệu và dịch vụ Bất cứ thư viện nào tạo điều kiện cho người đọc tiếp cận được những tư liệu nằm tại bất cứ nơi nào khác trên thế giới đều có thể được coi là "thư viện ảo" [6] Nói cách khác, thư viện ảo không phụ thuộc vào một địa điểm cố định và cho phép truy nhập thông tin từ xa thông qua mạng Còn thư viện điện tử có một địa điểm cụ thể, hữu hình, nơi bạn

Trang 15

đọc hay người sử dụng có thể tới để nhận những sản phẩm và dịch vụ được cung cấp dưới dạng điện tử Tuy nhiên, cũng có ý kiến cho rằng thư viện ảo nằm trong phạm trù thư viện điện tử, trong thư viện điện tử có thư viện ảo

1.2 Tra cứu trực tuyến OPAC

OPAC là một mục lục điện tử Nó tương đương với mục lục phiếu nhưng

có khả năng tìm kiếm trực tuyến OPAC cũng có thể là chạy trên Web và được gọi là Web OPAC [1] Web OPAC dùng cho các thư viện để chia sẻ thông tin thư mục

OPAC là cổng kết nối với người dùng tin với cơ sở dữ liệu của cơ quan thông tin – thư viện Cung cấp khả năng tìm kiếm các biểu thức tìm tin từ đơn giản đến phức tạp cả về các thông tin mô tả lẫn thông tin toàn văn Khả năng khai thông tin bằng công cụ tìm kiếm theo khái niệm của OPAC tạo ra một cuộc cách mạng trong tìm kiếm thông tin Với khả năng sẵn sàng đưa lên Internet, OPAC cho phép người dùng ở bất kỳ nơi nào cũng có thể truy cập được nguồn thông tin của các cơ quan thông tin – thư viện thông qua trình duyệt Web

Một số dịch vụ được cung cấp trên OPAC : mục lục tra cứu tìm tin trực tuyến; lưu thông trực tuyến; dịch vụ thông tin trực tuyến; dịch vụ liên thư viện; khai thác dữ liệu số trực tuyến, tra cứu liên thư viện qua giao thức Z39.50 tại nhiều máy chủ Z39.50 cùng một lúc

Trang 16

Chương 2: CÁC CHUẨN TRONG THƯ VIỆN ĐIỆN TỬ

2.1 Chuẩn biên mục và siêu dữ liệu:

2.1.1 Khổ mẫu biên mục – MARC

Phương pháp tạo lập bản ghi thư mục ở phần lớn các cơ quan thông tin – thư viện hiện nay dựa vào khổ mẫu MARC (Machine Readable Cataloguning) – Biên mục có thể đọc bằng máy Khổ mẫu MARC là một cấu trúc dành riêng cho các dữ liệu thư mục quản lý bằng máy tính điện tử Nét đọc đáo của nó là đưa ra một phương pháp mã hóa dựa trên cơ sở phân tích sâu sắc nhữn yếu tố thư mục (trong đó chịu ảnh hưởng rất lớn của quy tắc biện mục Anh - Mỹ AACR)

Đến nay đã có rất nhiều khổ mẫu MARC ra đời UNIMARC của IFLA ra đời giữa những nămn 70, NORMARC 1971 (NaUy), IBERMARC 1976 (Tây Ba Nha), DANMARC 1976 (Đan Mạch), LIBRISMARC 1976 (Thụy Điển), FINMARC1977 (Phần Lan), MALMARC 1978 (Malaysia), PHILMARC 1979 (Philippin), KORMARC 1981 (Hàn Quốc), Janpa /MARC 1981 (Nhật Bản), Chinese MARC 1982 (Đài Loan), SAMARC 1982 (Nam Phi), NewZealand MARC 1982 (Tân Tây Lan), SBN\ANAMARC 1983 (Italia), SINGMARC (Singapore), Indian MARC 1985 (Ấn Độ), PUL MARC 1985 (Trung Quốc), INDOMARC 1990 (Indonesia) [1, 2] vv…,tuy nhiện được sử dụng nhiều nhất là khổ MARC21 do Thư viện Quốc hội Mỹ phát triển

Hình 1 Thành phần MARC21

Khổ mẫu biên mục (BDF – Biliographic): được thiết kế chứa dữ liệu liên quan đến thông tin hình thức (tác giả, nhan đề, thông tin xuất bản) và nội dung của tài liệu (chỉ số phân loại, chủ đề, từ khoá,…)

Khổ mẫu nhất quán –ADF: được thiết kế để mang thông tin có liên quan đến những hình thức chuẩn của tên và chủ đề được dùng như là điểm truy nhập trong các bản ghi MARC, các hình thức tên, chủ đề và phụ đề này được dùng như những tham chiếu tới các hình thức chuẩn và các mối quan hệ qua lại giữa những hình thức này Một tên có thể được dùng như là một tiêu đề (điểm truy nhập) chính, bổ sung, tiêu đề bổ sung theo chủ đề, tiêu đề bổ sung theo tùng thư

Trang 17

Khổ mẫu phân loại – CDF: được thiết kế phản ánh thông tin về các số phân loại

và các định danh liên quan được tạo lập theo một khung phân loại chuẩn

Khổ mẫu lư trữ dự liệu – HDF được thiết kế nhằm:

- Nhận dạng các yếu tố dữ liệu trong các thông báo về tư liệu của từng thư viện

- Giao diện với các hệ thống điều khiển tự động như: mục lục liên hợp và mượn liên thư viện, nập các xuất bản phảm nhiều kỳ (bổ sung)

- Dùng cho các chuyên gia thông tin – thư viện tham gia tạo lập và duy trì thông tin về vốn tư liệu theo MARC21

Khổ mẫu cộng đồng – CMDF: được thiết kế để mang các yếu tố mô tả các loại nguồn lực không phải là thư mục Nó ra đời nhằm đáp ứng nhu cầu thông tin của cộng đồng

Cấu trúc bản ghi Biên mục MARC21

Cấu trúc của một biểughi biênmục MARC21 [1, 3] gồm ba phần:

- Đầu biểu (LEADER): là một trường dữ liệu đặc biệt có độ dài cố định 24

ký tự chứa các thông tin về quá trình xử lý bản ghi

- Thư mục (DIRECTORY): là phần tiếp sau ngay đầu biểu, là một loạt nhóm dữ liệu chỉ dẫn về các trường dữ liệu có trong bản ghi

- Các trường dữ liệu:là những trường của bản ghi chứa các dữ liệu mô tả Các trường dữ liệu có thể có độ dài thay đổi (Variable Fields) hoặc độ dài

cố định (Fixed – Length Fields)

Bên trong vùng các trường dữ liệu, mỗi trường dữ liệu có hai loại mà xác định nội dung là: Chỉ thị (gồm hai ký tự, nếu có) và dấu phân cách trường con (gốm hai ký tự) Giữa các trường sẽ có mã kết thúc trường Cuối mỗi bản ghi có mã kết thúc bản ghi

Các trường dữ liệu chia thành các khối sau đây:

00X Khối trường điều khiển (số và mã)

6XX Khối trường điểm truy cập chủ đề

7XX Khối trường tiêu đề bổ sung

8XX Khối trường liên quan đến vốn tài liệu, nơi và vị trí lưu giữ

Trang 18

Trường con

Trường con xác định từng yếu tố dữ liệu riêng biệt của trường dữ liệu Mỗi trường có ít nhất một trường con ký hiệu phân cách trường con gồm hai ký tự: dấu phân chác ($) và mã trường con (a, b, c…1, 2, 3…)

và tổ chức Siêu dữ liệu còn có thể được định nghĩa là dữ liệu có cấu trúc về dữ liệu” Gail Hodge định nghĩa siêu dữ liệu là “ thông tin có cấu trúc mà nó mô tả, giải thích, định vị, hoặc làm cho nguồn tin trở nên dễ tìm kiểm, sử dụng và quản

lý hơn Siêu dữ liệu được hiểu là dữ liệu về dữ liệu hoặc thông tin mô tả tài nguyên thông tin

Mục đích của siêu dữ liệu:

- Mục đích đầu tiên và cốt yếu nhất của siêu dữ liệu là góp phần mô tả và tìm lại các tài liệu nguyên điện tử

- Hỗ trợ cho việc sử dụng hiệu quả tài nguyên Một khi tài nguyên được tìm trong môi trường điện tử, siêu dữ liệu cung cấp cho người sử dụng những thông tin về kỹ thuật, về khuôn khổ kinh doanh (bản quyền, quyền truy cập,…)

- Đảm bảo sự liên tác (interoperability) giữa các hệ thống Những sơ đồ siêu dữ liệu được thống nhất sẽ giúp cho các hệ thống có thể nhận dạng đúng các yếu tố, có thể chuyển đổi dữ liệu dễ dàng, đảm bảo hoạt động trên mạng hiệu quả hơn

Một trong những sơ đồ yếu tố siêu dữ liệu phổ biến và được nhiều người biết đến là Yếu tố siêu dữ liệu cốt lõi Dublin Core (Dublin Core Metadata Ele mnet Inuttiative) Tại cuộc Hội thảo về siêu dữ liệu do Trung tâm Thư viện máy tính hoá OCLC ( Ohio Cumputer Libray Center) và Trung tâm Quốc gia về ứng dụng siêu máy tính NCSA (National Center for Suppẻcomputing Application) phối hợp tài trợ, tổ chức tại Dublin, Ohio, Mỹ, vào tháng 03/1995, các chuên gia đã

đè xuất bộ yếu tố siêu dữ liệu cốt lõi Dublin Core Tập hợp yếu tố siêu dữ liệu được gọi là “cốt lõi” (Core) vì nói được thiết kế đơn giản và chỉ bao quát 15 yếu

tố cốt lõi nhất (trong MARC21 có hơn 200 trường và rất nhiều trường con) Do

Trang 19

được đề xuất tại Hội thảo tổ chức tại Dunlin nên có tiền tố Dublin Bộ yếu tố siêu dữ liệu Dublin Core thường được gọi tắt là Dublin Core Tháng 06/2000, Dublin Core được Uỷ ban châu Âu về tiêu chuẩn hoá/ Hệ thống tiêu chuẩn hoá cho xã hội thông tin (CEN/ISSS – European Committee for Standarization / Information Sociecty Standard System) [1,5] coi là tiêu chuẩn Tháng 09/2001, Dublin Core được ban hành thành tiêu chuẩn quốc gia Mỹ, gọi là tiêu chuẩn

“The Dublin Core Metadata Element Set” ANSI/NISO Z39.85-2001

Khổ mẫu tiêu chuẩn siêu dữ liệu Dublin Core là tập hợp các yếu tố đơn giản nhưng hữu hiệu trong công việc mô tả một loạt nguồn tin trên mạng DC gồm 15 yếu tố, mà ngữ nghĩa được xác lập của nhiều chuyên gia Các yếu tố mô tả trong

DC đều không bắt buộc và có thể lặp, ngoài ra còn có một số lượng hạn chế các

từ hạn định và định ngữ có thể sử dụng để tiếp tục tinh chỉnh ý nghĩa các yếu tố

Các yêu tố mô tả: 15 yếu tố

- Nhan đề: tên của tài liệu được đặt bởi tác giả hoặc nhà xuất bản

- Tác giả (người sáng tác): cá nhân hoặc tổ chức sáng tạo ra nguồn thông tin Ví dụ: nhà văn, hoạ sỹ, nhà nhiếp ảnh, người minh hoạ

- Chủ đề và từ khoá: là chủ đề của nguồn tin, điển hình, chủ đề có thể được hiểu tương đương như từ khoá nhằm mô tả về một chủ đề hoặc một nội dung của nguòn thông tin Người ta rất khuyến khích việc sử dụng các quyến từ vựng có kiểm soát và các khung phân loại

- Mô tả: miêu tả nguyên văn về nội dung của nguồn thông tin, có thể bao gồm cả tóm tắt trong trường hợp tài liệu thành văn hoạc mô tả nội dung trong trường hợp không xác định rõ

- Nhà xuất bản: một thực thể chịu trách nhiệm về việc xây dựng nên hình thức của tài liệu Ví dụ: nhà xuất bản, một khoa trong trường đại học, hoặc một tổ chức

- Những người cộng tác: là cá nhân hoặc một tổ chức trên danh nghĩa cùng một người đóng góp trong việc xây dựng nguồn thông tin, tuy nhiên đối với những cá nhân hoặc tổ chức xây dựng nên nguồn tin thì họ chỉ đóng vai trò phụ, thứ yếu Ví dụ: người biên tập, người dịch, người hiệu đính…

- Thời gian xuất bản: thời gian xuất bản nguồn tin , được diễn tả theo cấu trúc Năm/Tháng/Ngày/ Ví dụ: 1994-11-05

- Loại dữ liệu: kiểu mô tả cho nguồn thông tin, ví dụ: trang chủ, bài thơ, quyển sách, báo cáo kỹ thuật, bài luận, từ điển, nhằm mục đích quốc tế hoá, kiểu mô tả nên nguồn tin nến lấy trong danh sách đã được xây dựng

- Khổ mẫu (định dạng): kiểu của dữ liệu tuỳ thuộc vào tài liệu, ví dụ: khối lượng và thời gian của những nguồn thông tin Kiểu dữ liệu được dùng để

mô tả cho nguồn thông tin, nhằm mục đích quốc tê hoá Định dạng nguồn tin nên chọn trong danh sách mới nhất do tổ chức quốc tế xây dựng

- Yếu tố nhận dạng: mã nhận dạng là một từ hoặc con số được sử dụng để nhận dạng nguồn thông tin Ví dụ: các nguồn thông tin trên mạng bao gồm cả URL và UNs Có một số mã nhận dạng duy nhất như: ISBN, chỉ

Trang 20

số sách theo tiêu chuẩn quốc tế, hoặc một số tên tương tự khác cũng có thể đại diện cho yếu tố này

- Nguồn: những thông tin nguồn dữ liệu

- Ngôn ngữ: Ngôn ngữ của nội dung thông tin

- Quan hệ: là một yêu tố nhận dạng về nguồn thông tin thứ hai có liên quan đến nguồn thông tin hiện thời Yếu tố này được sử dụng để mô tả cho mối quan hệ của các nguồn thông tin, nhằm mục đích quốc tế hoá

- Phạm vi (mức độ bao phủ): không gian và thời gian tạo ra tài liệu

- Bản quyền: sự xác định về quyền hạn của người quản lý nguồn thông tin

o Tác giả (người sáng tác)

o Nhà xuất bản

o Nhà phân phối, cộng tác

o Quản lý bản quyền 3- Các đối tượng cá biệt

o Thời gian xuất bản

o Loại dữ liệu

o Khổ mẫu (định dạng)

o Yếu tố nhận dạng

Các từ chuẩn giới hạn của Dublin Core [1, 4]

- Lọc yếu tố mô tả: làm cho nghĩa của một yếu tố mô tả hẹp hơn hoặc cụ thể hơn

- Khung mã hoá: nhận diện các quy tắc trợ giúp diễn giải giá tị của một yếu

tố mô tả nào đó, bao gồm các từ vựng kiểm soát và các ký hiệu hình thức hay các quy tắc cú pháp

- Từ vựng cho các yếu tố mô tả: bộ sưu tập; bộ dữ liệu; sự kiện; hình ảnh; các nguồn dữ liệu có tương tác; dịch vụ; phần mềm; âm thanh; văn bản Công cụ và phần mềm Dublin Core:

Công cụ:

- Các tiện ích

o Tạo siêu dữ liệu theo mẫu

o Công cụ tạo/ thay đổi mẫu

o Tự động trích dẫn/ tập hợ lại siêu dữ liệu

o Tự động tạo siêu dữ liệu

Trang 21

o Chuyển đổi giữa các khổ mẫu siêu dữ liệu

o Tự động tạo siêu dữ liệu

o Chuyển đổi giữa các khổ mẫu siêu dữ liệu

- Cho các chuyên gia tham khảo về Dublin Core

- Giới thiệu và diễn giải về Dublin Core

Đặc điểm Dublin Core

- Tạo lập và duy trì bản ghi một cách dễ dàng

- Ngữ nghĩa dễ hiểu

- Phạm vị sử dụng quốc tế rộng lớn với các phiên bản đa ngôn ngữ

- Khả năng mở rộng các yếu tố thuận tiện

2.1.3 Ngôn ngữ đánh giá mở rộng XML

XML (eXtennsible Markup Language) là ngôn ngữ đánh dấu mở rộng có nguồn gốc từ ngôn ngữ định dạng siêu văn bản HTML (Hyper Text Markup Language), cả hai ngôn ngữ này đều bắt nguồn từ chuẩn ngôn ngữ định dạng văn bản tổng quát có cấu trúc SGML (Structured General Markup Language) XML là ngôn ngữ được định nghĩa bởi tổ chức mạng toàn cầu (Word Wide Web Consortium), thường được viết tắt theo cách chơi chữ là W3G Đây là tổ chức quốc tế định ra các chuẩn web và internet

Cấu trúc XML

Một văn bản XML hình thành từ các thẻ (tag) với tên gọi phần tử (element) Khác với ngôn ngữ HTML, số lượng và tên gọi trong XML là không hạn chế XML là ngôn ngữ tổng quát dụng định nghĩa dữ liệu thông qua các thẻ Trong HTML các thể được định nghĩa và quy định trước [27] Trong khi đó, với XML

ta có thể tuỳ ý định nghĩa mọi thẻ Như vậy có thể coi XML như tập cha của ngôn ngữ HTML Dựa vào một số quy tắc, XML tự tồn tại và phát triển tự thân thành các ngôn ngữ định nghĩa khác

Điểm quan trọng nhất là XML cho phép dễ dàng xử lý, chuyển tải và trao đổi dữ liệu giữa rất nhiều ứng dụng và tài liệu người dùng với các định dạng khác nhau Nếu đã quen với máy tính, hẳn ta biết rằng có rất nhiều định dạng tệp khác nhau Việc chuyển đổi dự liệu giữa chúng quả là nan giải mặc dù có không ít trình ứng dụng hỗ trợ Ví dụ như tệp DOC, XLS, DBF, MDB (lập trình Access), TXT (tệp văn bản), RTF(Rich Text Format) và mới đây là HTML Chỉ riêng các tệp văn bản thôi đã gặp rất nhiều khó khăn, nếu bận nhận được một tệp Word 2000

Trang 22

mà máy tính của bạn dùng Word 7.0, cố gắng lắm cũng chỉ đọc được phần văn bản có các nội dung khác thường bị biến dạng

Trong XML, dữ liệu và định dạng được lưu ở dạng văn bản và có thể dễ dàng cấu hình cũng như thay đổi chúng bằng các trình soạn thảo thông thường nếu không có trong tay trình soạn thảo XML chuyên nghiệp Dữ liệu và các thẻ trong XML không mã hoá, không đòi hỏi bản quyền

Tháng 12/1997, phiên bản đầu tiên XML 1.0 (Extensible Markup Language – Ngôn ngữ đánh dấu mở rộng) ra đoìư và là chuẩn đơn giản của SGML Từ đó, nhiều công ty phần mềm đã chạy ứng dụng dựa trên XML đã ra đời Điển hình một số tuỳ biến ngôn ngữ định dạng dựa trên XML cho thấy sức mạnh của XML:

- BITS – Banking Industry Technology Secretariat: ngôn ngữ văn phòng về kỹ thuật nghiệp vụ ngân hàng

- IFX – Financial Exchange: trao đổi dữ liệu tài chính

- BIPS – Banking Internet Payment System: hệ thống thanh toán qua internet của nghiệp vụ ngân hàng

- TIM – Telecommunicaton Interchange Markup: định dạng trao đổi viễn thông

- EbXML – XML: kinh doanh điện tử

- PDML – Product Data Markup Language: ngôn ngữ định dạng dữ liệu sản phẩm

- FIX – Financial Information eXchange Protocol: giao thức trao đổi thông tin tài chính

- CML – Chemical Markup Language: ngôn ngữ định dạng trong lĩnh vực hoá học, cho phép biểu diễn các công thức hoá học, cho phép biểu diễn các công thức hoá học, hoá trị phân tử ở dạng đồ hoạ

Ưu điểm của XML:

- Có thể tạo bản ghi thư mục một lần và xuất bản chúng theo các dạng khác nhau

- Hiển thị bản ghi thư mục trực tiếp trên trình duyết Web, search engines (công cụ tìm kiếm) và các hệ thống thư viện tiềm năng khác mà không cần chuyển đổi

- Bản ghi thư mục có thể được chuyển đổi qua lại giữa XML và MARC mà không bị tổn thất

- Nhiều vấn đề tồn tại trong định dạng MARC được khắc phục, ví dụ như việc kiểm soát tiêu chuẩn

- Năm 1995, thư viện Quốc hội Mỹ bắt đầu nghiên cứu tính khả thi của việc dùng SGML (Standard Generalized Markup Language - Chuẩn ngôn ngữ định dạng văn bản tổng quát có cấu trúc) để mã hoá định dạng MARC21 Sau đó, phiên bản MARC DTDs (Document Type Definitions) định nghĩa laọi văn bản MARC để

Trang 23

định nghĩa dữ liệu MARC21 trong dạng thức SGML được phát hành năm 1998 Cùng năm này, Thư viện Quốc hội Mỹ công bố phần mềm chuyển đổi giữa MARC21 và SGML

2.1.4 Khổ mẫu MARCXML

Khổ mẫu MARC21 đã được biết đến rộng rãi trên thế giới như một khổ mẫu cho dữ liệu thư mục MARC21 được ứng dụng rộng rãi trong việc xây dựng các mục lục sách truy cập trực tuyến và trao đổi dữ liệu thư mục giữa các thư viện Xét về khía cạnh lý luận, MARC21 được coi là một khổ mẫu siêu dữ liệu, nhưng là siêu dữ liệu truyền thống Với sự phát triển của những ứng dụng XML, nhu cầu về khổ mẫu MARC21 trong môi trường XML trở nên cấp bách

và được quan tâm

Từ năm 1995, Thư viện Quốc hội Mỹ, đã có đề án phát triển MARC DTD MARC DTD có thể được dịch tạm là Định nghĩa phần tử tài liệu theo MARC Thuật ngữ “MARC DTD” được tạo ra từ cụm tiếng Anh Machine Readable Cataloging Document Type Definition, đề cập đến việc ứng dụng ngôn ngữ đánh dấu tổng quát chuẩn, viết tắt là SGML (Standard Generalized Markup Language) SGML là một ký thuật trình bày tài liệu ở dạng máy tính đọc được, được xây dựng thành tiêu chuẩn quốc tế ISO 8879 (Xử lý thông tin - Hệ thống văn phòng và văn bản – Ngôn ngữ đánh dấu tổng quát chuẩn) SGML được phát hiện để đáp ứng nhu cầu về chuẩn không độc quyền cho đánh dấu văn bản mà

dữ liệu máy tính có thể đọc được, có thể trao đổi giữa các môi trường mã hoá không giống nhau SGML được sử dụng rộng rãi trong xuất bản nơi các tài liệu được tạo ra bằng cách sử dụng những hệ thống máy tính khác nhau SGML hỗ trợ việc xác định tập hợp các yếu tố mô tả tài liệu

Mục đích đầu tiên của dự án MARC DTD là tạo ra một DTD theo SGML chuẩn

để hỗ trợ việc chuyển đổi dữ liệu theo cấu trúc MARC sang dữ liệu theo cấu trúc SGLM (và ngược lại) Dữ liệu theo cấu trúc MARC là ứng dụng của các tiêu chuẩn quốc tế về trao đổi thông tin ISO 2709 đã được thông qua từ hàng chục năm trước đây Để việc chuyển đổi này được chuẩn hoá, cần thiết phải có DTD chuẩn

MARC DTD xử lý mỗi bản ghi thư mục như một tài liệu điện tử Nó xác định (định nghĩa) mọi yếu tố có thể trong bản ghi MARC theo một quy định riêng

MARC XML DTD

Với sự phát triển của các ứng dụng ngôn ngữ XML trong tạo lập tài liệu điện tử, Thư viện Quốc hội Mỹ đã phát triển MARC XML DTD Phương án này được coi là hiệu quả hơn phương án đầu tiên gọi là Lược đồ MARCXML (MARCXML Schema) MARC XML DTD đã xác định mỗi yếu tố theo XML Việc này tạo ra một bộ DTD rất lớn, khá phức tạp

Trang 24

Về nguyên tắc, các yếu tố dữ liệu trong SGML được quy định bằng những cặp thẻ Để áp dụng cho dữ liệu theo MARC, mọi thẻ quy định yếu tố dữ liệu trong SGML đề sử dụng tiền tố “mrc” (có lẽ là viết tắt từ chữ MARC để thể hiện sự liên quan đến MARC) Điều này để đảm bảo không có sự trung lặp với những DTD có thể sử dụng một số yếu tố MARC trong tạo lập tài liệu điện tử (thí dụ như trong trường hợp cho tài liệu theo kiêu TEL)

Mọi dữ liệu liên quan đến dữ liệu mô tả thư mục đề sử dụng tiền tố “mrcb” Mọi yếu tố trong nhóm DTD về kiểm soát tính nhất quán (MARC Authority DTD group, bao gồm authority and classification records) bắt dầu bằng tiền tố

Hầu hết các nhãn trường theo MARC đều có trường con Trong MARC DTD người ta cũng sử dụng một mã ký tự làm thẻ cho trường con Trường con sẽ được gán cùng với thẻ nhãn trường bằng dấu gạch ngang Ví dự: mrcb245-a, mrcb245-b, mrcb245-6

Trong các bản ghi MARC, ngoài nhãn trường, trường con có chỉ thị Để chỉ dẫn rằng đây là dữ liệu liên quan đến chỉ thị, người ta đã đề xuất sử dụng các định danh “i1” và “i2” chi chỉ thị 1 và chỉ thị 2

Một số đặc trưng khác của dữ liệu MARC là sự có mặt của một số trường có độ dài cố định, trong đó mỗi vị trí đều được quy định cụ thể loại dữ liệu Thí dụ những trường này là trường 006-008 Cú pháp đối với các trường này sẽ như sau:

 Tiền tố chỉ thị nhãn trường “mrcb” hoặc “mrca”;

 Ba chữ chỉ thị nhãn trường;

 Mã dữ liệu và dấu gạch ngang;

 Định danh số chỉ thị vị trí của dữ liệu theo MARC

Thí dụ: mrcb008-BK-22

Đối với phần đầu bản ghi, người ta đề nghị sử dụng tiền tố, mã dữ liệu và vị trí của mã để làm thẻ meta Quy định cụ thể như sau:

 Tiền tố phần dầu biểu “mrcaldr” hoặc mrcbldr”;

 Mã dữ liệu theo MARC, dấu gạch ngang;

 Số định danh thông báo vị trí đối với mã dữ liệu

Thí dụ: mrcbldr-bd-05

Trang 25

Marc XML:

Metadata Object Description Schema – MODS

Nhóm nghiên cứu của Thư viện Quốc hội Mỹ dã phát triển một khuon khổ cho thao tác với dữ liệu theo khổ mẫu MARC trong môi trường XML Trên cơ sở những nghiên cứu về MARC – DTD, Thư viện quốc hội Mỹ cùng các nhóm chuyên gia dã phát triển Sơ đồ mô tả đối tượng siêu dữ liệu – MODS ( viết tắt từ tiếng Anh Metadata Object Description Schema) Mục đích của MODS là tạo khổ mẫu để mang dữ liệu từ bản ghi MARC21 cũng như cho phép tạo bản ghi môt tả của tài liệu điện tử nagy từ đầu theo SGML [1, 3]

2.2 Chuẩn trao đổi dữ liệu

Ngày nay, sự phát triển vượt bậc của công nghệ thông tin và viễn thông đã và đang tạo ra nhiều cơ hội song cũng ít thách thức cho hoạt động thông tin – thư viện Ngay từ khi còn hoạt động trong môi trường truyền thống, thực tế đã cho thấy: Vốn tài liệu của cơ quan thông tin – thư viện không thể dáp ứng được hết các nhu cầu của người dùng tin Trong môi trường hiện đại, người dùng tin chìm ngập trong biển thông tin nhưng lại rất khó khăn trong việc tìm kiếm đâu là thông tin chất lượng, có giá trị, phù hợp với nhu cầu…Vì vây, hệ thống các cơ quan thông tin – thư viện cần phải liên kết để khắc phục tình trạng phân tán về nguồn thông tin Đáp ứng nhu cầu thông tin ngày càng cao của người dùng tin Các cơ quan thông tin – thư viện không đáp ứng một cách nhanh chóng mà còn đầy đủ về nội dung và hình thức tài liệu cho người dùng tin Chính vì vậy cần có

sự trao đổi, hợp tác liên thông giữa các cơ quan thông tin – thư viện Sử dụng lại các bản ghi biên mục chuẩn, tiết kiệm thời gian, công sức, sự trùng lặp và kinh phí xử lý tài liệu Tuy nhiên, hiện nay, các cơ quan thông tin – thư viện chưa có

sự liên thông, trao đổi thông tin/tài liệu

Nguyên nhân chưa có sự liên thông trao đổi

- Các quy tắc mô tả chưa thống nhất

- Công cụ sử dụng chưa đáp ứng được nhu cầu trao đổi

- Nền tảng về tiềm lực công nghệ thông tin chưa có

Trang 26

Hình 2 Chuẩn trao đổi dữ liệu [31]

Nội dung cần thống nhất liên thông

 Thống nhất về quy tắc mô tả tài liệu: sử dụng MARC21

 Thống nhất về định dạng chủ đề và phân loại tài liệu

 Thống nhất về định chủ đề và phân loại tài liệu

 Thống nhất trong việc sử dụng phần mềm và các chuẩn công nghệ thông tin

Nội dung trao đổi

 Trao đổi bản ghi biên mục

 Thông qua tệp: ISO2709

 MARC

 Thông qua Z39.50

 Trao đổi tài liệu

 Tài liệu số

Các yếu tố và vấn đề liên quan đến liên thông chia sẻ nguồn lực thông tin

 Hạ tầng công nghệ thông tin

 Phần mềm

 Tuân theo các chuẩn trong thư viện và các chuẩn công nghệ thông tin

 Yếu tố con người: các nhà lãnh đạo, quản lý và các cán bộ thực thi

Có thể dẫn chứng ra mô hình liên thông Thư viện quốc gia và các tỉnh thành đã triển khai trong nhiều năm qua

Mục đích trao đổi thông tin

 Nhập dữ liệu từ thư viện Tỉnh/Thành phố lên thư viện Quốc gia

 Thư viện Tỉnh/Thành phố truy cập, khai thác thông tin thư mục của Thư viện Quốc gia

 Lưu chiểu tài liệu điện tử

Trang 27

 Đảm bảo tính thống nhất và phát triển hệ thống

 Trao đổi liên thư viện

Thực hiện quá trình trao đổi thông tin:

 Các thư viện tỉnh xuất các bản ghi thư mục cần chuyển lên Thư viện quốc gia ra tệp ISO 2790, hoặc dưới dạng XML, hoặc dưới dạng xuất nhập của Ilib

 Thư viện tỉnh gửi tệp này lên cho Thư viện quốc gia thông qua mạng WAN

 Thư viện Quốc gia kiểm tra lại tệp đã nhận và nhập chúng vào Cơ sở dữ liệu thông qua Module Nhập/Xuất dữ liệu

 Các thư viện truy cập vào Web của Thư viện Quốc gia để khai thác thông tin thư mục tại Thư viện Quốc gia trên các giao diện thân thiện với người dùng tin

 Các thư viện tỉnh cũng có thể thực hiện tra cứu trên cơ sở dữ liệu của các

cơ quan thông tin – thư viện khác (trong nước hoặc quốc tế) thông qua giao thức Z39.50 tại chính thư viện mình hoặc nối vào trang Web của Thư viện Quốc gia và quốc tế khác (Ví dụ như: tra cứu tại các cơ quan thông tin – thư viện các trường đại học trong nước hay tra cứu vào thư viện Quốc hội Mỹ,…) nhằm làm phong phú nguồn dữ liệu cho thư viện mình, phục vụ người dùng tin ngày một tốt hơn

 Các thư viện tỉnh có thể sao các bản ghi từ cơ sơ dữ liệu của Thư viện Quốc gia bằng cách sử dụng Module Nhập/Xuất dữ liệu

2.3 Chuẩn tra cứu liên thư viện Z39.50

Z39.50 là một chuẩn tìm kiếm và khai thác thông tin giữa các cơ quan thông tin – thư viện

Ban đầu Z39.50 là một chuẩn quốc gia của Mỹ về khai thác thông tin Tuy nhiên hiện nay, Z39.50 được cả thế giới công nhận như là một chuẩn chung về khai thác thông tin thay cho chuẩn tìm kiếm và khai thác thông tin Là một chuẩn ứng dụng mạng, vì vậy Z39.50 là một chuẩn mở nên nó cho phép trao đổi thông tin giữa các hệ thống chạy trên phần mềm và các phần cứng khác

Z39.50 được phát triển nhằm khắc phục những vấn đề liên quan đến việc tìm kiếm trong cơ sở dữ liệu ví dụ như phải biết hệ thống menu, ngôn ngữ tìm tin,…của mỗi hệ thống khác nhau Z39.50 làm cho đơn giản hoá quá trình tìm kiếm bằng việc sử dụng giao diện tìm kiếm quen thuộc của hệ thống đó để tìm kiếm vốn tài liệu ở chính cơ quan thông tin – thư viện đó cũng như ở các cơ quan thông tin – thư viện mà ứng dụng chuẩn này

Các chức năng tra cứu

Z39.50 server: cung cấp cho các thư viện khách Z39.50 khả năng tra cứu cơ sở

dữ liệu của cơ quan thông tin – thư viện

Z39.50 client: cung cấp cho cơ quan thông tin – thư viện khả năng tra cứu cơ sở

dữ liệu của các cơ quan thông tin – thư viện khác qua Z39.50

Trang 28

Z39.50 Getway: làm đầu mối gửi các yêu cầu tra cứu tới các máy chủ Z39.50 Người dùng tin không cần kết nối Internet trực tiếp, mà vẫn tra cứu được các máy chủ Internet

Tra cứu và nhập dữ liệu biên mục qua Z39.50

Để tra cứu được dữ liệu thông qua Z39.50, cần biết ba yếu tố sau:

Tên máy chủ

Cổng truy cập

Tên cơ sở dữ liệu

Sử dụng các chương trình xuất nhập dữ liệu để lấy dữ liệu từ Internet thông qua giao thức Z39.50 Cán bộ làm công tác biên mục có thể sử dụng chuẩn này để tra cứu trực tiếp vào các cơ sở dữ liệu trực tiếp trên mạng để tải về các bản ghi thư mục đã được xử lý để tái sử dụng lại Công việc duy nhất còn lại là bổ sung thêm chỉ số xếp giá hoặc đăng ký cá biệt cho bản ghi thư mục này Tại Việt Nam, cán bộ biên mục khi xử lý tài liệu có thể tải bản ghi thư mục tại hai địa chỉ sau: nếu là tài liệu nước ngoài thì có thể tải dữ liệu thư mục từ Thư viện Quốc hội Mỹ, nếu là tài liệu tiếng Việt thì có thể tải dữ liệu thư mục từ Thư viện Quốc gia Việt Nam

Đại học Quốc gia Australia Library.anu.edu.au 210 INNOPAC Amsterdam Public Library 194.171.56.160 8000 Catalogue OBA Thư viện Quốc hội Mỹ Z3950.loc.gov 7090 Voyager

Viện công nghệ Massachusetts Library.mit.edu 210 ADVANCE Thư viện Quốc gia Australia ilms.nla.gov.au 210 NLA

Thư viện New Zealand saturn.natlib.govt.nz 210 Pinz

Thư viện Quốc gia Việt Nam www.nlv.gov.vn 210 Default

Bảng 1: Một số địa chỉ Z39.50 trên Internet

2.3.1 Khái niệm về Z39.50

Z39.50 là gì: Z39.50 là một giao thức tiêu chuẩn quốc tế được sử dụng bởi hệ

thống máy tính kết nối mạng để lấy thông tin Z39.50 cho phép người tìm tin tìm kiếm nhiều hệ thống khác nhau trên mạng hoặc Internet thông qua việc sử dụng một giao diện người dùng duy nhất Nhiều nhà cung cấp phần mềm và hệ thống đem đến cho người dùng khả năng truy cập thông tin từ một sự đa dạng các hệ thống cá biệt, khác nhau từ phần cứng, phần mềm, giao diện, đến các câu lệnh tìm kiếm cơ sở dữ liệu Thách thức lớn với người dùng là Internet cung cấp

Trang 29

khả năng truy cập tới một khối lượng khổng lồ các cơ sở dữ liệu đang phát triển hàng ngày Thách thức đối với người tìm kiếm là làm sao để tìm thấy thông tin cần thiết giữa mảng thông tin rộng lớn một cách ít đau khổ nhất Mục tiêu của chuẩn Z39.50 là giảm sự phức tạp và khó khăn của việc tìm kiếm và lấy thông tin

Z39.50 làm cho việc sử dụng các nguồn tài nguyên thông tin giàu có trên Internet được dễ dàng hơn Khi sử dụng một hệ thống hỗ trợ Z39.50, một người dùng trong một hệ thống có thể tìm kiếm thông tin điện tử trong hệ thống khác

mà không cần phải biết cách làm việc của hệ thống đó

Z39.50 hoạt động như thế nào: Z39.50 hoạt động trong môi trường khách /

chủ, nó đóng vai trò như một ngôn ngữ chung mà tất cả các hệ thống hỗ trợ Z39.50 đều có thể hiểu được Nó như là một quốc tế ngữ _ Esperanto và làm cầu nối "nhiều ngôn ngữ và tiếng địa phương" mà hệ thống thông tin khác nhau

“nói” Để thực hiện giao tiếp và tương tác với Z39.50, cả máy khách và máy chủ phải sử dụng ngôn ngữ Z39.50 Hầu hết các triển khai Z39.50 sử dụng chuẩn TCP / IP giao thức truyền thông Internet để kết nối các hệ thống và phần mềm tương thích Z39.50 để dịch giữa chúng phục vụ việc tìm kiếm và thu thập thông tin Đối với người sử dụng, các công việc này được thực hiện sau hậu trường; họ chỉ đơn thuần nhìn thấy giao diện tìm kiếm và hiển thị kết quả thông thường

Để đạt được khả năng tương tác này, Z39.50 tiêu chuẩn hóa các thông điệp mà máy khách và các máy chủ sử dụng cho truyền thông, bất kể những gì bên dưới như phần mềm, hệ thống, hay nền tảng được sử dụng

Z39.50 hỗ trợ các hệ thống mở, có nghĩa là nó độc lập với chủ sở hữu hay các nhà cung cấp Một hệ thống khách thực thi giao thức Z39.50 cho phép giao tiếp với nhiều máy chủ khác nhau, các hệ thống máy chủ hỗ trợ giao thức này thì cho phép tìm kiếm từ các hệ thống khách được phát triển bởi các nhà cung cấp khác nhau Không cần phải biết hệ thống máy chủ hoạt động thế nào, người dùng thực hiện các tìm kiếm thông qua giao diện Z39.50 trên máy khách Z39.50 chi phối việc các máy khách “dịch” yêu cầu tìm kiếm sang một định dạng chuẩn để gửi đến máy chủ Sau khi nhận được yêu cầu tìm kiếm, máy chủ sử dụng quy tắc Z39.50 để “dịch” yêu cầu tìm kiếm vào một định dạng được công nhận bởi các

cơ sở dữ liệu cục bộ, thực hiện tìm kiếm, và trả về kết quả cho máy khách của người dùng Phần mềm giao diện người dùng của máy khách xử lý kết quả trả về qua Z39.50, với mục tiêu hiển thị càng gần với cách các bản ghi được trình diễn trong hệ thống cục bộ của người dùng càng tốt

2.3.2 Giải pháp và lợi ích của Z39.50

Z39.50 ban đầu được thiết kế để trợ giúp tìm kiếm với cơ sở dữ liệu rất lớn như các mục lục của OCLC và Thư viện Quốc Hội Mỹ Ngày nay Z39.50 được sử dụng cho một phạm vi rộng lớn các chức năng của thư viện bao gồm tìm kiếm

cơ sở dữ liệu, từ biên mục tới mượn liên thư viện tới tham chiếu Với sự phát triển nhanh chóng của Internet, tiêu chuẩn Z39.50 đã trở nên được chấp nhận rộng rãi như là một giải pháp cho các thách thức trong việc thu thập thông tin đa phương tiện bao gồm cả văn bản, hình ảnh, và tài liệu số hóa Z39.50 được sử

Trang 30

dụng để truy cập tới các nguồn thông tin đa dạng ví dụ như dữ liệu bảo tàng, thông tin chính phủ, và các dữ liệu không gian địa lý Nó cũng có thể được sử dụng để tìm kiếm cơ sở dữ liệu trực tuyến và CD-ROM mà các nhà cung cấp phát triển theo nhiều các đề án thiết kế đa dạng Không cần phải tìm hiểu từng

hệ thống, người dùng có thể tìm kiếm các cơ sở dữ liệu đó với một máy khách Z39.50 duy nhất, mặc dù mỗi hệ thống sử dụng một cấu hình phần cứng và phần mềm khác nhau, lưu trữ các loại dữ liệu khác nhau, và có logic khác nhau trong việc tìm kiếm cục bộ

Các thư viện có thể thông qua một giao diện duy nhất đã được tiêu chuẩn hóa cho phép độc giả của họ truy cập tới mục lục của thư viện, các CDROM đã mua, các cơ sở dữ liệu đã đặt trực tuyến và các nguồn tài nguyên Internet

Dữ liệu từ nhiều nguồn khác nhau có thể được trích ra một định dạng phổ biến

để sử dụng ngoại tuyến hoặc nhập vào một cơ sở dữ liệu cục bộ

Chia sẻ tài nguyên

Z39.50 thúc đẩy việc chia sẻ tài nguyên trên quy mô rộng Trong cộng đồng thư viện, ví dụ, Z39.50 hỗ trợ:

Tìm kiếm diện rộng tới các mục lục thư viện nằm trên Internet ở bất cứ nơi nào trên thế giới

Mượn liên thư viện với cách tiếp cận theo chuẩn Z39.50 để truyền tải thông tin

về vốn tư liệu, và đặt mượn, chuyển giao tài liệu trực tuyến

Một số lượng đáng kể các mục lục thư viện đã sẵn sàng cho tìm kiếm Z39.50 thông qua liên kết từ trang web của Thư viện Quốc Hội Mỹ, và ngày càng có thêm theo thời gian Vì ngày càng nhiều các tổ chức thiết lập truy cập mạng tới các bộ sưu tập số hóa điện tử, chia sẻ các nguồn tài nguyên đang xác lập một ý nghĩa mới trên cơ sở là tài liệu và sách vật lý dành cho mượn liên thư viện

Tăng năng suất

Bởi vì các giao diện tìm kiếm của các hệ thống khác nhau là trong suốt, người dùng không còn cần phải làm chủ việc làm thế nào để sử dụng mỗi cơ sở dữ liệu, tránh một đường cong học tập có khả năng dốc Thời gian đào tạo đội ngũ nhân viên có thể được giảm cho các chức năng cần đến việc tìm kiếm cơ sở dữ liệu, ví dụ như biên mục, bổ sung, và mượn liên thư viện Khả năng truy cập dễ dàng hơn tới các nguồn tài nguyên điện tử làm giảm tổng thời gian người dùng chi phí cho việc tìm kiếm thông tin liên quan

2.3.3 Tóm lược lịch sử phát triển của Z39.50

Z39.50 phát triển vượt ra khỏi Dự án Hệ Thống Liên Kết - Linked Systems Project (LSP), một sáng kiến trong những năm 1980 để chuẩn hóa tìm kiếm của các cơ sở dữ liệu thư mục chính của OCLC, Thư viện Quốc Hội Mỹ, Mạng Thư

Trang 31

Viện Washington - Washington (Western) Library Network (WLN), và các Thư viện Thông tin Nghiên cứu của Nhóm Thư viện Nghiên cứu - Research Libraries Group (RLG)

Làm việc song song với các sáng kiến LSP là nỗ lực tiêu chuẩn hóa trên một giao thức truy vấn thông tin cho các ứng dụng thư viện dưới sự bảo trợ của NISO Các giao thức được phát triển từ LSP chuyển đến NISO và được tiếp tục phát triển thành Z39.50 tiêu chuẩn thu hồi thông tin, đã được phê duyệt như là một tiêu chuẩn NISO năm 1988

Thư viện Quốc Hội Mỹ (LC)đã được chỉ định chính thức là Cơ quan Bảo trì và đăng ký quyền đối với tiêu chuẩn Z39.50 Như vậy, LC cung cấp thông tin liên quan đến sự phát triển và bảo trì Z39.50 các phiên bản hiện tại và tương lai, cũng như về việc thực hiện và sử dụng giao thức Z39.50

Một nhóm được gọi là Nhóm thực hiện Z39.50 (Z39.50 Implementors’ Group - ZIG) đảm nhận một vai trò chính trong sự phát triển liên tục Kết hợp với Cơ quan Bảo trì Z39.50, ZIG đã phát triển phiên bản 2 và 3 của giao thức Z39.50 (1992 và 1995 tương ứng) NISO sử dụng sự đồng thuận bình thường của nó và thủ tục biểu quyết để phê duyệt các phiên bản như là Tiêu chuẩn quốc gia

Chỉ trong hơn một thập kỷ, Z39.50 đã phát triển qua ba phiên bản, với mỗi phiên bản thêm chức năng tốt hơn và tinh tế hơn

- Phiên bản 1 được xác định các dịch vụ cốt lõi của Z39.50

- Phiên bản 2 chính thức hoá cấu trúc của thông tin trao đổi dựa trên các tiêu chuẩn ISO về ngôn ngữ mô tả dữ liệu và các quy tắc mã hóa được biết đến như ASN.1 BER Với sự đồng thuận về Z39.50 phiên bản 2, các nhà cung cấp đã bắt đầu tạo ra các ứng dụng nhanh chóng và là đà phát triển cho việc phát triển các chức năng tuân thủ Z39.50

- Phiên bản 3, phiên bản hiện tại của tiêu chuẩn, xây dựng bao gồm phiên bản 2 Phiên bản 3 là cực kỳ tốt trong việc hỗ trợ cho các ứng dụng đơn giản đến phức tạp

- Phiên bản hiện tại của tiêu chuẩn Z39.50 chính thức được biết đến như ANSI / NISO Z39.50-1995, định nghĩa dịch vụ và đặc tả giao thức cho các ứng dụng thu hồi thông tin - Information Retrieval Application

Tổ chức tiêu chuẩn quốc tế ISO đã phê duyệt hai tiêu chuẩn thu hồi thông tin trong năm 1993 (ISO 10162 và ISO 10163-1) Năm 1998, ISO đã thông qua giao thức Z39.50 và ban hành thông tin và tài liệu tiêu chuẩn ISO 23950 –Information retrieval (Z39.50), thu hồi hai tiêu chuẩn trước đó

Z39.50 toàn cầu

Z39.50 được công nhận trên toàn thế giới như là tiêu chuẩn quốc tế để tìm kiếm

và thu hồi thông tin trên mạng Sự hội tụ của Z39.50 và ISO 23.950 đã dẫn đến một tiêu chuẩn toàn cầu với sự hỗ trợ rộng rãi cho nhiều ngôn ngữ và các bộ ký

tự

Cơ quan Bảo trì Z39.50 phổ biến một loạt các thông tin về hoạt động thực hiện

dự án trên toàn thế giới, bao gồm các hệ thống tự động hóa thư viện và các hệ thống Z39.50 khách để truy cập vào cơ sở dữ liệu tham khảo, các ứng dụng thương mại, và các sáng kiến quan trọng của chính phủ quốc gia và quốc tế

Ngày đăng: 25/03/2015, 11:26

HÌNH ẢNH LIÊN QUAN

BẢNG KÝ HIỆU CÁC TỪ VIẾT TẮT - Nghiên cứu một số mô hình và giao thức thư viện điện tử
BẢNG KÝ HIỆU CÁC TỪ VIẾT TẮT (Trang 4)
Hình 1. Thành phần MARC21 - Nghiên cứu một số mô hình và giao thức thư viện điện tử
Hình 1. Thành phần MARC21 (Trang 16)
Hình 2. Chuẩn trao đổi dữ liệu [31] - Nghiên cứu một số mô hình và giao thức thư viện điện tử
Hình 2. Chuẩn trao đổi dữ liệu [31] (Trang 26)
Bảng 1: Một số địa chỉ Z39.50 trên Internet - Nghiên cứu một số mô hình và giao thức thư viện điện tử
Bảng 1 Một số địa chỉ Z39.50 trên Internet (Trang 28)
Hình 3: Mô phỏng mƣợn liên thƣ viện - Nghiên cứu một số mô hình và giao thức thư viện điện tử
Hình 3 Mô phỏng mƣợn liên thƣ viện (Trang 37)
Hình 4: Mô hình lớp - Nghiên cứu một số mô hình và giao thức thư viện điện tử
Hình 4 Mô hình lớp (Trang 44)
Hình 5: Giao diện tìm kiếm đơn giản - Nghiên cứu một số mô hình và giao thức thư viện điện tử
Hình 5 Giao diện tìm kiếm đơn giản (Trang 56)
Hình 6: Giao diện tìm kiếm nâng cao - Nghiên cứu một số mô hình và giao thức thư viện điện tử
Hình 6 Giao diện tìm kiếm nâng cao (Trang 57)
Hình 7: Kết quả tìm kiếm qua Z39.50 - Nghiên cứu một số mô hình và giao thức thư viện điện tử
Hình 7 Kết quả tìm kiếm qua Z39.50 (Trang 58)
Hình 9: Thông tin cơ sở dữ liệu - Nghiên cứu một số mô hình và giao thức thư viện điện tử
Hình 9 Thông tin cơ sở dữ liệu (Trang 59)

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w