tôi chon đề tài “Ứng dựng PHPAAOSQOL xây dụng Van để tạo lập nguồn tài liệu số, ứng dựng phần mềm xây dựng thư viên điện tử đã có một số công trình nghiên cứu được thực hiện trong những,
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO = BO VANHOA, THE THAO VA DU LICH
TRUONG DAI HOC VAN HOA HA NOL
LUAN VAN THAC Si KHOA HOC THU VIEN
NGUOI HUGNG DAN KHOA HOG: TS NGUYEN VIET NGHIA
IIA NOI - 2012
Trang 2Doan Anh Bic tà CHTV: 2010-2012
Lời cảm on
ĐÃ hoàn thành bản luận văn này, tôi đã nhận được sự hướng
dẫn và giúp đỡ tận tình của TS Nguyễn Viết Nghĩa Tôi xin bày tô
lòng biết ơn sâu sắc tới TS Nguyễn Viết Nghĩu về sự giủp dỡ gui bau nay
T61 xin chân thành cảm an kỹ sư Tô Trong Đức, người đã giúp
đỡ tôi xây dung và hodn thién phan mém DLS
Tôi xin chân thành cảm ơn Han Giảm đốc và tập thé cản bộ,
nhân viên thư viện tính Lạng Sơn đã guip tôi mong quả trình thứ
nghiém phan mém DLS
Tôi xin chân thành cảm ơn các thấy cô giảo tham gia giảng
dạy tại khoa sau đại học, Trường Đại học Ưăn hóa ITà Nội, các bạn
bè dằng nghiệp và người thân - những người dã quan lâm dộng viên, cổ vũ và giúp đỡ tôi trong quá trình học tập và thực biện luận vdn ndy
Tac gia
Trang 3Doãn Anh Đức 1 CHTV: 2010-2012
MỤC LỤC
CAC TU VIET TAT TRONG LUAN VAN
3 Mục tiêu và nhiệm vụ nghiên cứu 10
6 Ý nghĩa khoa học và ứng dụng của để tải - 11
7 Cấu trúc của luận văn 200.0 0xx 1]
Chương 1: TẢI LIỆU SỐ VÀ PHAN MEM QUẦN TRỊ TAT I TRU SỐ
TRONG HỆ THÓNG THƯ VIỆN CÔNG CỘNG
1.1.4 Tâm quan trọng của tải liệu số và việc quản lý tài liệu số 19 1.2 “Công tác số hóa tài liệu và việc ứng dựng phản mềm quản trị tải
liệu số ở các thư viện công cộng 6
Trang 4
liệu số
Chương 2: GIẢI PHÁP UN
2.2 Thiết kế hệ thống .45
2.2.1, Bài toán quản lý, khai thác tải liệu số ở các thư viện công cộng 45
2.3 Thiết kế các modnle của phân mm quản lý tài liệu số 154
Trang 53.2.7 Xuất bản thông tin ra CD-ROM, ô cứng dụ động 92
3.3.3 Một số lên lại sau khi thử nghiệm phần mễm DLS 95
3.4, Các kiên nghị và giải pháp hoàn thiên phan miễm 295
3.4.1 Tăng cưởng năng lực ứng dụng phần mẻm DLS của các thư viện
TÀI LIỆU THAM KHẢO
PHU LUC LUAN VAN
Trang 6Doãn Anh Đức 4 CHTV: 2010-2012
ASP Mỗi trudng kich bin tin may cha
(Active Server Pages) CD-ROM Đa quang chi doc
(Compact Dirk- Read Only Memory) CNNDS Công nghiệp nội đung số
CSDL: Cơ sở dữ liệu
css Cascading Style Sheets
DLS Phần mềm giải pháp thư viện số
(Digital Library Solutions) GUI Giao điện đồ họa người dùng
(Graphical User Interface) THb TIê quản trị thư viện điện tử tích hợp
(Intergrated Library Solutions)
(Local Network Area)
Libel Phần mềm giải pháp Thư viện điện tử
f]Brary OnÏ,ine) MARC Biên mục máy tính đọc được
(Machine Readable Catalog ) MySQL Tệ quán trị cơ sở dữ liệu
(My Structured Query Language)
OPAC Muc lục công công truy cap true tayén
(Online Public Access Catalog) PHP Nig6n ugit lap trinh
Personal Home Page)
Trang 7Doãn Anh Đức $ CHTV: 2010-2012
Bang 1.1: Điều tra tình hình số và ứng dụng phần mềm quan tn tai liệu
sổ tại một số thư viện tỉnh, thành phổ
Bảng 2.1: Bảng Users
Bảng 2.2: Bảng Bo su tap
Bảng 2.3
Bảng 2.4: Bảng Bạn dọc
Bang 2.8: Bang Thong_tin
Bang 2.6: Bang File tai lieu
Bang Sach
Bảng 2.7: Băng Lien he
Bang 2.8: Bang phân quyền người sử dụng,
Bang 2.9: Mô tả cấp độ báo mật tải liệu số
Bang 2.10: Mô tả nhỏm quyền của bạn doc
Trang
Trang 8Doãn Anh Đức 6 CHTV: 2010-2012
PHAN MO DAU
1 Tỉnh cấp thiết cũa đề tài
Trong thời đại ngày may, sự phát triển bảng nỗ của công nghệ thông tim
đã tác động lớn đến cuộc sống cũng như sự phát triển của xã hội Nhận thức
rõ tâm quan trọng, của của công nghệ thông tin đối với sự phát triển của đất
nước Bộ Chính trị đả ban bành chỉ thị số 58-CT/TƯ vẻ “Đây mạnh công
nghệ thông tin phục vụ sự nghiệp công nghiệp ha, hiện đại húa” Chỉ thị
38 khẳng định “Ứng dung và phát triển công nghệ thông tin là một nhiệm vụ
sa tiên trong chiến lược phát triển kinh lễ - xế hội, là phương tiện chủ lực để
đi tắt đón đầu, rúi ngắn khoảng cách phái triển so với các nước đi trước”
Công nghệ thông tin đang thay thé đần các phương tiện thủ công, mọi loại hình từ quản trị một bộ tuáy đến cách thức tiếp nhận kiến thức của muối cá niên cũng đang từng bước được số Trong bởi cảnh đó, công tác thông tin - thư viện cũng đã, dang và sẽ tiếp tục có những biến đổi sâu sắc với sự hiện
hữu của môi trường sẻ trong hoạt động Xây dựng thư viện số đã trở thành xu
hướng phát triển của hoạt động thông tin - tr viện toàn câu Thư viện số đã
giúp cho các thư viện triển khai phục vụ vượt ra khối khuôn viên của mình,
gác giới hạn vẻ hạn chế người sử dụng, bạn chế thời gian phục vụ, hạn chế tải
liệu phục vụ đã được vượt qua Bất cử người dùng tín nào, dù ở bất cứ nơi
dau, tai bat ky thai điểm nào đều có thể được phực vụ thông tin nếu truy cập vào một thư viện số Với những đặc điểm đó, thư viên số còn được gọi là thư
viên không nóc, thư viện không tường
Trong bởi cảnh hội nhập quốc tế dang diễn ra sôi động, xu hưởng liên kết hoạt đông giữa các cơ quan thỏng tin — thư viên là một tất yêu và sự bên kết nay đang dân vượt qua cả biển giới giữa các quốc gia, chau lục, hình
Trang 9cho sự liên kết ấy ngày cảng trở nên hữu Ích hơn Sự liên kết sẽ không thể đạt hiệu quả như mong muốn, nếu các cơ quan thông tin — thư viện không xây
dụng được các thự viện số, chỉa sẽ toàn văn của tải Hệu, vì chỉ có thư viện số mời giúp cho các cơ quan thông tỉ — thư viên trao đổi thông tín thuận tiện,
nhanh chóng Đẻ cũng là mình chứng cho sự phát triển về khoa học, công nghệ cúa một quốc gia, vủng lãnh thể,
Xây dựng thư viện số nhằm thoa man nhu câu tìm kiếm, khai thác và sử
dimg thang tin của con người trong ký nguyên mới - kỹ ng\tyên của trí thức,
từng bước đưa thư viện Việt Nam hòa nhập với mạng thông tu - thư viện gác
nước trong khu vực và thể giới
Vân để xây dựng thư viện hiện đại ở Việt Nam đã được Đảng và Nha
nước quan tàm chỉ dạo Ngày 4 tháng 5 nấm 2007, Bộ Văn hóa Thông tin
(nay là Bộ Văn hóa, Thể thao và Du lịch) đã ban hành quyết định số
10/2007/QĐ-BVHTT phê duyệt “Quy hoạch phát triển ngành thư viện Việt Nam tới năm 2010 và định hưởng phát triển tới năm 2020” trong đỏ
có nội dung: Ứng dung khoa bọc công nghệ cao nhằm tự động hóa, hiện đại hóa hoạt động của thư viện Phát triển thư viện điện tú, thu viện kỹ thuật số Suu tam, bdo tén và phái huy vốn di san văn hoá trong thư viện theo phương
pháp biện đại dựa vào công nghệ thông tim phát triển ở mức cao Thư viện
công cộng phải là nguồn lực giáp nâng cao dân tí và phd
ập giảo dục của cộng động, là cơ quan giáo dục thường xuyên dành cho mọi người Phần đầu đến năm 2010, toàn bộ thư viện các tình, hành phố được nỗi mạng với Thư Tiện Quốc gia Vidt Nam, Internat, sé héa 2094 tài liệu quỷ biếm, 40% thư viện cấp huyện ứng dụng công nghệ thông tin
Trang 10tôi chon đề tài “Ứng dựng PHPAAOSQOL xây dụng
Van để tạo lập nguồn tài liệu số, ứng dựng phần mềm xây dựng thư
viên điện tử đã có một số công trình nghiên cứu được thực hiện trong những,
iin gan đây
“ Cao Minh Kiém (2000), “Thư viên số - định nghữa - vẫn đề “, Tạp chí
Thông tin đ& Tư liệu, (3), tr 5-11 Bài báo phân tích những đặc điểm
chủ yếu của thư viện sổ, xây dựng kho tải liệu số, xây dựng siêu dữ
Nguyễn Hoàng Sơn (2003), Xây đựng mô bình thư viện điện tir & Việt
Nam trong giai đoạn hiện nay, Luận văn thạc sĩ Dễ tài đề cập tới các vấn để lý luận về thư viện điện tử, bao gồm: chiến lược của hệ thống Thông tin, khái niệm thư viện điện tử, các yếu tổ câu thành thư viện điện
Trang 11Doãn Anh Đức 9 CHTV: 2010-2012
tit, khdo sét ede yếu lỗ cầu thành thư viện điện tử, để xuất mội số
giải pháp xây đựng mô bình thư viện điện tử ở Việt Nam từ việc
lap du an đến thực thi đự án
% Pham Thi Mai (2009), Aghiên cứu phát triển thư viện điện tứ trong các trường đại học trên địa bàn Hà Nội hiện nay, Luận vẫn
thạc sỉ Công trình để cập tới một số vấn để như các khái niệm
liên quam đến tuy viện điện tử, gác yếu tô cầu thành thư viện điện
các giải pháp hoàn thiên quy tink số lóa tài hệu
Nhìn chưng, các công trình trêu mới chỉ để cập tới một số khía cạnh của vấn để xây dựng mô hinh thư viện điện tứ ở Việt Nam, xây dựng, phát triển nguồn tài liệu số Trong công trình của tác giả Nguyễn Minh Hiép có giới thiêu một số phần mềm nguồn mở của nước ngoài, tuy thiên trơng thực tế ứng đụng các phần 1uằm này vẫn gòn nhiều hạn chế như Việt hỏa chưa triệi để, cải đặi, quận trị không thuận tiện, giao
diện thiểu thân thiện Như vậy, có thể nói, cho đến nay chưa cỏ một công trình nào nghiên cứn một cách toàn điện về việc ứng dựng mã nguồn mỡ xây dung phan mém quản trị tài liệu số trong hệ thống thư
viên công công ở Việt Nam
Trang 12Doãn Anh Đức 10 CHTV: 2010-2012
3 Mục tiêu và nhiệm vụ nghiên cứu
Aục tiêu:
Ứng dụng ngôn ngữ lập trình PHP và hệ quân tạ cơ sở đữ liệu MySQL
xây dụng phân mềm quán trị tải liệu số cho hệ thông thư viện công, cộng
“Nhiệm vụ nghiên cứu:
sk Xác định các yêu cầu xây dựng phản mềm quán trị tài liệu số
s# Thiết kế, xây dung phan mém quan tri tải liệu số
s# Chạy thủ nghiệm phần mềm tại một thư viện công công tỉnh, thành phô
sw Dễ xuất giải pháp hoàn thiện phần mễm và đưa vào áp dựng trong thực
tiên
4 Đỗi tượng và phạm vì nghiên cứu
Tiảt tượng nghiên cứu: phần mềm quản trị tài liệu số trong hệ thẳng thư
viện công cộng,
Phạm vĩ nghiên cứu:
- Công tác số hỏa tải liệu và thực trạng ứng đụng phan mềm quân tị tải liệu số tại một số thư viện công cộng cấp tỉnh, thành phỏ: Bình Dương, Cân
Thơ, Gia Lai, Hải Dương, Hải Phòng, Hòa Bình, Lạng Sơn, Phú Yên, Sơn La,
Thừa Thiên - Tuế
- Xây dựng phần mềm quân trị tải liệu số
~ Thời gian: từ năm 2010 đến nay (2012).
Trang 13~ Phương pháp nghiên cửa tải liệu
Ø6 Ý nghĩa khaa học và ứng dụng của dé tai
- Vẻ mặt khca học: góp phan hoàn thiện lý luận khi tiến hành xây dựng, quân trị, khai thác nguễn tài liệu số phủ hợp với điển kiện của các thư viên
công công ö Việt Nam
- Về mặt ứng đụng; để tài có ý nghĩa thực tiễn bởi kết quả của để tai co thể được ứng dụng tại các thư viện cấp tính, cấp huyện trong hệ thông thư viện cổng cộng Ứng dụng PIIP/AfySQL (mà nguồn mở - miễn phí) để xây
dựng phần mềm giúp các thư viên công cộng tiết kiêm chỉ phi trang quá trinh
xây đựng, quản lý và khai [rác nguồn tải liệu số
7 Cấu trúc của luận văn
Ngoài phân mở đầu, kết luận, tài liệu tham khảo, phụ hịc, luận vẫn
dược chúa làm ba chương:
Chương ï: Tài liệu số và phần mềm quản trị tài liệu số trong hệ
thống thư viện công cộng
Chương 2: Giải pháp ứng dựng PHP/MYSQL xây dựng phẫu mềm quản trị tài liệu số
Chương 3: Thử nghiệm phần mềm và các giải pháp ứng dụng
Trang 14Doãn Anh Đức 12 CHTV: 2010-2012
Chương 1: TÀI LIỆU SỐ VA PHAN MEM QUAN TRI TAI LIEU SO
TRONG HE THONG THU VIEN CONG CONG
11 Tải liệu số
1.1.1 Khái niệm tản liệu số
Sự phát triển cực kỳ mau lọ gũa công nghệ thông tin va truyền thông, trong những năm gân đây đang tác động mạnh ruế tới mọi phương điện của đời sống xã hội, trong đó có lĩnh vực hoạt động thông tín thư viện Để sử
dựng được các phương tiện, kỹ thuật lưu trữ và truyền tải thông tin hiện đại, không thể không có những vật mang tín phủ hợp De đó, việc nghiền pứu, ứng
dụng và hoàn thiện các val mang tin mới là điểu được nhiều nhà khoa học hoạt động trong lĩnh vực thông tin, công nghệ và truyền thông quan tâm Đó chính là khởi đâu cho sự xuất hiện và phát triển không ngừng của một loại
bình tài liệu mới: Tải liệu số
Cho đến nay, đã có không ít định nghĩa vẻ tài liêu số được đưa ra Điểm thung của các định nghấa rày đến cho rằng: tôi liệu số là tài liệu mã thông tin chứa đựng trong đó đã được biểu diễn dưới dạng mã nhị phân, tức la
mã chỉ gềm hai số 0 và 1 Nói cách khác, những thông tin về tài liệu, một phan hay toàn bệ nội đung của tài liệu đã được chuyển thánh các bịt thông tin
dữ liệu và được lưu trữ, khai thác trên máy vị tính, với sự hỗ try cia md hay
một vải thiết bị chuyên dụng, phần mểm ứng dụng vả hệ thống mạng máy tính Như vậy, tải liệu được tạo lập trực tiếp từ máy vi tính, được lưu trữ
thành các tệp dữ liệu (file), với những định dạng khác nhau như: doo, exe, jps pdf, va cde thi liệu có nội đung là kết quả của quá trình số các loại
hình tài hệ khác: giấy, ảnh, phữm đều là tài liệu số Với cách hiểu đó, có
Trang 15Doãn Anh Đức 13 CHTV: 2010-2012
thể cơi nguồn tài liêu sé là tập hợp có tổ chức những bộ sưu lập thông tin số
và thông tín trong tài liệu đã được số
Do bản chất tổn tại và lưu trữ hoàn toàn khác biệt so với loại hình tài liệu truyền thống ngudn tai liệu số chỉ có thế được truy cập và khai thác trên mảy tính hay hệ thống mạng máy tính Một trong số các phương tiện cầu nói đưa người đúng tìn lới với nguồn tài liệu số chỉnh là hệ thống ede mue luc công cộng tra cứu trực tuyển (tiếng Anh là Online Public Access Catalog, được viết tắt là OPAC) Theo Từ điển Thông tin — Thư viện học trục tuyển - ODILIS, OPAC là một cơ sở đữ liện (CSDL) bao gềm các biểu ghi thi mục,
tâm thông tin, cơ quan lưu trữ Tuy nhiên, ngày nay, nhờ sự tiến bộ không,
ngừng của công nghệ, người dùng lim có thể thông qua OPAC để trà cửu
thông Gin ngay lrêt 1uáy tính tai ula, bại cơ quan, Lại trường học thông qua
các kết nổi Intemet có dây và không dây Dặc biệt, trong thời gian gần đây, rat nhiều loại điện thoại đi động đời mới có hỗ trợ kết nổi Intemet được tưng
ra thị trường, một trong những ứng đựng của các thiết bị này là tạo điều kiện đưa người dùng tin dén gan hơn với OPAC, với nguồn tín mà họ đăng tim kiểm Chính điểu này cũng dang tao nên một làn sóng mới trong hoạt động
thông thì - thư viện, đó là quáng bá hình ánh, marketing nguồn tin của mình trên mạng Internet và mạng điện thoại di động,
Đổi với một tải liệu ở đạng truyền thống: sách, bảo, luận văn, việc số lida tai liệu này có thể ở các cấp độ khác nhan: Số hóa thư mục, số hỏa dữ
kiện, dữ liệu và số hóa toàn văn.
Trang 16Doãn Anh Đức 14 CHTV: 2010-2012
Tài liêu số hoa thu mục là lài hêu chỉ được số phân thư muạc Các yếu
tổ thư mục được đưa vào số bao gồm một số hoặc tất cá các yếu tổ sau: Tên tác giả (có thể có nhiều tên tác giả, tên cơ quan hay tổ chức xuất bán tài liệu), tên người dịch, tên người sưu tâm, tên người hiệu đính ; Têu tái liệu (có thể bao gồm cả tên tài Hiệu hằng nhiều thứ tiếng khác nhau nếu tài Hệu được xuất bản đa ngôn ngữ), Nơi xuất bản, Nhà xuất bản, Nam xuất bản; Khổ cỡ của tải liệu; Số trang của tài Hiệu, Chí số ISBN hoặc ISSN Ngoài ra, còn một số các yêu tổ khác lá: Ký hiệu phân loại tài liệu, Kỷ hiệu xếp giả tài liệu (có thể
có cả ký hiệu tên thư viện, trung tâm thông tin, cơ quan lưu trữ tải liêu nêu là xnụe lục liên hợp), Ký hiệu định chủ để, Các từ khoá, Bãn tôm tắt nội dụng tải liệu
Tài liệu số hóa dữ kiện, dữ liệu là tải liệu ngoài phần số thư mục còn có thêm phân số một số đữ kiện, dữ liệu của tài liệu gốc nhưng không phải là
toàn bộ các thông tim chứa đựng trong tài liệu gốc Các đữ kiện, đữ liêu này
có thể là thông tín lịch sử; số liệu thống kế; biểu đổ timg trưởng; thánh phần cấu tạo, công thức điều chế hoá học, một số nhận định, phân tích và dự bao được nêu trong tài liệu gốc;
Tài liệu số hóa toán văn có nội đung là toàn bộ nội dung của tải liệu
gốc đã được số hóa Đây là loại hình tải liệu số trọn vẹn nhất, cỏ giả trị sử dụng lớn nhất trong số các loại hình tải liệu số Bởi giá trị của thông tin, nằm
Trang 17Doãn Anh Đức 15 CHTV: 2010-2012
điều này, có thể người đừng tin phôi lới lận nơi lưu giữ thông lin để lìm kiểm tài liệu gốc (nêu tải liệu đỏ chưa được số toàn văn) hoặc đưa ra yêu cầu được truy cập tới nguồn toàn văn (nếu người đùng tin chưa được cấp quyển truy cập, hoặc chưa đủ điều kiện dé được truy cập tới các nguồn toàn văn của tải liga quy, hiém và chứ lưu bánh nội bộ, hay chưa thực hiện các nghĩa vụ cần thiết như: trả phí truy cập, đăng ký thông tin người dùng ) Nhưng nếu chỉ sau một thao tác click chuột, người dùng tin truy cập được đến nguồn tài liệu
số toàn văn — điêu đó cũng đồng nghĩa với việc họ được sử dụng toàn bộ thông trn đỏ, rất nhanh chóng va thuận tiện mà không cần phải tính đến các
trở lực lớn như: khoảng cách địa lý, giới lạm thời gian hay những ức chế trong
khi chờ đợi để được đến hượt tiếp cân với toàn văn tải liệu Đó lả niềm mơ ước lớn lao nhất của rnọi người dùng tin trên thể giới và cững là điểm dich ma mọi thư viện, trung tâm thông tin, cơ quan lưu trữ trên toản cầu đang nỗ lực
hướng tới
1.1.2 Khái niệm thư viện số
Nhiều định nghĩa đã được công bỏ trong giới học giả toàn cầu về thư viện nhằm định nghĩa rõ rằng một thư viện số Dưới đây là một số định nghĩa tiêu biểu vẻ thư viện số
Hai học giả người Nga là Sokolova và Láyabev cho rằng thư viện số la
xuột hệ thống phân tân có khả năng lưu trữ và lận dụng hiệu quả cóc loại tải liệu điện tứ khác nhau, và giúp người dùng có thẻ truy cập và được chuyển giao thông tìn dễ dàng qua mang may tinh
Nhiều học giã Trang Quốc lại có cùng, quan điểm rằng “Một thư viện
sỗ liên thực tế không phối lá một thư viện ở góc độ mổ rộng không gian của
nó; thay vào đó nỏ lả trung tâm tải nguyễn thông tin s6 chia dung tai nguyên
thông tin đa phương tiện Một thư viện số tổn tại bằng việc số thông tin,
Trang 18Doãn Anh Đức 16 CHTV: 2010-2012
chẳng hạn như văn bản, ký tự, chữ viết, bìmh ảnh, viđeo và âm thanh, đồng thời cung cấp cho người dùng các dịch vụ thông tin nhanh chóng vá thuận tiện thông qua Tniemet, nhằm chuyển giao một hệ thắng thông tin số mà trong,
đủ việc chữa sẽ nguồn lài nguyễn luôn sẵn sảng”
Theo định nghĩa của Liên hiệp Thư viện số Iloa Kỷ năm 1999: Thư
viêu số là các cơ quan, tỔ chủ 66 ede nguồn lưo, kể cá các nguồn nhân lực chuyên hóa, để lựa clọn, câu trúc, cung cắp việc truy cập đến, diễn giải, phố biến, bão quản sự toàn ven, dam bao sự ổn định trong thời gian đái của sưu tập công trinh số mà chứng ở đạng sẵn sàng đề sử dựng một cách kinh tế cho xuột hoặc một số công đồng nhất định
Theo tác giả Vũ Văn Sơn: “Thư viện số là hình thúc kết hợp giữa thuế
bị tinh toán, lưu aữ vả truyền thông số với nội đụng và phẩn mềm cân thiết để tải tạo, thủ đây và mở rộng các địch vụ của các thư viện truyền thông vốn dựa trên các biện pháp thu thập, biên mục và phổ biến thông tin trên giấy và các vật liêu khác”
Tóm lại: Thư viện số được hiểu là nơi lưu trữ nguẫn thông tin số, đặc biệt là thông tìn toàn văn, đồng thời sử đụng các phương tiện số trong thu thập, hen trit, ait Uj, tim kiém va phé bién thong tin
1.1.3 Khái niệm siêu đữ liệu
Siêu đíữ liệu (metadata) là đạng đữ liệu miều tả về đữ liệu Trong cơ sở
dữ liêu, siêu đữ liệu là các đang biểu diễn khác nhau của các đổi tượng Trong,
cơ sở đử liệu quan hệ thì siêu dữ liệu là các định nghĩa của bảng, cột, cơ sở dữ
liệu, view và nhiều đổi tượng khác Trong kho dữ liệu, siêu đữ liệu là dang
định nghĩa dữ liệu như: băng, cột, một báo cáo, các luật doanh nghiệp hay
Trang 19Doãn Anh Đức 1? CHTV: 2010-2012
niưững quy tắc biên đổi Siêu dữ liệu bao quát tắt cả các phương điện của kho
dữ liệu
Thuật ngữ siêu đỡ liệu được định nghĩa là sự mỗ tả các nguồn thông tia
điện tử nhằm mục đích nhận diện, quản lý, phân loại và tra cứu nguồn thông
tin khi làm việc với tập hợp các nguên thông tin Siêu dữ liệu là những dữ liệu
xuô lã về ngữ? cảnh, nội dhưp, câu trúc và sự quản lý tái liệu theo dòng chây
của thời gian
Siêu dữ liệu phải chứa những thông tim:
œ- Cần trúc gủa dữ liệu
«Thuật toản sử dụng để tổng hợp đữ liệu
« Ảnh xạ xác định sự tương ứng dữ liệu từ môi trường tác nghiệp sang
kho dữ liệu
Siêu đữ liệu là đữ liệu để mô tả đữ liệu Khi đữ liệu được cung cấp cho người dùng cuối, thông tin siêu dữ liệu sẽ cung cấp những thông tin cho phép
họ hiểu rõ hơn bản chất về dữ liệu mà họ đăng gó Những thông lin này sẽ
piúp cho người dùng có được những, quyết định sử dụng đúng đẫn và phù hợp
về đữ liệu mà họ có
Tuỷ thuộc vào từng mục địch sử dụng khác nhau, từng loại dữ liệu khác
nhau mà cấu trúc và nội dung đữ liệu metadata có thế có những sự khác biệt Song, nhìn chúng sẽ báo gồm nốt số loại thông tin cơ bận se
« Théng tin mé ta vé ban than ct ligu metadata
« Thông tín về đữ liệu ma metadata mô tả
©) Théng tin về cá nhân, tổ chức lên quan đến dữ liệu metarlata và dữ liệu Dublin Cor: Metadata 14 indt trong những sơ đồ yêu tó giêu dữ liệu phổ biển và được nhiễu người biết đến Bộ yếu tổ này được hình thành lần đâu tiên vào năm 1995 bởi Sảng kiến Yêu tỏ Siêu dữ liệu Dublim Core (D2ublin
Trang 20Doãn Anh Đức 18 CHTV: 2010-2012
Core Metadata Element Initiative) Tap hop yéu 16 sidu dit ligu nay duge goi
là "cốt lõi” (eore) vì nỏ được thiết kế don giản và chỉ bao gồm 15 yếu tế mô
tả cốt lõi nhất (rong khi Mare21 có hơn 200 trường và rất nhiều trưởng con)
1 ĐC Creater (Tác giả): Tác giả của tái liệu, bao gồm cả tác giả cả
nhân và tác giả tận thê
2 DC Title (Nhan để): Nhan đề của tải liệu
3 DC Subject (Chủ để): Chủ để tài liệu đề cập đùng để phân loại tài
liệu Có thể thể hiện bằng từ, cụm từ(Khung chủ để), hoặc chỉ số
phân loại (Khung phân loại)
4 DC Contributor (Cộng tác, đóng góp): Tên những người cùng
tham gia cộng tác đóng gớp vào nội dung tài liệu, có thể là cá nhân, tổ
chức
§ DC Date (Nam xuất bãn): Ngày, tháng, năm ban hanh tai liệu
6 DC Puhlisher (Nhà xuất bản): hà xuất bản, nơi ban hành tải liệu
có thể là tên cá nhân, tên cơ quan, tễ chức, dịch vụ
7 DC Description (Trích dẫn, trích yếu nội dung): Tóm tắt, mô tả nội dung tài hiệu Có thể bao gốm tóm tắt, chủ thích, mục lục, đoạn văn bản để làm rõ nội dung
8 DC Type (Kiểu tải liệu): Mô tá bản chất của tải liệu Dùng các thuật nigữ mồ tả phạm bù kiếu: trang chủ, bài báo, bảo cáo, từ điển,
9 DC Format (M6 14 vat ly, định dạng): Mô tả sự trình bày vật lý
của tải liệu, có thể bao gồm; vật mang tìm, kích cỡ độ đải, kiểu dữ liệu ( doc, html, jpg, xls, phin mém )
10 DC Identifiers (Binh danh tư liệu): Là một dãy ký tự hoặc số
nhằm thể hiện tính đơn nhật cũa từ liệu (URLs, ISBN, ISSN)
Trang 21Doãn Anh Đức 19 CHTV: 2010-2012
11 DC Source (Nguén géc tài Héu): Ngudn gde ima tir liệu được tạo thành, yêu tổ này có thể gồm siều dữ liệu vẻ nguồn thông tim thử hai nhằm khai thác tư liệu hiện hành
12 ÚC Languagc (Ngôn ngữ): Ngôn ngữ của nội dung tư liệu, được
thánh lập theo quy tắc RFC1766
13 DC Relation (Liên kết toàn văn): Một định danh cho nguồn thứ hai và mối quan hệ của nó với tư liệu hiện hành Yêu tổ nảy thể hiện
Le nd si các nguồn từ Bên có Bé
sự kết nối giữa các nguồn tư liệu có liên quan
14 DC, Coverage (Dién bao qual) Cae thông tìm liên quan đến plaua
vi, quy mé hoe unte dé ban qual cia tài liệu Phạm vì đỏ có thể là
địa điểm, không gian hoặc thời gian, tọa độ
15 DC Right (Bản quyền): Các thông tím liên quam đến ban quyền của
tải liệu
Tắm quan trọng và ý nghĩa đặc biệt của siêu đữ liệu càng, rõ nét khi
quản lý tài liệu trong môi trường điện tử Trong môi trường điện tử, tài liệu chỉnh thức luôn luôn kèm theo cáo siêu đứ liệu Không có siêu dữ liệu không thể xác định ruột cách chính xác những đặc tính cơ bân của bài liệu điện tử:
Siêu dữ ệu đảm báo tính bất biển, độ tin cậy và chứng cử pháp lý của tải liệu
điện tứ
1.1.4 Tâm quan trọng cửa tải liệu số và việo quản lý tài liêu số
Ngày nay, nguồn tài liệu số đang giữ vai trỏ quan trọng, làm thay đổi
về chất hoạt động giao lưu thông tin nói chung và hoạt động thông tm thư viên nói riêng Tài liệu số và việc quản trị tải liệu số một cách hiệu quá đang
dòng một vai rò cực kỳ quan trọng trong các thư viện
Trang 22Doãn Anh Đức 20 CHTV: 2010-2012
- Tài liệu xô vừa là hệ quả rửa là cơ xữ phát triểu ngành xudt han điện tũ:
Tài liệu sổ ra đời đã gớp phần làm thay đổi điện mạo ngành xuất bản
với hàng loạt sản phẩm mới được tung ra thị trường với tên gọi loại hình lá Ấm
phẩm điện tử hay xuất bản phẩm điện ñữ Ý tưởng đầu tiên về xuất bản điện
tử được ông Vanner Bush đưa ra tại một hội thảo khoa học ở Viện Công nghệ Massachusertic (My) vào năm 1943, Sau đó Ít lâu, để gó một sự bằng nỗ hàng
loạt các sản phẩm kỹ thuật số và các lợi thể về kỹ thuật không thể phú nhận Năm 1991, cuốn sách điện tử đâu tiên chào đời tại Mỹ Từ năm 1998, sách điện tử được xuất bản ở dạng đĩa và có thể được tải xuống máy tính cả nhân
từ TnterueL Không còn nghỉ tgở gì nữa, điểu này có ý nghữa vô cùng quan
trọng cả về mặt học thuật cũng như trên phương điện kinh doanh
Vào năm 1995, F.W, Lancaster đã phác thảo một lịch sử ngắn gọn về
việc xuất bản các ấn phẩm điện tử như sau: Sứ dựng máy tính đề tạo ra những
ấn bản như bản in trên giấy thông thường -> Phân phối văn bản bằng hình
thức điện t (số) nơi mà phiên bản điện tử tương đương chính xác với phiên
bản in ân -> Xuất bản những ấn bản nhỏ gọn hơn bản in dưới hình thức số hoá, có thêm những dặc điểm phụ trội để mở rông khả năng nghiên cứu, điều khiển đữ liệu (qua sự tương xứng hình ánh) > Tao ra những ản bản hoàn toàn mới và khai thác thêm nhiều tính năng của các phương tiện kỹ thuật số, như ứng dựng các kết nối siêu văn bản, tích hợp các chức năng truyền thông,
Các loại hình xuất bản phẩm điện tử có trên thi trường hiên nay là sách
diện tử (E-Book) và các báo, tạp chi didn te (E-Journal),
Có thể hiểu một cách đơn giản, sách điện tử là sự trình bảy các tệp tin trên mản hình số, có thể là trên mạng hoặc trên CD ROM bay một thiết bị
số khác Bản thân thuật ngữ sách điện tứ đã có thể được hiểu là sự chứa đựng các thông tin đạng sách và việc biểu thị nổi dung thông tin ấy sẽ được thực
Trang 23Doãn Anh Đức 21 CHTV: 2010-2012
hiện nhờ muội tiết bị chuyên dung ndo dé (Kindle eda Amazon, Geimei,
Floyer ) Từ điển tiếng Anh rút gọn của nhả xuất ban Oxford The New
Concise Oxford English Dictionary (2001) od dua ra dinh nghia séch dién th
là: “Một phiên bản điện từ của một quyền sách in cb thé doc được trên máy tính cá nhân hay một thiết bị cẩm tuy được thiết kẾ cho mục đích này”
Cũng giêng như nguyễn lý ra đời của sách điện tử, các loại bảo và tạp
chỉ điện tử cũng được ra đời và ngày càng trở nên phổ biến
Sự xuất hiện của các xuất bản phẩm điện ti mot Tain nữa khẳng định việc tài liệu số ra đời đã làm thay đổi diện mạo ngành xuất bản toàn cau
~ Tài liệu vỗ là cư sỡ của xự hình thành và phát triển ngành công nghiện nội dụng vỗ
Sự phát triển có tinh chất bùng nỗ của các nguồn tài liệu số trong những năm gản đây đã dẫn đến hình thành khái niệm “nổi đứng sổ" và kéo theo đỏ là sự ra đời của ngành công nghiệp nội dung số
Trang 24Doãn Anh Đức t2 & CHTV: 2010-2012
Nội dụng 36 (tigug Anh la F-Content bay Digital Content) là thuật ngt được dùng dé chí cáo thông tin bữu ich chứa đựng trong các tài liệu số Các thông tin này cỏ thể tản tại trên website, hay thông tin chứa trong các tệp dir
liệu ở dạng văn bản, hình ảnh, ôm thanh hoặc dạng đa phương tiện, tích hợp van ban, am thauh, video Pay 1a muột khái niệm rộng, bao quát nhiều lĩnh
vực và phát triển liên tục, bao gồm phần mềm nội đung, trò chơi diện tử, học tập trực tuyển (1i-learming), xuất bán điện tử, quảng cáo trên Internet
Các sản phẩm chứa đựng nội dung sé, khi tham gia thị trường, sẽ làm
hình thánh nên ngành công nghiệp nội dung số (CNNDS) Công nghiệp nội
dụng số (Miếng Anh là Digital Contemt Tndustry - DỢP) là một khái niệm còn rất mới và trên thể giới vẫn chưa tìm ra được một định nghĩa thống nhất Theo quan điểm của Bộ Bưu chính- Viễn thông Việt Nam: CNNDS là ngành thiết
kế, sản xuất, xuất bản, lưu trữ, phân phối, phát hành các sán phẩm nội đụng số
và dịch vụ liên quan Tập hợp các hoạt động liên quan đến số hoá thông tin ở
quy mô lớn, cỏ sẵn phẩm hoàn chỉnh và có khả năng đem lại lợi nhuận thì được gợi là ngành CXNDS Cúc hoại động trong CNNDS bao gỗ: thu thập thông tim; phân tích nội dưng để phân loại, hưu trong bộ nhớ máy tính hoặc hiển thị nội dung trên mạng; bao gói thông tin thành các CSDL trên vật mang, tin mong muốn: CD - ROM, DVD, thiết bị lưu trữ đi động; nhân bản và cung,
án phẩm thuộc CSDI, đó hoặc loàn bộ CSDI,
cp (ban) ce
Nhiều người cho rằng, CNNDS lá một nhành của công nghệ thông tin
vì nó gắn liên với công nghệ thỏng tin [7, tr.]4] Sản phẩm của CNNDS chính
lá sản phẩm ca quả trình ứng dụng công nghệ thông tin, từ công nghệ phân
mềm, thu thập thông tin, xử lý, lưu trữ thông tin đến cung cấp thông tin CNNDS không chỉ hêu quan đến phan cimg, phan mềm may tỉnh bay hệ thống mạng mả còn liên quan đến nhiều lĩnh vực khác như: lưu trữ, săn xuất các thiết bị lưu trữ là các vật mang tìn hiện đại Như vậy, nguyên vật liệu đầu
Trang 25Doãn Anh Đức = & CHTV: 2010-2012
vào của ngành CNNDS là thông tín và sâm phẩm đầu ra cũng là thông từ Nhưng thông tin đầu ra là CSDL, là thông tin có cấu trúc, có nội dung cụ thể
và được cung câp cho những đối tượng cụ thé nhằm phục vụ cho một hay một
sổ hoại động kinh tế - xã hội nhất định
Chắc chắn rằng, nêu được tô chức tốt, các săn phẩm số sẽ có thị trường,
rộng lở, không phải chỉ ở trong muột quốc gia Nhận biết được điều đó, ngày 19/2/2001, Thủ tướng Chính phủ đã banhành Quyết địh sỏ 901/QÐ TTg về việc “Thành lập Liện Công nghệ phần mẫm và nội dung số Liệt
Nam, thuậc Bộ Bưu chính, Viễn thông " Từ đây, CNNDS ở Việt Nam tước sang mdt trang mei Hy vong, CNNDS sé khong ngừng lớn mạnh để lỗ trợ,
cung cấp các nguồn tải liệu số cho các Thư viên số va làm cho hoạt động thông tin khoa học công nghệ sối động, hap dan hon
- Quản lý tài liệu số toàn văn là cơ sở đỀ hình thành tuc viên số
Thư viên điện tử, thư viên là những tên gợi không
còn xa lạ đổi với những, người lâm công tác thứ viện Việt Nam nhưng vẫn còn tên tại nhiều cách hiểu, cách định nghĩa khác nhan Có thể coi thư viện số là mot kho thông tìn dưới đụng số, được câu trúc sao cho để đăng truy cập thông
qua cae mang indy tinh hay các mạng viễn thông Đó là một hệ thống thông
tin tự động hoá mà ở đó, người ta cò thể thu thập, xử lý, lưu trữ, tìm kiếm và phổ biến các tải liệu đưới đạng số thông qua các phương tiện công nghệ thông
fin và truyền thông
TIạt nhân của thư viện số là nguồn tài liệu sỏ Trong đỏ, một bộ phan la tài liệu số toàn vẫn từ tài liệu mm ấn, phần chủ yếu là các bộ sưu tập số mới
được xây dựng hoặc bổ sung qua nhiều con đường khác nhau như mua, được
biếu tặng, trao đổi Bộ sưu tập số là một tập hợp có tổ chức nhiều tải liệu số
với nhiều định dạng khác nhau: văn bản, hình ảnh, âm thanh, video Dù mỗi
Trang 26- Tạo ra một mỗi trưởng bình đẳng cho mọi người được sử đụng ti
thức nhận loại nà không vướng phi ráo cần về không gian, thời giam,
- Có tính lĩnh hoạt và khả năng dip ứng như cầu sử dụng xỗt cao nhờ tính chất đa truy cập của nguồn tài liệu số,
- Tiết kiệm thời gian và kinh phí cho thư viện trong việc xảy dựng kho tang, bảo quán tải liệu, cũng như giúp người dùng tia cất giám chỉ phi, giảm thời gian trong tìm kiểm thống tín;
- $4 hod toàn văn tải liệu và xây dung bộ sưu tập số là lựa chọn tối ưu
để bão tổn lâu dải các ti liệu gốc quý hiểm, ngăn chặn những rủi ro, huỹ hoại
tật hiệu do thời gian, thiên tai,
Phân cốt lõi cúa thư viện số là kho tài liệu số với phần mềm quán trị vốn tải liệu nảy Vi vậy, việc phát triển kho tải liệu số và tìm kiếm một phần mềm quản trị tài liệu số là công việc quan trọng hang đầu trong xây đựng thư
Trang 27Doãn Anh Đức 25 CHTV: 2010-2012
không thể tổ chức lưu trữ và bao quan được số lượng kin tai hệu số đang, tăng lên hàng ngày, đồng thời đọc giá cũng khó có thể tìm kiếm được tài liệu mình cần trong khối lượng tài liệu số khống lẻ của thư viện Tay nói khảc đi, phan mềm quân trị tải liệu số chính là chìa khỏa để thư viện cải tiến chất
lượng phục vụ, xây dựng các sâu phẩm và địch sụ thông tín có giá trị gia
tăng cao
Các thư viện, cơ quan thông tin nêu không sử dụng phần mềm quán trị tài liệu số sẽ không tổ chức, quản lý và khai thác hiệu quả nguồn tải liệu số của mình Nói cách khác, nguồn tải liện số đủ lớn tới đâu, nội đưng phong
puú, đa dạng cũng không tới được với người dùng lìn nêu không được tố
chức, quản lý khoa học bằng các phần mềm chuyên dụng Các thư viện, cơ quan thông tin sử dụng phân mễm quản trị tài liệu số đề có thể thu thập, xử lý, lưu trữ, tìm kiểm và phổ biển tài liệu số tới người dùng tín thông qua các phương tiện công nghệ thông tin và truyền thông
guễn tải liên số được quân lý thông qua công tác tạo lập các bộ sưu tập số, biên mục tải liệu số vào phần mềm Trên cơ sở đó các tư viễn, cơ quan thông tin tổ chức phân phỏi tải liệu số tới người dùng tm Người dừng tin ding ki str dung dich vụ thư viện số, tra tìm và khai thác tài liệu số qua module OPAC của phân mềm Phân mềm quản trị tài liệu số không chỉ giúp
các thư viện, cơ quan thông tin tạo lập, quản lý tải liệu số mà nó cèn là câu mỗi giữa người dùng tin với kho tải liệu số của các thư viên, cơ quan thông
Trang 28xử bý, lưu Irữ, từn kiếm và phố biên tài liệu sÕ tới người dùng từn
1⁄2 Công tác số hóa tài liệu vả vide img dung phan mém quan trị tải
liệu số ở các thư viện công cộng
1.2.1 Công tác số hóa tài liệu trong hệ thống thư viện công cộng,
Tế đánh giá thực trạng công tác số báa và xây đựng nguồn lực thông tin địa phương số, Bộ Văn hóa, Thể thao và Du lịch đã tiến hành một cuộc điều tra các thư viện công công cấp tỉnh trong phạm vì cả nước (@rềm 2011) Kết quả, có
43 thư viện tỉnh thành phố đã phân hỏi Trong số đó có 25 thư viện (chiếm 38,19) đã triển khai công tác số Việc sỏ hỏa tài liệu địa chí đã được tại triển
khai tạo các thư viện tỉnh nhằm mục đích bảo quản và quy tụ các nguồn tài liệu quý về một mối nhằm giúp bạn đọc và các nhà nghiên cửu tiếp cận được thông tin về xuất bản phẩm dịa phương, nhân vật lịch sử địa phương sự kiên địa phương, vấn để dân tộc học và bản sắc văn hóa truyền thống cia dia phương một cách đây đú, thuận tiện nhất
Việc số hóa tài liệu được thục hiện trong các thư viện Việt Nam từ cuối thập ky 90 của Thé kỹ XX Thư viện Khoa học Tổng hop Thanh phé Hé Chi
Minh (TVKHTHTPHCM) là một trong những Thư viện công cộng cấp tỉnh
tiên phong trong vide triển khai công tác số hóa lài liệu Ngay từ năm 1998 thư viện đã có chương trình số hóa đâu tiên với các sản phẩm đầu tiên là số
hóa khoảng 10 nhan để sách kho Dông Dương, chương trình nhàn ký niệm
300 năm Sài Gòn - TP.Hả Chí Minh Năm 2003, TVKHTHTPHCM thật sự
bắt đầu bối tay vào việc lập kế hoạch số hóa tài liệu, xây dựng xnột số CSDT
Trang 29Doãn Anh Đức 2? CHTV: 2010-2012
toàn văn Thư việu Quốc gia Việt Nam (TVQGVN) đã bắt đầu triểu khai số
hóa từ năm 2003
Nguồn kinh phi thực hiện số hóa có được từ các đự án số hóa do mước
ngoài lài trợ vẻ đo ngâu sách trìng ương và địa phương cập, Năm 2011,
TVQGVN đã bải đân tực liện Dự áu số hóa tải liệu với tổng kinh phí hơu 20
tỷ dễng Tại TVKHTHTIPHCM, Dự án VALEASE do thư viện phôi hợp với Tổng lãnh sự quán Pháp số hóa các tài liệu bằng tiếng Pháp và tiếng Việt nói
về 3 nước Dông Dương được tiến hành theo nhiều bước Dây là dự án được triển khai theo hình thức thuế ngoài (outsoureing) Số lượng tải liệu được số
la là sách Đông Dương khoảng 540.000 trung sách, báo tạp chí và công báo
Ta năm 2008 Thư viện tỉnh Yên Bứi được tiếp nhận Dự án hợp tác văn họá giữa tính Yên Bái và Hội đồng tỉnh Val-ds-Mame (Cộng hoà Pháp) với mục tiêu: Nâng cao năng hịc phục vụ cộng đồng, phát triển sự nghiệp văn hoá,
nâng cao đời sông văn hoá tỉnh thần cho nhân đân các dân tộc tỉnh Yên Bái Tiểu Dự án “Phục chế, báo quần và sổ hóa tài liệu cỗ lưu giữ tại Thư viện
tính Yên Bái” được thực hiện và bước đầu triển khai
9 thư viên tỉnh đã thường xuyên được cấp kinh phi chó hoạt động số bao gằm: TVKHTHTPHCM, Thư viện tỉnh Quảng Ngãi, 1à Tĩnh, Cân Tho,
Giá Lai, Bình Dương, Đắc Lễ
„ Bình Thuan, Viing Tau Tuy nhiên, khủi phi dành cho hoạt động số còn hạn chế, cỏ tới 83,3% thư viện chí được cấp 50.000.000 đồng/năm chó hoạt động nảy Chỉ có 3 thy viện được cấp trên 100.000.000 đểng cho hoạt động số: TVKIITHTPIICM, Thư viện tỉnh Bả
Ria
‘ing Tau va Thu vier tink Thanh Hoa
Một trong những hướng ưu tiên mà các thư viên hướng tới là số hóa
các tài liệu quý hiểm và tài liệu địa chỉ Trong, đỏ, 55,8% thư viện tiên hành số hóa tài liệu liệu địa chí và 20,9% số hóa tài liệu quý hiểm
Trang 30Doãn Anh Đức 28 CHTV: 2010-2012
Mu dù mới được triển khai, nhưng các thư viên để thực hiện số hóa
một số lượng tài liệu đáng kể
Tại TVQGVN, công tác số hóa được bắt đầu với đối tượng Luận án
Thiên nay, TVQGVN đã số được 15.571 bản, tương đương với 2.500.000
trang Bên canh đó TVQGVN còn số hóa các tài liệu quý hiếm Bộ Sưu tập
Đông Dương Thông kẻ để hình thành với 829 tên (130.333 trang), Bộ Sưu lập Thang Long Hà Nội với #50 tên, (407.970 trang)
“Tại các thư viện tình, việc số hóa đã đạt được một số kết quả nhất định Tỉnh đến tháng 11/2011, Thư viện KIITTT Tp T1 Chí Minh đã số hóa được
hơn 3.000 tải liệu địa chí với 530.000 trang; Thư viện tỉnh Sơn La đã thực hiện số hỏa được 313 tài liệu là sách chữ Thái cổ với 8.610 rang, Ngoài số
các tài liệu là sách chữ Thái cổ, Thư viện tỉnh Sơn La đã số hóa toàn văn được
269 tài liệu địa chí với 32.610 trang, thư viện tình Khánh Hòa số hỏa được
hon 550 tài liệu, Thừa Thiên Tiuế đã số được khoảng 180.000 trang tài liệu quý hiểm, các sắc phong luận văn luận án và bài bảo thí về địa phương, Thư viên tình Đồng Nai số hóa được 317 tai héu dia chi voi 24.544 trang: Thu viên tỉnh Gia Lai sẽ hóa được 47.200 trang,
Các tải liệu số trong các thư viện đã được đưa ra phục vụ với các mức độ
khác nhau Trong đó, phục vụ tại chỗ với mạng nội bộ (,AN) của thư viện
chiếm ưu thế (62,5 %4), số thư viện triển khai đưa lên mạng Internet cho ban doc siz dung còn hạn ché (37%) [2 tr.3]
1.2.2 Tổng quan ứng dụng phần mềm quản trị tài liệu số ở các thư viện công,
cộng
Trong những nằm gân đây, các thư viện oông công Việt Nam (chủ yêu
là thấr viện cấp tĩnh) đang lừng bước chuyển từ thư viên luyển thông sang tlúr
Trang 31Doãn Anh Đức 29 CHTV: 2010-2012
viên điện tử Vì thẻ bên cạnh tải liệu, sản phẩm thông tin truyền thông, các
thư viện tỉnh“thành phổ trong cả nước đã cỏ nhiều nỗ lực trong việc sưu tập, biên soạn và phát hảnh các sản phẩm thông tin như thư mục toàn văn chuyên
để, ân phẩm tóm tắt, tổng quan cũng như dịch vụ thông tin mới như lả phục
vụ theo chế độ hỏi đáp, nói chuyện chuyên đẻ địch vụ tra cửu thông tin qua mạng Một trong những hoạt động đề hình thành vốn tải liệu điện tử/tài liệu
số được các thư viên công công quan tâm thực hiện lả số các tài liệu quý
hiếm Nhiều thư viên đã xây dựng được các bộ sưu tập số lên đến hang tram
nghin trang,
Tuy nhiên, hâu hết các thư viên đều gap khó khăn khi tiền hành tỏ chức, quản lý và khai thác hiệu quả nguồn lực thông tin quỷ giá nảy Ngoài một số
phan mém thương mại như iLIB.Di của công ty CMC, Libol Digital của công,
ty Tỉnh Vân, Vebrary của công ty Lạc Việt các thư viện công cộng cỏn sử
dung phan mém nguén mé Greenstone đẻ quân lý tải liêu sẻ của mình vả tổ chức phục vụ bạn đọc tra cứu, khai thác tài liệu só
Bảng 1.1: Điều tra tình hình số hóa và ứng dung phan mém quén tri tai liệu số tai
một số thự viện tỉnh, thành phổ
Trang 32Doãn Anh Đức 30 CHTV: 2010-2012
Qua khảo sát tại TÔ thư viện tỉnh gó 04 thư viên đã có phần mềm quản trị tài liệu số, trong đỏ có Ò3 thư viện sử dụng phân mềm thương mại lả Bình Duong, Gia Lai va Son La Thu viện Phú Yên sử dựng phản mềm mã nguồn
id Greenstone dé quan tri bé suru tay sé
Sâu thư viện cản lại chưa sử dụng phần mém quan tri tai liệu số, tài liệu
vỗ cũ
các thư viên này chủ yêu được số hóa để bảo quân và "chờ" tìm được phan mềm thích hợp mới mang ra khai thác Jo không có phẩn mềm các thư viện này chưa thể phục vụ được bạn đọc mà mới chỉ lưu trong đĩa quang, 6 cứng Thư viện Thừa Thiên - Huế do chưa có phần mễm nên chưa thống kê
được chính xác tên tải liệu và số lượng trang tài liệu đã số hỏa
Các phần mềm thương mai đang được sử dụng tai các thư viên công cộng tuy đã đáp ứng được phân nao hoại động tế chức, quản lý và khai thác nguồn lực thông tin số nhưng các phẩn mềm nảy có giá thành khá cao (từ khoảng 400 triệu đến trên 1 tỷ đồng) Hơn nữa các phản mềm nảy vẫn cỏn nhiều lối mày smh trong quá trình sử dụng, Phẫu mềm nguồn mé Greenstone,
các thư viên công cộng lựa chọn sử dụng,
TỨng đụng mã nguồn mỡ để xây đựng một phan mém quản trị thư viện số nhỏ gợn, để sử địmg, đễ quản bị, giao điện thầu thiện và gần gũi với người Việt cho hệ thống thư viện công cộng là thực sự cần thiết vảo thời điểm nay 1.3.3 Yêu cầu của một phân mềm quan ti tii liệu số cho hệ thông thư viện
công cộng
Một phần mềm quản trị tài liệu số được coi là đáp ứng yêu cầu của thư
viện khi thỏa mãn các điều kiện sau:
Trang 33Doãn Anh Đức 31 CHTV: 2010-2012
- Dé ding và thuận tiện trong cải đặt và sử dụng,
- Có thể mỡ rộng các chức năng theo yêu cầu phát triển trong tương lai,
~_ Có thể quân lý được số lượng tài liệu lớu với nhiều kiêu đữ hệu số khác
nhau, việc tra cứu tìm kiểm thông tin chính xác vá nhanh chóng,
-_ Việc nhập thông tin vao hệ thông có thé được thực hiện từ nhiều máy
tỉnh khác nhau, từ nhiều địa điểm khảo nhau,
~_ Phân mễm có thể chạy trên nhiễu hệ điêu hành như các phiên bản khác
nhau của hệ điều hành Windows cũng như Unix hoặc Limux,
~_ Phần mềm đâm bảo quân lý am toàn dữ liên ở nhiều ruứ khác nhan
Những yêu câu trên đổi với một phân mềm quần trị tái liệu số được thể hiện dưới dạng các yêu cầu kỹ thuật như sau
a Nguyên tắc thiết kế theo module
Xây dựng theo kiến trúc nhiều lớp, hệ thống gồm nhiều module chức năng và được tích hợp thánh một hệ thống thống nhất Phân mềm được thiết kể, xây dựng và vận hành trên nguyên tắc mở, đảm bảo khả năng
mở rộng, nâng cấp, bổ sưng thêm các raodule chức năng mới má không, phả vỡ sự ổn định của hệ thống Phần mềm phải đảm bảo được sự kế
thừa những thành quả đạt được sau mỗi lần mở rộng, nâng cấp
Trang 34Doãn Anh Đức “ le CHTV: 2010-2012
cho CSDI ofa bé théng Gp tung, vậu hành, bão trí nhanh chóng, dễ dang
Chay trén nén web va bé trg giao thtte TCP/IP
Ứng dụng Web có thời gian phát triển nhanh, với giá thành phát triển
và triển khai thấp, tín cây, có thể truy cập từ bắt cứ đâu trên thể giới, Tmợi người có thể sử dựng mà không mắt thời gian tìm hiểu nhờ giao diện trực quan Hỗ trợ giao thie TCPAP dé dam bảo khả năng kết nếi,
chia sé dif liệu trong mạng nội bộ (LAN), mạng toàn cầu (Internet)
Sử dụng hệ quản trị CSDL mô hình quan hệ
Mô hình dữ liệu quan hệ được Cođđ để xuất năm 1970 và đến nay trở thành mô hình được sử dụng phổ biển trong các hệ quản trị CSDT TIệ
quản trị CSDT, mồ hình quan hệ có các ưu điểm: cải thiên tính độc lập
của dữ liệu và chương trình, tối ưu hỏa cách truy xuất đừ liệu; tăng tính:
bao mat và toàn vẹn dữ hệu
Vận hành ẩn định trên nhiêu hệ điều hảnh khác nhau
TIệ thống (gồm cả máy chủ và máy trạm) đảm bảo vận hành ôn định trên nhiều hệ thống khác nhau như: Windows, Linux, MacrOS Hệ thông có khả năng chay đồng thời bên nhiều HĐH khác nhau và có thể
chuyển đổi hai ch
a tir Windows sang Linux, MucrQS va.nguoe lai
Hé trợ đa ngôn ngữ (hễ trợ bang mi Unicode)
CA giao diện và bảng mã lưu trữ trong hệ thống đều phải hỗ trợ đa ngôn ngữ, đám bảo nhập tin, tìm kiểm tài liệu theo bắt ký ngôn ngữ nào (theo
bang mã Unicode) Hỗ trợ bang ma Unicode tigu chudn Việt Mam TƠVN 6909.
Trang 35Xuất băn điện tử
Phân mêm cỏ khả nắng xuất bản đữ liệu tù các bộ sưu tập số ra đĩa quang, ê cứng di động
TH trợ các định dạng tệp dữ liệu số phố biến
Phan 1 mì phải hỗ trợ tất cả cáo định dạng Re dữ liệu số: văn bản, âm thanh, hình ảnh, video
Vân hành ên định với CSDL lớn
Phan mém đảm bảo vận hành ổn định, tốc độ truy cập cao với CSDL lớn (rên 1 triệu biểu ghì)
An toàn hệ thông và báo mật dữ liệu
Phân mêm đảm bảo hỗ trợ nhiều mức độ vả eơ chế đăm bảo an toàn hệ thông và bão mật dữ ñệu khác nhau Phân quyền chặt chế tới người
dùng là cán bộ thư viện và người dùng là bạn dọc với nhiều mức độ bảo
mật khác nhau Đổi với đữ liệu số phan mẻm đám bảo phân quyền đến
từng tập dữ liệu riêng rẽ
Sao lưu phục hồ: dữ liệu
Sao lưu / phục hỏi đữ liệu dễ đàng, đâm bảo toàn vẹn dữ liệu cho hệ
thông
Cai dit, sử dụng, để dàng
Căm bộ thư viện có khả năng tự gài đặt, câu hình hệ thống Phần mm phái có giao diện trực quan, logic và dễ sứ đụng
Trang 36Phân mềm hỗ trợ nhập tin theo nhãn trường DublinCore, trao đổi dir
liga theo DublinCoreXML
TIỗ trợ nhiều khung phân loại
Phân mêm phải hỗ trợ các khumg phân loại phổ biển trên thế giới và
Việt Nam
Tiểm goái trùng biểu ghi
Phân mềm phải có khả nâng kiểm soat tring sé DKCB, trùng biểu phi
và thông báo tới cản bộ biên mục
| [18 trợ tìm kiếm đa dạng, chính xác
Tìm kiểm theo tật cá các trường nhập tin, kết hợp với việc sứ dụng toán
te logic (AND, OR, NOT) Tim kiếm không phân biệt chữ hoa, chữ thường,
Có thể duyệt theo chủ để
Ban dọc có thê duyệt dữ liệu theo từng chú đẻ, theo từng bộ sưu tập sở
Ngôn ngữ lập trình PHP vả hệ quản trị cơ sở dữ liệu MySQL
Tổng quan về PLIP và My8QL
1.3.1.1 Ngôn ngữ lập trình PIIP
Ban đầu PIIP được viết tắt bởi cụm từ Persơnal IIome Page PIIP được
phát triển từ năm 1994 bởi Rasmus Lerdorf Ban dau PHP chi 14 mét bé die ta Perl, duoc str dung để lưu đâu vết người đứng trên các trang web Sau đỏ
Rasinus Lerdorf đã phát triểu PHP như là một ruáy đặc tô (Scripting engine).
Trang 37Doãn Anh Đức 35 CHTV: 2010-2012
Ta nam 1997 PHP có bước phái tr tên vượt bậc, PHP không cởn là mot du an
cá nhằn của Rasmus Lerdorf mà đã trở thành một công nghệ web quan trọng,
và phổ biến Zaeev Suraski va Andi Gusman đã hoàn thiện việc phân tích cú pháp cho ngôn ngữ lập trình này, để rồi đến tháng 6 năm 1998 PHP3 ra đời
(phiên bản này các tập PHP có phẩm mỏ rộng là php3)
Ngày sau khí PHP 3.0 chính thức được công bổ, Andi Gubnam và
Zeev Suraski da bat dau bat tay vao việc viết lại phân lõi của PHP Miụe đích thiết kẻ là nhằm cải tiến tốc độ xữ lý các ứng dụng phức tạp, và cải tiến tính
module của cơ sở mã PIIP Tháng 5 năm 2000 PITP4 ra đời, ngoài tổo độ xử
lý được cải thiện rất nhiều, PHP 4.0 đem đến các tỉnh nẵng chủ yên khác gồm
cỏ sự hỗ trợ nhiều may chủ Web hơn, hỗ trợ phiên làm việc HTTP, tạo bộ đệm thông tin dầu ra, nhiều cách xử lý thông tin người sử dụng nhập vào bảo mật hơn và cùng cấp một vải các cấu trúc ngôn ngữ mới Với PHP 4, số nhà phát triển dùng PHP da lén dén hang trim nghìn và hàng triệu site đã công bổ cai dit PHP, chiếm khoảng 20% số tên miền trên mạng Internet
PHP4 là phiên bản chỉnh thức được sử dụng phố biến nhất hiện nay, my
nhiên người dùng đã có thể download PHP6 (phiên băn dùng thử) tại đụa chỉ
hittp://snaps.php.net
1.3.1.2 Cot 50 dit ligu MySQL
MySQL là hệ quản trị cơ sở dữ liệu mã nguồn mở phế biến nhất thể giới hiện nay, được các nhả phát triển rất ưa chuộng trong quá trình phát triển ứng dụng MySQL là cơ sở đữ liệu tốc độ cao, ỏn định và dễ sử dụng, hoạt động trên nhiều hệ điêu hành khác nhau, MySQL cung cấp một hệ thống lớn các hảm tiện ích mạnh mếẽ Với tốc độ vả tỉnh bảo mật cao, MySQL rất thích
Hợp cho các ứng dụng có truy cập CSDL trêu internet My8QL miễn phủ hoàn
Trang 38khác nhau Windows, Linux, Mac OS, thix, TreeSD, Nef3SD, Novell
NetWare, SGT Inx, Solans, SumOS,
1.3.2 Ly do lua chon PHP và MySOT, xây dựng phần mềm quản bị tài liệu số
1.3.3.1 Ly da chon PHP
Khi sử dụng PHP, người dùng sẽ cỏ dược lắc độ nhánh hơn nhiều số với các ngôn ngữ kịch bán khác, bởi PHP là phẩn mềm mã nguồn mở, được
hỗ trợ bới nhiều lập trình viên giỏi, có số lượng người dùng đồng đão Ngoài
ra PHP chạy được trên nhiều hệ điền hành khác nhau
Taút ngắn thời gian phát triển: PHD cho phép bạn tách phan HTML code
va phan script, do dé có thả độc lập giữa công việc phát triển mã và thiết kế
dé
Préu nay vừa giúp lập tinh vi đảng hơn vừa có thể làm cho chương, trù mém đèo hơn khi cân thay đổi giao diện
PLP la phần mềm mã nguồn mở: không chí là phần mềm mã nguồn mở
ma còn thục sự miễn phí (kế cả khí bạn sử đựng cho mục đích thương mai)
De la phétr méin mổ nguồn tuở, các lỗi (bug) của PHP được sông khai và nưanh chồng được sửa chữa bởi nhiều chuyên gia liên toàn thể giới
Tốc độ: nhờ vào sức nuạnh của Zend Engine, khi so sảnh PHP voi ASP,
có thể thây PHP vượt hơn ở một số bài kiểm tra (test), vượt trội ở tốc độ biên
dịch
Tỉnh khả chuyển: PHP được thiết kế để chạy trên nhiều nên tăng khác
nhau, có thể làm việc với nhiều phần mềm mảy chủ, cơ sở dữ liêu (vi du: san
Trang 39MySQL khéng chi la co sé dit igu ma nguồn mở phê biến nhất trên thể
giới, nó còn trở thành cơ sở dữ lệu được chọn cho thể hệ mới của các ứng dụng xây dựng trên nên Linux, Apache, MySQL, PIIP/Perl/Python MySQL chay trén hon 20 platform bao gém: Linux, Windows, OS/X, HP-UX, ATX, Netware, mang đến cho người dùng tỉnh linh hoại trong việc sử dụng
Tỉnh lnh hoại: Máy chủ cơ sở dữ liệu MySQT, cung cấp đặc tình lĩnh Hoạt, có sức chữa để xử lý các ứng dụng được nhúng sâu với dung lượng chỉ
IMB dé chay cdc kho dit héu dé sé lén dén hang terabytes thong tin Sy link hoạt về platform là một đặc tính lớn của MySQL với tất cả các phiên bản của Linux, Unix, va Windows dang dugc hé trg Va di nhién, tinh chat ma nguẫn
mo ciia MySQL cho phép sự tùy biển hoan toan theo ý muốn để thêm vào các yêu cầu thich hop cho database server
Tỉnh thực tìn cao: kiến trúc glorage-cugine cho phép các chuyên gia cơ
sở đữ liệu cấu hình máy chủ cơ sở dữ liệu MySQL đặc trưng cho các ứng
dụng đặc thù Dù ứng dụng là một hệ thống xử lý giao dịch tốc độ cao hay website dung hrong lớn phục vụ háng triệu yêu cầu mỗi ngày, MySQL có thế đáp ứng khả năng xử lý những đôi hoi khắt khe nhất cửa bài kì hệ thống nado
Với các tiện ích tôi tốc độ cao, đặc biệt bộ nhớ dệm (cachos), và các cơ chế xử
lý nâng cao khác, MySQL đưa ra tất cả các vũ khi cần phải cỏ cho các hệ thống
Có thể sử đụng ngay: sự tin cậy cao và tính *mì ãn liên” là những tiêu chuẩn đảm bảo của MySQL MySQL đưa ra nhiều tùy chọn có thê đứng ngay
Trang 40Tsolated — độc lập, Durable — bên vimg), khóa mức déng không hạn chế, kha năng giao dịch được phân loại, và hỗ Hợ giao dịch đa dạng (nau]-version) nưà
người đọc không bao giờ gây trở ngại cho người viết và ngược lại Tỉnh toán
vẹn của dữ liệu cũng phải được bảo đảm trong suết quả trình server có hiệu lực, các mức giao dịch độc lập được chuyên môn hỏa
Nơi lưu trữ Web va Data dang tin cay: MySQL la noi quan ly, lưu trữ
thông tín cho các webaites phải trao đổi thường xuyên vì nỏ có engine xử lý
tốc độ cao, khả năng chén đữ liệu nhanh, hỗ trợ nan che các chức năng chuyên dung ea web luc tim kiểm văn bản run Những tính năng nảy
cũng được áp dụng cho môi trường hưu trữ đữ liệu má My8QL tăng cường
dén hang terabyte cho cdc server don,
Chế độ báo mật dữ liệu mạnh: vì báo mật dữ liệu là công việc số một
của các chuyên gia về cơ sở đử liệu, MySQL đưa ra tỉnh năng bảo mật đặc
Hiệi chắc chấn dữ liệu sẽ được bảo mật tuyệt đôi Trong việu xác nhận lruy
cập cơ sở đữ liêu, MySQI cùng cấp cá kĩ thuật mạnh mà chắc chấn chỉ có người sử dụng đã được xác nhận mới có thẻ truy nhập được vào server cơ sở
dữ liệu, với khả năng này để chặn người dùng ngay từ mức máy khách là điền
có thể làm được SSH và SSL cũng được hỗ trợ để chắc chắn các kết nồi được
an toàn và bão 1uật Cuối cùng, Hiện ch gao lưu (backup) và phục hồi đữ liệu
(recovery) cung cắp bởi MySQL và các hãng phân mềm thử 3 cho phép sao