Yêu cầu cấp thiết hiện nay là cần nghiên cứu, xây dựng một phần mềm quản trị tài liệu số gọn nhẹ, giao diện thân thiện, đáp ứng chuẩn nghiệp vụ, phù hợp với hệ thống thư viện công cộng..
Trang 1DOÃN ANH ĐỨC
ỨNG DỤNG PHP/MySQL XÂY DỰNG PHẦN MỀM QUẢN TRỊ TÀI LIỆU SỐ HÓA CHO HỆ THỐNG THƯ VIỆN
Trang 2Lời cảm ơn
Để hoàn thành bản luận văn này, tôi đã nhận được sự hướng dẫn và giúp đỡ tận tình của TS Nguyễn Viết Nghĩa Tôi xin bày tỏ lòng biết ơn sâu sắc tới TS Nguyễn Viết Nghĩa về sự giúp đỡ quí báu này
Tôi xin chân thành cảm ơn kỹ sư Tô Trọng Đức, người đã giúp
đỡ tôi xây dựng và hoàn thiện phần mềm DLS
Tôi xin chân thành cảm ơn Ban Giám đốc và tập thể cán bộ, nhân viên thư viện tỉnh Lạng Sơn đã giúp tôi trong quá trình thử nghiệm phần mềm DLS
Tôi xin chân thành cảm ơn các thầy cô giáo tham gia giảng dạy tại khoa sau đại học, Trường Đại học Văn hóa Hà Nội, các bạn
bè đồng nghiệp và người thân - những người đã quan tâm động viên, cổ vũ và giúp đỡ tôi trong quá trình học tập và thực hiện luận văn này
Tác giả
Trang 3MỤC LỤC
CÁC TỪ VIẾT TẮT TRONG LUẬN VĂN 4
DANH MỤC BẢNG BIỂU 5
PHẦN MỞ ĐẦU 6
1 Tính cấp thiết của đề tài 6
2 Tình hình nghiên cứu 8
3 Mục tiêu và nhiệm vụ nghiên cứu 10
4 Đối tượng và phạm vi nghiên cứu 10
5 Phương pháp nghiên cứu 11
6 Ý nghĩa khoa học và ứng dụng của đề tài 11
7 Cấu trúc của luận văn 11
Chương 1: TÀI LIỆU SỐ VÀ PHẦN MỀM QUẢN TRỊ TÀI LIỆU SỐ TRONG HỆ THỐNG THƯ VIỆN CÔNG CỘNG 12
1.1 Tài liệu số 12
1.1.1 Khái niệm tài liệu số 12
1.1.2 Khái niệm thư viện số 15
1.1.3 Khái niệm siêu dữ liệu 16
1.1.4 Tầm quan trọng của tài liệu số và việc quản lý tài liệu số 19
1.2 Công tác số hóa tài liệu và việc ứng dụng phần mềm quản trị tài liệu số ở các thư viện công cộng 26
1.2.1 Công tác số hóa tài liệu trong hệ thống thư viện công cộng 26
1.2.2 Tổng quan ứng dụng phần mềm quản trị tài liệu số ở các thư viện công cộng 28
1.2.3 Yêu cầu của một phần mềm quản trị tài liệu số cho hệ thống thư viện công cộng 30
1.3 Ngôn ngữ lập trình PHP và hệ quản trị cơ sở dữ liệu MySQL 34
1.3.1 Tổng quan về PHP và MySQL 34
Trang 41.3.2 Lý do lựa chọn PHP và MySQL xây dựng phần mềm quản trị tài
liệu số 36
Chương 2: GIẢI PHÁP ỨNG DỤNG PHP/MYSQL XÂY DỰNG PHẦN MỀM QUẢN TRỊ TÀI LIỆU SỐ 41
2.1 Lựa chọn công nghệ hỗ trợ 41
2.1.1 AJAX 41
2.1.2 JAVASCRIPTS 43
2.1.3 CSS 44
2.2 Thiết kế hệ thống 45
2.2.1 Bài toán quản lý, khai thác tài liệu số ở các thư viện công cộng 45 2.2.2 Thiết kế cơ sở dữ liệu 46
2.2.3 Bảo mật và an toàn dữ liệu 52
2.3 Thiết kế các module của phần mềm quản lý tài liệu số 54
2.3.1 Thiết kế giao diện 54
2.3.2 Quản trị hệ thống 58
2.3.3 Trang tin 62
2.3.4 Biên mục 63
2.3.5 OPAC 69
2.3.6 Xuất bản điện tử 73
2.3.7 Bạn đọc 74
2.4 Đánh giá phần mềm đã xây dựng được 77
2.4.1 Những kết quả đã đạt được 77
2.4.2 Những vấn đề còn tồn tại 79
Chương 3: THỬ NGHIỆM PHẦN MỀM VÀ CÁC GIẢI PHÁP ỨNG DỤNG 80
3.1 Lựa chọn đơn vị chạy thử nghiệm 80
3.2 Thử nghiệm phần mềm 82
3.2.1 Cài đặt phần mềm 82
Trang 53.2.2 Đào tạo cán bộ thư viện 84
3.2.3 Biên mục dữ liệu số 86
3.2.4 Thử nghiệm trong mạng nội bộ (LAN) 89
3.2.5 Thử nghiệm qua Internet 89
3.2.6 Đào tạo người dùng tin 91
3.2.7 Xuất bản thông tin ra CD-ROM, ổ cứng di động 92
3.3 Đánh giá kết quả thử nghiệm 92
3.3.1 Những kết quả đã đạt được 92
3.3.2 Một số tồn tại sau khi thử nghiệm phần mềm DLS 95
3.4 Các kiến nghị và giải pháp hoàn thiên phần mềm 95
3.4.1 Tăng cường năng lực ứng dụng phần mềm DLS của các thư viện công cộng 95
3.4.2 Kiến nghị giải pháp triển khai ứng dụng 102
KẾT LUẬN 104
TÀI LIỆU THAM KHẢO 106
PHỤ LỤC LUẬN VĂN 110
Trang 6CÁC TỪ VIẾT TẮT TRONG LUẬN VĂN
AJAX Asynchronous JavaScript
ASP Môi trường kịch bản trên máy chủ
(Active Server Pages)
CD-ROM Đĩa quang chỉ đọc
(Compact Dirk- Read Only Memory)
CNNDS Công nghiệp nội dung số
CSDL: Cơ sở dữ liệu
CSS Cascading Style Sheets
DLS Phần mềm giải pháp thư viện số
(Digital Library Solutions)
GUI Giao diện đồ họa người dùng
(Graphical User Interface)
Ilib Hệ quản trị thư viện điện tử tích hợp
(Intergrated Library Solutions)
(Local Network Area)
Libol Phần mềm giải pháp Thư viện điện tử
(LIBrary OnLine)
MARC Biên mục máy tính đọc được
(Machine Readable Catalog )
MySQL Hệ quản trị cơ sở dữ liệu
(My Structured Query Language)
OPAC Mục lục công cộng truy cập trực tuyến
(Online Public Access Catalog)
(Personal Home Page)
Trang 7DANH MỤC BẢNG BIỂU
Trang Bảng 1.1: Điều tra tình hình số và ứng dụng phần mềm quản trị tài liệu
số tại một số thư viện tỉnh, thành phố……… 29
Bảng 2.1: Bảng Users……… 47
Bảng 2.2: Bảng Bo_su_tap……… 47
Bảng 2.3: Bảng Sach……… 48
Bảng 2.4: Bảng Ban_doc……… 49
Bảng 2.5: Bảng Thong_tin……… 50
Bảng 2.6: Bảng File_tai_lieu……… 51
Bảng 2.7: Bảng Lien_he……… 52
Bảng 2.8: Bảng phân quyền người sử dụng 59
Bảng 2.9: Mô tả cấp độ bảo mật tài liệu số……… 65
Bảng 2.10: Mô tả nhóm quyền của bạn đọc……… 75
Trang 8PHẦN MỞ ĐẦU
1 Tính cấp thiết của đề tài
Trong thời đại ngày nay, sự phát triển bùng nổ của công nghệ thông tin
đã tác động lớn đến cuộc sống cũng như sự phát triển của xã hội Nhận thức
rõ tầm quan trọng của của công nghệ thông tin đối với sự phát triển của đất nước Bộ Chính trị đã ban hành chỉ thị số 58-CT/TƯ về “Đẩy mạnh công nghệ thông tin phục vụ sự nghiệp công nghiệp hóa, hiện đại hóa” Chỉ thị
58 khẳng định “Ứng dụng và phát triển công nghệ thông tin là một nhiệm vụ
ưu tiên trong chiến lược phát triển kinh tế - xã hội, là phương tiện chủ lực để
đi tắt đón đầu, rút ngắn khoảng cách phát triển so với các nước đi trước”
Công nghệ thông tin đang thay thế dần các phương tiện thủ công, mọi loại hình từ quản trị một bộ máy đến cách thức tiếp nhận kiến thức của mỗi cá nhân… cũng đang từng bước được số Trong bối cảnh đó, công tác thông tin - thư viện cũng đã, đang và sẽ tiếp tục có những biến đổi sâu sắc với sự hiện hữu của môi trường số trong hoạt động Xây dựng thư viện số đã trở thành xu hướng phát triển của hoạt động thông tin - thư viện toàn cầu Thư viện số đã giúp cho các thư viện triển khai phục vụ vượt ra khỏi khuôn viên của mình, các giới hạn về hạn chế người sử dụng, hạn chế thời gian phục vụ, hạn chế tài liệu phục vụ đã được vượt qua Bất cứ người dùng tin nào, dù ở bất cứ nơi đâu, tại bất kỳ thời điểm nào đều có thể được phục vụ thông tin nếu truy cập vào một thư viện số Với những đặc điểm đó, thư viện số còn được gọi là thư viện không nóc, thư viện không tường
Trong bối cảnh hội nhập quốc tế đang diễn ra sôi động, xu hướng liên kết hoạt động giữa các cơ quan thông tin – thư viện là một tất yếu và sự liên kết này đang dần vượt qua cả biên giới giữa các quốc gia, châu lục, hình
Trang 9thành nên một mạng cung cấp thông tin toàn cầu Vấn đề đặt ra là, làm sao để cho sự liên kết ấy ngày càng trở nên hữu ích hơn Sự liên kết sẽ không thể đạt hiệu quả như mong muốn, nếu các cơ quan thông tin – thư viện không xây dựng được các thư viện số, chia sẻ toàn văn của tài liệu, vì chỉ có thư viện số mới giúp cho các cơ quan thông tin – thư viện trao đổi thông tin thuận tiện, nhanh chóng Đó cũng là minh chứng cho sự phát triển về khoa học, công nghệ của một quốc gia, vùng lãnh thổ
Xây dựng thư viện số nhằm thoả mãn nhu cầu tìm kiếm, khai thác và sử dụng thông tin của con người trong kỷ nguyên mới - kỷ nguyên của tri thức, từng bước đưa thư viện Việt Nam hòa nhập với mạng thông tin - thư viện các nước trong khu vực và thế giới
Vấn đề xây dựng thư viện hiện đại ở Việt Nam đã được Đảng và Nhà nước quan tâm chỉ đạo Ngày 4 tháng 5 năm 2007, Bộ Văn hóa – Thông tin (nay là Bộ Văn hóa, Thể thao và Du lịch) đã ban hành quyết định số 10/2007/QĐ-BVHTT phê duyệt “Quy hoạch phát triển ngành thư viện Việt Nam tới năm 2010 và định hướng phát triển tới năm 2020” trong đó
có nội dung: Ứng dụng khoa học công nghệ cao nhằm tự động hóa, hiện đại hóa hoạt động của thư viện Phát triển thư viện điện tử, thư viện kỹ thuật số Sưu tầm, bảo tồn và phát huy vốn di sản văn hoá trong thư viện theo phương pháp hiện đại dựa vào công nghệ thông tin phát triển ở mức cao Thư viện công cộng phải là nguồn lực giúp nâng cao dân trí và phổ cập giáo dục của cộng đồng, là cơ quan giáo dục thường xuyên dành cho mọi người Phấn đấu đến năm 2010, toàn bộ thư viện các tỉnh, hành phố được nối mạng với Thư Viện Quốc gia Việt Nam, Internet, số hóa 20% tài liệu quý hiếm, 40% thư viện cấp huyện ứng dụng công nghệ thông tin
Trang 10Dưới sự chỉ đạo đó hệ thống thư viện công cộng đã tiến hành số hóa tài liệu, xây dựng thư viện điện tử, thư viện số Tuy nhiên, vấn đề này còn mới
mẻ, do thiếu kinh nghiệm, gặp khó khăn trong công tác lựa chọn phần mềm quản trị tài liệu số nên vấn đề xây dựng thư viện điện tử, thư viện số mới chỉ mang tính phong trào chưa đạt hiệu quả như mong muốn Yêu cầu cấp thiết hiện nay là cần nghiên cứu, xây dựng một phần mềm quản trị tài liệu số gọn nhẹ, giao diện thân thiện, đáp ứng chuẩn nghiệp vụ, phù hợp với hệ thống thư
viện công cộng Vì vậy tôi chọn đề tài “Ứng dụng PHP/MySQL xây dựng phần mềm quản trị tài liệu số cho hệ thống thư viện công cộng”.
2 Tình hình nghiên cứu
Vấn đề tạo lập nguồn tài liệu số, ứng dụng phần mềm xây dựng thư viện điện tử đã có một số công trình nghiên cứu được thực hiện trong những năm gần đây:
Cao Minh Kiểm (2000), “Thư viện số - định nghĩa - vấn đề “, Tạp chí Thông tin & Tư liệu, (3), tr 5-11 Bài báo phân tích những đặc điểm
chủ yếu của thư viện số, xây dựng kho tài liệu số, xây dựng siêu dữ liệu
Nguyễn Minh Hiệp (2006), “Xây dựng thư viện số với hệ thống mã
nguồn mở”, Kỷ yếu hội thảo tổ chức và hoạt động thư viện điện tử, Phú Yên tr 35-43 Bài viết nêu định nghĩa thư viện số, giới thiệu một số
phần mềm quản trị tài liệu số tiêu biểu
Nguyễn Hoàng Sơn (2003), Xây dựng mô hình thư viện điện tử ở Việt Nam trong giai đoạn hiện nay, Luận văn thạc sĩ Đề tài đề cập tới các
vấn đề lý luận về thư viện điện tử, bao gồm: chiến lược của hệ thống thông tin, khái niệm thư viện điện tử, các yếu tố cấu thành thư viện điện
Trang 11tử, khảo sát các yếu tố cấu thành thư viện điện tử; đề xuất một số giải pháp xây dựng mô hình thư viện điện tử ở Việt Nam từ việc lập dự án đến thực thi dự án
Phạm Thị Mai (2009), Nghiên cứu phát triển thư viện điện tử trong các trường đại học trên địa bàn Hà Nội hiện nay, Luận văn thạc sĩ Công trình đề cập tới một số vấn đề như các khái niệm
liên quan đến thư viện điện tử, các yếu tố cấu thành thư viện điện
tử, vai trò của thư viện điện tử với phát triển giáo dục đại học ở Việt Nam
Lê Đức Thắng (2010), Phát triển nguồn lực tài liệu số tại Thư viện Quốc gia Việt Nam, Luận văn thạc sĩ Trong công trình của
mình, tác giả đề cập tới các khái niệm về tài liệu số, thư viện số; quy trình số hóa tài liệu ở Thư viện Quốc gia Việt Nam, đề xuất các giải pháp hoàn thiện quy trình số hóa tài liệu
Nhìn chung, các công trình trên mới chỉ đề cập tới một số khía cạnh của vấn đề xây dựng mô hình thư viện điện tử ở Việt Nam, xây dựng, phát triển nguồn tài liệu số Trong công trình của tác giả Nguyễn Minh Hiệp có giới thiệu một số phần mềm nguồn mở của nước ngoài, tuy nhiên trong thực tế ứng dụng các phần mềm này vẫn còn nhiều hạn chế như Việt hóa chưa triệt để, cài đặt, quản trị không thuận tiện, giao diện thiếu thân thiện Như vậy, có thể nói, cho đến nay chưa có một công trình nào nghiên cứu một cách toàn diện về việc ứng dụng mã nguồn mở xây dựng phần mềm quản trị tài liệu số trong hệ thống thư viện công cộng ở Việt Nam
Trang 123 Mục tiêu và nhiệm vụ nghiên cứu
Mục tiêu:
Ứng dụng ngôn ngữ lập trình PHP và hệ quản trị cơ sở dữ liệu MySQL xây dựng phần mềm quản trị tài liệu số cho hệ thống thư viện công cộng
Nhiệm vụ nghiên cứu:
Xác định các yêu cầu xây dựng phần mềm quản trị tài liệu số
Thiết kế, xây dựng phần mềm quản trị tài liệu số
Chạy thử nghiệm phần mềm tại một thư viện công cộng tỉnh, thành phố
Đề xuất giải pháp hoàn thiện phần mềm và đưa vào áp dụng trong thực tiễn
4 Đối tượng và phạm vi nghiên cứu
Đối tượng nghiên cứu: phần mềm quản trị tài liệu số trong hệ thống thư
viện công cộng
Phạm vi nghiên cứu:
- Công tác số hóa tài liệu và thực trạng ứng dụng phần mềm quản trị tài liệu số tại một số thư viện công cộng cấp tỉnh, thành phố: Bình Dương, Cần Thơ, Gia Lai, Hải Dương, Hải Phòng, Hòa Bình, Lạng Sơn, Phú Yên, Sơn La, Thừa Thiên – Huế
- Xây dựng phần mềm quản trị tài liệu số
- Thời gian: từ năm 2010 đến nay (2012)
Trang 135 Phương pháp nghiên cứu
- Phương pháp phân tích tổng hợp
- Phương pháp chuyên gia
- Phương pháp thực nghiệm
- Phương pháp nghiên cứu tài liệu
6 Ý nghĩa khoa học và ứng dụng của đề tài
- Về mặt khoa học: góp phần hoàn thiện lý luận khi tiến hành xây dựng, quản trị, khai thác nguồn tài liệu số phù hợp với điều kiện của các thư viện công cộng ở Việt Nam
- Về mặt ứng dụng: đề tài có ý nghĩa thực tiễn bởi kết quả của đề tài có thể được ứng dụng tại các thư viện cấp tỉnh, cấp huyện trong hệ thống thư viện công cộng Ứng dụng PHP/MySQL (mã nguồn mở - miễn phí) để xây dựng phần mềm giúp các thư viện công cộng tiết kiệm chi phí trong quá trình xây dựng, quản lý và khai thác nguồn tài liệu số
7 Cấu trúc của luận văn
Ngoài phần mở đầu, kết luận, tài liệu tham khảo, phụ lục, luận văn được chia làm ba chương:
Chương 1: Tài liệu số và phần mềm quản trị tài liệu số trong hệ
thống thư viện công cộng
Chương 2: Giải pháp ứng dụng PHP/MYSQL xây dựng phần mềm
quản trị tài liệu số
Chương 3: Thử nghiệm phần mềm và các giải pháp ứng dụng
Trang 14Chương 1: TÀI LIỆU SỐ VÀ PHẦN MỀM QUẢN TRỊ TÀI LIỆU SỐ
TRONG HỆ THỐNG THƯ VIỆN CÔNG CỘNG
1.1 Tài liệu số
1.1.1 Khái niệm tài liệu số
Sự phát triển cực kỳ mau lẹ của công nghệ thông tin và truyền thông trong những năm gần đây đang tác động mạnh mẽ tới mọi phương diện của đời sống xã hội, trong đó có lĩnh vực hoạt động thông tin – thư viện Để sử dụng được các phương tiện, kỹ thuật lưu trữ và truyền tải thông tin hiện đại, không thể không có những vật mang tin phù hợp Do đó, việc nghiên cứu, ứng dụng và hoàn thiện các vật mang tin mới là điều được nhiều nhà khoa học hoạt động trong lĩnh vực thông tin, công nghệ và truyền thông quan tâm Đó chính là khởi đầu cho sự xuất hiện và phát triển không ngừng của một loại hình tài liệu mới: Tài liệu số
Cho đến nay, đã có không ít định nghĩa về tài liệu số được đưa ra Điểm chung của các định nghĩa này đều cho rằng: tài liệu số là tài liệu mà thông tin chứa đựng trong đó đã được biểu diễn dưới dạng mã nhị phân, tức là
mã chỉ gồm hai số 0 và 1 Nói cách khác, những thông tin về tài liệu, một phần hay toàn bộ nội dung của tài liệu đã được chuyển thành các bit thông tin
dữ liệu và được lưu trữ, khai thác trên máy vi tính, với sự hỗ trợ của một hay một vài thiết bị chuyên dụng, phần mềm ứng dụng và hệ thống mạng máy tính Như vậy, tài liệu được tạo lập trực tiếp từ máy vi tính, được lưu trữ thành các tệp dữ liệu (file), với những định dạng khác nhau như: doc, exe, jpg, pdf,… và các tài liệu có nội dung là kết quả của quá trình số các loại hình tài liệu khác: giấy, ảnh, phim… đều là tài liệu số Với cách hiểu đó, có
Trang 15thể coi nguồn tài liệu số là tập hợp có tổ chức những bộ sưu tập thông tin số
và thông tin trong tài liệu đã được số
Do bản chất tồn tại và lưu trữ hoàn toàn khác biệt so với loại hình tài liệu truyền thống, nguồn tài liệu số chỉ có thể được truy cập và khai thác trên máy tính hay hệ thống mạng máy tính Một trong số các phương tiện cầu nối đưa người dùng tin tới với nguồn tài liệu số chính là hệ thống các mục lục công cộng tra cứu trực tuyến (tiếng Anh là Online Public Access Catalog, được viết tắt là OPAC) Theo Từ điển Thông tin – Thư viện học trực tuyến - ODILIS, OPAC là một cơ sở dữ liệu (CSDL) bao gồm các biểu ghi thư mục,
mô tả sách hoặc các tài liệu khác được sở hữu bởi một thư viện, trung tâm thông tin, cơ quan lưu trữ… hoặc một hệ thống các đơn vị này và người dùng
có thể truy cập qua mạng máy tính để biết thêm về nguồn tin họ cần Sự truy cập này ban đầu chỉ hạn chế trong phạm vi các máy tính đặt tại thư viện, trung tâm thông tin, cơ quan lưu trữ Tuy nhiên, ngày nay, nhờ sự tiến bộ không ngừng của công nghệ, người dùng tin có thể thông qua OPAC để tra cứu thông tin ngay trên máy tính tại nhà, tại cơ quan, tại trường học… thông qua các kết nối Internet có dây và không dây Đặc biệt, trong thời gian gần đây, rất nhiều loại điện thoại di động đời mới có hỗ trợ kết nối Internet được tung
ra thị trường, một trong những ứng dụng của các thiết bị này là tạo điều kiện đưa người dùng tin đến gần hơn với OPAC, với nguồn tin mà họ đang tìm kiếm Chính điều này cũng đang tạo nên một làn sóng mới trong hoạt động thông tin – thư viện, đó là quảng bá hình ảnh, marketing nguồn tin của mình trên mạng Internet và mạng điện thoại di động
Đối với một tài liệu ở dạng truyền thống: sách, báo, luận văn,… việc số hóa tài liệu này có thể ở các cấp độ khác nhau: Số hóa thư mục, số hóa dữ kiện, dữ liệu và số hóa toàn văn
Trang 16Tài liệu số hóa thư mục là tài liệu chỉ được số phần thư mục Các yếu
tố thư mục được đưa vào số bao gồm một số hoặc tất cả các yếu tố sau: Tên tác giả (có thể có nhiều tên tác giả, tên cơ quan hay tổ chức xuất bản tài liệu), tên người dịch, tên người sưu tầm, tên người hiệu đính…; Tên tài liệu (có thể bao gồm cả tên tài liệu bằng nhiều thứ tiếng khác nhau nếu tài liệu được xuất bản đa ngôn ngữ); Nơi xuất bản, Nhà xuất bản, Năm xuất bản; Khổ cỡ của tài liệu; Số trang của tài liệu; Chỉ số ISBN hoặc ISSN… Ngoài ra, còn một số các yếu tố khác là: Ký hiệu phân loại tài liệu, Ký hiệu xếp giá tài liệu (có thể
có cả ký hiệu tên thư viện, trung tâm thông tin, cơ quan lưu trữ tài liệu nếu là mục lục liên hợp); Ký hiệu định chủ đề; Các từ khoá; Bản tóm tắt nội dung tài liệu…
Tài liệu số hóa dữ kiện, dữ liệu là tài liệu ngoài phần số thư mục còn có thêm phần số một số dữ kiện, dữ liệu của tài liệu gốc nhưng không phải là toàn bộ các thông tin chứa đựng trong tài liệu gốc Các dữ kiện, dữ liệu này
có thể là thông tin lịch sử; số liệu thống kê; biểu đồ tăng trưởng; thành phần cấu tạo; công thức điều chế hoá học; một số nhận định, phân tích và dự báo được nêu trong tài liệu gốc; …
Tài liệu số hóa toàn văn có nội dung là toàn bộ nội dung của tài liệu gốc đã được số hóa Đây là loại hình tài liệu số trọn vẹn nhất, có giá trị sử dụng lớn nhất trong số các loại hình tài liệu số Bởi giá trị của thông tin, nằm ngay ở chính thông tin đó, chứ không phải được quy định bởi tên tác giả, tên tài liệu… hay một vài dòng xuất hiện trong nguồn tin Nếu có trong tay tài liệu số thư mục, người dùng tin chỉ biết thông tin về tài liệu (nghĩa là thông tin về thông tin) Nếu có được tài liệu số dữ kiện, dữ liệu thì người dùng tin cũng mới chỉ chạm được vào một phần của kho báu thông tin Nghĩa là, để có được toàn bộ thông tin mình cần, người dùng tin phải trải qua ít nhất một bước nữa để có được có toàn văn tài liệu ở định dạng thích hợp Để thực hiện
Trang 17điều này, có thể người dùng tin phải tới tận nơi lưu giữ thông tin để tìm kiếm tài liệu gốc (nếu tài liệu đó chưa được số toàn văn) hoặc đưa ra yêu cầu được truy cập tới nguồn toàn văn (nếu người dùng tin chưa được cấp quyền truy cập, hoặc chưa đủ điều kiện để được truy cập tới các nguồn toàn văn của tài liệu quý, hiếm và chỉ lưu hành nội bộ, hay chưa thực hiện các nghĩa vụ cần thiết như: trả phí truy cập, đăng ký thông tin người dùng…) Nhưng nếu chỉ sau một thao tác click chuột, người dùng tin truy cập được đến nguồn tài liệu
số toàn văn – điều đó cũng đồng nghĩa với việc họ được sử dụng toàn bộ thông tin đó, rất nhanh chóng và thuận tiện mà không cần phải tính đến các trở lực lớn như: khoảng cách địa lý, giới hạn thời gian hay những ức chế trong khi chờ đợi để được đến lượt tiếp cận với toàn văn tài liệu Đó là niềm mơ ước lớn lao nhất của mọi người dùng tin trên thế giới và cũng là điểm đích mà mọi thư viện, trung tâm thông tin, cơ quan lưu trữ trên toàn cầu đang nỗ lực hướng tới
1.1.2 Khái niệm thư viện số
Nhiều định nghĩa đã được công bố trong giới học giả toàn cầu về thư viện nhằm định nghĩa rõ ràng một thư viện số Dưới đây là một số định nghĩa tiêu biểu về thư viện số:
Hai học giả người Nga là Sokolova và Liyabev cho rằng thư viện số là một hệ thống phân tán có khả năng lưu trữ và tận dụng hiệu quả các loại tài liệu điện tử khác nhau, và giúp người dùng có thể truy cập và được chuyển giao thông tin dễ dàng qua mạng máy tính
Nhiều học giả Trung Quốc lại có cùng quan điểm rằng “Một thư viện
số trên thực tế không phải là một thư viện ở góc độ mở rộng không gian của nó; thay vào đó nó là trung tâm tài nguyên thông tin số chứa đựng tài nguyên thông tin đa phương tiện Một thư viện số tồn tại bằng việc số thông tin,
Trang 18chẳng hạn như văn bản, ký tự, chữ viết, hình ảnh, video và âm thanh, đồng thời cung cấp cho người dùng các dịch vụ thông tin nhanh chóng và thuận tiện thông qua Internet, nhằm chuyển giao một hệ thống thông tin số mà trong
đó việc chia sẻ nguồn tài nguyên luôn sẵn sàng”
Theo định nghĩa của Liên hiệp Thư viện số Hoa Kỳ năm 1999: Thư viện số là các cơ quan, tổ chức có các nguồn lực, kể cả các nguồn nhân lực chuyên hóa, để lựa chọn, cấu trúc, cung cấp việc truy cập đến, diễn giải, phổ biến, bảo quản sự toàn vẹn, đảm bảo sự ổn định trong thời gian dài của sưu tập công trình số mà chúng ở dạng sẵn sàng để sử dụng một cách kinh tế cho một hoặc một số cộng đồng nhất định
Theo tác giả Vũ Văn Sơn: “Thư viện số là hình thức kết hợp giữa thiết
bị tính toán, lưu trữ và truyền thông số với nội dung và phần mềm cần thiết để tái tạo, thúc đẩy và mở rộng các dịch vụ của các thư viện truyền thống vốn dựa trên các biện pháp thu thập, biên mục và phổ biến thông tin trên giấy và các vật liệu khác”
Tóm lại: Thư viện số được hiểu là nơi lưu trữ nguồn thông tin số, đặc biệt là thông tin toàn văn, đồng thời sử dụng các phương tiện số trong thu thập, lưu trữ, xử lý, tìm kiếm và phổ biến thông tin
1.1.3 Khái niệm siêu dữ liệu
Siêu dữ liệu (metadata) là dạng dữ liệu miêu tả về dữ liệu Trong cơ sở
dữ liệu, siêu dữ liệu là các dạng biểu diễn khác nhau của các đối tượng Trong
cơ sở dữ liệu quan hệ thì siêu dữ liệu là các định nghĩa của bảng, cột, cơ sở dữ liệu, view và nhiều đối tượng khác Trong kho dữ liệu, siêu dữ liệu là dạng định nghĩa dữ liệu như: bảng, cột, một báo cáo, các luật doanh nghiệp hay
Trang 19những quy tắc biến đổi Siêu dữ liệu bao quát tất cả các phương diện của kho
dữ liệu
Thuật ngữ siêu dữ liệu được định nghĩa là sự mô tả các nguồn thông tin điện tử nhằm mục đích nhận diện, quản lý, phân loại và tra cứu nguồn thông tin khi làm việc với tập hợp các nguồn thông tin Siêu dữ liệu là những dữ liệu
mô tả về ngữ cảnh, nội dung, cấu trúc và sự quản lý tài liệu theo dòng chảy của thời gian
Siêu dữ liệu phải chứa những thông tin:
Cấu trúc của dữ liệu
Thuật toán sử dụng để tổng hợp dữ liệu
Ánh xạ xác định sự tương ứng dữ liệu từ môi trường tác nghiệp sang kho dữ liệu
Siêu dữ liệu là dữ liệu để mô tả dữ liệu Khi dữ liệu được cung cấp cho người dùng cuối, thông tin siêu dữ liệu sẽ cung cấp những thông tin cho phép
họ hiểu rõ hơn bản chất về dữ liệu mà họ đang có Những thông tin này sẽ giúp cho người dùng có được những quyết định sử dụng đúng đắn và phù hợp
về dữ liệu mà họ có
Tuỳ thuộc vào từng mục đích sử dụng khác nhau, từng loại dữ liệu khác nhau mà cấu trúc và nội dung dữ liệu metadata có thể có những sự khác biệt Song, nhìn chung sẽ bao gồm một số loại thông tin cơ bản sau:
Thông tin mô tả về bản thân dữ liệu metadata
Thông tin về dữ liệu mà metadata mô tả
Thông tin về cá nhân, tổ chức liên quan đến dữ liệu metadata và dữ liệu Dublin Core Metadata là một trong những sơ đồ yếu tố siêu dữ liệu phổ biến và được nhiều người biết đến Bộ yếu tố này được hình thành lần đầu tiên vào năm 1995 bởi Sáng kiến Yếu tố Siêu dữ liệu Dublin Core (Dublin
Trang 20Core Metadata Element Initiative) Tập hợp yếu tố siêu dữ liệu này được gọi
là “cốt lõi” (core) vì nó được thiết kế đơn giản và chỉ bao gồm 15 yếu tố mô
tả cốt lõi nhất (trong khi Marc21 có hơn 200 trường và rất nhiều trường con)
1 DC Creater (Tác giả): Tác giả của tài liệu, bao gồm cả tác giả cá nhân và tác giả tập thể
2 DC Title (Nhan đề): Nhan đề của tài liệu
3 DC Subject (Chủ đề): Chủ đề tài liệu đề cập dùng để phân loại tài liệu Có thể thể hiện bằng từ, cụm từ/(Khung chủ đề), hoặc chỉ số phân loại/ (Khung phân loại)
4 DC Contributor (Cộng tác, đóng góp): Tên những người cùng tham gia cộng tác đóng góp vào nội dung tài liệu, có thể là cá nhân, tổ chức
5 DC Date (Năm xuất bản): Ngày, tháng, năm ban hành tài liệu
6 DC Publisher (Nhà xuất bản): Nhà xuất bản, nơi ban hành tài liệu
có thể là tên cá nhân, tên cơ quan, tổ chức, dịch vụ
7 DC Description (Trích dẫn, trích yếu nội dung): Tóm tắt, mô tả nội dung tài liệu Có thể bao gồm tóm tắt, chú thích, mục lục, đoạn văn bản để làm rõ nội dung
8 DC Type (Kiểu tài liệu): Mô tả bản chất của tài liệu Dùng các thuật ngữ mô tả phạm trù kiểu: trang chủ, bài báo, báo cáo, từ điển
9 DC Format (Mô tả vật lý, định dạng): Mô tả sự trình bày vật lý của tài liệu, có thể bao gồm; vật mang tin, kích cỡ độ dài, kiểu dữ liệu (.doc, html, jpg, xls, phần mềm )
10 DC Identifiers (Định danh tư liệu): Là một dãy ký tự hoặc số nhằm thể hiện tính đơn nhất của tư liệu (URLs, ISBN, ISSN)
Trang 2111 DC Source (Nguồn gốc tài liệu): Nguồn gốc mà tư liệu được tạo thành, yếu tố này có thể gồm siêu dữ liệu về nguồn thông tin thứ hai nhằm khai thác tư liệu hiện hành
12 DC Language (Ngôn ngữ): Ngôn ngữ của nội dung tư liệu, được thành lập theo quy tắc RFC1766
13 DC Relation (Liên kết toàn văn): Một định danh cho nguồn thứ hai và mối quan hệ của nó với tư liệu hiện hành Yếu tố này thể hiện
sự kết nối giữa các nguồn tư liệu có liên quan
14 DC Coverage (Diện bao quát): Các thông tin liên quan đến phạm
vi, quy mô hoặc mức độ bao quát của tài liệu Phạm vi đó có thể là địa điểm, không gian hoặc thời gian, tọa độ
15 DC Right (Bản quyền): Các thông tin liên quan đến bản quyền của tài liệu
Tầm quan trọng và ý nghĩa đặc biệt của siêu dữ liệu càng rõ nét khi quản lý tài liệu trong môi trường điện tử Trong môi trường điện tử, tài liệu chính thức luôn luôn kèm theo các siêu dữ liệu Không có siêu dữ liệu không thể xác định một cách chính xác những đặc tính cơ bản của tài liệu điện tử Siêu dữ liệu đảm bảo tính bất biến, độ tin cậy và chứng cứ pháp lý của tài liệu điện tử
1.1.4 Tầm quan trọng của tài liệu số và việc quản lý tài liệu số
Ngày nay, nguồn tài liệu số đang giữ vai trò quan trọng, làm thay đổi
về chất hoạt động giao lưu thông tin nói chung và hoạt động thông tin – thư viện nói riêng Tài liệu số và việc quản trị tài liệu số một cách hiệu quả đang đóng một vai trò cực kỳ quan trọng trong các thư viện
Trang 22- Tài liệu số vừa là hệ quả vừa là cơ sở phát triển ngành xuất bản điện tử
Tài liệu số ra đời đã góp phần làm thay đổi diện mạo ngành xuất bản
với hàng loạt sản phẩm mới được tung ra thị trường với tên gọi loại hình là ấn phẩm điện tử hay xuất bản phẩm điện tử Ý tưởng đầu tiên về xuất bản điện
tử được ông Vanner Bush đưa ra tại một hội thảo khoa học ở Viện Công nghệ Massachusertte (Mỹ) vào năm 1945 Sau đó ít lâu, đã có một sự bùng nổ hàng loạt các sản phẩm kỹ thuật số và các lợi thế về kỹ thuật không thể phủ nhận Năm 1991, cuốn sách điện tử đầu tiên chào đời tại Mỹ Từ năm 1998, sách điện tử được xuất bản ở dạng đĩa và có thể được tải xuống máy tính cá nhân
từ Internet Không còn nghi ngờ gì nữa, điều này có ý nghĩa vô cùng quan trọng cả về mặt học thuật cũng như trên phương diện kinh doanh
Vào năm 1995, F.W Lancaster đã phác thảo một lịch sử ngắn gọn về việc xuất bản các ấn phẩm điện tử như sau: Sử dụng máy tính để tạo ra những
ấn bản như bản in trên giấy thông thường Phân phối văn bản bằng hình thức điện tử (số) nơi mà phiên bản điện tử tương đương chính xác với phiên bản in ấn Xuất bản những ấn bản nhỏ gọn hơn bản in dưới hình thức số hoá, có thêm những đặc điểm phụ trội để mở rộng khả năng nghiên cứu, điều khiển dữ liệu (qua sự tương xứng hình ảnh) Tạo ra những ấn bản hoàn toàn mới và khai thác thêm nhiều tính năng của các phương tiện kỹ thuật số, như ứng dụng các kết nối siêu văn bản, tích hợp các chức năng truyền thông …
Các loại hình xuất bản phẩm điện tử có trên thị trường hiện nay là sách điện tử (E-Book) và các báo, tạp chí điện tử (E-Journal)
Có thể hiểu một cách đơn giản, sách điện tử là sự trình bày các tệp tin trên màn hình số, có thể là trên mạng hoặc trên CD – ROM hay một thiết bị
số khác Bản thân thuật ngữ sách điện tử đã có thể được hiểu là sự chứa đựng các thông tin dạng sách và việc biểu thị nội dung thông tin ấy sẽ được thực
Trang 23hiện nhờ một thiết bị chuyên dụng nào đó (Kindle của Amazon, Geimei, Floyer…) Từ điển tiếng Anh rút gọn của nhà xuất bản Oxford – The New Concise Oxford English Dictionary (2001) có đưa ra định nghĩa sách điện tử
là: “Một phiên bản điện tử của một quyển sách in có thể đọc được trên máy tính cá nhân hay một thiết bị cầm tay được thiết kế cho mục đích này”
Cũng giống như nguyên lý ra đời của sách điện tử, các loại báo và tạp chí điện tử cũng được ra đời và ngày càng trở nên phổ biến
Có một số cách thông dụng để khách hàng sử dụng ấn phẩm điện tử: lên mạng đọc từ website, dùng tài khoản đăng nhập hệ thống và tải về máy tính cá nhân để đọc chúng, đăng nhập tài khoản trên mạng và tải về các máy
trợ giúp cá nhân (personal digital assistant) hay thiết bị cầm tay computer), in ra giấy để đọc…
(handheld-Sự phát triển của công nghệ thông tin và truyền thông đã thúc đẩy sự phát triển của ngành xuất bản điện tử Theo số liệu thống kê, năm 2004 chỉ có 36.000 tên tạp chí điện tử, nguồn tin điện tử là 5,4 triệu tên Năm 2009, con số này là 159.000 tên tạp chí điện tử, nguồn tin điện tử tăng lên tới 42,1 triệu tên
(Theo OCLC 2004 Information format: content, not containers)
Sự xuất hiện của các xuất bản phẩm điện tử một lần nữa khẳng định việc tài liệu số ra đời đã làm thay đổi diện mạo ngành xuất bản toàn cầu
- Tài liệu số là cơ sở của sự hình thành và phát triển ngành công nghiệp nội dung số
Sự phát triển có tính chất bùng nổ của các nguồn tài liệu số trong
những năm gần đây đã dẫn đến hình thành khái niệm “nội dung số” và kéo
theo đó là sự ra đời của ngành công nghiệp nội dung số
Trang 24Nội dung số (tiếng Anh là E-Content hay Digital Content) là thuật ngữ được dùng để chỉ các thông tin hữu ích chứa đựng trong các tài liệu số Các thông tin này có thể tồn tại trên website, hay thông tin chứa trong các tệp dữ liệu ở dạng văn bản, hình ảnh, âm thanh hoặc dạng đa phương tiện, tích hợp văn bản, âm thanh, video… Đây là một khái niệm rộng, bao quát nhiều lĩnh vực và phát triển liên tục, bao gồm phần mềm nội dung, trò chơi điện tử, học tập trực tuyến (E-learning), xuất bản điện tử, quảng cáo trên Internet…
Các sản phẩm chứa đựng nội dung số, khi tham gia thị trường, sẽ làm hình thành nên ngành công nghiệp nội dung số (CNNDS) Công nghiệp nội dung số (tiếng Anh là Digital Content Industry - DCI) là một khái niệm còn rất mới và trên thế giới vẫn chưa tìm ra được một định nghĩa thống nhất Theo quan điểm của Bộ Bưu chính- Viễn thông Việt Nam: CNNDS là ngành thiết
kế, sản xuất, xuất bản, lưu trữ, phân phối, phát hành các sản phẩm nội dung số
và dịch vụ liên quan Tập hợp các hoạt động liên quan đến số hoá thông tin ở quy mô lớn, có sản phẩm hoàn chỉnh và có khả năng đem lại lợi nhuận thì được gọi là ngành CNNDS Các hoạt động trong CNNDS bao gồm: thu thập thông tin; phân tích nội dung để phân loại, lưu trong bộ nhớ máy tính hoặc hiển thị nội dung trên mạng; bao gói thông tin thành các CSDL trên vật mang tin mong muốn: CD - ROM, DVD, thiết bị lưu trữ di động; nhân bản và cung cấp (bán) các sản phẩm thuộc CSDL đó hoặc toàn bộ CSDL
Nhiều người cho rằng, CNNDS là một nhánh của công nghệ thông tin
vì nó gắn liền với công nghệ thông tin [7, tr.14] Sản phẩm của CNNDS chính
là sản phẩm của quá trình ứng dụng công nghệ thông tin, từ công nghệ phần mềm, thu thập thông tin, xử lý, lưu trữ thông tin đến cung cấp thông tin CNNDS không chỉ liên quan đến phần cứng, phần mềm máy tính hay hệ thống mạng mà còn liên quan đến nhiều lĩnh vực khác như: lưu trữ, sản xuất các thiết bị lưu trữ là các vật mang tin hiện đại Như vậy, nguyên vật liệu đầu
Trang 25vào của ngành CNNDS là thông tin và sản phẩm đầu ra cũng là thông tin Nhưng thông tin đầu ra là CSDL, là thông tin có cấu trúc, có nội dung cụ thể
và được cung cấp cho những đối tượng cụ thể nhằm phục vụ cho một hay một
số hoạt động kinh tế - xã hội nhất định
Chắc chắn rằng, nếu được tổ chức tốt, các sản phẩm số sẽ có thị trường rộng lớn, không phải chỉ ở trong một quốc gia Nhận biết được điều đó, ngày 19/7/2007, Thủ tướng Chính phủ đã ban hành Quyết định số 901/QĐ –
TTg về việc “Thành lập Viện Công nghệ phần mềm và nội dung số Việt Nam, thuộc Bộ Bưu chính, Viễn thông ” Từ đây, CNNDS ở Việt Nam bước
sang một trang mới Hy vọng, CNNDS sẽ không ngừng lớn mạnh để hỗ trợ, cung cấp các nguồn tài liệu số cho các Thư viện số và làm cho hoạt động thông tin khoa học công nghệ sôi động, hấp dẫn hơn
- Quản lý tài liệu số toàn văn là cơ sở để hình thành thư viện số
Thư viện điện tử, thư viện số, thư viện ảo,… là những tên gọi không còn xa lạ đối với những người làm công tác thư viện Việt Nam nhưng vẫn còn tồn tại nhiều cách hiểu, cách định nghĩa khác nhau Có thể coi thư viện số là một kho thông tin dưới dạng số, được cấu trúc sao cho dễ dàng truy cập thông qua các mạng máy tính hay các mạng viễn thông Đó là một hệ thống thông tin tự động hoá mà ở đó, người ta có thể thu thập, xử lý, lưu trữ, tìm kiếm và phổ biến các tài liệu dưới dạng số thông qua các phương tiện công nghệ thông tin và truyền thông
Hạt nhân của thư viện số là nguồn tài liệu số Trong đó, một bộ phận là tài liệu số toàn văn từ tài liệu in ấn, phần chủ yếu là các bộ sưu tập số mới được xây dựng hoặc bổ sung qua nhiều con đường khác nhau như mua, được biếu tặng, trao đổi…Bộ sưu tập số là một tập hợp có tổ chức nhiều tài liệu số với nhiều định dạng khác nhau: văn bản, hình ảnh, âm thanh, video Dù mỗi
Trang 26tài liệu riêng lẻ có sự khác nhau về cách thể hiện, nhưng đều cung cấp một giao diện đồng nhất mà qua đó việc tra cứu, truy cập tài liệu được thực hiện
dễ dàng, thuận tiện Phần mềm quản trị tài liệu số sẽ đem lại cho thư viện tiện ích nổi trội mà dịch vụ thư viện truyền thống chưa có như:
- Tạo ra một môi trường bình đẳng cho mọi người được sử dụng tri thức nhân loại mà không vướng phải rào cản về không gian, thời gian;
- Có tính linh hoạt và khả năng đáp ứng nhu cầu sử dụng rất cao nhờ tính chất đa truy cập của nguồn tài liệu số;
- Tiết kiệm thời gian và kinh phí cho thư viện trong việc xây dựng kho tàng, bảo quản tài liệu,… cũng như giúp người dùng tin cắt giảm chi phí, giảm thời gian trong tìm kiếm thông tin;
- Số hoá toàn văn tài liệu và xây dựng bộ sưu tập số là lựa chọn tối ưu
để bảo tồn lâu dài các tài liệu gốc quý hiếm, ngăn chặn những rủi ro, huỷ hoại tài liệu do thời gian, thiên tai,…
Phần cốt lõi của thư viện số là kho tài liệu số với phần mềm quản trị vốn tài liệu này Vì vậy, việc phát triển kho tài liệu số và tìm kiếm một phần mềm quản trị tài liệu số là công việc quan trọng hàng đầu trong xây dựng thư viện số
- Quản trị tài liệu số giúp thư viện đổi mới và nâng cao chất lượng phục vụ người dùng tin
Trong thư viện hiện đại, tài liệu số đóng một vai trò cực kỳ quan trọng Theo xu hướng phát triển chung của khoa học và công nghệ, việc xuất bản tài liệu số sẽ là phương thức xuất bản cạnh tranh với phương thức xuất bản trên giấy hiện nay, điều đó có nghĩa là tài liệu số sẽ chiếm tỉ lệ ngày càng cao trong các thư viện Nếu không có phần mềm quản trị tài liệu số tốt, thư viện
Trang 27không thể tổ chức lưu trữ và bảo quản được số lượng lớn tài liệu số đang tăng lên hàng ngày, đồng thời đọc giả cũng khó có thể tìm kiếm được tài liệu mình cần trong khối lượng tài liệu số khổng lồ của thư viện Hay nói khác đi, phần mềm quản trị tài liệu số chính là chìa khóa để thư viện cải tiến chất lượng phục vụ, xây dựng các sản phẩm và dịch vụ thông tin có giá trị gia tăng cao
Các thư viện, cơ quan thông tin nếu không sử dụng phần mềm quản trị tài liệu số sẽ không tổ chức, quản lý và khai thác hiệu quả nguồn tài liệu số của mình Nói cách khác, nguồn tài liệu số dù lớn tới đâu, nội dung phong phú, đa dạng cũng không tới được với người dùng tin nếu không được tổ chức, quản lý khoa học bằng các phần mềm chuyên dụng Các thư viện, cơ quan thông tin sử dụng phần mềm quản trị tài liệu số để có thể thu thập, xử lý, lưu trữ, tìm kiếm và phổ biến tài liệu số tới người dùng tin thông qua các phương tiện công nghệ thông tin và truyền thông
Nguồn tài liệu số được quản lý thông qua công tác tạo lập các bộ sưu tập số, biên mục tài liệu số vào phần mềm Trên cơ sở đó các thư viện, cơ quan thông tin tổ chức phân phối tài liệu số tới người dùng tin Người dùng tin đăng kí sử dụng dịch vụ thư viện số, tra tìm và khai thác tài liệu số qua module OPAC của phần mềm Phần mềm quản trị tài liệu số không chỉ giúp các thư viện, cơ quan thông tin tạo lập, quản lý tài liệu số mà nó còn là cầu nối giữa người dùng tin với kho tài liệu số của các thư viện, cơ quan thông tin
Phần mềm quản trị tài liệu số giúp các thư viện, cơ quan thông tin dễ dàng xuất bản nguồn thông tin số trên Internet, trong mạng nội bộ và thông qua các thiết bị lưu trữ di động
Trang 28Như vậy có thể nói rằng để tạo lập, quản lý và khai thác tài liệu số không thể không có các phần mềm quản trị tài liệu số Một thư viện số sẽ không thể tồn tại nếu không có phần mềm quản trị chuyên dụng để thu thập,
xử lý, lưu trữ, tìm kiếm và phổ biến tài liệu số tới người dùng tin
1.2 Công tác số hóa tài liệu và việc ứng dụng phần mềm quản trị tài
liệu số ở các thư viện công cộng
1.2.1 Công tác số hóa tài liệu trong hệ thống thư viện công cộng
Để đánh giá thực trạng công tác số hóa và xây dựng nguồn lực thông tin địa phương số, Bộ Văn hóa, Thể thao và Du lịch đã tiến hành một cuộc điều tra các thư viện công cộng cấp tỉnh trong phạm vi cả nước (năm 2011) Kết quả, có
43 thư viện tỉnh thành phố đã phản hồi Trong số đó có 25 thư viện (chiếm 58,1%) đã triển khai công tác số Việc số hóa tài liệu địa chí đã được tại triển khai tạo các thư viện tỉnh nhằm mục đích bảo quản và quy tụ các nguồn tài liệu quý về một mối nhằm giúp bạn đọc và các nhà nghiên cứu tiếp cận được thông tin về xuất bản phẩm địa phương, nhân vật lịch sử địa phương, sự kiện địa phương, vấn đề dân tộc học và bản sắc văn hóa truyền thống của địa phương một cách đầy đủ, thuận tiện nhất
Việc số hóa tài liệu được thực hiện trong các thư viện Việt Nam từ cuối thập kỷ 90 của Thế kỷ XX Thư viện Khoa học Tổng hợp Thành phố Hồ Chí Minh (TVKHTHTPHCM) là một trong những thư viện công cộng cấp tỉnh tiên phong trong việc triển khai công tác số hóa tài liệu Ngay từ năm 1998 thư viện đã có chương trình số hóa đầu tiên với các sản phẩm đầu tiên là số hóa khoảng 10 nhan đề sách kho Đông Dương, chương trình nhân kỷ niệm
300 năm Sài Gòn – TP.Hồ Chí Minh Năm 2003, TVKHTHTPHCM thật sự bắt đầu bắt tay vào việc lập kế hoạch số hóa tài liệu, xây dựng một số CSDL
Trang 29toàn văn Thư viện Quốc gia Việt Nam (TVQGVN) đã bắt đầu triển khai số hóa từ năm 2003
Nguồn kinh phí thực hiện số hóa có được từ các dự án số hóa do nước ngoài tài trợ và do ngân sách trung ương và địa phương cấp Năm 2011, TVQGVN đã bắt đầu thực hiện Dự án số hóa tài liệu với tổng kinh phí hơn 20
tỷ đồng Tại TVKHTHTPHCM, Dự án VALEASE do thư viện phối hợp với Tổng lãnh sự quán Pháp số hóa các tài liệu bằng tiếng Pháp và tiếng Việt nói
về 3 nước Đông Dương được tiến hành theo nhiều bước Đây là dự án được triển khai theo hình thức thuê ngoài (outsourcing) Số lượng tài liệu được số hóa là sách Đông Dương khoảng 540.000 trang sách, báo tạp chí và công báo
Từ năm 2008 Thư viện tỉnh Yên Bái được tiếp nhận Dự án hợp tác văn hoá giữa tỉnh Yên Bái và Hội đồng tỉnh Val-de-Marne (Cộng hoà Pháp) với mục tiêu: Nâng cao năng lực phục vụ cộng đồng, phát triển sự nghiệp văn hoá, nâng cao đời sống văn hoá tinh thần cho nhân dân các dân tộc tỉnh Yên Bái
Tiểu Dự án “Phục chế, bảo quản và số hóa tài liệu cổ lưu giữ tại Thư viện tỉnh Yên Bái” được thực hiện và bước đầu triển khai
9 thư viện tỉnh đã thường xuyên được cấp kinh phí cho hoạt động số bao gồm: TVKHTHTPHCM, Thư viện tỉnh Quảng Ngãi, Hà Tĩnh, Cần Thơ, Gia Lai, Bình Dương, Đắc Lắc, Bình Thuận, Vũng Tàu Tuy nhiên, kinh phí dành cho hoạt động số còn hạn chế, có tới 83,3% thư viện chỉ được cấp 50.000.000 đồng/năm cho hoạt động này Chỉ có 3 thư viện được cấp trên 100.000.000 đồng cho hoạt động số: TVKHTHTPHCM, Thư viện tỉnh Bà Rịa-Vũng Tàu và Thư viện tỉnh Thanh Hóa
Một trong những hướng ưu tiên mà các thư viện hướng tới là số hóa các tài liệu quý hiếm và tài liệu địa chí Trong đó, 55,8% thư viện tiến hành số hóa tài liệu liệu địa chí và 20,9% số hóa tài liệu quý hiếm
Trang 30Mặc dù mới được triển khai, nhưng các thư viện đã thực hiện số hóa một số lượng tài liệu đáng kể
Tại TVQGVN, công tác số hóa được bắt đầu với đối tượng Luận án Hiện nay, TVQGVN đã số được 15.571 bản, tương đương với 2.500.000 trang Bên canh đó TVQGVN còn số hóa các tài liệu quý hiếm Bộ Sưu tập Đông Dương Thống kê đã hình thành với 829 tên (130.333 trang); Bộ Sưu tập Thăng Long Hà Nội với 850 tên, (407.970 trang)
Tại các thư viện tỉnh, việc số hóa đã đạt được một số kết quả nhất định Tính đến tháng 11/2011, Thư viện KHTH Tp Hồ Chí Minh đã số hóa được hơn 3.000 tài liệu địa chí với 530.000 trang; Thư viện tỉnh Sơn La đã thực hiện số hóa được 313 tài liệu là sách chữ Thái cổ với 8.610 trang Ngoài số các tài liệu là sách chữ Thái cổ, Thư viện tỉnh Sơn La đã số hóa toàn văn được
269 tài liệu địa chí với 32.610 trang; thư viện tỉnh Khánh Hòa số hóa được hơn 550 tài liệu, Thừa Thiên Huế đã số được khoảng 180.000 trang tài liệu quý hiếm, các sắc phong, luận văn luận án và bài báo thí về địa phương; Thư viện tỉnh Đồng Nai số hóa được 317 tài liệu địa chí với 24.544 trang; Thư viện tỉnh Gia Lai số hóa được 47.200 trang,
Các tài liệu số trong các thư viện đã được đưa ra phục vụ với các mức độ khác nhau Trong đó, phục vụ tại chỗ với mạng nội bộ (LAN) của thư viện chiếm ưu thế (62,5 %), số thư viện triển khai đưa lên mạng Internet cho bạn đọc sử dụng còn hạn chế (37%)… [2, tr.5]
1.2.2 Tổng quan ứng dụng phần mềm quản trị tài liệu số ở các thư viện công
cộng
Trong những năm gần đây, các thư viện công cộng Việt Nam (chủ yếu
là thư viện cấp tỉnh) đang từng bước chuyển từ thư viện truyền thống sang thư
Trang 31viện điện tử Vì thế bên cạnh tài liệu, sản phẩm thông tin truyền thống, các thư viện tỉnh/thành phố trong cả nước đã có nhiều nỗ lực trong việc sưu tập, biên soạn và phát hành các sản phẩm thông tin như: thư mục toàn văn chuyên
đề, ấn phẩm tóm tắt, tổng quan cũng như dịch vụ thông tin mới như là phục
vụ theo chế độ hỏi đáp, nói chuyện chuyên đề, dịch vụ tra cứu thông tin qua mạng Một trong những hoạt động để hình thành vốn tài liệu điện tử/tài liệu
số được các thư viện công cộng quan tâm thực hiện là số các tài liệu quý hiếm Nhiều thư viện đã xây dựng được các bộ sưu tập số lên đến hàng trăm nghìn trang
Tuy nhiên, hầu hết các thư viện đều gặp khó khăn khi tiến hành tổ chức, quản lý và khai thác hiệu quả nguồn lực thông tin quý giá này Ngoài một số phần mềm thương mại như iLIB.Di của công ty CMC, Libol Digital của công
ty Tinh Vân, Vebrary của công ty Lạc Việt các thư viện công cộng còn sử dụng phần mềm nguồn mở Greenstone để quản lý tài liệu số của mình và tổ chức phục vụ bạn đọc tra cứu, khai thác tài liệu số
Nhan đề Số lượng trang
Bảng 1.1: Điều tra tình hình số hóa và ứng dụng phần mềm quản trị tài liệu số tại
một số thư viện tỉnh, thành phố
Trang 32Qua khảo sát tại 10 thư viện tỉnh có 04 thư viện đã có phần mềm quản trị tài liệu số, trong đó có 03 thư viện sử dụng phần mềm thương mại là Bình Dương, Gia Lai và Sơn La Thư viện Phú Yên sử dụng phần mềm mã nguồn
mở Greenstone để quản trị bộ sưu tập số
Sáu thư viện còn lại chưa sử dụng phần mềm quản trị tài liệu số, tài liệu
số của các thư viện này chủ yếu được số hóa để bảo quản và "chờ" tìm được phần mềm thích hợp mới mang ra khai thác Do không có phần mềm các thư viện này chưa thể phục vụ được bạn đọc mà mới chỉ lưu trong đĩa quang, ổ cứng Thư viện Thừa Thiên - Huế do chưa có phần mềm nên chưa thống kê được chính xác tên tài liệu và số lượng trang tài liệu đã số hóa
Các phần mềm thương mại đang được sử dụng tại các thư viện công cộng tuy đã đáp ứng được phần nào hoạt động tổ chức, quản lý và khai thác nguồn lực thông tin số nhưng các phần mềm này có giá thành khá cao (từ khoảng 400 triệu đến trên 1 tỷ đồng) Hơn nữa các phần mềm này vẫn còn nhiều lỗi nảy sinh trong quá trình sử dụng Phần mềm nguồn mở Greenstone, DSpace, Zope dù được sử dụng miễn phí nhưng cài đặt và sử dụng phức tạp Về giao diện các phần mềm này nhìn chung chưa thân thiện nên ít được các thư viện công cộng lựa chọn sử dụng
Ứng dụng mã nguồn mở để xây dựng một phần mềm quản trị thư viện số nhỏ gọn, dễ sử dụng, dễ quản trị, giao diện thân thiện và gần gũi với người Việt cho hệ thống thư viện công cộng là thực sự cần thiết vào thời điểm này
1.2.3 Yêu cầu của một phần mềm quản trị tài liệu số cho hệ thống thư viện
công cộng
1.2.3.1 Nhóm yêu cầu về công nghệ
Một phần mềm quản trị tài liệu số được coi là đáp ứng yêu cầu của thư viện khi thỏa mãn các điều kiện sau:
Trang 33- Dễ dàng và thuận tiện trong cài đặt và sử dụng,
- Có thể mở rộng các chức năng theo yêu cầu phát triển trong tương lai,
- Có thể quản lý được số lượng tài liệu lớn với nhiều kiểu dữ liệu số khác nhau, việc tra cứu tìm kiếm thông tin chính xác và nhanh chóng,
- Việc nhập thông tin vào hệ thống có thể được thực hiện từ nhiều máy tính khác nhau, từ nhiều địa điểm khác nhau,
- Phần mềm có thể chạy trên nhiều hệ điều hành như các phiên bản khác nhau của hệ điều hành Windows cũng như Unix hoặc Linux,
- Phần mềm đảm bảo quản lý an toàn dữ liệu ở nhiều mức khác nhau
Những yêu cầu trên đối với một phần mềm quản trị tài liệu số được thể hiện dưới dạng các yêu cầu kỹ thuật như sau:
a Nguyên tắc thiết kế theo module
Xây dựng theo kiến trúc nhiều lớp, hệ thống gồm nhiều module chức năng và được tích hợp thành một hệ thống thống nhất Phần mềm được thiết kế, xây dựng và vận hành trên nguyên tắc mở, đảm bảo khả năng
mở rộng, nâng cấp, bổ sung thêm các module chức năng mới mà không phá vỡ sự ổn định của hệ thống Phần mềm phải đảm bảo được sự kế thừa những thành quả đạt được sau mỗi lần mở rộng, nâng cấp
b Xây dựng theo mô hình khách / chủ
Phần mềm phải đảm bảo được thiết kế và vận hành theo mô hình khách chủ (client/server) để đảm bảo dữ liệu được quản lý tập trung dễ dàng cho việc bảo mật, đồng bộ, sao lưu phục hồi Phần mềm được thiết kế theo mô hình khách chủ còn giúp cho hệ thống có tốc độ xử lý cao hơn, tránh tình trạng quá tải Thiết kế theo mô hình khách chủ còn đảm bảo
Trang 34cho CSDL của hệ thống tập trung, vận hành, bảo trì nhanh chóng, dễ dàng
c Chạy trên nền web và hỗ trợ giao thức TCP/IP
Ứng dụng Web có thời gian phát triển nhanh, với giá thành phát triển
và triển khai thấp, tin cậy, có thể truy cập từ bất cứ đâu trên thế giới, mọi người có thể sử dụng mà không mất thời gian tìm hiểu nhờ giao diện trực quan Hỗ trợ giao thức TCP/IP để đảm bảo khả năng kết nối, chia sẻ dữ liệu trong mạng nội bộ (LAN), mạng toàn cầu (internet)
d Sử dụng hệ quản trị CSDL mô hình quan hệ
Mô hình dữ liệu quan hệ được Codd đề xuất năm 1970 và đến nay trở thành mô hình được sử dụng phổ biến trong các hệ quản trị CSDL Hệ quản trị CSDL mô hình quan hệ có các ưu điểm: cải thiện tính độc lập của dữ liệu và chương trình; tối ưu hóa cách truy xuất dữ liệu; tăng tính bảo mật và toàn vẹn dữ liệu…
e Vận hành ổn định trên nhiều hệ điều hành khác nhau
Hệ thống (gồm cả máy chủ và máy trạm) đảm bảo vận hành ổn định trên nhiều hệ thống khác nhau như: Windows, Linux, MacrOS… Hệ thống có khả năng chạy đồng thời trên nhiều HĐH khác nhau và có thể chuyển đổi hai chiều từ Windows sang Linux, MacrOS… và ngược lại
f Hỗ trợ đa ngôn ngữ (hỗ trợ bảng mã Unicode)
Cả giao diện và bảng mã lưu trữ trong hệ thống đều phải hỗ trợ đa ngôn ngữ, đảm bảo nhập tin, tìm kiếm tài liệu theo bất kỳ ngôn ngữ nào (theo bảng mã Unicode) Hỗ trợ bảng mã Unicode tiêu chuẩn Việt Nam TCVN 6909
Trang 35k An toàn hệ thống và bảo mật dữ liệu
Phần mềm đảm bảo hỗ trợ nhiều mức độ và cơ chế đảm bảo an toàn hệ thống và bảo mật dữ liệu khác nhau Phân quyền chặt chẽ tới người dùng là cán bộ thư viện và người dùng là bạn đọc với nhiều mức độ bảo mật khác nhau Đối với dữ liệu số phần mềm đảm bảo phân quyền đến từng tệp dữ liệu riêng rẽ
l Sao lưu phục hồi dữ liệu
Sao lưu / phục hồi dữ liệu dễ dàng, đảm bảo toàn vẹn dữ liệu cho hệ thống
m Cài đặt, sử dụng dễ dàng
Cán bộ thư viện có khả năng tự cài đặt, cấu hình hệ thống Phần mềm phải có giao diện trực quan, logic và dễ sử dụng
Trang 361.2.3.2 Nhóm yêu cầu về nghiệp vụ thư viện
a DublinCore
Phần mềm hỗ trợ nhập tin theo nhãn trường DublinCore, trao đổi dữ liệu theo DublinCoreXML
b Hỗ trợ nhiều khung phân loại
Phần mềm phải hỗ trợ các khung phân loại phổ biến trên thế giới và Việt Nam
c Kiểm soát trùng biểu ghi
Phần mềm phải có khả năng kiểm soát trùng số ĐKCB, trùng biểu ghi
và thông báo tới cán bộ biên mục
d Hỗ trợ tìm kiếm đa dạng, chính xác
Tìm kiếm theo tất cả các trường nhập tin, kết hợp với việc sử dụng toán
tử logic (AND, OR, NOT) Tìm kiếm không phân biệt chữ hoa, chữ thường
e Có thể duyệt theo chủ đề
Bạn đọc có thể duyệt dữ liệu theo từng chủ đề, theo từng bộ sưu tập số
1.3 Ngôn ngữ lập trình PHP và hệ quản trị cơ sở dữ liệu MySQL
1.3.1 Tổng quan về PHP và MySQL
1.3.1.1 Ngôn ngữ lập trình PHP
Ban đầu PHP được viết tắt bởi cụm từ Personal Home Page PHP được phát triển từ năm 1994 bởi Rasmus Lerdorf Ban đầu PHP chỉ là một bộ đặc tả Perl, được sử dụng để lưu dấu vết người dùng trên các trang web Sau đó Rasmus Lerdorf đã phát triển PHP như là một máy đặc tả (Scripting engine)
Trang 37Tới năm 1997 PHP có bước phát triển vượt bậc, PHP không còn là một dự án
cá nhân của Rasmus Lerdorf mà đã trở thành một công nghệ web quan trọng
và phổ biến Zaeev Suraski và Andi Gusman đã hoàn thiện việc phân tích cú pháp cho ngôn ngữ lập trình này, để rồi đến tháng 6 năm 1998, PHP3 ra đời (phiên bản này các tệp PHP có phần mở rộng là php3)
Ngay sau khi PHP 3.0 chính thức được công bố, Andi Gutmans và Zeev Suraski đã bắt đầu bắt tay vào việc viết lại phần lõi của PHP Mục đích thiết kế là nhằm cải tiến tốc độ xử lý các ứng dụng phức tạp, và cải tiến tính module của cơ sở mã PHP Tháng 5 năm 2000 PHP4 ra đời, ngoài tốc độ xử
lý được cải thiện rất nhiều, PHP 4.0 đem đến các tính năng chủ yếu khác gồm
có sự hỗ trợ nhiều máy chủ Web hơn, hỗ trợ phiên làm việc HTTP, tạo bộ đệm thông tin đầu ra, nhiều cách xử lý thông tin người sử dụng nhập vào bảo mật hơn và cung cấp một vài các cấu trúc ngôn ngữ mới Với PHP 4, số nhà phát triển dùng PHP đã lên đến hàng trăm nghìn và hàng triệu site đã công bố cài đặt PHP, chiếm khoảng 20% số tên miền trên mạng Internet
PHP5 là phiên bản chính thức được sử dụng phổ biến nhất hiện nay, tuy nhiên người dùng đã có thể download PHP6 (phiên bản dùng thử) tại địa chỉ http://snaps.php.net
1.3.1.2 Cơ sở dữ liệu MySQL
MySQL là hệ quản trị cơ sở dữ liệu mã nguồn mở phổ biến nhất thế giới hiện nay, được các nhà phát triển rất ưa chuộng trong quá trình phát triển ứng dụng MySQL là cơ sở dữ liệu tốc độ cao, ổn định và dễ sử dụng, hoạt động trên nhiều hệ điều hành khác nhau, MySQL cung cấp một hệ thống lớn các hàm tiện ích mạnh mẽ Với tốc độ và tính bảo mật cao, MySQL rất thích hợp cho các ứng dụng có truy cập CSDL trên internet MySQL miễn phí hoàn
Trang 38toàn cho nên người dùng có thể tải MySQL về từ trang chủ http://www.mysql.com MySQL có nhiều phiên bản cho các hệ điều hành khác nhau: Windows, Linux, Mac OS, Unix, FreeBSD, NetBSD, Novell NetWare, SGI Irix, Solaris, SunOS,
1.3.2 Lý do lựa chọn PHP và MySQL xây dựng phần mềm quản trị tài liệu số
1.3.3.1 Lý do chọn PHP
Khi sử dụng PHP, người dùng sẽ có được tốc độ nhanh hơn nhiều so với các ngôn ngữ kịch bản khác, bởi PHP là phần mềm mã nguồn mở, được
hỗ trợ bởi nhiều lập trình viên giỏi, có số lượng người dùng đông đảo Ngoài
ra PHP chạy được trên nhiều hệ điều hành khác nhau
Rút ngắn thời gian phát triển: PHP cho phép bạn tách phần HTML code
và phần script, do đó có thể độc lập giữa công việc phát triển mã và thiết kế Điều này vừa giúp lập trình viên dễ dàng hơn vừa có thể làm cho chương trình mềm dẻo hơn khi cần thay đổi giao diện
PHP là phần mềm mã nguồn mở: không chỉ là phần mềm mã nguồn mở
mà còn thực sự miễn phí (kể cả khi bạn sử dụng cho mục đích thương mại)
Do là phần mềm mã nguồn mở, các lỗi (bug) của PHP được công khai và nhanh chóng được sửa chữa bởi nhiều chuyên gia trên toàn thế giới
Tốc độ: nhờ vào sức mạnh của Zend Engine, khi so sánh PHP với ASP,
có thể thấy PHP vượt hơn ở một số bài kiểm tra (test), vượt trội ở tốc độ biên dịch
Tính khả chuyển: PHP được thiết kế để chạy trên nhiều nền tảng khác nhau, có thể làm việc với nhiều phần mềm máy chủ, cơ sở dữ liệu (ví dụ: sản
Trang 39phẩm được phát triển trên nền UNIX, sau đó có thể chuyển sang Windows mà không gặp phải bất cứ vấn đề gì)
1.3.3.2 Lý do chọn MySQL
MySQL không chỉ là cơ sở dữ liệu mã nguồn mở phổ biến nhất trên thế giới, nó còn trở thành cơ sở dữ liệu được chọn cho thế hệ mới của các ứng dụng xây dựng trên nền Linux, Apache, MySQL, PHP/Perl/Python MySQL chạy trên hơn 20 platform bao gồm: Linux, Windows, OS/X, HP-UX, AIX, Netware, mang đến cho người dùng tính linh hoạt trong việc sử dụng
Tính linh hoạt: Máy chủ cơ sở dữ liệu MySQL cung cấp đặc tính linh hoạt, có sức chứa để xử lý các ứng dụng được nhúng sâu với dung lượng chỉ 1MB để chạy các kho dữ liệu đồ sộ lên đến hàng terabytes thông tin Sự linh hoạt về platform là một đặc tính lớn của MySQL với tất cả các phiên bản của Linux, Unix, và Windows đang được hỗ trợ Và dĩ nhiên, tính chất mã nguồn
mở của MySQL cho phép sự tùy biến hoàn toàn theo ý muốn để thêm vào các yêu cầu thích hợp cho database server
Tính thực thi cao: kiến trúc storage-engine cho phép các chuyên gia cơ
sở dữ liệu cấu hình máy chủ cơ sở dữ liệu MySQL đặc trưng cho các ứng dụng đặc thù Dù ứng dụng là một hệ thống xử lý giao dịch tốc độ cao hay website dung lượng lớn phục vụ hàng triệu yêu cầu mỗi ngày, MySQL có thể đáp ứng khả năng xử lý những đòi hỏi khắt khe nhất của bất kì hệ thống nào Với các tiện ích tải tốc độ cao, đặc biệt bộ nhớ đệm (caches), và các cơ chế xử
lý nâng cao khác, MySQL đưa ra tất cả các vũ khí cần phải có cho các hệ thống
Có thể sử dụng ngay: sự tin cậy cao và tính “mì ăn liền” là những tiêu chuẩn đảm bảo của MySQL MySQL đưa ra nhiều tùy chọn có thể dùng ngay
Trang 40từ cấu hình tái tạo chủ/khách tốc độ cao, để các nhà phân phối thứ 3 đưa ra những giải pháp có thể dùng ngay duy nhất cho server cơ sở dữ liệu MySQL
Hỗ trợ giao dịch mạnh: MySQL đưa ra một trong số những engine giao dịch cơ sở dữ liệu mạnh nhất trên thị trường Các đặc trưng bao gồm hỗ trợ giao dịch ACID hoàn thiện ( Atomic – tự động, Consistent – thống nhất, Isolated – độc lập, Durable – bền vững), khóa mức dòng không hạn chế, khả năng giao dịch được phân loại, và hỗ trợ giao dịch đa dạng (multi-version) mà người đọc không bao giờ gây trở ngại cho người viết và ngược lại Tính toàn vẹn của dữ liệu cũng phải được bảo đảm trong suốt quá trình server có hiệu lực, các mức giao dịch độc lập được chuyên môn hóa
Nơi lưu trữ Web và Data đáng tin cậy: MySQL là nơi quản lý, lưu trữ thông tin cho các websites phải trao đổi thường xuyên vì nó có engine xử lý tốc độ cao, khả năng chèn dữ liệu nhanh, hỗ trợ mạnh cho các chức năng chuyên dụng của web như tìm kiếm văn bản nhanh Những tính năng này cũng được áp dụng cho môi trường lưu trữ dữ liệu mà MySQL tăng cường đến hàng terabyte cho các server đơn
Chế độ bảo mật dữ liệu mạnh: vì bảo mật dữ liệu là công việc số một của các chuyên gia về cơ sở dữ liệu, MySQL đưa ra tính năng bảo mật đặc biệt chắc chắn dữ liệu sẽ được bảo mật tuyệt đối Trong việc xác nhận truy cập cơ sở dữ liệu, MySQL cung cấp các kĩ thuật mạnh mà chắc chắn chỉ có người sử dụng đã được xác nhận mới có thể truy nhập được vào server cơ sở
dữ liệu, với khả năng này để chặn người dùng ngay từ mức máy khách là điều
có thể làm được SSH và SSL cũng được hỗ trợ để chắc chắn các kết nối được
an toàn và bảo mật Cuối cùng, tiện ích sao lưu (backup) và phục hồi dữ liệu (recovery) cung cấp bởi MySQL và các hãng phần mềm thứ 3 cho phép sao