Trung tam Thong tin Thu vien, DHQGHNTrương Thị Hồng Quyên * Phạm Thị Thu ** Tóm tắt: Với sự phát triển không ngừng của mạng xã hội, sự ra đời của các thiết bị mới tiên tiến, mọi hoạt độ
Trang 1Trung tam Thong tin Thu vien, DHQGHN
Trương Thị Hồng Quyên *
Phạm Thị Thu **
Tóm tắt: Với sự phát triển không ngừng của mạng xã hội, sự ra đời của
các thiết bị mới tiên tiến, mọi hoạt động thường ngày đang dần được internet hóa.Dẫn đến lượng thông tin ngày càng đa dạng, đã đặt ra thách thức cho các nền công nghiệp khác nhau phải tìm một phương pháp khác để xử lý dữ liệu Big data có thể hiểu là “Dữ liệu lớn” đã ra đời
để giải quyết vấn đề đó.Vậy, Dữ liệu lớn thực chất là gì?Và nó b́t nguồn
từ đâu? Nó tác động như thế nào tới một số hoạt động của Trung tâm Thông tin - Thư viện, ĐHQGHNN (VNU-LIC) trong thời đại cách mạng công nghiệp 4.0 đang phát triển như vũ bão hiện nay.
Từ khóa: Dữ liệu lớn; Công nghiệp 4.0; Thư viện; VNU-LIC.
Đặt vấn đề
Thư viện là nơi lưu giữ và cung cấp tri thức, là kho tàng tri thức của nhân loại Đồng thời, là trung tâm của môi trường giáo dục và nghiên cứu, là cầu nối trung gian giữa người tạo ra tri thức và những người sử dụng tri thức phục vụ cho quá trình học tập, nghiên cứu và sáng tạo… Chính những vai trò quan trọng đó đã một lần nữa khẳng định thư viện
là bộ phận quan trọng không thể thiếu trong các cơ sở giáo dục và đào tạo Thư viện đại học của thế kỷ 21 đã và đang chịu sự tác động mạnh
mẽ của cuộc Cách mạng Công nghiệp 4.0 (CMCN 4.0)
* Trung tâm Thông tin - Thư viện, Đại học Quốc gia Hà Nội.
** Thạc sĩ, Trung tâm Thông tin - Thư viện, Đại học Quốc gia Hà Nội.
Trang 2Trung tam Thong tin Thu vien, DHQGHN
449
TáC đỘng CỦA Big dATA TỚi hoẠT đỘng THƯ VIỆN TẠI TRuNg TÂM THôNg TIN - THƯ VIỆN,
Ngày nay, CMCN 4.0 dẫn đến việc áp dụng công nghệ thông tin
và truyền thông trong hoạt động thư viện là sự đòi hỏi tất yếu Với
sự phát triển không ngừng của mạng xã hội, sự ra đời của các thiết bị mới tiên tiến, mọi hoạt động thường ngày đang dần được Internet hóa Lượng thông tin ngày càng đa dạng đã đặt ra thách thức cho các nền công nghiệp khác nhau, phải tìm phương pháp để xử lý khối lượng dữ liệu khổng lồ và đa dạng về chủng loại Dữ liệu lớn ra đời là giải pháp cho vấn đề trên
Dữ liệu lớn là thuật ngữ dùng để chỉ một tập hợp dữ liệu rất lớn và rất phức tạp mà những công cụ, ứng dụng xử lý dữ liệu truyền thống không thể nào đảm đương được Tuy nhiên, Dữ liệu lớn chứa rất nhiều thông tin quý giá mà nếu trích xuất thành công, nó sẽ giúp rất nhiều cho việc kinh doanh, nghiên cứu khoa học, dự đoán các dịch bệnh sắp phát sinh và thậm chí là cả việc xác định điều kiện giao thông theo thời gian thực Chính vì thế, những dữ liệu này phải được thu thập, tổ chức, lưu trữ, tìm kiếm, chia sẻ theo một cách khác so với bình thường
1 Dữ liệu lớn là gì?
Thế giới đang ngày càng trở nên thông minh hơn, khả năng tiếp cận với khối lượng lớn dữ liệu - từ đó dẫn đến sự hình thành Dữ liệu lớn Có nhiều vấn đề xoay quanh các khối dữ liệu lớn này Chúng ta đều cần phải biết nó là gì và hoạt động như thế nào?
Có nhiều định nghĩa, nhiều góc nhìn về Dữ liệu lớn, theo Wikipediea
Dữ liệu lớn “là thuật ngữ dùng để chỉ một tập hợp dữ liệu rất lớn và rất phức tạp mà những công cụ, ứng dụng xử lý dữ liệu truyền thống không thể nào đảm đương được”.
Nói đến Dữ liệu lớn, người ta thường có thể tìm các câu trả lời cho các câu hỏi này trên Internet; và nói chung đa số sẽ nói về các đặc tính của Dữ liệu lớn đó là 3V chính bao gồm Volume (kích thước), Velocity (tốc độ), Variety (tính đa dạng) và 2V khác bao gồm Veracity (tính xác thực) và Value (giá trị) Dữ liệu lớn đang ngày càng rất nhiều quanh ta là một hiện thực khách quan Trong bối cảnh cuộc cách mạng công nghiệp
Trang 3Trung tam Thong tin Thu vien, DHQGHN
lần thứ tư và thế giới dịch vụ thông minh (smart service world), Dữ liệu lớn có thể được đề cập đến dưới dạng 6C: Connection - Kết nối (cảm biến và mạng); Cloud - Đám mây (tính toán và theo yêu cầu); Cyber - Không gian ảo (mô hình và bộ nhớ); Content - Nội dung/ Bối cảnh (ý nghĩa và tương quan); Community - Cộng đồng (chia sẻ và cộng tác); Custom - Tuỳ chỉnh (cá nhân hoá và giá trị) [10]
Tên gọi “Dữ liệu lớn” khiến đa số chúng ta chỉ hình dung tính chất lớn mà không hình dung về độ phức tạp, nhưng về cơ bản thì hai tính chất này ở Dữ liệu lớn luôn đi cùng nhau Trong đó, tính chất phức tạp còn đặc trưng và thách thức hơn vấn đề độ lớn của dữ liệu Dữ liệu là nguồn chứa hầu hết mọi thông tin của con người, nhưng những thông tin này không hiển thị trực tiếp ra cho chúng ta dùng ngay mà chỉ có thể tìm ra chúng khi phân tích (xử lý) được dữ liệu Đây là một thách thức lớn, là bài toán khó cho hầu khắp các lĩnh vực mà Dữ liệu lớn tác động đến
2 Những tác động của Dữ liệu lớn đối với đời sống xã hội nói chung
và hoạt động thông tin thư viện nói riêng
CMCN 4.0 đang làm thay đổi cách thức sản xuất, chế tạo và hình thành kết nối của hàng tỷ người trên thế giới thông qua các thiết bị di động và khả năng tiếp cận với cơ sở Dữ liệu lớn Trong thế giới toàn cầu hóa ngày nay, các hoạt động hàng ngày của chúng ta đã tạo ra các
dữ liệu một cách liên tục Nhờ những công nghệ đột phá của cách mạng công nghiệp lần thứ tư, lượng dữ liệu này ngày một khổng lồ, liên tục thay đổi và có những tác động trở lại đến hầu hết các lĩnh vực và mọi mặt của đời sống xã hội
Theo dự báo, CMCN 4.0 sẽ tạo ra một lượng lớn dữ liệu, dự kiến đến năm 2020, lượng dữ liệu sẽ tăng gấp 50 lần hiện nay Thông qua thu thập, phân tích và xử lý lượng Dữ liệu lớn này sẽ tạo ra những tri thức mới, hỗ trợ việc đưa ra quyết định của các chủ thể trên thế giới (doanh nghiệp, chính phủ, người dân) [11]
Trang 4Trung tam Thong tin Thu vien, DHQGHN
451
TáC đỘng CỦA Big dATA TỚi hoẠT đỘng THƯ VIỆN TẠI TRuNg TÂM THôNg TIN - THƯ VIỆN,
2.1 Đối với mọi mặt của đ̀i sống xã hội
Với mọi mặt: kinh tế, chính trị, giáo dục… Dữ liệu lớn chứa rất nhiều thông tin quý giá mà nếu trích xuất thành công sẽ giúp rất nhiều cho việc kinh doanh, nghiên cứu khoa học, điều hành đất nước
Việc sử dụng Dữ liệu lớn sẽ dần phổ biến hơn với mọi người, từ những người nông dân cho đến kỹ sư hay các nhà hoạch định chính sách kinh tế của quốc gia Theo Ankur Jain, nhà sáng lập và CEO của Humin (một công ty công nghệ của Mỹ) cho rằng, chúng ta sẽ bắt đầu định tuyến dữ liệu vào các đối tượng, sự vật, sự việc trong đời thực và giúp chúng ta xử lý công việc tốt hơn
Nếu để ý một chút, chúng ta sẽ thấy khi mua sắm online trên eBay, Amazon hoặc những trang tương tự, trang này cũng sẽ đưa ra những sản phẩm gợi ý tiếp theo cho khách hàng Ví dụ khi xem điện thoại, nó sẽ gợi ý cho bạn mua thêm ốp lưng, pin dự phòng; hoặc khi mua áo thun thì sẽ có thêm gợi ý quần jean, dây nịt Do đó, nghiên cứu được sở thích, thói quen của khách hàng cũng gián tiếp giúp doanh nghiệp bán được nhiều hàng hóa hơn Vậy những thông tin về thói quen, sở thích này có được từ đâu? Chính là từ lượng dữ liệu khổng lồ mà các doanh nghiệp thu thập trong lúc khách hàng ghé thăm và tương tác với trang web của mình Chỉ cần doanh nghiệp biết khai thác một cách có hiệu quả Dữ liệu lớn thì nó không chỉ giúp tăng lợi nhuận cho chính họ mà còn tăng trải nghiệm mua sắm của người dùng, chúng ta có thể tiết kiệm thời gian hơn nhờ những lời gợi ý so với việc phải tự mình tìm kiếm [6] Ngoài ra, Dữ liệu lớn còn tác động đến cả hệ thống quyền lực chính trị, điều phối đất nước Kết quả bầu cử Tổng thống Mỹ năm 2016 là một ví dụ điển hình về những tác động mà Dữ liệu lớn can thiệp vào Ứng dụng được Dữ liệu lớn có thể giúp các tổ chức, chính phủ dự đoán được tỉ lệ thất nghiệp, xu hướng nghề nghiệp của tương lai để đầu tư cho những hạng mục đó, hoặc cắt giảm chi tiêu, kích thích tăng trưởng kinh tế, thậm chí là ra phương án phòng ngừa trước một dịch bệnh nào đó Việc phân tích Dữ liệu lớn sẽ giúp các quyết sách của nhà cầm quyền được đưa ra phù hợp với thực tiễn và các đối tượng quản lý; góp phần xây dựng Chính phủ liêm chính, kiến tạo, hành động và phục vụ
Trang 5Trung tam Thong tin Thu vien, DHQGHN
2.2 Đối với hoạt động thư viện
Hiện nay, thư viện đại học trên thế giới đang có những chuyển biến tích cực cùng với sự đổi mới của giáo dục đại học và sự phát triển của CMCN 4.0 Thư viện đại học của thế kỷ 21 sẽ bị ảnh hưởng bởi ba yếu
tố quan trọng, đó là: sự phát triển của công nghệ, đổi mới giáo dục và
sự thay đổi không ngừng của xã hội Thư viện đang thay đổi để đóng vai trò mới, rộng và đầy đủ hơn, theo hướng làm tất cả những gì có thể
để thích ứng và đáp ứng cao nhất nhu cầu về thông tin khoa học phục
vụ học tập, nghiên cứu và giảng dạy
Trong lĩnh vực công nghệ số, liên quan trực tiếp đến lĩnh vực thông tin - thư viện, sự phát triển và ứng dụng của các công nghệ Dữ liệu lớn, Internet vạn vật (Internet of Things) hay Trí tuệ nhân tạo (AI) hứa hẹn mang lại nhiều thay đổi trong việc phát triển và cung cấp các dịch vụ thông tin tới người dùng Thư viện là môi trường ứng dụng các công nghệ số từ rất sớm Từ năm 2004, khái niệm “thư viện không tường”
đã được các nhà nghiên cứu sử dụng để chỉ các thư viện ứng dụng công nghệ thông tin để cung ứng các sản phẩm và dịch vụ thư viện ảo
mà không phụ thuộc vào các thư viện vật lý Những đổi mới về vai trò
và hoạt động của thư viện ngày nay diễn ra rất nhanh chóng, trên một phạm vi rộng lớn và hết sức sâu sắc Thư viện nhìn nhận thực trạng hoạt động tại đơn vị mình để từ đó rút ra kinh nghiệm nhằm thúc đẩy và có hướng xây dựng, phát triển thích ứng với thời đại
2.3 Dữ liệu lớn tác động đến VNU-LIC
- Hạ tầng trang thiết bị công nghệ thông tin
Trong bối cảnh phát triển của khoa học - công nghệ, VNU-LIC
đã chủ động trong nghiên cứu và ứng dụngcông nghệ để đổi mới hoạt động, đáp ứng nhu cầu của người dùng.VNU-LIC đã chủ động tiên phong trong việc nâng cấp, phát triển các sản phẩm và dịch vụ thông tin - thư viện theo hướng tích hợp giải pháp công nghệ hiện đại Công nghệ thông tin và các trang thiết bị thư viện hiện đại thế hệ mới hiện có của VNU-LIC bao gồm: hệ thống mượn, trả sách tự động; trả sách 24/7 với hạ tầng công nghệ thông tin hiện đại (đường truyền Internet Leased
Trang 6Trung tam Thong tin Thu vien, DHQGHN
453
TáC đỘng CỦA Big dATATỚi hoẠT đỘng THƯ VIỆN TẠI TRuNg TÂM THôNg TIN - THƯ VIỆN,
Line 500Mb, 20 IP thực, 15 máy chủ cấu hình cao, 100TB bộ lưu trữ và Backup, 5 LAN ); Cổng an ninh Hibrid; 2 hệ thống số hóa ScanRobot Treventus 2500 trang/giờ đảm bảo cho VNU-LIC vận hành thường xuyên và liên tục hệ thống 24/24h Giai đoạn tới VNU-LIC đang có kế hoạch bổ sung một số trang thiết bị hiện đại khác như giá sách thông minh cùng với một số phần mềm đồng bộ với URD2 như: Aleph (Quản trị hệ thống thư viện tài liệu in tích hợp hiện có hơn 2300 thư viện lớn trên thế giới đang sử dụng); Rosetta (là công cụ để phát triển kho tài sản
số, bao gồm: tạo lập, quản lý, bảo quản, chia sẻ và chuyển giao các bộ sưu tập số),… với định hướng tạo nên một VNU-LIC Dữ liệu lớn (Dữ liệu lớn Center) hướng tới mô hình thư viện số dùng chung cho các thư viện đại học ở Việt Nam Với hạ tầng công nghệ hiện đại, phần mềm quản trị thư viện số, công cụ tìm kiếm đám mây URD2 hiện đại số 1 thế giới và hệ thống CSDL học thuật đỉnh cao, VNU-LIC luôn giữ vị thế hàng đầu trong hệ thống các thư viện đại học Việt Nam, đáp ứng nhu cầu tài liệu học thuật cho nghiên cứu và đào tạo của ĐHQGHN
Để có một công cụ khai thác tài nguyên thông tin khoa học hiệu quả và chuyên nghiệp, cùng một lệnh tìm kiếm có thể truy vấn đến các kho tài liệu trong thư viện và trên thế giới, VNU-LIC đã trang bị sản phẩm cổng giao diện tích hợp kiến thức tìm kiếm tập trung URD2 (Uniied Resource Discovery and Delivery)[5]; phần mềm Bookworm (mượn trả tài liệu số trực tuyến trên thiết bị thông minh smartphone; điện thoại di động…)
- Nguồn nhân lực
Với mục tiêu xây dựng VNU-LIC trở thành một trung tâm dữ liệu hiện đại và thông minh, là nơi cung cấp nguồn thông tin đa ngành đa lĩnh vực Với nhận định tính hiệu quả của hệ thống phụ thuộc rất lớn vào đội ngũ cán bộ tham gia vận hành nó, cùng với sự thay đổi rất rõ
và sâu sắc về chức năng của không gian thư viện, thì các hoạt động cụ thể gắn liền với công tác chuyên môn nghiệp vụ của người làm công tác thư viện cũng cần phải thay đổi cho phù hợp và bắt kịp với thời đại Phải hiểu rõ thế nào là thư viện số, thư viện thông minh, để xây dựng
và phát triển thư viện thông minh cần phải đảm bảo và đáp ứng những
Trang 7Trung tam Thong tin Thu vien, DHQGHN
điều kiện cần và đủ nào? Do đó, vấn đề đào tạo nguồn nhân lực số có trình độ tham gia vào hệ thống công nghệ số là một nhu cầu cấp thiết hàng đầu Nguồn nhân lực của VNU-LIC hiện nay có đặc điểm nổi bật là: số lượng cán bộ làm công tác thư viện ngày càng gia tăng do quy mô đào tạo của VNU và mạng lưới phục vụ ngày càng được mở rộng; cơ cấu trẻ hơn, năng động, sáng tạo và nhiệt huyết hơn…
Hiện nay, đội ngũ cán bộ thư viện của VNU-LIC bên cạnh việc
xử lý thông tin đối với các loại hình tài liệu, đồng thời chủ động tham gia các lớp đào tạo nâng cao về năng lực chuyên môn, tiếp cận các loại hình tài liệu trực tuyến, gắn kết chặt chẽ với đội ngũ cán bộ giảng dạy
và nghiên cứu, chủ động tìm hiểu về các ngành nghề mà VNU đang đào tạo để có những tư vấn phù hợp
- Nguồn lực thông tin
VNU-LIC là một đơn vị trực thuộc VNU, được giao nhiệm vụ đảm bảo tài nguyên thông tin khoa học và công nghệ chất lượng cao, phục vụ đội ngũ cán bộ, giảng viên, nhà nghiên cứu và người học trong và ngoài VNU Vì vậy để hoàn thành nhiệm vụ chính trị quan trọng đó, vượt qua khó khăn, phát huy tính chủ động sáng tạo của mình, VNU-LIC đã định
hướng “Xây dựng Thư viện số nghiên cứu phục vụ đại học định hướng nghiên cứu” và có những bước đi quan trọng đầu tiên như: chuẩn bị
nguồn lực thông tin số, hạ tầng công nghệ, các trang thiết bị thư viện chuyên dụng mới, ứng dụng các phần mềm tiên tiến, phát triển các dịch
vụ thông tin - thư viện hiện đại kết hợp với đào tạo nâng cao trình độ chuyên môn cho đội ngũ cán bộ
Xác định chiến lược để xây dựng một thư viện số thì nguồn lực thông tin trọng yếu ban đầu là tài liệu số và trước hết phải dựa vào nội lực Với đội ngũ cán bộ, giảng viên, nhà nghiên cứu và người học đông đảo (gần 4.000 cán bộ, trên 25.000 người học/năm) thì số lượng tài liệu khoa học nội sinh như các đề tài khoa học, sáng chế, tài liệu hội nghị hội thảo, các bài báo trong nước và quốc tế cùng với luận án, luận văn là rất lớn, đồng thời với hệ thống giáo trình của nhà xuất bản và
11 chuyên san tạp chí khoa học VNU VNU-LIC bước đầu đã xây dựng được một cơ sở dữ liệu tài liệu số học thuật nội sinh với số lượng cả tài
Trang 8Trung tam Thong tin Thu vien, DHQGHN
455
TáC đỘng CỦA Big dATA TỚi hoẠT đỘng THƯ VIỆN TẠI TRuNg TÂM THôNg TIN - THƯ VIỆN,
liệu Born Digital và Digitization lên đến trên 50.000 đối tượng Trong đó: gần 5.000 sách giáo trình và tài liệu tham khảo của nhà xuất bản VNU; Khoảng 1.000 tài liệu Thông tin địa chất và Tài nguyên địa chất Việt Nam; Gần 1.500 đề tài nghiên cứu khoa học cấp Nhà nước và cấp VNU; Khoảng 10.000 Thư tịch cổ Hán Nôm; 26.000 đề tài luận án, luận văn; 4.500 bài báo thuộc Tạp chí nghiên cứu khoa học VNU; 5.000 bài thuộc Kỷ yếu các Hội thảo khoa học,
Ngoài ra, VNU-LIC cũng chú trọng đầu tư kinh phí nâng cấp và mua cơ sở dữ liệu điện tử như: E-book và E-journal, đây là loại hình tài liệu không thể thiếu trong một thư viện đại học nghiên cứu Bên cạnh
đó, VNU-LIC đang phục vụ CSDL MathSciNet của Hội Toán học Mỹ, ScienceDirect của Nhà xuất bản Elsevier, sách điện tử của Springer và hàng nghìn tạp chí truy cập mở khác, Đặc biệt, giai đoạn 2017-2020 VNU-LIC đã có kế hoạch bổ sung thêm các CSDL nổi tiếng khác như Nature, Springer Journal - Ebooks, ACM, Emerald, IG Publishing, để đạt độ phủ cao cho tất cả các ngành / chuyên ngành đào tạo và nghiên cứu của VNU Với nhiều hình thức như: sử dụng kinh phí thường xuyên, kinh phí dự án, tham gia các consortium, liên hệ với đối tác và nhà xuất bản để dùng thử Hiện nay, VNU-LIC có một đội ngũ cán bộ thường xuyên tìm kiếm, khai thác các nguồn cơ sở dữ liệu mở Có thể nói, nguồn Dữ liệu lớn của VNU-LIC là một loại “tài sản tri thức” vô giá, góp phần không nhỏ vào những thành công, cũng như các yêu cầu nghiên cứu và đào tạo của VNU [9]
- Sản phẩm và dịch vụ thông tin
Tăng cường xây dựng các sản phẩm và dịch vụ thông tin mới là một nhiệm vụ được VNU-LIC đặc biệt quan tâm và đẩy mạnh Sản
phẩm thông tin “Hướng dẫn học tập và nghiên cứu theo chủ đề” cho
khoảng 100 ngành đã được hoàn thiện, giúp định hướng thông tin, tìm tài liệu nhanh chóng, rút ngắn quá trình nghiên cứu… được đông đảo bạn đọc sử dụng và đánh giá cao
Hiện nay, VNU-LIC đang triển khai hiệu quả các loại hình dịch vụ gồm: cung cấp thông tin theo yêu cầu;cung cấp tài khoản cơ sở dữ liệu
Trang 9Trung tam Thong tin Thu vien, DHQGHN
điện tử; hỗ trợ trực tuyến Online Chat, Hotline, Email phục vụ miễn phí; dịch vụ đăng ký thành viên của thư viện; dịch vụ số hóa tài liệu; dịch vụ đào tạo kiến thức thông tin; dịch vụ photocopy & scan tài liệu
3 Cơ hội và thách thức đối với VNU-LIC
Sự bùng nổ dữ liệu trong thời đại số đã mang đến nhiều thách thức Khi dữ liệu ngày càng lớn thì nó như một hòn đá tảng, người bê nó sẽ không nhìn thấy đường Việc tập trung xử lý, phân tích các tập Dữ liệu lớn liên quan thì nhận được nhiều thông tin hơn việc phân tích các tập
dữ liệu nhỏ lẻ, đồng thời mở ra hướng sáng tạo mới thay vì chỉ giải quyết các vấn đề được đặt ra trước đó Bởi vậy, vai trò của Dữ liệu lớn trong các xu hướng công nghệ là rất quan trọng Nó được xem là một trong các công nghệ lõi trong CMCN 4.0, là một trong bốn thành phần chính của Internet kết nối vạn vật (IoT)
Dữ liệu lớn được mô tả như loại hàng hóa mới cho nền kinh tế thế
kỷ 21 Tuy nhiên, Dữ liệu lớn cũng có thể bị kẻ xấu lợi dụng để gây ra các ảnh hưởng tiêu cực Do vậy, Dữ liệu lớn đặt ra những cơ hội và các thách thức lớn cả về quản lý và quản trị trong tiến trình tận dụng tiềm năng của nó để mang lại lợi ích to lớn và tích cực cho mọi mặt của đời sống xã hội [1]
Tại chiến lược phát triển VNU đến năm 2020 tầm nhìn năm 2030
đã khẳng định “Trở thành đại học định hướng nghiên cứu, đa ngành,
đa lĩnh vực có tính hội nhập cao, trong đó một số trường đại học, viện nghiên cứu thành viên thuộc các lĩnh vực khoa học cơ bản, công nghệ cao và kinh tế - xã hội mũi nhọn đạt trình độ tiên tiến châu Á”.
Bên cạnh những kết quả, thành tựu, những cơ hội mà VNU-LIC đã kịp thời nắm bắt và đạt được, vẫn còn tồn tại một số hạn chế, thách thức
và khó khăn [3] Cụ thể như sau:
3.1 Thách thức về phần mềm phân tích, xử lý vàlưu trữ Dữ liệu lớn
Cuộc cách mạng về công nghệ thông tin đã làm thay đổi các thư viện từ truyền thống sang hiện đại
Trang 10Trung tam Thong tin Thu vien, DHQGHN
457
TáC đỘng CỦA Big dATA TỚi hoẠT đỘng THƯ VIỆN TẠI TRuNg TÂM THôNg TIN - THƯ VIỆN,
Để có thể nghiên cứu về Dữ liệu lớn, trước tiên cần phải có dữ liệu (data) thật lớn (big), cần chỗ để lưu trữ (acquire) Đây chính là thách thức lớn nhất mà VNU-LIC đang đối mặt Hạ tầng công nghệ thông tin của VNU-LIC chưa đủ mạnh để có thể lưu trữ Dữ liệu lớn Phần mềm lưu trữ Dữ liệu lớn chỉ có thể có ở các công ty lớn như FPT, VCCorp, ACB, CoopMart khi mà họ có số lượng các transaction rất lớn Do đó
ở đây xuất hiện một nghịch lí, đó là các đơn vị nghiên cứu như trường đại học thì lại không có dữ liệu thực để nghiên cứu, trong khi các đơn vị
có dữ liệu thì lại không có đủ chuyên gia Với sự tăng trưởng theo cấp
số nhân của số lượng dữ liệu, các hệ thống thư viện truyền thống không thể đáp ứng được nhu cầu tin của người dùng hiện đại [4]
Việc phân tích Dữ liệu lớn không đúng cách có thể nảy sinh nhiều vấn đề: truy cập dữ liệu, chính sách, bảo mật Với khối lượng dữ liệu khổng lồ mà VNU-LIC đang có, rõ ràng việc lưu trữ và xử lý nó là một thách thức không hề nhỏ, bao gồm thu thập dữ liệu, hiệu chỉnh, lọc nhiễu, mô hình hóa, phân tích đầu ra Hiện tại, hai nền tảng được dùng phổ biến để xử lý Dữ liệu lớn là Hadoop và Spark.Bên cạnh đó, việc quản lý dữ liệu, liên quan đến các vấn đề truy xuất, tính riêng tư, bảo mật cũng là một vấn đề, nhằm chắc chắn rằng dữ liệu đó được sử dụng chính xác, giám sát dữ liệu, quản lý vòng đời của nó
Việc phân tích và xử lý Dữ liệu lớn tại VNU-LIC đang đối mặt với nhiều thách thức:
- Cơ sở hạ tầng và công nghệ
VNU-LIC đã có một cơ sở hạ tầng (phần cứng, phần mềm) Đồng
bộ hóa tất cả các hoạt động thư viện đang gặp khó khăn, VNU-LIC vẫn đang tiến hànhphục vụ loại hình thư viện truyền thống và thư viện số, thông minh Cụ thể, cho quản lý các bộ sưu tập số đơn giản hoặc các phần mềm thư viện trước đó và chính điều này đã làm nảy sinh hai vấn
đề gồm: muốn tạm thời giữ lại và chưa thay thế hoàn toàn; hệ thống mới phải tích hợp được với hệ thống cũ và dữ liệu cũ phải được chuyển đổi