Bài viết tổng quan các quan niệm của các nhà nghiên cứu trên thế giới về ba thuật ngữ chính: Quản trị dữ liệu, Chất lượng dữ liệu, Kiến thức dữ liệu và mối quan hệ giữa quản trị dữ liệu với chất lượng dữ liệu và kiến thức dữ liệu.
Trang 1TỔNG QUAN VỀ QUẢN TRỊ DỮ LIỆU, KIẾN THỨC DỮ LIỆU VÀ
QUẢN LÝ CHẤT LƯỢNG DỮ LIỆU
Ths Nguy ễn Lê Phương Hoài
Viện Thông tin Khoa học xã hội
Tóm tắt: Quản trị dữ liệu và kiến thức dữ liệu là hai khối quan trọng trong nền
tảng kiến thức của các chuyên gia thông tin liên quan đến việc hỗ trợ nghiên cứu chuyên sâu về dữ liệu, cả về chất lượng dữ liệu và quản lý dữ liệu nghiên cứu Áp dụng quản trị
dữ liệu để nghiên cứu quy trình quản lý dữ liệu và đào tạo kiến thức dữ liệu giúp phác
họa các phạm vi quyết định và xác định trách nhiệm giải trình cho việc ra quyết định
Quản trị dữ liệu là một dịch vụ dựa trên các quy trình chuẩn, lặp lại và được thiết kế để cho phép minh bạch các quá trình liên quan đến dữ liệu Quản trị dữ liệu đề cập đến các quy tắc, chính sách, tiêu chuẩn; quyền quyết định; trách nhiệm giải trình và phương pháp
thực thi Dù đã nhận được nhiều sự quan tâm trong các tổ chức thư viện, các cán bộ thư
viện đã có một số kỹ năng về quản trị dữ liệu, song kiến thức về quản trị dữ liệu vẫn là
nền tảng cho các dịch vụ dữ liệu nghiên cứu, nhất là khi nó xuất hiện ở tất cả các mức độ
của dịch vụ dữ liệu nghiên cứu và quản trị dữ liệu có thể áp dụng cho dữ liệu lớn
Từ khóa: Quản trị dữ liệu, Kiến thức dữ liệu, Dịch vụ dữ liệu nghiên cứu
Khoa học chuyên sâu về dữ liệu, cùng với các nhiệm vụ cho kế hoạch quản lý dữ liệu và dữ liệu mở từ các nhà tài trợ nghiên cứu, đã làm tăng sự chú trọng về quản lý dữ liệu nghiên cứu trong cả các thư viện nghiên cứu và các thư viện đại học Các cán bộ thư viện đại học thường được lồng ghép vào quá trình nghiên cứu, trước tiên là trong các dịch
vụ dữ liệu nghiên cứu (research data service - RDSs) Do đó, việc hỗ trợ nghiên cứu
chuyên sâu về dữ liệu là xu hướng hàng đầu trong hoạt động thư viện đại học Đó là tâm điểm đặc biệt vì nó tạo cơ hội để thay đổi thực tế là các giảng viên và các nhà nghiên cứu coi thư viện không phải là nơi hỗ trợ nghiên cứu theo thời gian thực, mà chỉ là một trung tâm phân phối tài liệu
Trang 2Theo Koltay1 và McMillan2, hai yếu tố quan trọng của cơ sở tri thức có ý nghĩa quyết định đối với các chuyên gia thông tin tham gia vào việc hỗ trợ nghiên cứu chuyên
sâu về dữ liệu gồm: quản trị dữ liệu và kiến thức dữ liệu Quản trị dữ liệu (data governance - DG) cho phép cung cấp dịch vụ dữ liệu nghiên cứu tốt hơn Kiến thức dữ liệu, liên quan chặt chẽ đến các dịch vụ dữ liệu nghiên cứu mà bao gồm quản trị dữ liệu
nghiên cứu (research data management - RDM) Khái niệm dịch vụ dữ liệu nghiên cứu
và đào tạo kiến thức dữ liệu đang được các nhà nghiên cứu bàn đến, cho nên mối quan hệ của chúng với quản trị dữ liệu cần được xem xét Bài viết tổng quan các quan niệm của
các nhà nghiên cứu trên thế giới về ba thuật ngữ chính: Quản trị dữ liệu, Chất lượng dữ liệu, Kiến thức dữ liệu và mối quan hệ giữa quản trị dữ liệu với chất lượng dữ liệu và
kiến thức dữ liệu
1 Qu ản trị dữ liệu
Khái niệm Quản trị dữ liệu ít được đề cập trong các tài liệu khoa học thông tin –
thư viện Một số ít tài liệu cho rằng lĩnh vực học thuật, thông tin – thư viện cần quan tâm đến quản trị dữ liệu Điều này được DosSantos nhận định: “Vai trò của nhà quản trị dữ
liệu phải thay đổi giống như một nhân viên dữ liệu để làm cho việc quản trị dữ liệu trở thành động lực đằng sau sự đổi mới kinh doanh, thay vì là trở ngại đối với dữ liệu Mục tiêu này có thể đạt được bằng cách cung cấp công nghệ thông tin như là một dịch vụ và cho phép các quá trình định vị và tổ chức các dữ liệu có sẵn tốt nhất”3
“Quản trị dữ liệu có thể ám chỉ các cơ quan tổ chức; các quy tắc, chính sách, tiêu chuẩn; quyền quyết định; trách nhiệm giải trình và phương pháp thực thi Quản trị dữ liệu cho phép đưa ra quyết định tốt hơn và bảo vệ nhu cầu của các bên liên quan Nó khuyến khích áp dụng các cách tiếp cận phổ biến đối với các vấn đề dữ liệu Quản trị dữ liệu cũng giúp xây dựng các quy trình chuẩn, lặp lại, giảm chi phí và tăng hiệu quả”4
1
Koltay T (2015a), “Data literacy: In search of a name and identity”, Journal of Documentation,
71(2): 401–415
2
MacMillan D (2014), “Data sharing and discovery: What librarians need to know”, Journal of Academic
Librarianship, 40(5): 541–549
3DosSantos J (2015), “What librarians can teach us about managing Big Data”, InFocus
https://infocus.emc.com/joe_dossantos/what-librarians-can-teach-us-about-managing-big-data
4 DGI (2015a), “Definitions of Data Governance”,
http://www.datagovernance.com/adg_data_governance_definition/
Trang 3Các tác giả Khatri & Brown5 và Weill & Ross6 cùng cho rằng quản trị dữ liệu mô
tả các lĩnh vực quyết định, tức là những quyết định phải được thực hiện để đảm bảo quản
lý hiệu quả và sử dụng nguồn lực của tổ chức Quản trị dữ liệu cũng xác định phạm vi trách nhiệm đối với việc ra quyết định bằng cách xác định người có quyền quyết định trong tổ chức và người chịu trách nhiệm về quyết định liên quan đến nguồn lực dữ liệu Seiner cho biết thêm rằng: “Quản trị dữ liệu hợp lệ có thể yêu cầu xác định những người
có trách nhiệm về dữ liệu, họ xác định, tạo ra và sử dụng để hoàn thành công việc hoặc
chức năng của họ Việc quản trị đúng đắn và hiệu quả phụ thuộc nhiều vào công nghệ cũng như về văn hoá tổ chức”7
Trách nhiệm, các thành phần chính của quản lý và tiêu chuẩn hóa, được định nghĩa theo cách thức kiểm tra và cân bằng giữa các nhóm khác nhau, giữa những người tạo ra
và thu thập thông tin, những người quản lý, những người sử dụng và những người đưa ra các tiêu chuẩn và yêu cầu tuân thủ “Quản lý dữ liệu liên quan đến việc đảm bảo các dữ liệu không thuộc quyền quản lý của người sở hữu Do đó các nhà quản lý dữ liệu đại diện cho mối quan tâm của người dùng và đảm bảo rằng các công việc liên quan đến dữ liệu được thực hiện theo các chính sách và quy định đã được xác định Ngược lại, quản trị dữ liệu là một quá trình tổng thể nhằm kết hợp các nhóm chức năng (bao gồm cả người quản
lý dữ liệu) để tạo ra các quy tắc phụ thuộc lẫn nhau hoặc để giải quyết các vấn đề và cung cấp dịch vụ cho các bên liên quan dữ liệu”8
Quản trị dữ liệu hiệu quả cần phải xác định được mục tiêu, xây dựng quy trình và tiêu chuẩn riêng Đồng thời xác định trách nhiệm, vai trò của từng nhân viên quản trị dữ liệu Theo nghĩa quản lý, giám sát và đo lường các khía cạnh khác nhau của một tổ chức, quản trị có thể liên quan đến việc quản lý công nghệ thông tin, nhân lực và các nguồn lực hữu hình khác Dữ liệu ở khắp mọi nơi, do đó quản trị dữ liệu theo chiều rộng Các định nghĩa về dữ liệu và cách sử dụng dữ liệu là một phần của quá trình quản lý dữ liệu, trong
5Khatri V, Brown CV (2010), “Designing data governance”, Communications of the ACM, 53(1): 148–
152
6 Weill P, Ross JW (2004), IT Governance: How Top Performers Manage IT Decision Rights for
Superior Results, Boston, MA: Harvard Business School Press.
7 Seiner RS (2014), Non-Invasive Data Governance: The Path of Least Resistance and Greatest
Success, Basking Ridge, NJ: Technics Publications
8 Rosenbaum S (2010), “Data governance and stewardship: Designing data stewardship entities and
advancing data access”, Health Services Research, 45(5): 1442–1455
Trang 4khi tích hợp dữ liệu và xác định các cá nhân giám sát việc quản lý các quá trình dữ liệu gắn liền với quản trị dữ liệu Quản trị dữ liệu cũng phải bao gồm siêu dữ liệu, dữ liệu phi cấu trúc, đăng ký, phân loại…
Các nguyên tắc truyền thống của quản trị dữ liệu cũng áp dụng cho dữ liệu lớn Trong số các loại dữ liệu lớn, dữ liệu từ Web và từ truyền thông xã hội, hay dữ liệu từ máy tính đến máy tính đều đáng chú ý Quản trị dữ liệu lớn đặc biệt quan trọng đối với
việc sử dụng dữ liệu được chấp nhận Mặc dù tích hợp dữ liệu lớn khác với tích hợp dữ
liệu truyền thống theo nhiều yếu tố, song nó cho thấy sự phức tạp và tầm quan trọng của
quản trị dữ liệu Tích hợp dữ liệu có thể hiểu là sự kết hợp các quy trình kỹ thuật để tổng
hợp dữ liệu từ các nguồn khác nhau thành thông tin có ý nghĩa và có giá trị Tích hợp dữ
liệu giúp làm rõ, làm sạch, giám sát, chuyển đổi và cung cấp dữ liệu, do đó nó cung cấp
dữ liệu đáng tin cậy từ nhiều nguồn khác nhau Tích hợp dữ liệu giải quyết các vấn đề liên quan đến việc kết hợp dữ liệu có xuất xứ đa dạng bằng cách thể hiện một quan điểm
thống nhất về những dữ liệu này
Trong môi trường nghiên cứu, các bên liên quan của quản trị dữ liệu là các nhà nghiên cứu, các viện nghiên cứu, các nhà tài trợ, các nhà xuất bản và công chúng nói chung Am hiểu về quản trị dữ liệu giúp các nhà nghiên cứu yên tâm về các quyền và lợi ích Các cơ cấu quản trị cũng cần thiết cho việc quản lý các dữ liệu liên quan đến con người, bởi vì việc đảm bảo những thông tin cá nhân đòi hỏi không chỉ phải thiết lập các tiêu chuẩn và các quy tắc thực tiễn mà còn thúc đẩy sự thay đổi văn hoá theo hướng quản
lý dữ liệu tốt hơn Ngoài các chức năng này, quản trị dữ liệu trong môi trường nghiên cứu cho phép truy cập và chia sẻ hợp lý ngay cả khi quyền sở hữu dữ liệu thường không rõ ràng, bởi vì người có đóng góp trong các dữ liệu nghiên cứu không chắc là chủ sở hữu dữ
liệu Nhiều kỹ năng của quản trị dữ liệu như xử lý các điều khoản và thỏa thuận cấp phép, cũng như kiến thức về bản quyền đã được các cán bộ thư viện sở hữu
Tựu chung lại, quản trị dữ liệu là điểm khởi đầu cho việc quản lý dữ liệu Một chương trình quản lý dữ liệu chính thức phải cung cấp câu trả lời cho các câu hỏi về khả năng sẵn có, khả năng truy cập, nguồn, giá trị và độ tin cậy Là một phần trách nhiệm trong toàn bộ các thành phần của một tổ chức, quản trị dữ liệu bắt buộc phải cung cấp các cách tiếp cận phối hợp, liên chức năng và tạo điều kiện thực hành tốt nhất Quản trị dữ
liệu ngăn chặn việc lạm dụng tài sản dữ liệu của tổ chức và khuyến khích sử dụng hiệu
quả hơn các tài sản dữ liệu tương tự của chính tổ chức này Am hiểu về bản chất của quản
trị dữ liệu là cơ sở cho dịch vụ dữ liệu nghiên cứu và quản trị dữ liệu phát triển tốt là một trong những điều kiện cần thiết cho dữ liệu mở
Trang 52 Quản lý chất lượng dữ liệu và chất lượng dữ liệu
Quản trị dữ liệu "đảm bảo rằng dữ liệu đáng tin cậy và rằng mọi người có thể phải
chịu trách nhiệm cho bất kỳ sự bất lợi nào xảy ra vì chất lượng kém"9 Quan niệm tương
tự, Khatri và Brown nhấn mạnh: “Quản trị bao gồm việc xác định người trong tổ chức có quyền đặt ra các tiêu chuẩn về chất lượng dữ liệu”10 Quản lý dữ liệu liên quan đến việc xác định các tiêu chuẩn thực tế được áp dụng cho chất lượng dữ liệu, trong khi quản trị
dữ liệu chỉ định người nên đưa ra những tiêu chuẩn này Theo Seiner, “Quản trị dữ liệu chính thức hóa không chỉ hành vi liên quan đến định nghĩa, tổ chức và sử dụng dữ liệu,
mà còn về chất lượng”11 Tương tự, Báo cáo của Information Builders cho rằng quản trị
dữ liệu là một thành phần quan trọng của bất kỳ chiến lược quản lý chất lượng dữ liệu nào Một báo cáo khác có tựa đề Quản trị thông tin thành công thông qua dữ liệu chất lượng cao nhấn mạnh sự thành công của một chương trình quản trị thông tin phụ thuộc
vào chất lượng dữ liệu có thể đạt được nếu chúng ta giảm sự gia tăng của dữ liệu không chính xác hoặc không nhất quán bằng việc phân tích và giám sát liên tục
Chất lượng dữ liệu là một trong những nền tảng của mô hình chuyên sâu về dữ liệu của nghiên cứu khoa học Việc đánh giá dữ liệu đòi hỏi kiến thức chuyên ngành sâu
và đánh giá theo cách truyền thống các bộ dữ liệu rất tốn thời gian và tốn kém, trong khi các phương pháp tiếp cận tự động đang ở giai đoạn sơ khai Trong lĩnh vực học thuật, vấn
đề về chất lượng dữ liệu đã được xây dựng tương đối tỉ mỉ, do đó việc xử lý sâu hơn là không cần thiết Tuy nhiên, các yếu tố đáng chú ý nhất, đó là khả năng sẵn có, khả năng khám phá, độ tin cậy và tính xác thực, khả năng chấp nhận, tính chính xác (bao gồm tính đúng đắn và nhất quán), khả năng áp dụng, toàn vẹn, đầy đủ, dễ hiểu và khả năng sử dụng Rõ ràng là các dịch vụ dữ liệu nghiên cứu được cung cấp bởi các thư viện đại học
có thể đóng vai trò quan trọng như là các trung tâm dữ liệu chất lượng trong trường đại học, bằng cách cung cấp các dịch vụ kiểm tra và kiểm định chất lượng dữ liệu cho các cộng đồng nghiên cứu Mặc dù mối quan tâm cho tính sẵn có của dữ liệu là một yêu cầu
rõ ràng, song việc hướng đến các nhân viên dữ liệu, hiểu biết về cách đánh giá tính xác
9Sarsfield S (2009), The Data Governance Imperative: A Business Strategy for Corporate Data, Ely: IT
Governance
10Khatri V, Brown CV (2010), “Designing data governance”, Communications of the ACM, 53(1): 148–
152
11Seiner RS (2014), Non-Invasive Data Governance: The Path of Least Resistance and Greatest Success,
Basking Ridge, NJ: Technics Publications
Trang 6thực, tính toàn vẹn và tính chính xác của các đối tượng số theo thời gian cũng sẽ có ích Gần đây, Zilinski và Nelson đã xác định một số yếu tố khác của chất lượng dữ liệu như là
phạm vi và sự liên quan đến câu hỏi và định dạng nghiên cứu, bao gồm các trường và các đơn vị được sử dụng, các quy ước đặt tên, ngày tạo và cập nhật Chúng cũng hướng sự chú ý của người dùng đến một tập hợp các thuộc tính kiểm soát chất lượng tương tự như quản trị dữ liệu để trả lời câu hỏi rằng kiểm soát chất lượng được nêu rõ hay không bằng cách tìm hiểu người kiểm tra chất lượng và những quy trình kiểm tra 12
Theo Smith, “Quản trị dữ liệu thành công không chỉ phụ thuộc vào các quy định liên quan đến vai trò nói chung mà còn các trách nhiệm liên quan đến các tiêu chuẩn dữ liệu thích hợp và các môi trường siêu dữ liệu được quản lý Do đó, quản lý siêu dữ liệu là một trong những quá trình quản trị dữ liệu quan trọng liên quan đến chất lượng, cho phép ghi lại nguồn gốc dữ liệu đảm bảo chất lượng được đảm bảo”13
3 Qu ản trị dữ liệu, chất lượng dữ liệu và kiến thức dữ liệu
Mặc dù kiến thức dữ liệu đang trải qua giai đoạn phát triển, song kiến thức dữ liệu mới bắt đầu được chấp nhận rộng rãi như là một khả năng quan trọng cho các chuyên gia thông tin tham gia vào việc hỗ trợ nghiên cứu chuyên sâu về dữ liệu Mặt khác, các thuật ngữ trong lĩnh vực kiến thức dữ liệu vẫn chưa được chuẩn hóa Có kiến thức dữ liệu khoa học và kiến thức dữ liệu nghiên cứu Carlson tranh luận về kiến thức dữ liệu thông tin khác với ý nghĩa hạn chế của kiến thức dữ liệu, tức là khả năng đọc đồ thị và biểu đồ thích hợp, rút ra kết luận chính xác từ dữ liệu và nhận dạng khi dữ liệu được sử dụng theo cách gây hiểu nhầm hoặc không thích hợp 14
Mặc dù các thuật ngữ khác nhau, song định nghĩa cho thấy có điểm chung thống nhất Nhìn vào sự phát triển của các định nghĩa về kiến thức dữ liệu, Fosmire và Miller
đã nói đơn giản về kiến thức thông tin trong thế giới dữ liệu Hai năm sau, kiến thức dữ
12 Zilinski LD, Nelson MS (2014), “Thinking critically about data consumption: Creating the data
credibility checklist”, Proceedings of the American Society for Information Science and Technology,
51(1): 1–4
13Smith AM (2007), “Data governance best practices: The beginning”, EIMInsight (1)1
http://www.eiminstitute.org/library/eimi-archives/volume-1-issue-1-march-2007-edition/data-governance-best-practices-2013-the-beginning
14 Carlson J, Fosmire M, Miller C, (2011), “Determining data information literacy needs: A study of
students and research faculty”, portal: Libraries and the Academy, 11(2): 629–657
Trang 7liệu được định nghĩa rõ ràng là khả năng hiểu, sử dụng và quản lý dữ liệu Theo định nghĩa của Calzada Prado và Marzal, “kiến thức dữ liệu cho phép các cá nhân truy cập, diễn giải, đánh giá, quản lý, xử lý và sử dụng hợp lý dữ liệu”15
Như đã đề cập ở trên, Johnson mô tả kiến thức dữ liệu chi tiết hơn, xác định nó như là khả năng xử lý, sắp xếp và lọc số lượng lớn thông tin, việc này đòi hỏi phải biết cách tìm kiếm, lọc và xử lý để tạo ra và tổng hợp thông tin16 Rõ ràng rằng các thuộc tính này về cơ bản giống với các đặc điểm của kiến thức thông tin khi chúng xuất hiện trong định nghĩa phổ biến và được thừa nhận rộng rãi về kiến thức thông tin, bao gồm khả năng nhận biết nhu cầu thông tin, xác định, định vị, đánh giá và sử dụng thông tin để giải quyết một vấn đề cụ thể
Một số tác giả nhấn mạnh những điểm tương đồng với kiến thức thông tin Khung kiến thức thông tin của Australia và New Zealand, cho thấy những người có kiến thức thông tin có thể thu thập, lưu trữ và phổ biến không chỉ văn bản mà cả dữ liệu nữa17 Andretta đã xác định việc trình bày, đánh giá và diễn giải các dữ liệu định tính và định lượng như là một kết quả học tập của kiến thức thông tin18 Theo Hunt, việc đào tạo kiến thức dữ liệu cần phải vay mượn từ đào tạo kiến thức thông tin, ngay cả khi lĩnh vực kiến thức dữ liệu phổ biến hơn lĩnh vực kiến thức thông tin19 Schneider cũng xác định kiến thức dữ liệu như là một phần của kiến thức thông tin20
15 Calzada Prado JC, Marzal MÁ (2013), “Incorporating data literacy into information literacy programs:
Core competencies and contents”, Libri, 63(2): 123–134
16 Johnson CA (2012), The Information Diet: A Case for Conscious Consumption, Sebastopol,
CA: O’Reilly Media
17 Bundy A (ed.) (2004), Australian and New Zealand Information Literacy Framework,
Adelaide: Australian and New Zealand Institute for Information Literacy
18Andretta S, Pope A, Walton G (2008), “Information Literacy Education in the UK”, Communications in
Information Literacy, 2(1): 36–51
19 Hunt K (2004), “The challenges of integrating data literacy into the curriculum in an undergraduate
institution”, IASSIST Quarterly, 28(2): 12–15,http://www.iassistdata.org/downloads/iqvol282_3hunt.pdf
20Schneider R (2013), “Research data literacy”, In: Kurbanoglu S, (eds) Worldwide Commonalities and
Challenges in Information Literacy Research and Practice, Cham: Springer International, pp 134–140
Trang 8Cả hai mô hình Bảy trụ cột của kiến thức thông tin SCONUL21và thấu kính kiến thức thông tin về Khung phát triển của các nhà nghiên cứu Vitae22 đều nhấn mạnh rằng
để xác định thông tin nào có thể cung cấp tư liệu tốt nhất nhằm đáp ứng nhu cầu tin, tìm kiếm, tạo ra và xử lý với dữ liệu nghiên cứu là rất quan trọng, vì kiến thức thông tin hiện nay không chỉ bao gồm các thông tin được công bố và các dữ liệu cơ bản Điều này phù hợp với cách giải thích thông tin rộng hơn, thừa nhận rằng khái niệm thông tin bao gồm
dữ liệu nghiên cứu Carlson nhấn mạnh rằng mở rộng phạm vi kiến thức thông tin bao gồm quản lý dữ liệu là một sự phát triển hợp lý Si cho rằng các dịch vụ liên quan đến dữ liệu cần được hỗ trợ bởi các chuyên gia giỏi về kiến thức thông tin23
Calzada Prado và Marzal cho biết “Kiến thức thông tin và kiến thức dữ liệu là một phần của sự liên tục giáo dục về khoa học, một quá trình đào tạo bắt đầu ở trường học được hoàn thiện và trở nên chuyên sâu trong đào tạo đại học và trở thành một phần của quá trình học tập suốt đời”24 Hai tác giả cũng xác định được một số tiêu chí về kiến thức thông tin và tiêu chuẩn năng lực kiến thức thông tin cho giáo dục đại học gồm: Xác định
dữ liệu cần thiết; Truy cập các nguồn dữ liệu phù hợp với các thông tin cần thiết; Nhận biết giá trị, phân loại và định dạng dữ liệu nguồn; Đánh giá dữ liệu và nguồn của nó; Lựa chọn và tổng hợp dữ liệu và kết hợp dữ liệu với các nguồn thông tin khác và kiến thức sẵn có; Sử dụng dữ liệu một cách có đạo đức; Áp dụng kết quả để học tập, ra quyết định hoặc giải quyết vấn đề
Họ cũng nhấn mạnh đến khả năng xác định bối cảnh trong đó dữ liệu được tạo ra
và tái sử dụng Bằng cách đề cập đến hai thành phần chính trong vòng đời dữ liệu, chúng phù hợp với quan điểm hiện tại về kiến thức thông tin kết hợp sự hiểu biết về cách thức tạo ra thông tin
21 SCONUL (2011), The SCONUL Seven Pillars of Information Literacy Core Model for Higher
Education, London: Society of College, National and University Libraries Working Group on
Information Literacy http://www.sconul.ac.uk/sites/default/files/documents/coremodel.pdf
22 Vitae (2011), Researcher Development Framework Cambridge: Careers Research and Advisory Centre
https://www.vitae.ac.uk/vitae-publications/rdf-related/researcher-development-framework-rdf-vitae.pdf
23 Si L, Zhuang X, Xing W, (2013), “The cultivation of scientific data specialists”, Library Hi Tech,
31(4): 700–724
24 Calzada Prado JC, Marzal MÁ (2013), “Incorporating data literacy into information literacy programs:
Core competencies and contents”, Libri, 63(2): 123–134
Trang 9Mandinach và Gummer xác định “Kiến thức dữ liệu là khả năng am hiểu và sử
dụng dữ liệu hiệu quả để đưa ra quyết định, kiến thức dữ liệu có vai trò hỗ trợ ra quyết định, do đó kiến thức dữ liệu gắn liền với quản trị dữ liệu” 25
Theo Hiệp hội Thư viện đại học và nghiên cứu (Association of College and Research Libraries), “Kiến thức dữ liệu tập trung vào việc tìm hiểu cách tìm và đánh giá
dữ liệu, nhấn mạnh đến phiên bản của tập dữ liệu nhất định và người chịu trách nhiệm về
nó, các trích dẫn và sử dụng dữ liệu có đạo đức”26
Xem xét tất cả các định nghĩa này, kiến thức dữ liệu có thể được định nghĩa là một
bộ kỹ năng và kiến thức cơ bản, trao quyền cho các cá nhân biến dữ liệu thành thông tin
và thành kiến thức có thể thực hiện bằng cách cho phép họ truy cập, giải thích, đánh giá,
quản lý và sử dụng dữ liệu một cách có đạo đức
Searle xác định kiến thức dữ liệu là một trong các hoạt động dịch vụ dữ liệu nghiên cứu hỗ trợ các nhà nghiên cứu xây dựng các kỹ năng và kiến thức cần thiết để
quản lý dữ liệu hiệu quả27 Do đó, có thể nói rằng kiến thức dữ liệu có liên quan thực tế đến tất cả các quy trình được dịch vụ dữ liệu nghiên cứu quy định, và xây dựng khung chính cho sự tham gia của các thư viện trong việc hỗ trợ mô hình nghiên cứu chuyên sâu
về dữ liệu Các dịch vụ dữ liệu nghiên cứu chắc chắn là toàn diện, do đó bao gồm các khía cạnh của chúng làm cho kiến thức dữ liệu rộng khắp và toàn diện
Khi đặt kiến thức dữ liệu gần với kiến thức thông tin, cần xem xét đến kiến thức thông tin tổng quát Theo Carlson, các chương trình dữ liệu thông tin phải phù hợp với
thực tiễn chuyên ngành và văn hoá hiện nay28 Một nghiên cứu phân tích của Pinto cho
thấy kiến thức thông tin cả trong khoa học y tế và khoa học xã hội đều có 'nhân cách' cụ
25 Mandinach E, Gummer E (2013), “A systemic view of implementing data literacy in educator
preparation”, Educational Researcher, 42(1): 30–37
26ACRL (2013), Intersections of Scholarly Communication and Information Literacy: Creating Strategic
Collaborations for a Changing Academic Environment, Chicago, IL: Association of College and
Research Libraries http://acrl.ala.org/intersections
27 Searle S, Wolski M, Simons N, (2015), “Librarians as partners in research data service development at
Griffith University”, Program, 49(4): 440–460.
28 Carlson J, Fosmire M, Miller C, (2011), “Determining data information literacy needs: A study of
students and research faculty”, portal: Libraries and the Academy, 11(2): 629–657
Trang 10thể riêng29 Nói chung, các phương pháp tiếp cận mới hơn đối với kiến thức thông tin
nhấn mạnh rằng thông tin được sử dụng trong các bối cảnh chuyên ngành khác nhau Farrell và Badke nhấn mạnh: “Để đáp ứng nhu cầu của thời đại thông tin đối với những người xử lý thông tin có trình độ, việc đào tạo kiến thức thông tin phải nằm trong phạm
vi thực tiễn văn hoá xã hội của các ngành bằng việc tập trung mở rộng vào nhận thức
luận và siêu diễn ngôn Kiến thức thông tin thực sự sẽ đòi hỏi các cán bộ thư viện hoặc các giảng viên mời gọi sinh viên vào các ngành học Vì vậy, kiến thức thông tin phải được hiểu là thực hành thông tin thuộc về một ngành học.”30
Kỹ năng kiến thức dữ liệu cũng được xem là một ngành học cụ thể Về kỹ năng và
khả năng cần thiết, những người có kiến thức dữ liệu biết cách chọn và tổng hợp dữ liệu
và kết hợp nó với các nguồn thông tin khác và kiến thức đã có Họ cũng phải nhận ra giá
trị dữ liệu nguồn và làm quen với các loại và định dạng dữ liệu Các kỹ năng khác bao
gồm xác định, thu thập, tổ chức, phân tích, tóm tắt và ưu tiên dữ liệu Xây dựng các giả thuyết, xác định các vấn đề, giải thích dữ liệu, xác định, lập kế hoạch, thực hiện, cũng như giám sát các quá trình hành động cũng gắn liền với các kỹ năng cần thiết và bổ sung thêm cho nhu cầu biến đổi dữ liệu cho các mục đích sử dụng cụ thể
Ridsdale thiết lập một ma trận về năng lực kiến thức dữ liệu với ý định thúc đẩy
một cuộc đối thoại liên tục về các tiêu chuẩn về kiến thức dữ liệu và kết quả học tập trong đào tạo kiến thức dữ liệu Hoạt động có lẽ quan trọng nhất trong ma trận này là đánh giá
chất lượng, bao gồm việc đánh giá các nguồn dữ liệu cho độ tin cậy và sai sót hoặc các
vấn đề Việc đánh giá xuất hiện trong quá trình thu thập dữ liệu và giải thích dữ liệu rõ ràng cho thấy các cơ chế cũng đặc trưng cho kiến thức thông tin Ngay cả việc hiển thị dữ
liệu bao gồm đánh giá các biểu thị đồ họa về dữ liệu.31
Một chương trình học về kiến thức dữ liệu thí điểm tại Đại học Purdue được xây
dựng dựa trên các kỹ năng lập kế hoạch; mô hình vòng đời; khám phá và thu nhận; mô tả
29 Pinto M, Pulgarin A, Escalona M (2014), “Viewing information literacy concepts: A comparison of two
branches of knowledge”, Scientometrics, 98(3): 231–232
30 Farrell R, Badke W (2015), “Situating information literacy in the disciplines”, Reference Services
Review, 43(2): 319–340
31
Ridsdale C, Rothwell J, Smit M, (2015), “Strategies and Best Practices for Data Literacy Education Knowledge Synthesis Report”, Halifax, NS: Dalhousie University