1. Trang chủ
  2. » Luận Văn - Báo Cáo

Tổng quan về quản trị dữ liệu, kiến thức dữ liệu và quản lý chất lượng dữ liệu

15 6 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 15
Dung lượng 215,48 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Bài viết tổng quan các quan niệm của các nhà nghiên cứu trên thế giới về ba thuật ngữ chính: Quản trị dữ liệu, Chất lượng dữ liệu, Kiến thức dữ liệu và mối quan hệ giữa quản trị dữ liệu với chất lượng dữ liệu và kiến thức dữ liệu.

Trang 1

TỔNG QUAN VỀ QUẢN TRỊ DỮ LIỆU, KIẾN THỨC DỮ LIỆU VÀ

QUẢN LÝ CHẤT LƯỢNG DỮ LIỆU

Ths Nguy ễn Lê Phương Hoài

Viện Thông tin Khoa học xã hội

Tóm tắt: Quản trị dữ liệu và kiến thức dữ liệu là hai khối quan trọng trong nền

tảng kiến thức của các chuyên gia thông tin liên quan đến việc hỗ trợ nghiên cứu chuyên sâu về dữ liệu, cả về chất lượng dữ liệu và quản lý dữ liệu nghiên cứu Áp dụng quản trị

dữ liệu để nghiên cứu quy trình quản lý dữ liệu và đào tạo kiến thức dữ liệu giúp phác

họa các phạm vi quyết định và xác định trách nhiệm giải trình cho việc ra quyết định

Quản trị dữ liệu là một dịch vụ dựa trên các quy trình chuẩn, lặp lại và được thiết kế để cho phép minh bạch các quá trình liên quan đến dữ liệu Quản trị dữ liệu đề cập đến các quy tắc, chính sách, tiêu chuẩn; quyền quyết định; trách nhiệm giải trình và phương pháp

thực thi Dù đã nhận được nhiều sự quan tâm trong các tổ chức thư viện, các cán bộ thư

viện đã có một số kỹ năng về quản trị dữ liệu, song kiến thức về quản trị dữ liệu vẫn là

nền tảng cho các dịch vụ dữ liệu nghiên cứu, nhất là khi nó xuất hiện ở tất cả các mức độ

của dịch vụ dữ liệu nghiên cứu và quản trị dữ liệu có thể áp dụng cho dữ liệu lớn

Từ khóa: Quản trị dữ liệu, Kiến thức dữ liệu, Dịch vụ dữ liệu nghiên cứu

Khoa học chuyên sâu về dữ liệu, cùng với các nhiệm vụ cho kế hoạch quản lý dữ liệu và dữ liệu mở từ các nhà tài trợ nghiên cứu, đã làm tăng sự chú trọng về quản lý dữ liệu nghiên cứu trong cả các thư viện nghiên cứu và các thư viện đại học Các cán bộ thư viện đại học thường được lồng ghép vào quá trình nghiên cứu, trước tiên là trong các dịch

vụ dữ liệu nghiên cứu (research data service - RDSs) Do đó, việc hỗ trợ nghiên cứu

chuyên sâu về dữ liệu là xu hướng hàng đầu trong hoạt động thư viện đại học Đó là tâm điểm đặc biệt vì nó tạo cơ hội để thay đổi thực tế là các giảng viên và các nhà nghiên cứu coi thư viện không phải là nơi hỗ trợ nghiên cứu theo thời gian thực, mà chỉ là một trung tâm phân phối tài liệu

Trang 2

Theo Koltay1 và McMillan2, hai yếu tố quan trọng của cơ sở tri thức có ý nghĩa quyết định đối với các chuyên gia thông tin tham gia vào việc hỗ trợ nghiên cứu chuyên

sâu về dữ liệu gồm: quản trị dữ liệu và kiến thức dữ liệu Quản trị dữ liệu (data governance - DG) cho phép cung cấp dịch vụ dữ liệu nghiên cứu tốt hơn Kiến thức dữ liệu, liên quan chặt chẽ đến các dịch vụ dữ liệu nghiên cứu mà bao gồm quản trị dữ liệu

nghiên cứu (research data management - RDM) Khái niệm dịch vụ dữ liệu nghiên cứu

và đào tạo kiến thức dữ liệu đang được các nhà nghiên cứu bàn đến, cho nên mối quan hệ của chúng với quản trị dữ liệu cần được xem xét Bài viết tổng quan các quan niệm của

các nhà nghiên cứu trên thế giới về ba thuật ngữ chính: Quản trị dữ liệu, Chất lượng dữ liệu, Kiến thức dữ liệu và mối quan hệ giữa quản trị dữ liệu với chất lượng dữ liệu và

kiến thức dữ liệu

1 Qu ản trị dữ liệu

Khái niệm Quản trị dữ liệu ít được đề cập trong các tài liệu khoa học thông tin –

thư viện Một số ít tài liệu cho rằng lĩnh vực học thuật, thông tin – thư viện cần quan tâm đến quản trị dữ liệu Điều này được DosSantos nhận định: “Vai trò của nhà quản trị dữ

liệu phải thay đổi giống như một nhân viên dữ liệu để làm cho việc quản trị dữ liệu trở thành động lực đằng sau sự đổi mới kinh doanh, thay vì là trở ngại đối với dữ liệu Mục tiêu này có thể đạt được bằng cách cung cấp công nghệ thông tin như là một dịch vụ và cho phép các quá trình định vị và tổ chức các dữ liệu có sẵn tốt nhất”3

“Quản trị dữ liệu có thể ám chỉ các cơ quan tổ chức; các quy tắc, chính sách, tiêu chuẩn; quyền quyết định; trách nhiệm giải trình và phương pháp thực thi Quản trị dữ liệu cho phép đưa ra quyết định tốt hơn và bảo vệ nhu cầu của các bên liên quan Nó khuyến khích áp dụng các cách tiếp cận phổ biến đối với các vấn đề dữ liệu Quản trị dữ liệu cũng giúp xây dựng các quy trình chuẩn, lặp lại, giảm chi phí và tăng hiệu quả”4

1

Koltay T (2015a), “Data literacy: In search of a name and identity”, Journal of Documentation,

71(2): 401–415

2

MacMillan D (2014), “Data sharing and discovery: What librarians need to know”, Journal of Academic

Librarianship, 40(5): 541–549

3DosSantos J (2015), “What librarians can teach us about managing Big Data”, InFocus

https://infocus.emc.com/joe_dossantos/what-librarians-can-teach-us-about-managing-big-data

4 DGI (2015a), “Definitions of Data Governance”,

http://www.datagovernance.com/adg_data_governance_definition/

Trang 3

Các tác giả Khatri & Brown5 và Weill & Ross6 cùng cho rằng quản trị dữ liệu mô

tả các lĩnh vực quyết định, tức là những quyết định phải được thực hiện để đảm bảo quản

lý hiệu quả và sử dụng nguồn lực của tổ chức Quản trị dữ liệu cũng xác định phạm vi trách nhiệm đối với việc ra quyết định bằng cách xác định người có quyền quyết định trong tổ chức và người chịu trách nhiệm về quyết định liên quan đến nguồn lực dữ liệu Seiner cho biết thêm rằng: “Quản trị dữ liệu hợp lệ có thể yêu cầu xác định những người

có trách nhiệm về dữ liệu, họ xác định, tạo ra và sử dụng để hoàn thành công việc hoặc

chức năng của họ Việc quản trị đúng đắn và hiệu quả phụ thuộc nhiều vào công nghệ cũng như về văn hoá tổ chức”7

Trách nhiệm, các thành phần chính của quản lý và tiêu chuẩn hóa, được định nghĩa theo cách thức kiểm tra và cân bằng giữa các nhóm khác nhau, giữa những người tạo ra

và thu thập thông tin, những người quản lý, những người sử dụng và những người đưa ra các tiêu chuẩn và yêu cầu tuân thủ “Quản lý dữ liệu liên quan đến việc đảm bảo các dữ liệu không thuộc quyền quản lý của người sở hữu Do đó các nhà quản lý dữ liệu đại diện cho mối quan tâm của người dùng và đảm bảo rằng các công việc liên quan đến dữ liệu được thực hiện theo các chính sách và quy định đã được xác định Ngược lại, quản trị dữ liệu là một quá trình tổng thể nhằm kết hợp các nhóm chức năng (bao gồm cả người quản

lý dữ liệu) để tạo ra các quy tắc phụ thuộc lẫn nhau hoặc để giải quyết các vấn đề và cung cấp dịch vụ cho các bên liên quan dữ liệu”8

Quản trị dữ liệu hiệu quả cần phải xác định được mục tiêu, xây dựng quy trình và tiêu chuẩn riêng Đồng thời xác định trách nhiệm, vai trò của từng nhân viên quản trị dữ liệu Theo nghĩa quản lý, giám sát và đo lường các khía cạnh khác nhau của một tổ chức, quản trị có thể liên quan đến việc quản lý công nghệ thông tin, nhân lực và các nguồn lực hữu hình khác Dữ liệu ở khắp mọi nơi, do đó quản trị dữ liệu theo chiều rộng Các định nghĩa về dữ liệu và cách sử dụng dữ liệu là một phần của quá trình quản lý dữ liệu, trong

5Khatri V, Brown CV (2010), “Designing data governance”, Communications of the ACM, 53(1): 148–

152

6 Weill P, Ross JW (2004), IT Governance: How Top Performers Manage IT Decision Rights for

Superior Results, Boston, MA: Harvard Business School Press.

7 Seiner RS (2014), Non-Invasive Data Governance: The Path of Least Resistance and Greatest

Success, Basking Ridge, NJ: Technics Publications

8 Rosenbaum S (2010), “Data governance and stewardship: Designing data stewardship entities and

advancing data access”, Health Services Research, 45(5): 1442–1455

Trang 4

khi tích hợp dữ liệu và xác định các cá nhân giám sát việc quản lý các quá trình dữ liệu gắn liền với quản trị dữ liệu Quản trị dữ liệu cũng phải bao gồm siêu dữ liệu, dữ liệu phi cấu trúc, đăng ký, phân loại…

Các nguyên tắc truyền thống của quản trị dữ liệu cũng áp dụng cho dữ liệu lớn Trong số các loại dữ liệu lớn, dữ liệu từ Web và từ truyền thông xã hội, hay dữ liệu từ máy tính đến máy tính đều đáng chú ý Quản trị dữ liệu lớn đặc biệt quan trọng đối với

việc sử dụng dữ liệu được chấp nhận Mặc dù tích hợp dữ liệu lớn khác với tích hợp dữ

liệu truyền thống theo nhiều yếu tố, song nó cho thấy sự phức tạp và tầm quan trọng của

quản trị dữ liệu Tích hợp dữ liệu có thể hiểu là sự kết hợp các quy trình kỹ thuật để tổng

hợp dữ liệu từ các nguồn khác nhau thành thông tin có ý nghĩa và có giá trị Tích hợp dữ

liệu giúp làm rõ, làm sạch, giám sát, chuyển đổi và cung cấp dữ liệu, do đó nó cung cấp

dữ liệu đáng tin cậy từ nhiều nguồn khác nhau Tích hợp dữ liệu giải quyết các vấn đề liên quan đến việc kết hợp dữ liệu có xuất xứ đa dạng bằng cách thể hiện một quan điểm

thống nhất về những dữ liệu này

Trong môi trường nghiên cứu, các bên liên quan của quản trị dữ liệu là các nhà nghiên cứu, các viện nghiên cứu, các nhà tài trợ, các nhà xuất bản và công chúng nói chung Am hiểu về quản trị dữ liệu giúp các nhà nghiên cứu yên tâm về các quyền và lợi ích Các cơ cấu quản trị cũng cần thiết cho việc quản lý các dữ liệu liên quan đến con người, bởi vì việc đảm bảo những thông tin cá nhân đòi hỏi không chỉ phải thiết lập các tiêu chuẩn và các quy tắc thực tiễn mà còn thúc đẩy sự thay đổi văn hoá theo hướng quản

lý dữ liệu tốt hơn Ngoài các chức năng này, quản trị dữ liệu trong môi trường nghiên cứu cho phép truy cập và chia sẻ hợp lý ngay cả khi quyền sở hữu dữ liệu thường không rõ ràng, bởi vì người có đóng góp trong các dữ liệu nghiên cứu không chắc là chủ sở hữu dữ

liệu Nhiều kỹ năng của quản trị dữ liệu như xử lý các điều khoản và thỏa thuận cấp phép, cũng như kiến thức về bản quyền đã được các cán bộ thư viện sở hữu

Tựu chung lại, quản trị dữ liệu là điểm khởi đầu cho việc quản lý dữ liệu Một chương trình quản lý dữ liệu chính thức phải cung cấp câu trả lời cho các câu hỏi về khả năng sẵn có, khả năng truy cập, nguồn, giá trị và độ tin cậy Là một phần trách nhiệm trong toàn bộ các thành phần của một tổ chức, quản trị dữ liệu bắt buộc phải cung cấp các cách tiếp cận phối hợp, liên chức năng và tạo điều kiện thực hành tốt nhất Quản trị dữ

liệu ngăn chặn việc lạm dụng tài sản dữ liệu của tổ chức và khuyến khích sử dụng hiệu

quả hơn các tài sản dữ liệu tương tự của chính tổ chức này Am hiểu về bản chất của quản

trị dữ liệu là cơ sở cho dịch vụ dữ liệu nghiên cứu và quản trị dữ liệu phát triển tốt là một trong những điều kiện cần thiết cho dữ liệu mở

Trang 5

2 Quản lý chất lượng dữ liệu và chất lượng dữ liệu

Quản trị dữ liệu "đảm bảo rằng dữ liệu đáng tin cậy và rằng mọi người có thể phải

chịu trách nhiệm cho bất kỳ sự bất lợi nào xảy ra vì chất lượng kém"9 Quan niệm tương

tự, Khatri và Brown nhấn mạnh: “Quản trị bao gồm việc xác định người trong tổ chức có quyền đặt ra các tiêu chuẩn về chất lượng dữ liệu”10 Quản lý dữ liệu liên quan đến việc xác định các tiêu chuẩn thực tế được áp dụng cho chất lượng dữ liệu, trong khi quản trị

dữ liệu chỉ định người nên đưa ra những tiêu chuẩn này Theo Seiner, “Quản trị dữ liệu chính thức hóa không chỉ hành vi liên quan đến định nghĩa, tổ chức và sử dụng dữ liệu,

mà còn về chất lượng”11 Tương tự, Báo cáo của Information Builders cho rằng quản trị

dữ liệu là một thành phần quan trọng của bất kỳ chiến lược quản lý chất lượng dữ liệu nào Một báo cáo khác có tựa đề Quản trị thông tin thành công thông qua dữ liệu chất lượng cao nhấn mạnh sự thành công của một chương trình quản trị thông tin phụ thuộc

vào chất lượng dữ liệu có thể đạt được nếu chúng ta giảm sự gia tăng của dữ liệu không chính xác hoặc không nhất quán bằng việc phân tích và giám sát liên tục

Chất lượng dữ liệu là một trong những nền tảng của mô hình chuyên sâu về dữ liệu của nghiên cứu khoa học Việc đánh giá dữ liệu đòi hỏi kiến thức chuyên ngành sâu

và đánh giá theo cách truyền thống các bộ dữ liệu rất tốn thời gian và tốn kém, trong khi các phương pháp tiếp cận tự động đang ở giai đoạn sơ khai Trong lĩnh vực học thuật, vấn

đề về chất lượng dữ liệu đã được xây dựng tương đối tỉ mỉ, do đó việc xử lý sâu hơn là không cần thiết Tuy nhiên, các yếu tố đáng chú ý nhất, đó là khả năng sẵn có, khả năng khám phá, độ tin cậy và tính xác thực, khả năng chấp nhận, tính chính xác (bao gồm tính đúng đắn và nhất quán), khả năng áp dụng, toàn vẹn, đầy đủ, dễ hiểu và khả năng sử dụng Rõ ràng là các dịch vụ dữ liệu nghiên cứu được cung cấp bởi các thư viện đại học

có thể đóng vai trò quan trọng như là các trung tâm dữ liệu chất lượng trong trường đại học, bằng cách cung cấp các dịch vụ kiểm tra và kiểm định chất lượng dữ liệu cho các cộng đồng nghiên cứu Mặc dù mối quan tâm cho tính sẵn có của dữ liệu là một yêu cầu

rõ ràng, song việc hướng đến các nhân viên dữ liệu, hiểu biết về cách đánh giá tính xác

9Sarsfield S (2009), The Data Governance Imperative: A Business Strategy for Corporate Data, Ely: IT

Governance

10Khatri V, Brown CV (2010), “Designing data governance”, Communications of the ACM, 53(1): 148–

152

11Seiner RS (2014), Non-Invasive Data Governance: The Path of Least Resistance and Greatest Success,

Basking Ridge, NJ: Technics Publications

Trang 6

thực, tính toàn vẹn và tính chính xác của các đối tượng số theo thời gian cũng sẽ có ích Gần đây, Zilinski và Nelson đã xác định một số yếu tố khác của chất lượng dữ liệu như là

phạm vi và sự liên quan đến câu hỏi và định dạng nghiên cứu, bao gồm các trường và các đơn vị được sử dụng, các quy ước đặt tên, ngày tạo và cập nhật Chúng cũng hướng sự chú ý của người dùng đến một tập hợp các thuộc tính kiểm soát chất lượng tương tự như quản trị dữ liệu để trả lời câu hỏi rằng kiểm soát chất lượng được nêu rõ hay không bằng cách tìm hiểu người kiểm tra chất lượng và những quy trình kiểm tra 12

Theo Smith, “Quản trị dữ liệu thành công không chỉ phụ thuộc vào các quy định liên quan đến vai trò nói chung mà còn các trách nhiệm liên quan đến các tiêu chuẩn dữ liệu thích hợp và các môi trường siêu dữ liệu được quản lý Do đó, quản lý siêu dữ liệu là một trong những quá trình quản trị dữ liệu quan trọng liên quan đến chất lượng, cho phép ghi lại nguồn gốc dữ liệu đảm bảo chất lượng được đảm bảo”13

3 Qu ản trị dữ liệu, chất lượng dữ liệu và kiến thức dữ liệu

Mặc dù kiến thức dữ liệu đang trải qua giai đoạn phát triển, song kiến thức dữ liệu mới bắt đầu được chấp nhận rộng rãi như là một khả năng quan trọng cho các chuyên gia thông tin tham gia vào việc hỗ trợ nghiên cứu chuyên sâu về dữ liệu Mặt khác, các thuật ngữ trong lĩnh vực kiến thức dữ liệu vẫn chưa được chuẩn hóa Có kiến thức dữ liệu khoa học và kiến thức dữ liệu nghiên cứu Carlson tranh luận về kiến thức dữ liệu thông tin khác với ý nghĩa hạn chế của kiến thức dữ liệu, tức là khả năng đọc đồ thị và biểu đồ thích hợp, rút ra kết luận chính xác từ dữ liệu và nhận dạng khi dữ liệu được sử dụng theo cách gây hiểu nhầm hoặc không thích hợp 14

Mặc dù các thuật ngữ khác nhau, song định nghĩa cho thấy có điểm chung thống nhất Nhìn vào sự phát triển của các định nghĩa về kiến thức dữ liệu, Fosmire và Miller

đã nói đơn giản về kiến thức thông tin trong thế giới dữ liệu Hai năm sau, kiến thức dữ

12 Zilinski LD, Nelson MS (2014), “Thinking critically about data consumption: Creating the data

credibility checklist”, Proceedings of the American Society for Information Science and Technology,

51(1): 1–4

13Smith AM (2007), “Data governance best practices: The beginning”, EIMInsight (1)1

http://www.eiminstitute.org/library/eimi-archives/volume-1-issue-1-march-2007-edition/data-governance-best-practices-2013-the-beginning

14 Carlson J, Fosmire M, Miller C, (2011), “Determining data information literacy needs: A study of

students and research faculty”, portal: Libraries and the Academy, 11(2): 629–657

Trang 7

liệu được định nghĩa rõ ràng là khả năng hiểu, sử dụng và quản lý dữ liệu Theo định nghĩa của Calzada Prado và Marzal, “kiến thức dữ liệu cho phép các cá nhân truy cập, diễn giải, đánh giá, quản lý, xử lý và sử dụng hợp lý dữ liệu”15

Như đã đề cập ở trên, Johnson mô tả kiến thức dữ liệu chi tiết hơn, xác định nó như là khả năng xử lý, sắp xếp và lọc số lượng lớn thông tin, việc này đòi hỏi phải biết cách tìm kiếm, lọc và xử lý để tạo ra và tổng hợp thông tin16 Rõ ràng rằng các thuộc tính này về cơ bản giống với các đặc điểm của kiến thức thông tin khi chúng xuất hiện trong định nghĩa phổ biến và được thừa nhận rộng rãi về kiến thức thông tin, bao gồm khả năng nhận biết nhu cầu thông tin, xác định, định vị, đánh giá và sử dụng thông tin để giải quyết một vấn đề cụ thể

Một số tác giả nhấn mạnh những điểm tương đồng với kiến thức thông tin Khung kiến thức thông tin của Australia và New Zealand, cho thấy những người có kiến thức thông tin có thể thu thập, lưu trữ và phổ biến không chỉ văn bản mà cả dữ liệu nữa17 Andretta đã xác định việc trình bày, đánh giá và diễn giải các dữ liệu định tính và định lượng như là một kết quả học tập của kiến thức thông tin18 Theo Hunt, việc đào tạo kiến thức dữ liệu cần phải vay mượn từ đào tạo kiến thức thông tin, ngay cả khi lĩnh vực kiến thức dữ liệu phổ biến hơn lĩnh vực kiến thức thông tin19 Schneider cũng xác định kiến thức dữ liệu như là một phần của kiến thức thông tin20

15 Calzada Prado JC, Marzal MÁ (2013), “Incorporating data literacy into information literacy programs:

Core competencies and contents”, Libri, 63(2): 123–134

16 Johnson CA (2012), The Information Diet: A Case for Conscious Consumption, Sebastopol,

CA: O’Reilly Media

17 Bundy A (ed.) (2004), Australian and New Zealand Information Literacy Framework,

Adelaide: Australian and New Zealand Institute for Information Literacy

18Andretta S, Pope A, Walton G (2008), “Information Literacy Education in the UK”, Communications in

Information Literacy, 2(1): 36–51

19 Hunt K (2004), “The challenges of integrating data literacy into the curriculum in an undergraduate

institution”, IASSIST Quarterly, 28(2): 12–15,http://www.iassistdata.org/downloads/iqvol282_3hunt.pdf

20Schneider R (2013), “Research data literacy”, In: Kurbanoglu S, (eds) Worldwide Commonalities and

Challenges in Information Literacy Research and Practice, Cham: Springer International, pp 134–140

Trang 8

Cả hai mô hình Bảy trụ cột của kiến thức thông tin SCONUL21và thấu kính kiến thức thông tin về Khung phát triển của các nhà nghiên cứu Vitae22 đều nhấn mạnh rằng

để xác định thông tin nào có thể cung cấp tư liệu tốt nhất nhằm đáp ứng nhu cầu tin, tìm kiếm, tạo ra và xử lý với dữ liệu nghiên cứu là rất quan trọng, vì kiến thức thông tin hiện nay không chỉ bao gồm các thông tin được công bố và các dữ liệu cơ bản Điều này phù hợp với cách giải thích thông tin rộng hơn, thừa nhận rằng khái niệm thông tin bao gồm

dữ liệu nghiên cứu Carlson nhấn mạnh rằng mở rộng phạm vi kiến thức thông tin bao gồm quản lý dữ liệu là một sự phát triển hợp lý Si cho rằng các dịch vụ liên quan đến dữ liệu cần được hỗ trợ bởi các chuyên gia giỏi về kiến thức thông tin23

Calzada Prado và Marzal cho biết “Kiến thức thông tin và kiến thức dữ liệu là một phần của sự liên tục giáo dục về khoa học, một quá trình đào tạo bắt đầu ở trường học được hoàn thiện và trở nên chuyên sâu trong đào tạo đại học và trở thành một phần của quá trình học tập suốt đời”24 Hai tác giả cũng xác định được một số tiêu chí về kiến thức thông tin và tiêu chuẩn năng lực kiến thức thông tin cho giáo dục đại học gồm: Xác định

dữ liệu cần thiết; Truy cập các nguồn dữ liệu phù hợp với các thông tin cần thiết; Nhận biết giá trị, phân loại và định dạng dữ liệu nguồn; Đánh giá dữ liệu và nguồn của nó; Lựa chọn và tổng hợp dữ liệu và kết hợp dữ liệu với các nguồn thông tin khác và kiến thức sẵn có; Sử dụng dữ liệu một cách có đạo đức; Áp dụng kết quả để học tập, ra quyết định hoặc giải quyết vấn đề

Họ cũng nhấn mạnh đến khả năng xác định bối cảnh trong đó dữ liệu được tạo ra

và tái sử dụng Bằng cách đề cập đến hai thành phần chính trong vòng đời dữ liệu, chúng phù hợp với quan điểm hiện tại về kiến thức thông tin kết hợp sự hiểu biết về cách thức tạo ra thông tin

21 SCONUL (2011), The SCONUL Seven Pillars of Information Literacy Core Model for Higher

Education, London: Society of College, National and University Libraries Working Group on

Information Literacy http://www.sconul.ac.uk/sites/default/files/documents/coremodel.pdf

22 Vitae (2011), Researcher Development Framework Cambridge: Careers Research and Advisory Centre

https://www.vitae.ac.uk/vitae-publications/rdf-related/researcher-development-framework-rdf-vitae.pdf

23 Si L, Zhuang X, Xing W, (2013), “The cultivation of scientific data specialists”, Library Hi Tech,

31(4): 700–724

24 Calzada Prado JC, Marzal MÁ (2013), “Incorporating data literacy into information literacy programs:

Core competencies and contents”, Libri, 63(2): 123–134

Trang 9

Mandinach và Gummer xác định “Kiến thức dữ liệu là khả năng am hiểu và sử

dụng dữ liệu hiệu quả để đưa ra quyết định, kiến thức dữ liệu có vai trò hỗ trợ ra quyết định, do đó kiến thức dữ liệu gắn liền với quản trị dữ liệu” 25

Theo Hiệp hội Thư viện đại học và nghiên cứu (Association of College and Research Libraries), “Kiến thức dữ liệu tập trung vào việc tìm hiểu cách tìm và đánh giá

dữ liệu, nhấn mạnh đến phiên bản của tập dữ liệu nhất định và người chịu trách nhiệm về

nó, các trích dẫn và sử dụng dữ liệu có đạo đức”26

Xem xét tất cả các định nghĩa này, kiến thức dữ liệu có thể được định nghĩa là một

bộ kỹ năng và kiến thức cơ bản, trao quyền cho các cá nhân biến dữ liệu thành thông tin

và thành kiến thức có thể thực hiện bằng cách cho phép họ truy cập, giải thích, đánh giá,

quản lý và sử dụng dữ liệu một cách có đạo đức

Searle xác định kiến thức dữ liệu là một trong các hoạt động dịch vụ dữ liệu nghiên cứu hỗ trợ các nhà nghiên cứu xây dựng các kỹ năng và kiến thức cần thiết để

quản lý dữ liệu hiệu quả27 Do đó, có thể nói rằng kiến thức dữ liệu có liên quan thực tế đến tất cả các quy trình được dịch vụ dữ liệu nghiên cứu quy định, và xây dựng khung chính cho sự tham gia của các thư viện trong việc hỗ trợ mô hình nghiên cứu chuyên sâu

về dữ liệu Các dịch vụ dữ liệu nghiên cứu chắc chắn là toàn diện, do đó bao gồm các khía cạnh của chúng làm cho kiến thức dữ liệu rộng khắp và toàn diện

Khi đặt kiến thức dữ liệu gần với kiến thức thông tin, cần xem xét đến kiến thức thông tin tổng quát Theo Carlson, các chương trình dữ liệu thông tin phải phù hợp với

thực tiễn chuyên ngành và văn hoá hiện nay28 Một nghiên cứu phân tích của Pinto cho

thấy kiến thức thông tin cả trong khoa học y tế và khoa học xã hội đều có 'nhân cách' cụ

25 Mandinach E, Gummer E (2013), “A systemic view of implementing data literacy in educator

preparation”, Educational Researcher, 42(1): 30–37

26ACRL (2013), Intersections of Scholarly Communication and Information Literacy: Creating Strategic

Collaborations for a Changing Academic Environment, Chicago, IL: Association of College and

Research Libraries http://acrl.ala.org/intersections

27 Searle S, Wolski M, Simons N, (2015), “Librarians as partners in research data service development at

Griffith University”, Program, 49(4): 440–460.

28 Carlson J, Fosmire M, Miller C, (2011), “Determining data information literacy needs: A study of

students and research faculty”, portal: Libraries and the Academy, 11(2): 629–657

Trang 10

thể riêng29 Nói chung, các phương pháp tiếp cận mới hơn đối với kiến thức thông tin

nhấn mạnh rằng thông tin được sử dụng trong các bối cảnh chuyên ngành khác nhau Farrell và Badke nhấn mạnh: “Để đáp ứng nhu cầu của thời đại thông tin đối với những người xử lý thông tin có trình độ, việc đào tạo kiến thức thông tin phải nằm trong phạm

vi thực tiễn văn hoá xã hội của các ngành bằng việc tập trung mở rộng vào nhận thức

luận và siêu diễn ngôn Kiến thức thông tin thực sự sẽ đòi hỏi các cán bộ thư viện hoặc các giảng viên mời gọi sinh viên vào các ngành học Vì vậy, kiến thức thông tin phải được hiểu là thực hành thông tin thuộc về một ngành học.”30

Kỹ năng kiến thức dữ liệu cũng được xem là một ngành học cụ thể Về kỹ năng và

khả năng cần thiết, những người có kiến thức dữ liệu biết cách chọn và tổng hợp dữ liệu

và kết hợp nó với các nguồn thông tin khác và kiến thức đã có Họ cũng phải nhận ra giá

trị dữ liệu nguồn và làm quen với các loại và định dạng dữ liệu Các kỹ năng khác bao

gồm xác định, thu thập, tổ chức, phân tích, tóm tắt và ưu tiên dữ liệu Xây dựng các giả thuyết, xác định các vấn đề, giải thích dữ liệu, xác định, lập kế hoạch, thực hiện, cũng như giám sát các quá trình hành động cũng gắn liền với các kỹ năng cần thiết và bổ sung thêm cho nhu cầu biến đổi dữ liệu cho các mục đích sử dụng cụ thể

Ridsdale thiết lập một ma trận về năng lực kiến thức dữ liệu với ý định thúc đẩy

một cuộc đối thoại liên tục về các tiêu chuẩn về kiến thức dữ liệu và kết quả học tập trong đào tạo kiến thức dữ liệu Hoạt động có lẽ quan trọng nhất trong ma trận này là đánh giá

chất lượng, bao gồm việc đánh giá các nguồn dữ liệu cho độ tin cậy và sai sót hoặc các

vấn đề Việc đánh giá xuất hiện trong quá trình thu thập dữ liệu và giải thích dữ liệu rõ ràng cho thấy các cơ chế cũng đặc trưng cho kiến thức thông tin Ngay cả việc hiển thị dữ

liệu bao gồm đánh giá các biểu thị đồ họa về dữ liệu.31

Một chương trình học về kiến thức dữ liệu thí điểm tại Đại học Purdue được xây

dựng dựa trên các kỹ năng lập kế hoạch; mô hình vòng đời; khám phá và thu nhận; mô tả

29 Pinto M, Pulgarin A, Escalona M (2014), “Viewing information literacy concepts: A comparison of two

branches of knowledge”, Scientometrics, 98(3): 231–232

30 Farrell R, Badke W (2015), “Situating information literacy in the disciplines”, Reference Services

Review, 43(2): 319–340

31

Ridsdale C, Rothwell J, Smit M, (2015), “Strategies and Best Practices for Data Literacy Education Knowledge Synthesis Report”, Halifax, NS: Dalhousie University

Ngày đăng: 24/04/2022, 09:39

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w