Nhằm đáp ứng đòi hỏi yêu cầu ngày càng cao của người dùng tin là cán bộ, sinh viên và giảng viên, nghiên cứu viên của Đại học Quốc gia Hà Nội, công tác tổ chức và phân loại tri thức tạ[r]
Trang 1Trung tam Thong tin Thu vien, DHQGHN
Hoàng Yến1
* - Nguyễn Thị Hòa 2 **
Tóm tắt: Trình bày các khái niệm liên quan tới tri thức, phân loại và tổ chức
tri thức Nghiên cứu, áp dụng phân loại và tổ chức tri thức cho tri thức số nội
sinh tại Trung tâm Thông tin - Thư viện, Đại học Quốc gia Hà Nội (ĐHQGHN);
giúp cho việc xây dựng các bộ sưu tập số tài liệu nội sinh đạt chuẩn quốc
tế Kết quả: Thư viện số tài liệu nội sinh ĐHQGHN được xếp hạng 170/3.059
Thư viện số tài liệu nội sinh các đại học, học viện và 184/3.158 thư viện số
tài liệu nội sinh nói chung trên thế giới tham gia xếp hạng.
Từ khóa: Phân loại tri thức; Tổ chức tri thức; Thư viện số nội sinh.
MỞ ĐẦU
“Thư viện phải là nơi chia sẻ tri thức, truyền cảm hứng sáng tạo”
đó là chỉ đạo của Phó thủ tướng Vũ Đức Đam tại Hội thảo “Phát triển và
đổi mới hoạt động thư viện trong thời kỳ mới” [6] do Bộ Văn hóa Thể
thao và Du lịch tổ chức vào ngày 5 tháng 12 năm 2018, Phó Thủ tướng nhấn mạnh vai trò không thể thiếu của thư viện đối với việc xây dựng
và phát triển văn hoá, con người Việt
Khoa học là tổ chức tri thức, trí tuệ, là tổ chức cuộc sống Từ thời xưa cho đến ngày nay, kiến thức khoa học về con người ngày càng tăng theo thời gian và ứng dụng khôn ngoan của kiến thức này đã dẫn đến sự phát triển của nền văn minh nhân loại Tổ tiên của chúng ta đã có được kiến thức về các quy luật tự nhiên như hiện tượng thời tiết tạo ra sự định
∗ Thạc sĩ, Trung tâm Thông tin – Thư viện, Đại học Quốc gia Hà Nội.
∗∗ Trung tâm Thông tin – Thư viện, Đại học Quốc gia Hà Nội.
Trang 2Trung tam Thong tin Thu vien, DHQGHN
cư lâu dài, sự phát triển nông nghiệp và do đó phát triển nền văn minh của con người
Nhà bác học nổi tiếng Karan Sing đã từng nói rằng “Chúng ta đang
ngập chìm trong biển thông tin nhưng lại đang khát tri thức” [7] Câu
nói này làm nổi bật sự khác biệt về lượng lẫn về chất giữa hai khái niệm thông tin và tri thức Vậy làm sao để biến vũ trụ thông tin thành tri thức đáp ứng nhu cầu của người dùng, đó là bài toán đặt ra với công tác phân loại và tổ chức tri thức, đồng thời khẳng định vai trò của tổ chức tri thức trong môi trường tương lai của giao tiếp và trao đổi tri thức
1 CÁC KHÁI NIỆM LIÊN QUAN
1.1 Phân loại là gì?
Có nhiều cách tiếp cận và định nghĩa khác nhau về “phân loại” tùy theo cách nhìn và phương thức của mỗi cá nhân hay tổ chức
Phân loại là một trong những công cụ tổ chức kiến thức lâu đời nhất và nổi bật nhất Phân loại là một từ được sử dụng trong đời sống
xã hội và nhiều ngành khoa học Mọi sự vật và hiện tượng đều có thể phân loại và đều được phân loại Trong đời sống hàng ngày thực ra ta
đã thường xuyên phân loại bởi vì khi con người muốn nhận biết một sự vật và hiện tượng, muốn khảo sát phân tích và đánh giá chúng đều phải được phân loại chúng với các mục đích khác nhau
Phân loại chính là việc phân chia, sắp xếp các sự vật, hiện tượng theo những trật tự nhất định Trật tự sắp xếp này dựa trên những dấu hiệu giống và khác nhau của chúng để đưa vào từng nhóm riêng biệt Ngày nay, phân loại được xác định là hệ thống logic để sắp xếp tri thức, nó đã và đang đóng vai trò chính yếu trong suốt lịch sử thư viện, dịch vụ và quản lý thông tin
1.2 Tri thức là gì?
Trong hệ thống lý thuyết về tri thức có các quan điểm khác nhau xoay quanh khái niệm “tri thức”
Trang 3Trung tam Thong tin Thu vien, DHQGHN
Tri thức được xem như là thông tin nằm trong bộ não của con người: là tập hợp những kinh nghiệm, giá trị, ngữ cảnh của thông tin và các kiến thức chuyên sâu giúp cho việc đánh giá và phối hợp để tạo nên các kinh nghiệm và thông tin mới bao gồm cả sự so sánh, kết quả, liên
hệ và giao tiếp (Davenport and Prusak, 1998; Davenport, 1999)
Trong bản dự thảo tiêu chuẩn ISO/DIS 9000 đưa ra lấy ý kiến trong năm 2014, “tri thức” được định nghĩa là “Tập hợp thông tin sẵn có được coi như một niềm tin được minh chứng là có khả năng đúng cao” Trong
Từ điển Merriam Webster “tri thức” được định nghĩa là “thực tế hoặc điều
kiện biết điều gì đó với sự quen thuộc có được thông qua kinh nghiệm hoặc sự liên tưởng” Như vậy, khái niệm về tri thức có hai đặc điểm: (1)
là sự hiểu biết hay sự chắc chắn về vấn đề hoặc nội dung chủ điểm và (2)
có được từ kinh nghiệm hoặc sự liên hệ/liên tưởng giữa các yếu tố
1.3 Các loại tri thức
Có rất nhiều cách phân loại khác nhau về tri thức, tuy nhiên trong
hệ thống các lý thuyết liên quan đến quản trị tri thức, phân loại tri thức
theo dạng thức tri thức, có thể được chia thành ba loại là tri thức hiện (explicit knowledge), tri thức ẩn (tacit knowledge) và tri thức ngầm (implicit knowledge)
1.3.1 Tri thức hiện (explicit knowledge)
Là tri thức có tính khách quan; là tri thức có thể dễ dàng được khớp nối, mã hóa, lưu trữ và truy cập Nó có thể dễ dàng truyền đạt và chia sẻ cho người khác Hầu hết các dạng tri thức hiện có thể được lưu trữ trong phương tiện truyền thông nhất định Tri thức hiện thường được xem là
bổ sung cho tri thức ngầm Một số ví dụ như các tri thức về chuyên môn được trình bày trong giáo trình, sách, báo, tạp chí,… hay tri thức hiện
là hướng dẫn sử dụng, tài liệu, quy trình và video hướng dẫn, tác phẩm nghệ thuật, thiết kế sản phẩm…
Trang 4Trung tam Thong tin Thu vien, DHQGHN
1.3.2 Tri thức ẩn (tacit knowledge)
Là những tri thức có tính chủ quan, dựa trên nhận thức, kinh nghiệm;
là tri thức khó chuyển giao cho người khác bằng cách viết nó ra hoặc diễn đạt bằng lời Tri thức ẩn là không thể thiếu đối với toàn bộ ý thức của một người, có được phần lớn thông qua sự liên kết với người khác và đòi hỏi các hoạt động chung hoặc chúng phải được truyền từ người này sang người khác Giống như phần chìm của tảng băng trôi, nó tạo thành phần lớn những gì người ta biết và hình thành nên khung cơ bản giúp kiến thức
rõ ràng có thể thực hiện được
Tri thức ẩn có thể bao gồm các kỹ năng nhận thức như niềm tin, hình ảnh, cảm nhận và tư duy cũng như các kỹ năng, kỹ thuật, sự thuần thục và bí quyết…
1.3.3 Tri thức ngầm (implicit knowledge)
Là những tri thức được bao gồm hay nằm sẵn trong các sản phẩm, các quá trình hay văn hóa của tổ chức Những tri thức này có thể chưa được tiêu chuẩn hóa, văn bản hóa, người làm thì biết được nhưng mới
ở mức chấp nhận tự nhiên mà không có các sự lý giải hoặc nắm rõ ràng được cơ chế của sự việc
2 TỔ CHỨC TRI THỨC VÀ CÁC PHƯƠNG PHÁP TỔ CHỨC TRI THỨC
Thuật ngữ “tổ chức tri thức” (Knowledge Organization - KO) có nguồn gốc trong lĩnh vực Khoa học Thông tin Thư viện (Library and In-formation Science - LIS) vào khoảng năm 1900 Tổ chức tri thức đóng vai trò quan trọng cho sự thành công của bất kỳ thư viện công cộng nào Thuật ngữ này có ý nghĩa khác nhau với quan điểm từ các lĩnh vực khác nhau Ở một góc nhìn rộng hơn, tổ chức tri thức là phân loại thông tin xã hội và xác định các khái niệm và quan hệ giữa chúng Trong lĩnh vực Khoa học Thông tin Thư viện, tổ chức tri thức có ý nghĩa liên quan đến việc xử lý và quản lý tài nguyên tri thức một cách có hệ thống để chúng có thể dễ dàng truy cập
Tổ chức tri thức là các hoạt động liên quan đến việc mô tả tài liệu, lập chỉ mục và lập danh mục, phân loại và tổ chức các tài nguyên tri thức như cơ sở dữ liệu, lưu trữ, bản đồ và các nguồn kiến thức khác theo
Trang 5Trung tam Thong tin Thu vien, DHQGHN
các định dạng khác nhau Nó được thực hiện bởi các chuyên gia thông tin, nhà lưu trữ, chuyên gia môn học, cũng như các thuật toán máy tính
Tổ chức tri thức đóng vai trò là cầu nối giữa nhu cầu thông tin của người dùng và tài liệu trong bộ sưu tập Dữ liệu được xử lý mới thành thông tin Thông tin được xử lý mới thành tri thức
Theo trình tự thời gian, các phương pháp tổ chức tri thức được Broughton; Hansson; Hjørland & López-Huertas (2005) đưa ra là:
Sơ đồ minh họa các phương pháp tổ chức tri thức
2.1 Tổ chức tri thức theo phương pháp truyền thống sử dụng các khung phân loại như DDC, LCC
Phương pháp tổ chức tri thức truyền thống xuất hiện trước năm
1876 Phân loại từ lâu đã được sử dụng trong thư viện và hệ thống thông
tin để cung cấp, hướng dẫn cho người dùng trong việc làm rõ nhu cầu thông tin của người dùng và để cấu trúc kết quả tìm kiếm
Quá trình khám phá và sáng tạo tri thức trong khoa học theo truyền thống đã đi theo con đường khám phá, quan sát, mô tả, phân tích, tổng hợp và kiểm tra các hiện tượng và sự kiện Như khi chúng ta tìm hiểu ô
tô thì chúng ta không nhìn nhận nó trên phương diện là một phương tiện
đi lại, một động cơ mà chúng ta phải xem xét những yếu tố liên quan đến nó như thẩm mỹ, kinh tế và giá trị tâm lý mà chúng ta muốn nhận được khi sở hữu chiếc xe này
Trang 6Trung tam Thong tin Thu vien, DHQGHN
Theo quan điểm của nhà triết học Aristotle (Ackrill, 1963), thế giới
tự nhiên của chúng ta là một thể thống nhất Toàn bộ có thể được chia nhỏ và mỗi lớp khác thành các lớp con, v.v quá trình này tuân theo một
bộ quy tắc liên kết và phân biệt có trật tự, có hệ thống và làm thế nào để chúng ta đi đến các quy tắc phân chia Theo Aristotle, chỉ quan sát toàn diện mới có thể tiết lộ các thuộc tính thực sự (thiết yếu) của mỗi thực thể Cơ sở để phân chia là những đặc điểm hoặc đặc tính của sự vật, hiện tượng mà dựa vào đó để phân chia tiếp theo trong một lớp hay một lớp con Cơ sở phân chia phục vụ cho mục tiêu phân loại đó, do vậy khi mục tiêu phân loại thay đổi thì cơ sở phân loại cũng thay đổi theo Lớp phân loại bao gồm lớp khởi đầu và lớp phái sinh Để tạo ra một lớp mới
- lớp phái sinh - xuất phát từ lớp khởi đầu thì phải tìm ra những điểm khác nhau của các đơn vị trong lớp khởi đầu Những điểm khác nhau này là cơ sở tạo ra lớp phái sinh, đó là cơ sở để phân chia Yếu tố để liên
hệ giữa các đơn vị của cùng một lớp được tạo lập do sự tồn tại cùng với mục đích và có mối liên hệ trong không gian và thời gian
Có nhiều cách tiếp cận quá trình phân loại và xây dựng nền tảng của các sơ đồ phân loại Mỗi hệ thống phân loại có mục tiêu khác nhau và mỗi loại sơ đồ phân loại có các đặc tính cấu trúc khác nhau cũng như các điểm mạnh và điểm yếu khác nhau về mô tả tri thức và khám phá tri thức Khung phân loại thập tiến Dewey (DDC - Dewey Decimal Clas-sification) được thực hiện bởi nhà thư viện học nổi tiếng của Mỹ Melvil Dewey (1851-1931) dùng 10 chữ số Ả Rập từ 0 đến 9 để sắp xếp toàn bộ tri thức của nhân loại Khung phân loại DDC gồm 10 lớp chính với 1000
đề mục có khuynh hướng phản ánh hiện trạng thế giới phương Tây
Khung phân loại Thư viện Quốc hội Hoa Kì (LCC - Library of Congress Classification) Bảng chính khung phân loại thư viện Quốc hội Hoa Kỳ phân chia tri thức của nhân loại thành 21 lớp cơ bản sử dụng
21 chữ cái tiếng Anh làm ký hiệu Đây là khung phân loại theo mang đặc tính chủ đề và thực dụng
Các khung phân loại có các thuộc tính thể hiện sự đại diện của các thực thể và các mối quan hệ trong các cấu trúc phản ánh kiến thức về
Trang 7Trung tam Thong tin Thu vien, DHQGHN
miền được phân loại Những cách tiếp cận này là hệ thống phân cấp, cây cối, mô hình và phân tích các khía cạnh của tri thức Mục đích của quá trình phân loại cho phép người dùng tin giới hạn được phạm vi kiến thức mà họ cần đồng thời khám phá kiến thức mới về lĩnh vực nào đó
2.2 Tổ chức tri thức theo phương pháp phân tích khía cạnh
Phân tích khía cạnh ở dạng thô sơ đã được SR Ranganthan (nhà Toán học và thủ thư người Ấn Độ) phát kiến vào những năm 1930, mặc dù nó
đã đi trước các phương pháp phân tích tổng hợp tương tự để phân loại và lập chỉ mục đối tượng, đặc biệt là Henry Bliss, Paul Otlet trong lĩnh vực phân loại và Kaiser trong việc lập chỉ mục Phân tích này được phát triển vào năm 1950, chủ yếu bởi các thành viên của Nhóm Nghiên cứu Phân loại Vương quốc Anh, như một công cụ để tổ chức các bộ sưu tập tài liệu trong các lĩnh vực khoa học kỹ thuật, khoa học và xã hội, nơi nó có hiệu quả cao trong việc lưu trữ và truy xuất các đối tượng phức tạp Lý thuyết phân tích khía cạnh hiện đại tương phản với các quan điểm kiến thức trước đây như một tổng thể (được chia thành các đơn vị nhỏ hơn và nhỏ hơn)
2.3 Tổ chức tri thức theo phương pháp truy hồi thông tin
Phương pháp truy hồi thông tin còn gọi là truy vấn thông tin, xuất hiện khoảng năm 1950 Quá trình truy xuất thông tin bắt đầu khi người dùng nhập truy vấn vào hệ thống Truy vấn nhu cầu thông tin, ví
dụ chuỗi tìm kiếm trong công cụ tìm kiếm web Trong truy xuất thông tin, một truy vấn không xác định duy nhất một đối tượng trong bộ sưu tập; thay vào đó, một số đối tượng có thể phù hợp với truy vấn
2.4 Phương pháp tiếp cận thư mục
Tiếp cận thư mục hình thành năm 1963, là việc sử dụng các phương
pháp thống kê để phân tích sách, bài báo và các ấn phẩm khác Phương pháp thư mục thường được sử dụng trong lĩnh vực thư viện và khoa học thông tin Các lĩnh vực phụ của thư mục học liên quan đến phân tích các ấn phẩm khoa học Phân tích trích dẫn là một phương pháp thư mục thường được sử dụng dựa trên việc xây dựng biểu đồ trích dẫn , biểu diễn mạng hoặc biểu đồ của các trích dẫn giữa các tài liệu Phân tích
Trang 8Trung tam Thong tin Thu vien, DHQGHN
trích dẫn bao gồm kiểm tra, giới thiệu các tài liệu, được sử dụng để tìm kiếm tài liệu và phân tích giá trị của chúng
2.5 Quan điểm hướng đến người dùng
Phương pháp này xuất hiện những năm 1970, công nghệ đã cung
cấp cho người dùng quyền truy cập vào thông tin tăng lên dẫn đến tăng kiểm soát người dùng thông tin Điều này đã dẫn đến tầm quan trọng ngày càng tăng của việc đáp ứng nhu cầu của người dùng và cải thiện
hệ thống thông tin Như trong nhiều lĩnh vực khác, trong đó các dịch
vụ và sản phẩm đã phát triển một cuộc cách mạng lấy người dùng làm trung tâm, cách tiếp cận này là hướng đến người dùng, đáp ứng nhu cầu
về thông tin của người dùng, hay thân thiện với người dùng
2.6 Phương pháp phân tích tên miền
Phương pháp phân tích tên miền được hình thành vào đầu những năm 1990 Phân tích tên miền là một lý thuyết về cách tiếp cận thư viện
và khoa học thông tin và tổ chức tri thức Các đối tượng của tổ chức tri thức có thể được khái quát hóa, đặc biệt là về các hệ thống tổ chức tri thức và các quy trình tổ chức tri thức (ví dụ các hệ thống phân loại
và quá trình phân loại) Việc lập chỉ mục của một tài liệu nhất định sẽ phản ánh nhu cầu của một nhóm người dùng nhất định hoặc một mục đích lý tưởng nhất định Lập chỉ mục tài liệu là việc gắn thẻ các tài liệu
có thông tin được tìm kiếm thường xuyên nhất giúp cho việc tìm kiếm nhanh hơn Khi các chỉ mục đã được lập thông tin đã được lưu trữ lúc này khi người dùng tìm kiếm với các từ khóa các kết quả sẽ được hiển thị và các kết quả này sẽ được truy xuất từ nguồn dữ liệu đã được lưu trữ, lập chỉ mục trước đó Tiêu chí thành công của thông tin hệ thống là
họ xác định và truyền đạt kiến thức cần thiết cho người dùng
3 PHÂN LOẠI VÀ TỔ CHỨC TRI THỨC SỐ NỘI SINH TẠI TRUNG TÂM THÔNG TIN - THƯ VIỆN, ĐẠI HỌC QUỐC GIA HÀ NỘI
Mục tiêu của quản trị tri thức là biến tri thức tiềm ẩn của mỗi cá nhân thành tri thức hiện cho tổ chức, tập thể có thể sử dụng được Trong mỗi
cá nhân đều tồn tại những tri thức ẩn, những tri thức chưa được khai thác
Trang 9Trung tam Thong tin Thu vien, DHQGHN
có thể là do nó chưa được khơi gợi hoặc do mỗi cá nhân không muốn chia sẻ Vậy làm thế nào để đánh thức tiềm năng và trí tuệ trong mỗi các nhân, giúp họ có thể áp dụng nguồn tri trức trong học tập, nghiên cứu, công việc ? Những tri thức ẩn là những kinh nghiệm, những kỹ năng, những bí quyết, những mối quan hệ những “tài sản vô hình” vận hành trong bộ não dưới dạng tiềm ẩn sẽ được chuyển sang tri thức hiện hữu qua phương thức chia sẻ, được cấu trúc lại để mọi người có thể học tập;
và một hệ thống tri thức phức tạp và có hệ thống hơn được tạo ra Kết quả của quá trình này là tạo ra một kho tri thức hiện hữu dùng chung cho tất
cả mọi người và kho tri thức này không ngừng được làm giàu theo thời gian Để cho quá trình tạo ra tri thức mới được tiếp tục diễn ra thì việc phân loại và tổ chức tri thức đặc biệt quan trọng Tri thức được phân loại
và tổ chức một cách khoa học được xác định là hệ thống logic để sắp xếp tri thức Đặc biệt trong môi trường số phân loại được sử dụng như là phương tiện tổ chức và truy cập thông tin Với sự phát triển nhanh chóng của tài nguyên mạng, một khối lượng thông tin khổng lồ trên mạng toàn cầu đòi hỏi phải được tổ chức, và phân loại là một giải pháp Phân loại là quá trình phân chia tri thức hiện đã được in ấn, xuất bản trên các vật mang tin khác nhau; sắp xếp chúng thành những ngành khoa học cơ bản theo một trật tự nhất định, logic và khoa học; xác định nội dung và thể hiện nội dung đó bằng những ký hiệu đã được định sẵn trong khung phân loại, tạo
ra công cụ tìm tin tiền kết hợp Một trong những khung phân loại được sử dụng phổ biến trên thế giới và ở Việt Nam hiện nay là: Khung phân loại thập phân DDC (Dewey Decimal Classification) Trong Khung DDC, những môn loại căn bản được sắp xếp theo những ngành kiến thức hay
bộ môn (hay ngành học) Trong bậc cao nhất của Khung DDC, nó được
phân chia ra làm mười môn loại chính, bao gồm tất cả tri thức của con người Mỗi một môn loại chính lại được phân chia thành mười phân mục
và mỗi phân mục lại chia thành những đoạn (có khi những số có trong
những phân mục và những đoạn chưa được dùng đến) Các lĩnh vực khoa học đều được sắp xếp từ chung đến riêng, từ toàn thể đến bộ phận Cơ sở sắp xếp là bộ môn khoa học, lĩnh vực khoa học Chính ưu điểm này của DDC đã được phát huy hết sức rõ ràng khi tổ chức tri thức với số lượng tài liệu lớn thuộc rất nhiều ngành, lĩnh vực đào tạo trong ĐHQGHN
Trang 10Trung tam Thong tin Thu vien, DHQGHN
ĐHQGHN là một đại học đa ngành, đa lĩnh vực, chất lượng cao; trong quá trình đào tạo và nghiên cứu khoa học, nhà trường đã tạo ra một khối lượng tri thức lớn có giá trị gọi là nguồn tin nội sinh, bao gồm các công trình nghiên cứu khoa học, luận án, luận văn, sách giáo trình, sách tham khảo, tài liệu hội nghị, hội thảo khoa học… Đây là nguồn tri thức hiện rất
có giá trị, phục vụ đắc lực cho học tập, giảng dạy, nghiên cứu khoa học Với việc tổ chức tri thức theo Khung phân loại DDC, tri thức nhân loại được sắp xếp theo hệ phân cấp từ chủ đề khái quát nhất đến chủ đề chi tiết nhất Người dùng tin có thể tìm được thông tin về một chủ đề cụ thể và hy vọng thông tin đó sẽ được chuyển thành tri thức đế áp dụng giải quyết một vấn đề nào đó
Minh họa tri thức trong Bộ sưu tập số được phân chia thành 10 lớp chính theo DDC
Việc phân loại và tổ chức các nguồn tri thức thành các bộ sưu tập số không chỉ là phương tiện cung cấp các tài liệu học tập, nghiên cứu trong không gian số - phù hợp với xu thế của thời đại, nó còn là một trong những tiêu chí để xếp hạng Website ĐHQGHN qua chỉ số Webometrics - Webometrics là một cách thức đánh giá các website của đại học do nhóm nghiên cứu Cybermetrics Lab thuộc tổ chức Spanish National Research Council (CSIC) có trụ sở tại Madrid đề xuất và được thừa nhận rộng rãi, được các tổ chức đảm bảo chất lượng sử dụng ĐHQGHN duy trì vị trí số 1 Việt Nam và tiếp cận top 1.000 thế giới trong bảng xếp hạng Webometrics tháng 1/2019 Một trong những chỉ