1. Trang chủ
  2. » Giáo án - Bài giảng

Giáo trình hệ thống tìm tin

105 596 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Hệ Thống Tìm Tin Thủ Công
Trường học Đại học Bách khoa Hà Nội
Chuyên ngành Hệ Thống Tìm Tin
Thể loại Giáo trình
Thành phố Hà Nội
Định dạng
Số trang 105
Dung lượng 1,71 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Nội dung Text: Giáo trình Hệ thống tìm tin: Phần 2 PGS.TS. Đoàn Phan Tân Chưcỉng 5 H Ệ T H Ố N G T ÌM T IN T H Ủ C Ô N G Hệ thống tìm tin thủ công bao gồm các thành phần chính là hệ thống mục lục, các bộ phiếu thư mục và các bộ phiếu dữ kiện. 5.1. Hệ thống mục lục 5.1.1. K h á i niêm Hệ thống mục lục thư viện (hay thường được gọi là mục lục) là một tập hợp có tổ chức các biểu ghi phản ánh vốn tài liệu của một kho tài iiệu hay một bộ sưu tập nào đó. MỘI bộ sưu tập có thể bao gồm một hoặc nhiều loại hình tài liệu như sách, ấn phẩm định kỳ, bàn đồ, tranh ánh, băng hình... Thông thường, mục lục phản ánh vốn tài liệu của một thư viện hoặc cơ quan ihông tin. Tuy nhiên, cũng có những mục lục phản ánh vốn tài liệu cùa nhiều ihư viện, cơ quan Ihông tin nhằm hỗ trợ cho việc chia sẻ nguồn lực thông tin giữa các tồ chức nh ư mục lục liên hợp. Việc tổ chức mục lục Irở nên cần thiét đối với một thư viện khi vốn lài liệu phát triển đến mức không thể kiểm soát được từng tài liệu trong kho. Một thư viện tư nhân nhò hoặc một thư viện của lớp học không nhất thiết phài tổ chức mục lục vì người sử dụng có ihề nhớ từng quyển sách, bâng ghi âm, bản đồ và các tài liệu khác theo các dấu hiệu như tác giả, nhan đề, chủ đề, hình dáng, màu sắc hay thậm chí vị trí của tài liệu trên một giá sách cụ thể. Nếu vốn tài iiệu lớn hơn một chút thì thư viện có thể sắp xếp tài liệu theo một 107

Trang 1

Chưcỉng 5

H Ệ T H Ố N G T ÌM T IN T H Ủ C Ô N G

H ệ thống tìm tin thủ công bao gồm các thành phần chính là

hệ thống mục lục, các bộ phiếu thư mục và các bộ phiếu d ữ kiện

5.1 Hệ thống mục lục

5.1.1 K h á i niêm

Hệ thống mục lục thư viện (hay thường được gọi là m ục lục)

là một tập hợp có tổ chức các biểu ghi phản ánh vốn tài liệu của một kho tài iiệu hay một bộ sưu tập nào đó MỘI bộ sưu tập có thể bao gồm một hoặc nhiều loại hình tài liệu như sách, ấn phẩm định

kỳ, bàn đồ, tranh ánh, băng hình Thông thường, mục lục phản ánh vốn tài liệu của một thư viện hoặc cơ quan ihông tin Tuy nhiên, cũng có những mục lục phản ánh vốn tài liệu cùa nhiều ihư viện, c ơ quan Ihông tin nhằm hỗ trợ cho việc chia sẻ nguồn lực thông tin giữa các tồ chức n h ư mục lục liên hợp

Việc tổ chức mục lục Irở nên cần thiét đối với một thư viện khi vốn lài liệu phát triển đến mức không thể kiểm soát được từng tài liệu trong kho Một thư viện tư nhân nhò hoặc một thư viện của lớp học không nhất thiết phài tổ chức mục lục vì người sử dụng có ihề nhớ từng quyển sách, bâng ghi âm, bản đồ và các tài liệu khác theo các dấu hiệu như tác giả, nhan đề, chủ đề, hình dáng, màu sắc hay thậm chí vị trí của tài liệu trên một giá sách cụ thể N ếu vốn tài iiệu lớn hơn một chút thì thư viện có thể sắp xếp tài liệu theo một

Trang 2

cách nào đó, chẳng hạn như phân nhóm tài liệu theo chủ đề và cho phép người sử dụng tự chọn tài liệu trong kho Khi vốn tài liệu quá lớn đến mức không thể sử dụng cách sắp xếp và lìm tài liệu đơn giản thì thư viện phải lập biểu ghi hay phiếu mô tả chính ihức cho từng tài liệu để có thể dề dàng tìm kiếm, kiểm kê và quản lý tài liệu.

5.1.2 C hức n ăn g của m ục lục

Mục lục có các chức năng cơ bàn là nhận dạng, tập hợp, đánh giá hay chọn lọc và xác định vị trí của lài liệu C ác chức n ă n g này

có sự phụ thuộc lẫn nhau

C hứ c n àn g nhận dạng h ay tìm kiếm tà i liệu M ục lục được

xây dựng rihẳm lạo điều kiện cho người s ử d ụ n g có Ihể đấi chiếu các dừ liệu về tài liệu đã biết với các biểu ghi trong m ục lục để xác định ihư viện có tài liệu đó hay không Nói cách khác, mục lục cho phép người sử dựng nhận dạng hoặc tìm kiếm tài liệu dựa trên các

dừ liệu đã biết về tài liệu như tác giâ, nhan đề, chủ đ ề

C húc n ă n g tậ p ỉĩơ p tà i liệu Chức n ă n g này cho phép các

biểu ghi của các tài liệu giống nhau hoặc c ó liên quan chặt chẽ với nhau về một phương diện hoặc dấu hiệu nào đ ó được tập họp vào mội chồ trong mục lục Chẳng hạn, các tài liệu về c ù n g một chù đề được tập hợp lại với nhau trong mục lục chủ đề hay m ục lục phân loại, các tài liệu của cùng một tác giả được xếp c ù n g nhau Irong mục lục chừ cái N hờ đó, người sử dụng có thể biết được trong m ộl thư viện, c ơ quan thông tin có bao nhiêu tài liệu của một tác giả nào đó hoặc có bao nhiêu tài liệu về m ột chủ đề nào đ ó M ộ t Irong những cách tốt nhất để thực hiện chức n ă n g tập hợp tài liệu !à thông qua quá trình kiểm soát tiêu đề chuẩn, đặc biệt là xây d ự n g

hệ thống tham chiếu (chỉ chồ) qua lại

Trang 3

Chức n ă n g đánh giá hay chọn lọc tà i liệu Chức năng này cho

phép người sừ dụng lựa chọn từ nhiều biểu ghi những tài liệu thích hợp nhất và tốt nhất chứa đựng kiến thức hoặc thông tin cần thiết Chẳng hạn, người sử dụng c ó thế lựa chọn một lần xuất bản nào đó Irong nhiều lằn xuất bản khác nhau của cùng một tác phẩm hoặc lựa chọn nhừng tài liệu có cùng một nội dung nhưng được viết bời các tác giả khác nhau và được chứa trên các vật mang tin khác n h a u

C hức n ă n g x á c định vị tr í tà i liệu M ục lục phản ánh địa chỉ

luu trìr tài iiệu troiig kho cúd m5t hDặc rrột số thư V’ện, c ơ quan thông tin N h ờ đó, người sừ đụng có thể dề dàng xác định được vị trí của tài liệu cần tìm

5.1.3 C ác h ìn h th ứ c m ục lục thủ công

5 ĩ 3.1 M ụ c lụ c sách t •

Mục lục sách là mục lục được ghi chép hoặc in dưới dạng các tập sách M ục lục sách thường ià các danh mục tài liệu được sắp xếp theo vần c h ữ cái tên tác già, nhan đề hoặc theo chủ đề

So với m ục lục phiếu, mục lục sách có ưu điểm là c ó độ nén cao, c ơ động, c ó thể đem theo để sử dụng ờ mọi nơi và có thể xem lướt nhanh T u y nhiên, m ục lục sách c ó hạn chế là chi phí cập nhật cao nên mục lục sách không được c ập nhật thường xuyên như mục lục phiếu

Hiện nay m ục lục sách vẫn đ ư ợ c sử dụng cùng với các loại mục lục khác trong nhiều thư viện Đ ặc biệt, mục lục sách vẫn được sừ dụng n h ư phư ư ng tiện duy nhất để truy cập các tài liệu quí hiếm trong m ộ t số thư viện và c ơ quan lưu trừ

Trang 4

5 1.3.2 M ụ c lụ c p h iếu

M ụ c lục phiếu là m ục lục được tạo thành từ những phiêu mô

tà (biểu ghi) với kích thước khác nhau Hiện nay, kích thước của phiếu chuẩn ỉà 7,5 X 12,5 cm Các phiếu mô tà có thể đ ư ợ c chép tay, đánh m á y hoặc được in từ máy tính

Bên cạnh nhừng hạn chế như thiếu tính gọn nén, c h iếm nhiều diện tích, không c ơ động, mục lục phiếu cũng có các ưu điểm như

dễ cập nhật và cho phép nhiều người sử dụng cùng m ột lúc

Hiện nay mục lục phiếu vẫn được sử dụng trong nhiều thư viện C ó nhiều lý do để các thư viện duy trì mục lục phiếu như thư viện không c ó khả năng và điều kiện trang bị phần m è m và thiết bị cần thiết cho mục lục điện từ; thư viện không có khả năng chuyền đôi hồi c ổ hoàn toàn m ục lục phiếu sang mục lục điện tử hoặc đơn giản là do nó phù hợp với thói quen của nsư ờ i sừ dụng th ư viện

5.1.4 T iêu c h í đánh giá ch ấ t lư ọ ìig m ục lục

Dù được tồ chức dưới bất kỳ hình thức nào, m ột mục lục hiệu quả phải đ ả m báo một số tiêu chuẩn nhất định cho p h é p tra cứu và quản trị dễ dàng C ó thể đánh giá chất lượng của m ột mục lục dựa trên các tiêu c h í dưới đây

Tính linh h o ạ t và cậ p nhật Việc bồ sung và thanh lọc tài

liệu đ ư ợ c tiến hành thường xuyên trong các thư viện, c ơ quan thông tin M ục lục phải phản ánh kịp thời sự thay đổi trong vốn tài liệu c ủ a th ư viện, c ơ q u a n thông tin

T ín h linh hoạt ở m ục lục phiếu cao hơn so với m ụ c lục d ạ n g sách C ó thể dễ d à n g thêm vào hay loại bỏ các biểu ghi khỏi các hộp phiếu khi cần thiết So với mục lục phiếu thì m ục lục sách khó

110

Trang 5

cập nhật hơn vì m ột khi đã được in ra thì k h ô n g thể thêm vào hoặc oại bỏ các biêu ghi được nữa, tiìr khi xuấl bản các phụ trương hoặc tái bản T uy nhiên, vì hiện nay các mục lục này được biên soạn bằng m áy lính nên c ó thể thay đổi các biểu ghi hiện có m ộ t cách linh hoạt Ví dụ, chi cần sừ dụng một lệnh đ ơ n giản là có thề thay đồi hàng loạt biểu ghi, trong khi với mục lục phiếu thì phải sừa từng phiếu một.

Tính thân th iện đ ố i vớ i n g u ờ ỉ s ử d ụ n g M ụ c lục phải được

tồ cliúc sao cho người sử d ạ n g có ihẻ tìni kiếni nhanh chó n g và d l dàng các biểu ghi Điều này đòi hòi cách sắp xếp các biểu ghi trong mục lục phải khoa học, p h ù hợp với thói quen tìm tin c ủ a người dùng lin và các h ư ớ n g dẫn s ử dụng phái rõ ràng, dễ hiểu

Tính kinh tế M ục lục phái được tổ ch ứ c với các p h ư ơ n g án

hợp lý, có tính đến chi p h í xây dựng, duy irì m ục lục c ũ n g n h ư hiệu quả k i n h tế cùa m ục lục

Phiếu dùng c h o các m ụ c lục phiếu dề sản xuất và chi phí không cao T ro n g khi đó, giá thành biên soạn và xuất bản m ục lục sách lư ơ n g đối c a o nếu n h ư chi sản xuất Íí bản N ế u số bản m ục lục được xuất bản nhiều thì chi p h í sẽ thấp hơn so với m ục lục phiếu

Tính s ử d ụ n g th u ậ n tiện M ục lục phải gọn nhẹ, c h iếm ít

diện lích và dề dùng iruy cập đổi với người sử dụng

5.1 5 C ác th àn h p h ần củ a hc th ốn g m ục lục

M ột hệ thống m ục lục truyền thống g ồ m ba thành phần là mục lục công cộng, mục lục c ô n g vụ và hộp phiếu tiêu đề chuẩn

M ục lục c ô n g c ộ n g (public access cataỉog) ià m ục lục dành cho người sừ dụng truy c ậ p tự do Tùy theo cách sắp xếp các phiếu

Trang 6

mô tả, c ó thể chia mục lục công cộng thành mục lục c h ữ cái, mục lục phân loại, mục lục chủ đề.

M ục lục công vụ là mục ỉục sừ dụng nội bộ (thường là mục lục vị trí, tổng mục lục c h ữ cái) phục vụ cho hoạt động nghiệp vụ của nhân viên thư viện

M ục lục vị tn phàn ánh lổ chức kho tài liệu của một thư viện Các phiếu mô tả trong mục lục được sắp xếp theo trật tự c ủ a tài liệu trên giá Vì vậy, mục lục vị tn còn được gọi là mục lục xếp giá Các phiếu mô tả của mục lục vị trí thường phản ánh đầy đủ số lượng bản/tập và vỊ trí c ủ a các tài liệu trong kho, đặc biệt khi một thư viện có nhiều kho tài liệu Mục ỉục vị tri thường được bao quàn

và sử dụng nội bộ ở bộ phận tồ chức kho

Các hộp phiếu tiêu đề chuẩn chứa các phiếu thể hiện các hình thức tên cá nhân và tập thề, nhan đề thống nhất, tùng thư và các đề mục c hủ đề đã được iựa chọn là các hình thức chuẩn để sử dụng như các tiêu đề trong một mục lục cụ thể Các hộp phiếu tiêu đề chuẩn cũng chứa danh mục các tham chiếu đùng trong mục lục công cộng

để chì chỗ từ dạng không chuẩn sang dạng chuẩn được sử dụng làm tiêu đề Các hộp phiếu này thường được sử dụng nội bộ

5.1.6 H ệ th ốn g m ụ c lụ c c h ữ cái ( M L C C )

5.1.6.1 K h á i niệm

M ục lục chữ cái là hệ thống mục lục trong đó các phiếu mô tả được sắp xếp theo trật tự c h ữ cái tên lác giả hoặc nhan đề tài liệu được phản ánh trong mục lục

M ục lục c h ữ cái là hệ thống tìm tin được tổ chức theo sơ đ ồ tuyến tính T ro n g m ục lục c h ừ cái, thông tin về mồi tài liệu được

Trang 7

trình bày trên một phiếu mô tả Các phiếu mô tả được sắp xếp dựa trên các đặc trưng hình thức cùa tài liệu là tên tác giả/nhan đề tài liệu Cách sắp xếp này cho phép người sử dụng có thể trả lời được hai c â u hỏi c ơ bản sau: 1) T h ư viện có hay không một tài liệu cụ thể với tên tác giả và/hoặc nhan đề đ ã được biết trước; 2) T h ư viện

c ó n h ừ n g tác phẩm nào của một tác giả cụ thề

Mục lục chữ cái phản ánh đầy đ ủ và toàn diện vốn tài liệu cùa thư viện vì thành phần của mục lục không chỉ có các phiếu m ô tả chíĩỉh m à còn bao gồm các phiếu mỏ tả 00 s j n g và các phiếu chỉ chỗ

5.1.6.2 C ấu trú c m u c lu c c h ữ cá i*

C ác thành phần của mục lục c h ừ cái bao gồm các phiếu mô

tả, các phiếu tiêu đề và các phiếu chỉ chỗ

tả chính nhằm m ở rộng khả nãng tìm tin cho người sừ dụng

Người ta chọn một trong các điểm truy cập làm tiêu đề của phiếu mô tả chính Các điểm truy cập còn lại được sử dụng làm các tiêu đề của các phiếu mô tả bồ sung Tên tác giả và nhan đề thường được dùng làm tiêu đề của phiếu m ô tả chính

Trang 8

Phiếu tiêu đề

Phiếu liêu đề được sứ dụng đổ phân chia giới hạn các phiếu

mô tả theo các từ, cụm từ nhằm tạo điều kiện thuận tiện cho người

sừ dụng Phiếu tiêu đề được làm bằng loại giấy cứng, có kích thước 7,5 X 12,5 c m và có p h ầ n n h ô lên c a o 1,5 c m ( đ ư ợ c gọi là g ờ phiếu).

C ó hai loại phiếu tiêu đề là phiếu liêu đề chính và phiếu tiêu

đề phụ Phiếu tiêu đề chính có phần 2Ờ phiếu nhô lên ờ giữa, chiếm

^/3 chiều rộng của phiếu Phiếu tiêu đề chính được sử dụng để phân định giới hạn các vần chừ cái cúa ngôn ngừ được sử d ụ n g hoặc các tác giả nổi tiếng, các cơ quan, tổ chức quan trọng

Phiếu tiêu đề phụ có gờ nhô lẻn bên phâi hoặc bên irái và chiếm '/3 hoặc Va chiều rộng của phiếu Phiếu tiêu đề phụ được sừ

dụng đề phân biệt các phiếu Irong cùng một vằn (ví dụ c, CH hoặc

N NH) hoặc các lác giả nồi tiếng, lác giả có nhiều tài liệu

P h i ể u chỉ chỗ

Đe kiếm soát tính thống nhất trong hệ thống m ục lục nhằm tạo điều kiện thuận tiện cho việc sứ dụng, bên cạnh các phiếu m ô tả mục lục chữ cái còn có các phiếu chi chỗ (cùng đ ư ợ c xếp theo vần chữ cái)

Phiếu chì chồ (“xem ” , “dùng cho” ) được sứ d ụ n g để hướng dẫn người sử dụng đến tiêu đề mô tà thống nhất được s ứ dụng trong mục lục Ví dụ;

Trần xế Xương

xem

T ú Xương

Trang 9

Phiếu chỉ chỗ qua lại (“cũng x e m ”) được dùng để hướng dẫn người sử dụng lìm thêm những tiêu đề khác trong mục lục có liên quan đến vấn đề đang được tra cứu.

5.1.6.3 C ách tồ chứ c p h iếu m ô tả tro n g m ụ c lụ c chữ cái

C ó hai kiểu sắp xếp phiếu mô tả trong M L C C là kiểu từ điển

và kiều phân đoạn

M ụ c lụ c c h ữ cá i kiểu t ừ điển Cách tổ chức theo kiểu từ điển

được sử dụng phổ biến ờ M ỹ cho đến những năm 1990 Trong

M L C C kiẻu từ điên, tất ca các phỉếu mô tả có tiêu đề là tên tác giả, nhan đề tài liệu, chủ đề được xếp chung theo trật tự c h ừ cái, lần lượt theo từng từ một Cách sấp xếp này đơn giản, dễ tra cứu nếu số phiếu m ô tả lì và tập trung trong m ột ô phiếu T uy nhiên, khi thư viện phát triển, cách sắp xểp này trở nên cồng kềnh và phức tạp vì các phiếu mô tả sẽ được xếp dàn trải trong nhiều ô phiếu khác nhau Khi đó, cách sắp xểp sẽ trờ nên phức tạp vì phải cân nhắc vị Iií của các phiếu mô tả Chẳng hạn, phiếu mô tả các tác phẩm của Charles Dicken được sắp xếp sau hay trước các phiếu mô tà cùa các tác phẩm viết về ông? Ngoài ra, còn xuất hiện một vấn đề khác là các phiếu m ô tả các tài liệu về cùng một chủ đề bị phân tán ở nhiều chồ irong m ục lục Trên thực tế, mục lục kiểu từ điển vẫn được sử dụng ph ổ biến vì phần lớn người sừ dụng tìm tài liệu về một khía cạnh c ủ a vấn đề nhiều hơn là tìm hiểu vấn đề một cách toàn diện Bên cạn h đó, người s ử dụng có thể sử dụng hệ thống các phiếu chí chồ (“x e m ” , “cũng x e m ”) để lìm các khía cạnh khác nhau của các vẩn đề

M ụ c lụ c c h ữ c á i kiểu p h â n đoạn Mục lục chữ cái phân đoạn

được đ ư a vào sử dụng từ nhừng năm 1930 để khắc phục nhược

Trang 10

điểm của mục lục kiểu từ điển M ục lục chừ cái được phân chia thành hai ioại là mục lục chủ đề và mục lục chừ cái tác giả/nhan đề Cách sẳp xếp phiếu m ô tả trong mục lục chừ cái kiểu phân đoạn đơn giản hơn trong m ục lục kiều từ điền và việc tra cứu cũng dề dàng hơn tuy hiện tượng tài liệu về cùng một chủ đề bị phân tán vẫn không khắc phục được Ngoài ra, với cách sắp xếp này lại có

sự bất tiện khác là trước khi tra cứu người sử dụng phải xác định mình cần tìm theo tác giả, nhan đề hay chủ đề để sử dụng bộ phận mục lục tương ứng Vì vậy, người sừ dụng cần được hướng dần và huấn luyện về cách tra cứu các hệ thống mục lục này

C ó một số thư viện phân chia thành ba phằn riêng biệt là mục lục tác giả, mục ỉục nhan đề và mục lục chủ đề M ặc dù cách sẳp xếp phiếu mô tả trong hệ Ihổng này có thể đơn giản nhưng cách tra cứu lại phức tạp hơn so với hệ thống được phân thành hai loại mục lục Chẳng hạn, VỚI cách sắp xếp này, các phiếu m ô tả lác phẩm cùa Dickens được xếp dưới tên Dickens trong mục lục lác giá, các phiếu m ô tả với tiêu đề là nhan đề của các tiểu thuyết riêng lẻ của Dickens được xếp trong mục lục nhan đề và phiếu m ô lả các tài liệu về Dickens được xếp trong mục lục chủ đề

Cách tồ chức m ục lục chủ đề sẽ được đề cập sau Trong mục này chỉ đề cập cách tổ chức mục lục chừ cái tác giả và nhan đề được gọi là mục lục c h ữ cái (MLCC)

C ác q u i tắ c tồ chức Qui tắc lổ chức chung nhẩt là tất cả các

phiếu (bao gồm phiếu mô tà, phiếu tiêu đề, phiếu chỉ chồ) trong

M LCC đều được xếp theo trật tự vần chữ cái của từng ngôn ngừ hay của ưm g hệ ngôn ngừ được chọn để thể hiện liêu đề m ô tả Trong một số trường hợp, các phiếu được sắp xếp không theo nguyên tắc

Trang 11

này Ví dụ, các tác phẩm của cùng m ộ t tác giả được xếp theo thứ tự lẩn lượt là toàn tập, tuyển tập và các tác phẳm riêng lẻ (ở phần này các tác p h ẩ m được xếp theo trật tự c h ừ cái tên tác phẩm).

Qui tắc tồ chức này được thề hiện qua các qui tắc cụ thể sau đây

- C á c phiếu mô tả trong M L C C được xếp theo trật tự vần chừ cái đầu tiên của tên tác giả hoặc nhan đề tài liệu N ếu chữ cái đầu tiên giống nhau thì căn cứ vào các c h ừ cái tiếp theo

- T ro n g mồi vần chừ cái, tên tác giả được viết tắt phải xếp trước các tên tác giả được viết đầy đủ

- C á c tác giả Việt N am được xếp theo vần chữ cái họ, tên đệm, tên riêng hoặc bút danh Các tác giả nước ngoài được xếp theo họ, tên riêng, tên đệm đúng như mô tả trên phiếu Nếu các tác giả trùng c ả họ, tên thì phân biệt theo nghề nghiệp hay thứ bậc irong gia đình V í dụ:

Nguyền Q u a n g Sáng, Đ ạo điền

N guyền Q uang Sáng, N h à vãn

- Phiếu m ô tả các tác phẩm của một tác giả được xếp tập trung vào một chồ và iheo thứ tự sau:

Trang 12

+ Tác phẩm của riêng tác già hoặc tác giả cùng viết với người khác được xếp theo thứ lự: toàn tập, tuyển tập, các tác phẩm riêng lẻ;

+ Các tác phẩm m à tác già Iham gia vào việc xuất bản với tư cách là người biên soạn, dịch, biên tập, hiệu đ ín h được xếp iheo vần c h ừ cái nhan đề tài liệu và không tính đến vai trò của tác giả trone việc xuất bản tài liệu;

+ Các tác phẩm nói về tác già thì phiếu mô tả bổ sung về tác giả đó được xếp theo thứ tự vần chữ cái họ tên người viết hoặc nhan đề của tác phẩm

- Tác giả có nhiều tên gọi khác nhau, tác già nước ngoài được dịch hoặc phiên âm theo nhiều cách khác nhau thì các phiểu mô tà iên quan đến tác phẩm hay bản Ihân tác giả được sắp xếp dưới tên thông dụng nhất và lập phiếu chỉ chồ cho các tên khác

Ví dụ: Phiếu chi chỗ:

Lê Hữu Trác Xem

Hải T hư ợ ng Lãn ô n g

- Tác giả là tổ chức, cơ quan

+ Các tổ chức chính irị, c ơ quan nhà nước, các tổ chức quốc gia và quốc tế với các lên gọi irong các thời kỳ khác nhau dược sắp xếp tập trung dưới lên gọi chính thức hiện nay của tổ chức hoặc cơ quan đó và có phiếu chi chỗ cho các tên gọi cũ

+ Các tổ chức chính trị được xếp theo thứ lự c h ừ cái các tổ chức trực thuộc

118

Trang 13

Ví dụ:

Đảng Cộng sản Việt nam Ban bí thư

Ban chấp hành

Bộ chính trị Đại hội

9

Thành ủy Tinh ùy

+ Các lần đại hội, hội ngh) của các tổ chức chinh Irị đưọc xép theo trật tự lớn dần của các kỳ đại hội, hội nghị

+ Phiếu mô tả của các c a quan nhà nước Việi N a m được xếp theo trình tự:

Ví dụ: 1001 đêm được xếp vào vần M - Một nghìn ỉc một đêm+ Nếu một tác phẩm được tái bản nhiều lần thì xếp theo irình

tự thời gian ngược từ mới đến cù (lần tái bản sau được xếp lên trên lan xuất bản trước)

+ Nếu một tác phẩm được xuất bản hoặc tái bản bởi nhiều nhà xuất bản khác nhau thì các phiếu mô tả được xếp theo trật tự sau: Năm xuất bản - Nơi xuất bản - Nhà xuất bản

Trang 14

+ Các m ạo từ đứng đầu nhan đề, tiêu đề thường được bò qua khi xếp phiếu mô tả, trừ ta rờ n g hợp đó là m ột bộ phận không thể thiếu được trong tên cá nhân.

- Sắp xếp các phiếu chỉ chồ: các p h iế u chi chồ “cũng xem” được xếp trước các phiếu mô tả hay biểu ghi c ó cùng tiêu đề

Các bư ớc tổ chứ c Việc tổ ch ứ c các phiếu m ô tá trong

M L C C bao gồ m các bước cụ thế n h ư sau;

- Bước 1: N h ó m s a bộ các phiếu theo vần chừ cái: các thư

viện thường sử d ụ n g c ác h ộ p phiếu, mồi hộp được chia thành nhiều ngăn n h ỏ và được đánh dấu theo trật tự chữ cái để n h ó m phiếu sơ bộ

- Bước 2: x ế p phiếu vào các ô phiếu trong tủ mục lục theo

hệ thống phân loại nào đó

M ụ c lục phân loại phản ánh k h o tài liệu c ủ a thư viện theo nội dung các ngành khoa học m ột cách hệ thống, ư u điềm của mục lục phân loại là không bị ảnh hường bời s ự thay đổi thuật ngữ vì nó sử dụng c ác ký hiệu, c h ữ và/hoặc số thay c h o từ ngừ Nhược điểm lớn nhất c ủ a M L P L ỉà do được xây d ự n g d ự a trên m ộ t khung phân loại nhất định nên nếu người dùng tin k h ô n g q u e n với các ký hiệu phân

Trang 15

loại thì sẽ gặp khó khăn khi tra cứu và nhiều khi cần có sự hướng dẫn c ù a nhân viên thư viện.

M ục lục phân loại là m ộ t trong những công cụ tra cứu quan trọng, đặc biệt là trong các thư viện không tồ chức kho mờ M L P L giúp người dùng tin tra cứu lài liệu cần thiết theo các đề tài hoặc các lĩnh vực tri thức nhất định

M L P L là công c ụ hỗ trợ nhân viên thư viện trong công tác bồ sung tài liệu, tra cứu tài liệu, biên soạn thư mục, lựa chọn tài liệu cho các triển lãm c huvên đ ề

5.1.7.2 C ầu trú c m ụ c lụ c p h â n ỉo ạ i

C ác bộ phận cấu thành M L P L bao gồ m các phiếu mô tả, các phiếu tiêu đề, các phiếu chi chồ và phiếu ngăn

P h i ế u m ô tả

Các yếu tố trong phiếu m ô tả được trình bày thống nhất theo

m ột qui tắc m ô tả thư mục nhất định K ý hiệu phân loại của tài liệu phải được thể hiện trên phiếu m ô tả Đối với nhừng tài liệu có nội dung phản ánh nhiều vấn đề, nghĩa là có từ hai ký hiệu phân loại trở lên thì phải có phiếu bổ sung c h o các ký hiệu phân loại Mỗi ký hiệu phân loại phải có một phiếu mô lả và các phiếu mô tả này sẽ được sắp xếp ở các vị trí khác n h a u trong MLPL

P h i ế u tiê u đề

T ro n g M L P L cũng sừ d ụ n g các phiếu tiêu đề có gờ nhô lên như trong M L C C Các phiếu tiêu đề đ ư ợ c chia thành nhiều cấp tương đ ư ơ n g với các lớp trong khung phân loại Các phiếu tiêu đề

có gờ nhô ỡ giừa thường được dành cho các lớp phân chia thử nhất

Trang 16

(tiêu đề c ấ p 1), thứ hai (tiêu đề cấp 2), đôi khi cho lớp thứ ba (ùôu

đề cấp 3) C ác phiếu c ó g ờ nhô bèn phải hoặc bôn trái đành cho các cấp chia tiếp theo Trên gờ phiếu tiêu đề ghi ký hiệu phân loại vù tên đề mục phân loại cùa khung phân loại được sử dụng Trong thân phiếu ghi ký hiệu phân loại và tên các m ục con ÍIVC thuộc Ví

dụ dưới đây là phiếu tiêu đề cấp I Các phiếu tiêu đề cấp 3, cấp 4 cũng được m ô tả tưcmg lự

Phiếu chỉ chồ đi (“ x e m ” ) h ư ớ n g dẫn người sử dụng lìm tài liệu ờ đề m ục chính xác trong trường hợp tài liệu có nội dung được phản ánh ờ nhiều m ục n h ư n g chỉ đ ư ợ c xếp ở m ột m ục nhất định

P h i ế u n g ă n

C ác phiếu ngăn có kích thước b ằ n g phiếu m ô là nhưng khác màu, được dùng để phân cách c ác phiếu m ô tả có cùng ký hiệu phân loại n h ư n g khác nhau ở m ột số đặc đ iể m khác n h ư ngôn ngừ, loai hình tài liêu

Trang 17

5.1.7.3 C ách tổ ch ứ c p h iế u m ô tả tro n g M L P L

Sơ đồ tồ chức thông tin được áp d ụ n g trong M L P L là sơ đồ đảo, nghĩa là các phiếu m ô tà được sắp xếp theo ký hiệu phân loại thể hiện nội dung tài liệu

Trong M L P L , các phiếu mồ tả có c ù n g ký hiệu phân loại được xếp chung sau mồi phiếu tiêu đề trên đ ó ghi ký hiệu phân loại

và tên đề mục tương ứ ng trong khung phân loại Đ ể thuận tiện cho việc tra 2 ỨU sat’ n c i phiếu tiôu đè chỉ nên xếp k h o ả r g 50 phiếu mô

lả Các phiếu m ô tả trong từng mục đ ư ợ c xếp theo tù n g lìhóm ngôn ngữ và có phiếu ngăn giừa các nhóm ngôn ngừ T r o n g mỗi nhóm ngôn ngừ, các phiếu m ô tả được xếp theo th ứ tự vần c h ữ cái các tiêu đề mô tả (tên tác giả hoặc nhan đề tài liệu) C ũ n g có thể sắp xếp các phiếu m ô tả theo thứ tự thời gian ng ư ợ c c ủ a năm xuất bản

và các lần xuất bản tài liệu (tài liệu mới xuất bản được xếp lên íniớc các tài liệu cũ hơn) để ưu tiên giới thiệu các tài liệu mới

Mục iục phân loại được chứa trong các hộp phiếu trong tủ mục lục Trên mồi hộp phiếu có nhãn ghi ký hiệu phân loại và các mục chứa trong hộp phiếu

5.1.7.4 H ộ p p h iế u tra ch íi đ ề - c h ữ cá i

Hộp phiếu tra chủ đ ề - c h ừ cái là c ô n g cụ hỗ trợ cho M L P L nhằm giúp người sứ dụng tra cứu M L P L m ộ t cách hiệu quả Hộp phiếu tra chú đề - c h ừ cái g ồ m cấc đề m ụ c chủ đ ề được trình bày irên phiếu (có hình ihức như phiếu mò là và được gọi là phiếu Ira chủ đề ~ chữ cái) phản ánh nội dung của các tài liệu hiện có tại thư viện Việc lổ chức hộp phiếu tra chủ đề - c h ừ cái th ư ờ n g được thực hiện đồng thời với việc tổ chức M L P L Việc lập các phiếu tra chủ

Trang 18

đề - chừ cái đ ư ợ c thực hiện trên c ơ sở phân ioại tài liệu của thư viện hoặc c ơ quan thông tin và Iheo các bước như sau:

- D ự a trên nội d u n g tài liệu để xác định chủ đề đặc trưng cùa tài liệu;

- Đối chiếu chủ đề vừa được xác định với bảng tra chủ đề trong k h u n g phân Ịoại để bảo đảm sự thống nhất thuật ngừ;

- Trình bày đề mục chủ đề trên phiếu thông thường (7,5 X 12,5 cm) Mồi chủ đề được trình bày trên một phiếu Phần góc phải cùa phiếu ghi ký hiệu phân loại của đề mục hoặc tiểu đề mục

N ếu nội dung tài liệu gồm nhiều chủ đề riêng biệt và được thể hiện bằng nhiều ký hiệu phân loại thì mỗi ký hiệu phân loại phải được thể hiện trên một phiếu tra chủ đề

Các phiếu trong hộp phiếu chủ đề - chừ cái được sắp xếp theo vần c h ữ cái c ủ a các đề mục chủ đề

5.1.8 M u c lu c ch ủ đề• •

5.1.8.1 K h á i niệm

M ục lục chủ đề là hệ thống mục lục trong đó các phiếu mô tả được sắp xếp theo chủ đề cùa tài liệu

M ục lục c h ủ đề phàn ánh vốn tài liệu cùa thư viện theo chù

đề của nội d u n g tài liệu Mục lục chủ đề đặc biệt hữu dụng khi phản ánh nội d u n g tài liệu thuộc các ngành khoa học ứng dụng Vì vậy, m ục lục này th ư ờ n g được sử dụng trong các ihư viện, cơ quan thông tin c huyên ngành

M ụ c lục c h ủ đề giúp người dùng tin tìm tài liệu cần thiết theo từng chủ để c ụ thể Đối với nhân viên thư viện, mục lục chủ đề là

Trang 19

công cụ hồ trợ biên soạn các thư mục c huyên đề, tra cứu theo yêu cầu, tuyên truyền, giới thiệu tài liệu theo các chuyên đ ề

5.1.8.2 C ấu trú c m ụ c lụ c chủ đềt •

Phiếu mô tả

Phiếu mô tả trình bày đầy đủ các yếu tố mồ tả n h ư trong mục lục c h ừ cái ở phía trên góc bên trái c ủ a phiếu ghì ký hiệu xếp giá của tài liệu C ác đề mục chủ đề của tài liệu và ph ụ đề (nếu có) được

!iệl kê phía dưới các >ếu tố mô lả Nếư lài liệu có trSĩi 2 đề mực chủ

đề thì phải lập phiếu bồ sung cho các c h ủ đề

Phiếu tiêu đề

T r o n g m ụ c lục chủ đề cũng sử dụng các phiếu tiêu đề (bao gồm phiếu tiêu đề chính và phiếu tiêu đ ề phụ) để thể hiện các đề mục chủ đề, p h ụ đề và phân chia các phiếu trong cùng chủ đề T hư viện có thể tự lập các phiếu liêu đề hoặc dựa trên m ột b ả n g đề mục chủ đề có sằn

Trang 20

Các phiếu được chứa trong các hộp phiếu trong tủ mục lục Trên mồi hộp phiếu có dán nhãn ghi đề mục chủ đề ở đầu và cuối hộp phiếu.

5.2 Các bộ phiếu thư mục

B ộ phiếu thư mục là công cụ phản ánh các lồi liệu hoặc Ịhông tin về nhìmg vấn đề và đề tài thuộc diện phục vụ của c ơ quan thông tin, thư viện, không phụ thuộc vào loại hình tài liệu và nơi bảo quản chúng

T ùy theo nhiệm vụ và đặc điẻm cùa tồ chức, các c ơ quan thông tin, thư viện có thề xâv dựng các bộ phiếu thu m ục như bộ phiếu tra cứu chính, các bộ phiếu chuyên đề, các bộ phiếu thư mục theo loại hình tài liệu, bộ phiếu tra cứu nhân vật, bộ phiếu tra cứu địa chí

5.2.1 Bộ p h i ế u t r a CÚII c h í n h

Bộ phiếu tra cứu chính được sử dụng để irả lời các yêu cầu tin chuyên đề theo diện phục vụ của cơ quan thông tin, thư viện Đặc điểm của bộ phiếu tra cứu chính là nó phản ánh các tài liệu về những chuyên đề chính cũng như những vấn đề có liên quan thuộc diện bao quát đề tài của c ơ quan thông tin, thư viện, không phụ thuộc vào loại hình và nơi bào quản nhừng tài liệu đó

Bộ phiếu tra cứu chính không chi phản ánh các sách chuyên khảo, các báo cáo và nhừng lài liệu lưưng lự mà còn phản ánh cả các bài trích từ các tạp chí, tuyển tập và các chư ơng m ục của sách

Bộ phiếu này thường được xây dựng trong các c ơ quan thông tin hoặc thư viện chuyên ngành

Trang 21

5.2.2 C á c bộ p h iế u c h u y ê n đề

Các bộ phiếu chuyên đề được xây dựng theo những vấn đề/đề lài được nhiều người quan tâm và có tính thời sự Tương tự bộ phiếu tra cứu chính, các bộ phiếu này được sừ dụng đề trà lời các ycu cầu tin chuyên đề Đặc điểm của các bộ phiếu chuyên đề là chúng phàn ánh vấn đề một cách đ ầ y đủ, toàn diện và phản ánh nhiều loại hình tài liệu, không phụ thuộc vào nơi bảo quản tài liệu

5.2.3 Các bộ phiếu theo loại hình tài liệu

Các bộ phiểu iheo ỉoại hình tài liệu được sử dụng để trả lời những yêu cầu cung cấp các loại hình tài liệu nhất định hoặc thông tin về các loại hình tài liệu, không phụ thuộc vào nơi bảo quản chúng

C ác c ơ quan thông tin, thư viện c ó thể xây dựng các bộ phiếu theo loại hình tài liệu như bộ phiếu bài trích từ báo, tạp chí, bộ phiểu báo cáo về các công trình nghiên cứư khoa học, bộ phiếu catalo c ô n g nghiệp, bộ phiếu các công trình thiết kế, thử nghiệm

5.3 Các bộ phiếu dữ kiện

Các bộ phiếu tra d ữ kiện được xây dựng để trả lời các yêu cầu tin d ừ kiện cụ thể, giúp người dùng tin nhanh chóng tìm được Ihông tin cần thiết

Các bộ phiếu dữ kiện lưu trừ các số liệu hoặc dữ kiện về một đối tượng hoặc một nhóm đối tượng nhất định như các vậl liệu, thiết

bị, quy trình công nghệ, các tổ c h ứ c Các số liệu/dữ kiện này được rút ra từ một hoặc nhiều tài liệu Vì vậy, khi sử dụng các bộ phiếu dừ kiện, người đùng tin được giải phóng khòi các bước tìm tài liệu và rút ra từ những tài liệu lìm được những thông tin cần thiết

Trang 22

5.3.1 Bộ p h i ế u c á c s ả n p h ẩ m , th iế t bị

B ộ phiếu các sản phẩm, thiết bị được sử d ụ n g để trả lời các yêu cầu tin về các tính năng, các thông số kỳ thuật, đặc đ iể m kết cấu, giá thành của sản p h ẩ m hoặc thiết bị, các nhà sản xuất và cung cấp sản phẩm hoặc thiết bị

N guồn thu thập và bổ sung thông tin cho bộ phiếu sản phẩm

và thiết bị bao gồ m nhiều loại tài liệu khác nhau như c ác catalô công nghiệp c ủ a các nhà sản xuất hoặc cung cấp trong và ngoài nước, các bảng giá, các tạp chí khoa học - công nghệ và tạp chí thương mại - c ô n g n g h i ệ p

5.3.2 Bô phiếu dữ kiên về vât liêu

B ộ phiếu d ừ kiện về vật liệu cung cấp d ừ kiện về tính năng, công dụng, lĩnh vực ứ n g dụng, thành phần hóa học, các tính chất cơ học, công nghệ c h ế tạo, giá thành, nhà sản xuấí/cung c ấ p của các vật liệu khác nhau

Bộ phiếu d ữ kiện về vật liệu thường được xây d ự n g trong các

c ơ quan thông tin c huyên ngành như trung tâm thông tin xây dựng, trung tâm thông tin dệt - m a y Nguồn thu thập và bổ sung thông tin cho bộ phiếu vật liệu là các ỉoại tài liệu n h ư c ác catalô công nghiệp của các nhà sản xuấưcung cấp, các tài liệu định m ức kỳ thuật, sổ tay kỹ t h u ậ t

5.3.3 B ộ p h iếu c á c q u y trình công n gh ệ và sá n g kiến

Bộ phiếu các qu y trình công nghệ và sáng kiến cung cấp thông tin về các qui trình công nghệ và các trang thiết bị tiên tiến, các sáng kiến cải tiến k ỳ thuật được đề xuất và áp d ụ n g ở các c ơ sở nghiên cứu, sản xuất B ộ phiếu này thường được x â y d ự n g trong các c ơ quan thông tin c h u y ên ngành

Trang 23

Chương 6

HỆ THỐNG TÌM TIN T ự ĐỘNG HÓA• • »

6.1 Khái quát về hệ thống tìm tin tự động hóa

6.1.1 K h á i n iệ m «

ỉ l ệ thốn^ tìm lin ụr độ ig, hóa (H T T T T Đ H ) là 'lệ tliống tìm tin

sử dụng m á y tính điện tử để thực hiện một số chức năng

M ộ t hệ thống lìm lin tự động hóa bao g ồ m các thành phần cơ bản sau:

- Hệ thống công cụ logic - ngừ nghĩa;

- C ác phương tiện kỳ thuật đảm bảo thực hiện các chức năng

c ủ a hệ thống;

- C ác c ơ sở d ừ liệu;

- Các yểu tố và phương tiện đ à m bảo vận hành hệ thống

H ệ thống công cụ logic - ngừ nghĩa bao g ồ m các c ô n g cụ xử

ý hình thức và nội dung lài liệu n h ư các qu y tắc m ô tả thư mục,

zấc khổ m ẫu trao đổi d ừ liệu, các ngôn n g ữ tìm tin, các q u y lắc sử

dụng các c ô n g c ụ logic - ngừ nghĩa, các tiêu chuẩn phù hợp ngừ nghĩa và m ột số cồng cụ ngừ nghĩa khác Hệ thống c ô n g cụ - ngừ íighĩa đ ó n g vai trò quan trọng trong việc xừ lý, trình bày, tồ chức

và tìm kiếm thồng tin

C á c ph ư ơ n g tiện kỳ thuật bao gồ m phần cứng, phần m ề m và :ác thiết bị viễn thông

Trang 24

M ộ t hệ thống phần cứng máy lính điện tử bao gồ m m ộ t bộ xử

ý trung tâm (CPU) và các thiết bị ngoại vi

B ộ xử lý trung tâm thực hiện các chức n ă n g chủ yếu của máy lính điện từ Bộ x ừ lý trung tâm có ba khối là khối điều khiển, khối tính toán và bộ nhớ trong

B ộ n h ớ trong (R A M , R O M ) chứa ihông tin đ ư ợ c ghi trước và được cung cấp

R A M (R a ndom -A cc e ss M emory) là bộ n h ớ chi chửa thông tin khi m áv tính làm việc Thông tin ờ dạng d ữ liệu hoặc chương trình được nhập vào R A M khi bộ x ử lý trung tâm yêu cầu Thông ihirờng, thông tin được n h ậ p trực tiếp vào R A M từ bàn phím hoặc các thiểt bị nhập khác hoặc được lải lừ các bộ n h ớ ngoài (ihiết bị lưu írừ ngoại vi)

R O M (R ead-O nly M em ory) là bộ nhớ c h ứ a c ác chương innh điều khiển c ơ bàn, các phần mềm hệ th ố n s và ứ n g d ụ n g do nhà sàn xuất cưng cấp T h ô n g tin được chứa trons R O M có thề đọc được - nghTa là c ó Ihề tìrn lại để bộ x ừ lý trung tâm sừ dụng, nhưng khôns Ihể xóa, bổ sung hoặc chinh sửa

C ác thiết bị ngoại vi thực hiện chức năng nhập, xuất hoạc lưu trử thông tin Các thiết bị nhập như bàn phím, m áy q u é t được sứ dụng để nhập thông tin vào máy tính điện từ, nghĩa là chuyển thôn? tin lừ d ạ n g ngôn n g ữ tự nhiên sang dạng đọc máy T h ô n g tin được nhập vào m áy tính dưới dạng mã hóa, mỗi ký tự được bicLi điền dưới d ạ n g m ột chuồi các số nhị phân Có nhiều hệ thống mã dùng cho c ác loại m á y lính điện từ khác nhau, trong đ ó c ó hai hệ thống

m ã quan trọng là E B C D I C (Extended Binary C o d e d Decimal Interchange Code) và A SC II (American S tandard C ode for IníoiTnation Interchange)

Trang 25

Các thiết bị xuất như màn hình, máy in được sử d ụ n g để xuất thông lin lừ máy tính điện tử, nghĩa là c huyển thông lin từ dạng đọc m áy sang dạng ngôn ngừ tự nhiên.

Các thiết bị ngoại vi và phương tiện lưu trừ thông tin được thiết kế để lưu giữ thông tin ở dạng đọc máy Các thiết bị này được xem như bộ nhớ ngoài, bổ sung cho bộ n h ớ trong hạn chế c ủ a bộ

x ừ lý trung tâm B ộ n h ớ ngoài của m áy tính điện từ bao g ồ m băng

từ, đĩa quang, đìa từ (đĩa cứng và đĩa mềm)

Phần rnèm ỉà một chương trình hoặc một tập h ợ p có cáu trúc các lệnh cho phép m áy lính thực hiện các chức nàng xừ lý thông tin Các lệnh này có thể được biểu diễn bằng ngôn n g ữ m áy ở dạng

m à nhị phân hoặc bằng ngôn ngừ lập trình và sau đó được dịch sang ngôn ngừ m áy bằng các trình dịch C ó hai loại phần m ề m là phần mềm hệ thổng và phần m ề m ứng dụng

Phần mềm hệ thống là các chương trình cần thiết để thực hiện

và điều khiển các hoạt động cùa một máy lính như khởi đ ộ n g máy lính, đ iề u khiển x u ấ t v à n h ậ p d ừ l i ệ u

Phần m ềm ứng dụng là phần m ềm được thiết kế để thực hiện các nhiệm vụ, chức năng thường được người sử dụng m áy tính yêu cầu Cũng giong như các loại phần m ềm khác, phần m ề m ứ ng dụng được cung cấp bởi các nhà sàn xuất m áy tính hoặc các c ô n g ly chuyên phát triổn phần mềm Có nhiều loại phần m ềm ứ ng dụng

n h ư p h ẩ n m ềm s o ạ n i h à o vãn b án , p h ầ n m ề m q u ả n trị d ừ liệu, p h ầ n mềm thiết kế đồ họa, phần mềm truyền thôns; và các phần mềm chuyôn dụng Irong các lĩnh vực khác

C ơ sớ dử liệu là thành phần c ơ bàn của một hệ thống thông tin ụr động hóa Vì vậy, cơ sở dừ liệu sẽ được đề cập chi tiết hơn ờ nhiìng phần tiếp theo trons chương này

Trang 26

Các yếu tố và phương tiện đảm bảo vận hành hộ thống lÌTi lin bao gồm nhân sự và các tài liệu hướng dẫn nghiệp vụ Nhản sự làm việc với hệ thống bao gồm các nhóm chuyên gia có írách nhiệm thiết kế, xây dựng, vận hành, khai thác, bảo trì hệ thổng và những người dùng tin sử dụng hệ ihống đề lìm tin.

6.1.2 Phân loai hê th án g tìm tin tư đ ô n g hóa

C ó thể phân ioại hệ thống lìm lin lự động hoá dựa trên cic cơ

sở khác nhau Sau đây là cách phân ỉoại dựa trên mục đích cung cấp dịch vụ, phương thức truy cập và thế hệ c ủ a hệ thống tìm :in lự động hóa

6.1.2.1 Phân lo ạ i th eo m ụ c đích cu n g cấp dịch vụ

Theo mục đích cung cấp dịch vụ, có thể phân các hệ hống lìm tin tự động hóa thành hai loại ià hệ ihống tìm tin nội bộ và hệ thổng tìm tin Ihương mại Hệ thống tìm tin nội bộ được xây dựng nhằm phục vụ người sử dụng thuộc một tổ chức nhất định Hệ thống tìm tin thương mại cung cấp dịch vụ truy cập các CSDL hoặc ngân hàng dữ liệu cho người sử dụng dựa trên c ơ chế thị trjờng Người sử dụng Ihanh toán phí dịch vụ dựa trên mức độ sử dụng dịch vụ

6.1.2.2 Phân lo ạ i th eo p h ư ơ n g íh ú v tru y cập

Theo phương thức truy cập CSDL, có thể chia các hệ :hống tìm tin tự động hóa thành hai loại là hệ thống tìm tin cục bộ và hệ thống tìm tin trực tuyến Hệ thống tìm tin cục bộ cung cấp khả năng truy cập các C S D L được lưu trữ trên máy tính điện từ tại chồ trong khi hệ thống tìm tin trực tuyến cung cấp khả năng truy cập các C S D L được lưu trừ trên các máy tính điện tử ờ xa thông qua

Trang 27

m ạng máy tính và các phương tiện viễn thông Nguyên lý và kỳ thuật tìm tin trên hai hệ thống này về c ơ bàn không có sự khác biệt

Đ iểm khác biệt giừa hệ thống tìm tin trực tuyến với hệ thống tìm tin cục bộ là công nghệ truy cập phức tạp hơn, bat buộc phải có các phưímg tiện viễn thông để đảm bảo ph ư ơ n g thức truy cập lừ xa

6.1.2.3 Phân lo a i theo th ế h ê củ a h ê th ố n g tìm tin• • • o

T h e o thế hệ của hệ thống tìm tin, có thể chia các hệ thống tìm tip tự động hóa íhành ba loại như sau:

- Hệ thống tìm lin thế hệ thứ nhất: là hệ thống cung cấp khả năng tìm thông tin thư mục với các lệnh tìm ờ dạng dòng lệnh Cách sử dụng hệ thống phức tạp, đòi hỏi người sử dụng phái có nhừng kỹ năng tìm tin nhất định Vì vậy, người sừ dụng hệ thống này chủ yếu là các chuyên gia thông tin

- Hệ thống lìm tin thế hệ thứ hai; là hệ thống cung cấp khả

n ã n s tìm ihông tin thư mục và toàn vãn với các lệnh tìm ờ dạng hệ thống thực đơn Cách sử dụng hệ thống này đơn giản hơn so với hệ thống Ihế hệ thứ nhất Người sử dụng hệ thống có thể là các chuyên gia hoặc người sừ dụng Ihông thường

- Hệ thống tìm tin thế hệ thứ ba: là hệ thống cung cấp khả năng tìm thông tin đa phương tiện, cho phép người sử dụng khai thác thông tin một cách dễ dàng qua các giao diện đ è họa

6.2 Các chức năng của hệ thống tìm tin tự động hóa

6.2.1 Tìm tin

C hức năng tìm tin cho phép tìm các biểu ghi trong C S D L đáp ứng yêu cầu tin cụ thể của người sử dụng Đe thực hiện việc tìm tin

Trang 28

trong hệ thống, người sừ dụng phải thề hiện yêu cầu tin b ằ n g biểu thức tìm Biểu Ihức tìm có thể bao gồ m vãn bán với ngôn ngừ tự nhiên ờ dạng kết hợp và/hoặc các ihuật n g ữ tìm được kết hợp với nhau bời các loán lừ lìm tin Biểu thức tìm tin có thể áp d ụ n g với biểu ghi đ ầ y đủ hoặc chứa một số các thông số bồ sung giới hạn tìm trong m ột vùng c ủ a biểu ghi (ví dụ trong một truờng nào đó).

6.2.1.1 L o g ic B o o l

Logic Bool cho phép người sử d ụ n s kết hợp nhiều khái niệm với nhau m ột cách logic để xác định thông tin cần thiết C ác phép toán cúa logic Bool cho phép thực hiện ba loại quan hệ c ơ bản giửa các khái niệm là quan hệ tư ơng giao, q u a n hệ kết hợp và quan hệ loại tiTÌ Các toán tử Boo! được sừ d ụ n g tư ơ n g ứng là A N D , OR, và NOT Đ ây là n h ừ n g toán tứ Bool đ ư ợ c s ử dụng phô biến nhất Irong các hậ thống tìm tin

Toán tử A N D được sứ d ụ n g đế lìm các biểu ghi đ ồ n g Ihời chứa các ihuật n g ừ tìm đã được xác định Với biểu thức tìm có dạng: A A N D B, trong đ ó A, B là các thuật ngừ tìm ihì kếi quá lìm được là các biểu ghi đồng thời c h ứ a A và B

Toán tử O R cho phép tìm các biểu ghi thỏa mãn yêu cầu là chứa ít nhất một trong n h ừ n g thuật n g ữ tìm đã được xác định trong biểu thức tìm Với biểu thức tìm có d ạ n g A O R B thì kết quà tìm được là các biểu ghi c h ứ a một Irong hai ihuật ngừ hoặc chứa cà hai thuật ngừ A và B

Toán tử N O T cho phép tìm c ác biểu ghi thóa mãn yêu c ầ u là chì chứa thuật ngữ tìm đ ứ n g trước toán tử và không chứa thuật ngữ tìm đứng sau toán từ Nếu biểu thức tìm c ó dạng A N O T B thì kết quả lìm được là các biểu ghi chí chứa thuật ngữ A và không chứa

Trang 29

thuậl ngừ B T h ứ tự của các thuật n g ữ tìm trong biêu thức tìm với toán từ N O T có ý nghĩa quan trọng Kẻl quả c ủ a biểu thức tìm A

N O T B sè khác kếl quả c ủ a B N O T A

Ngoài các toán tử Bool nói trên, mộl số hệ thống còn sử dụng toán tử X O R (Exclusive O R ) n h ư n s nói chu n g khồng hữu ích đối với người sử dụng vì phần lớn n s ư ờ i sứ dụng k h ô n g hiều toán từ này Toán tử X O R cho phép tìm các biểu ghi thỏa m ãn điều kiện là chi chứa một trong hai thuật ngừ đã được xác định, không được đồnỵ rhời chưa cả hai thuật ngử N ếu biểu ihửc tim c ó dạng A

X O R B thì kết quà tim được là các biểu ghi chỉ c h ứ a A hoặc B, không bao gồ m các biểu ghi c h ứ a cá A và B

Dấu ngoặc đơn được sử dụng trong biểu Ihức tìm tin đề xác định trình tự thực hiện các p h é p toán Bool N ếu trong biểu thức không sử dụng ngoặc đơn, hệ thống sẽ thực hiện các p h é p toán theo

tn n h tự ưu tiên mặc định (thông thường theo thứ tự N O T , AND,

O R và từ trái sang phài) Phần iợn các hệ thống thương mại không cho phép s ứ dụng kỳ thuật tìm theo irọng số thuật n g ữ (W eighted term) trong các biểu thức sử dụng các phép toán Bool

Logic Bool có ưu điểm là logic rõ rà n g và có thể dề d à n g viết trình dịch cho logic này Hạn chế c ủ a logic Bool !à phần lớn người

sừ dụng khÔK*g tư duy mộl cách tự nhiên trong các điều kiện của logic Booỉ Vì vậy, logic này c ó vẻ nhân tạo và đôi khi người sừ dụng gặp khó khăn khi biếu đạt yêu cầu tin hoặc khi xem kết quả tìm được M ột hạn chê khác là các biêu thức Bool có thê cho nhiêu kết quà tìm và không phân biệt m ứ c độ thích hợp c ú a các biểu ghi tìm được C ó thể khắc phục hạn c h ế này b ằ n g cách tìm tinh lọc với các điều kiện n h ư ngôn ngữ, thời gian

Trang 30

6.2.1.2 Toán tử lân cân

Toán từ lân cận được sử dụng để qui định khoảng cách yêu cầu giừa hai thuật ngừ tìm trong một biểu ghi nhằm tăng đ ộ chính xác của việc tìm tin Hình thức biểu diễn tổng quát của toán tử lân cận là:

Thuật ngữ tìm 1 trong “m ” “đon vị” cùa thuật n g ữ tìm 2

Toán tử khoảng cách “m ” là một số nguyên và các đơn vị ià

ký tự, từ, câu hoặc đoạn văn

Các hệ Ihống tìm tin khác nhau có thể sừ dụng các đơn vị ngừ nghĩa khác nhau để xác định khoảng cách Ví dụ, với các biểu ghi

c ó cấu trúc, đơn vị để tính khoảng cách là ký tự Với các biểu ghi

c ó chứa hình ảnh, đoạn vãn giữa các hình ảnh có thể giúp tìm chính xác m ột hình ảnh nào đó T ro n g một số trường hợp, toán lừ iân cận xác định vị trí của thuật ngữ lìm ihứ 2 đối với thuật ngữ tìm Ihứ i (trước hoặc sau thuật ngừ tìm thứ 1) và trong m ộl khoảng cách được xác định C hẳng hạn, toán tử lân cận Adjacent (ADJ) thường qui định hai thuật ngừ phải nằm kề nhau và chỉ theo một chiều xuôi V í dụ, với biểu thức:

Information ADJ Science

Trang 31

Kết quả tìm được bao gồm các biểu ghi có chứa “ Informalion Science” và không bao gồm các biểu ghi c ó chứa “Science Iníorm ation”

M ộ t trường h ọ p đặc biệt khác là khi khoảng cách được xác định bằng zero có nghĩa là nằm trong c ù n g đơn vị ngừ nghĩa Ví

dụ, với biểu thức;

“ Nucỉear” within zero paragraphs o f “cỉean-up”

K Ì t q j ả tìm đuợc; baD gồni các biểu ghi chứa “ Nacỉear” và

“clean-up” trong cùng một đoạn văn

Các hệ thống tìm tin khác nhau có thể sử dụng các loại toán

tử lân cận khác nhau Hơn nữa, cách biều đạt cùng m ột toán từ lân cận irong các hệ thống tìm tin cũng có thể khác nhau

6.2.1.3 Tìm cum t ừ chính x á c

M ột cụm từ bao gồ m hai hoặc nhiều từ và được xem như một đơn vị ngừ nghĩa độc lập Ví dụ, “United States o f A m erica” là một cụm từ bao g ồ m bốn từ, được xác định như m ột thuật ngữ tìm thể hiện một khái niệm ngữ nghĩa c ụ Ihể (một quốc gia) và có thể được

sử dụng với m ột toán tử bất kỳ trong số các toán tử đã được đề cập

ở trên

Toán từ tìm cụm từ chính xác là m ột toán tử đặc biệt tương tự toán tử lân cận (Adjacent) cho phép tìm các từ nằm kề nhau và theo một trật tự xác định

6 2 1 4 T oán t ử ch ặ t từ (T runcation)

K ỹ thuật tìm tin với toán từ chặt từ cho phép m ở rộng một thuậi ngừ tìm bằng cách chặt bớt một phần của thuật ngữ và tìm tất

Trang 32

cà các biếu ghi c ó chứa phần còn lại ciia thuật ngữ đó Ví dụ, biểu thức tìm tin s ử dụng toán tứ chặt từ với ký hiệu * như sau: Fish^-

Khi đó, các biều ghi có chứa các thuật ngừ tìm như: Fish; Pishbone; Pisher; Pisherman; Pishery; Pishing; Pishing line đều được xem là thích hợp với yêu cầu tin và đều được liệt kê trong kết quả tìm

Kỳ thuật chặt từ có tác dụng m ở rộng kết quà tìm Các hệ thống tìm tin c ó thể hỗ trợ kỹ thuật chặt từ bên trái (tìm tiếp vĩ nsừ), chặt từ bên phải (tìm liếp đầu ngữ) hoặc chặt cà hai bên cùa từ, Có một số hệ thống hồ trợ kỳ Ihưật chặt từ ở bên trong từ Ví dụ;

Các biểu ghi có chứa “ minicomputer"

“ m i c r o c o m p u t e r ” h o ặ c “ C o m p u ter ” đ ề u được coi

là th íc h h ợ p

C ác biểu ghi có chứa “c om puters” , “c o m p u tin g ” ,

“c o m p u ie s ” đều được coi là thích hợp

C ác biểu ghi có c h ứ a “ m icrocom putcrs”

“ m inicom puting” , “c o m p u te ” đều được coi là thích hợp

C ác biểu ghi có chứa “ m u lti-n a iio n a r’,

“ multinational” đều được coi là thích hợp

6 2 Ĩ.5 K ỹ th u ậ t tìm so sánh

K ỳ thuật tìm so sánh cho phép tìm theo các dấu hiệư định lượng T o á n tử so sánh (=, <, >, <=, >= ) đ ư ợ c sử dụng trong nhiều

Trang 33

hệ thống tìm tin để tìm theo giá trị số hoặc dãy số (hoặc ngày tháng) Ví dụ:

Ví dụ:

- w o m ? m có thể cho kết quả là các biểu ghi chứa w om an loặc women

- c o o k in s * classes có ihể cho kết quả là các biểu ghi chứa

“cooking school ciasses” hoặc “c o o k in g and w ine tasting classes”

6.2 ĩ , 7 K ỹ th u ậ t tìm th eo trọ n g s ố củ a th u ậ t n g ữ

T ìm theo trọng số của thuật ngừ (W eighted term) là k ỳ thuật tìm cho phép tìm các từ và cụm từ bằng cách xác định tầm quan irọng của từng thuậl ngừ theo cám nhận c ủ a người sử dụng T rọ n g

số là một sổ từ 0.0 đến l.o (hoặc c ó thể là số nguyên) chỉ m ứ c độ quan trọng c ú a từng thuật ngừ tìm trong tập hợp các thuật ngữ Ví

dụ, trong m ột biểu thức tìm với nhiều thuật ngừ, ta có thể xác định cho từng thuật ngừ tìm một irọng số chi tầm quan Irọng c ủ a thuật ngừ đó trong mối tương quan với các thuật ngừ khác trong biếu

Trang 34

thức tìm Trong kết quá tìm, nhừng biểu ghì thích hợp nhất sẽ được sắp xếp đầu liên, Iheo trọng số tương quan đã được xác định,

Ví dụ, với biểu thức tìm:

{TENNIS(.8) O R G 0 L F (.4 ) ) A N D C H A M PIO N {.6)

Một H T T T thực hiện biểu thức tìm này trước hết có thể xử lý tương tự như với một biểu thức Booỉ thông thường đe tạo ra một tập kết quả ban đầu, sau đó mới sử dụng các ư ọ n g sổ đã xác định

để tính hạng cho từng biểu ghi Nếu TE N N IS và C H A M P IO N xuất hiện trong một biểu ghi thì biểu ghi đó sè có trọng số 8 + .6 = 1.4 Nếu hai thuật ngừ G O L F và C H A M P IO N xuất hiện, biểu ghi có trong số 4 + 6 = l.o Nếu cả hai thuật ngừ T E N N ĨS VA G O L F cùng xLiẩt hiện với C H A M P IO N , biểu ghi có thê có trọng số 8 + 4 + 6 = 1.8 hoặc 8 + 6 = 1.4 nếu ta chí sừ dụng giá trị cao hơn trong

biểu thức OR Khi đó, các biểu s,hi troris kết quả tìm sẽ được sắp

xếp theo Ihứ lự như sau:

1 Biểu ghi chứa đồng thời 3 thuật ngừ với tổng trọng số 1.8

2 Biểu ghi chứa TENNIS V À CHAM PION với tồng trọng sổ1.4

3 Biếu ghi chứa G O LF và CH A M PIO N với tổng trọng số 1.0

6.2.2 H iể n thị k ế t q u á

Khi kết thúc tìm tin, chức năng hiển thị của hệ thống sỗ hồ trợ người sử dụng xác định các biểu ghi cằn thiết và lựa chọn đổ hiền thị Có hai cách hiền thị tóm iược kết quả tìm c ủ a một biểu thức: trình bày các biểu ghi theo dòng và bằng đồ thị Từ những trình bày tóm lược này, người sừ dụng có thể lựa chọn các biểu ghi

Trang 35

cụ thể và các trường trong biếu ghi để hiền thị H ệ thống cũng cho phép di chuyển dề dàng giữa các trình bày tóm lược và xem các biểu ghi cụ thể N eu biểu thức tìm không chính xác thì kết quả tìm

có thể chứa nhiều biểu ghi không thích hợp với yêu cầu tin của người sừ đụng M ột số hệ thống cung cấp các chức năng: Tìm lại trong các kết quả lìm; Lọc lại kết quà tìm hoặc Đ ánh dấu các biểu ghi được chọn để giúp người sử dụng chọn lọc được các biểu ghi thích họ p nhắt

6 2 2 ỉ Sắp xếp k ế t qu ả ã v i

Trong các hệ thống sừ dụng toán tử Bool, kết quá tìm được

hiển thị là tổng số các biểu ohi tìm được Tất cả các biểu ghi tìm được đều thỏa mãn các điều kiện của biểu thức Bool Có thể dễ dàng tìm hiểu lý do một biểu ghi được lựa chọn (ví dụ dựa vào các thuật ngừ được đánh dấu) và được hiển thị trong các biểu ghi tìm được Các kết qu? tìm có ihể được sắp xếp theo một dấu hiệu nào

đó, ví dụ, theo nhan đề hoặc theo trình tự thời gian từ mới đến cũ NcLi*SLr dụng cách sắp xếp dựa trên mức độ thích hợp của kết quả tìm được thì hệ thống sẽ hiển thị biểu ghi c ù n g với điểm số về mức

độ thích hợp và một mô tả biểu ghi ngắn gọn (thường trong cùng một dòng trên màn hình) Vì mồi biểu ghi thường chỉ được dành một dòng trên màn hình khi hiền thị ngắn gọn nên các hệ thống chỉ hiến thị một phần cúa một trường trong biểu ghi (thường là trường nhan đề) cùng với điếm số về mức độ thích hợp của biểu ghi Điểm

số về mức độ thích hợp là sự đánh giá của hệ thống về mức độ đáp ứng cùa biểu ghi đối với biểu ihức tìm Điều này cho phép người sừ dụng dề dàng lựa chọn các kết quả thích hợp nhất với yêu cầu tin Đối với người sử dụng, cách trình bày điểm số cụ thể về mức độ thích hợp của biểu ghi khó hiểu hơn cách trình bày các biểu ghi

Trang 36

theo lừng loại mức độ thích hợp C hăng hạn, một sô hệ thông phân

ra các loại mức độ thích hợp và mồi loại được ihể hiện bằng một màu N hư vậy, các biểu ghi có mức đ ộ Ihích hợp khác nhau sẽ được hiển thị bằng các màu khác.nhau M ột số hệ thống phân thành các mức độ như cao, tương đốl cao, trung bình, thấp và không Ihích hợp Với kỳ thuật sử dụng màu, hệ thống không cần ghi chi số về

m ức độ thích hợp của biểu ghi, nhờ vậy có Ihể dành ihêm chồ để hiển thị nhan đề nhiều hơn Tuy nhiên, kỳ thuật này cũng gây khó khăn cho những người sử dụng bị loạn màu hoặc mù màu

K ỳ thuật trình bày bằng đồ Ihị thể hiện các mối liên quan thích hợp của các biểu ghi tìm được và có thể sừ dụng Ví dụ, có thể trình bày kết ạ u á tìm bằng một đồ thị 2 hoặc 3 chiều, trong đó các điềm trên đồ thị ihề hiện các biểu ghi và vị trí của các điểm thể hiện mối tương quan giữa các biểu ghi và với yêu cầu tin của người

sừ dụng T rong một số im ờ n g hợp, các loại màu cũng được sử dụng trong kỹ thuật hiển thị này Kỳ thuật này cho phép người sử dụng xem các nhóm biểu ghi được phân theo chủ đề và có thể xem toàn bộ m ột nhóm nào đó hoặc chuyển qua một nhóm chủ đề khác Cách này cũng lương lự n h ư khi lướt xem các giá sách trong một thư viện Với cách này, người sử dụng c ó thể thấy hiệu quả của biểu thức tìm của mình hơn là chỉ hiển thị một ít biểu ghi

Hiện nay có nhiều hệ thống hồ trợ cho người sừ dụng chức năng lựa chọn cách sắp xếp kết quả tìm theo ý m uốn, ví clụ sắp xếp theo nhan đề, theo tác già, năm xuất bản,

6.2.2.2 G iớ i hạn vùn g hiển th ị

Để tiết kiệm thời gian, người sử dụng chi muốn xem những thông tin cần thiết nhất để xác định biểu ghi có thích hợp hay

Trang 37

không N ếu biểu ghi được xem là thích họp thì người sử dụng mới cần hiển ihị đầy đủ biểu íỊhi để xem chi tiết Vì vậy, tóm lược kết quả tìm phải được trình bày một cách chọn lọc và phải hiển thị nhừng thông tin cần thiết có thể giúp người sử dụng xác định được mức độ thích hợp của biểu ghi Ví dụ, nhan đề và tóm tắl có thể là thông tin cần thiết và đủ để người sử dụng d ự đoán được mức độ thích hợp của một biểu ghi Việc hiển thị giới hạn trong hai trường này cho phép hệ thống trình bày các kết qưá tìm được trong một màn hình Điều này giúp naười sử d ụ n s có ihể xem lướt nhanh và nắm được mức đ ộ thích hợp có thể có của các hiêu ghi tren màn hình.

6 2 2 3 Đ ánh đấu (ỉỉig h lig h tin g )

K ỳ thuật đánh dấu giúp người sử dụng nhanh chóng tập trung vào những phần thích hợp của vãn bàn để xem mức độ thích hợp

c u a biểu ghi Độ đậm khác nhau của phần đánh dấu cho biết mức

độ quan trọng cùa từ được đánh dấu đối với việc lựa chọn biểu ghi

đó Phần lớn các hệ thốna cho phép việc hiển thị một tài liệu bắt đầu từ phần được đánh dấu đầu tiên trong tài liệu và sau đó chuyền sang phần được đánh dấu tiếp theo MỘI chức năng khác hồ trợ hệ thống xác định đoạn văn trong lài liệu thích hợp nhất với yêu cầu tin và sau đ ó tài liệu sẽ được hiển thị bắt đầu từ đoạn vãn này Một

số hệ thổng cho phép n íư ờ i sử dụng hiển thị một tài liệu theo thứ

tự các đoạn văn hoặc các từ c ó tầm quan trọng nhấl đối với vị tn xếp hạng c ủ a tài liệu Dưới đây là một ví dụ về kỹ thuật đánh dấu khi hiển thị kết quả tìm

Trang 38

These search terms have been highlighted; fact retrieval

This is the html version of the í'le

hưD://infolab stanford.edu/Dub/Qio/dbd/acm/chaDlO.Ddf.

G o o g I e automatically generates html versions of documents as

we cravvl the web.

To link to or bookmark this page, use the following urí:

http;//www.google.com/search?q=cache;HS9MkjHJc3sJ:i nfolab.stanford.edu/pub/gio/dbd/acm/chaplC.pdf+%22 f act+reCrieval+system%22&hl=en£cgl=vn&ct=clnk&cd=19

G oogỉe is n either ajfứ iated with the a u th o rs oỷíỉxis p a g e n o r responsible fo r iis conieni.

A fact retrieval-system is characterized by extensive use of the íetch operaiion and by the use of indexed or đirect access One or few relations will participate in a query Since the ansvvers are already bound

to a particular query type, it is also possible to bind the database structure

to malch the queries so that rapid responses are obtained

10-2-2 Statistical lnference

When the size of a response to a query is so large that the user cannot comprehend it, techniques of data reduction must be employed The techniques required may range from simple cross-tabulations to extensive stalisíical Processing in orđer to provide meaningíul data The process of obtaining these results is more complex than the simple request-response sequence Many intermediale data elemenls are obtaineđ from the database lo be incorporated into the resull

H ì n h 6.1

Trang 39

6.2.3 C ác chứ c n ăn g khác

C ó nhiều chức năng phụ trợ giúp người sử dụng nhập biểu thức tìm, giảm bớt thời gian lập biểu thức tìm, giảm bớt xác suất nhập một biểu ghi không chính xác C hức năng hiển thị từ vựng cung cấp thông tin về các từ có trong c ơ sờ d ữ liệu và vai trò của chủng trong các biểu ghi trong CSDL T ìm lại trong kết quả tìm và nhật ký tìm tin tóm lược các hoạt động tìm tin trước đó của người

sử dụng và cho phép người sừ dụng truy cập các kết quả tìm trước

đo từ cuộc lìrn hiện tại Các biểu thức có sẵn cho pnép truy cập các biểu thức được tạo ra và đ ư ọ c lưu ỉại trong n h ừ n g cuộc tìm trước

c ủ a người sử dụng

6.2.3 ĩ H iển th ị t ừ vụ n g

Chức năng hiển thị lừ vựng cung cấp khả năng hiền thị các từ trong C S D L theo trật tự chừ cái Một cách ỉogic, tất cả các từ trong

C S D L được lưu trừ trong một trật tự cùng với số của các biểu ghi

c ó chứa từ đó Người sử dụng có thể nhập m ột từ hoặc m ột phần

c ủ a từ và hệ th ố n g sẽ hiển thị các LỪ x u n g q u a n h các từ đư ợc nhập

vào T rong hình 6.2 là kết quả được hiển thị trên màn hình nểu người sứ dụng nhập “c o m p u t” Hệ thống cho biết m ột phần của từ được người sử dụng nhập vào và sau đó hiền thị các từ khác tìm được trong C S D L theo trật tự vần chừ cái của phần tiếp theo từ đã được nhập Người sử dụng cũng có Ihể xem các thuật ngữ khác trong C S D L nằm phía trước từ đ ư ợ c nhập vào Chức năng hiền thị

từ vựng cung cấp Ihông lin về các lừ chính xác Irong C S D L và tác động của việc sử dụng các từ trong mộl cuộc tìm C hẳng hạn, khi xem từ vựng, người sử dụng có thể xác định tác động của việc sử dụng kỹ thuậi chặt từ đối với một thuật ngừ tìm và nhừng lỗi chính

Trang 40

tà có thể gặp Ví dụ, neười sừ dụng có thể biết đirợc khi n h ậ j vào ihuật ngữ tìm “c o m p u l* ” thì hệ thống sè lìm “co m p u lsio n ” loậc

“com pulsive” hoặc “compulsory” Với chức n ã n s hiến Ihị từ Nựng, người sử d ụ n g có thể biết tần suất của m ột thuật n g ừ lìm troriị các biểu ghi để quyết định toán lử tìm tin cần sừ dụng Ví dụ, kiông nên s ử dụng toán tử O R với các thuật ngừ tìm lin có lần suất lơn vì khi đó kết q u ả rìm có thể quá lớn

H ì n h 6.2 H iển th ỉ từ vin ig với th u ậ t n g ữ đư ợc nhập vào là

Ngày đăng: 03/07/2014, 14:50

TỪ KHÓA LIÊN QUAN

w