Tìm kiếm thông tin trong môi trường điện tử
Trang 1Tìm kiếm thông tin trong
môi trường điện tử
TP Hồ Chí Minh, ngày 09 tháng 6 năm 2008
Trang 2Kh¸i niÖm vÒ t×m tin trùc tuyÕn
+ Lµ qu¸ tr×nh mµ ng êi t×m tin truy cËp trùc tiÕp vµo nh÷ng m¸y tÝnh l u gi÷ c¬ së d÷ liÖu th«ng qua hÖ thèng m¹ng m¸y tÝnh, viÔn th«ng (John Convey)
Trang 3Phân loại tìm tin tự động hóa
• Phân loại tìm tin tự động hóa dựa vào nơi l
Trang 4CD-ROM
• Khái niệm về CD-ROM:
CD-ROM (Compact Disc Read Only Memory - Bộ nhớ chỉ đọc trên đĩa nén) là một dạng bộ nhớ chỉ đọc đ ợc ứng dụng rộng rãi trong hoạt động l u trữ và tìm tin
Trang 5- Thiết bị đọc CD-ROM có thể đ ợc tích hợp vào mạng máy tính để khai thác dữ liệu trên địa CD-ROM theo chế độ mạng
- Đĩa CD-ROM có thể chứa một phần hoặc toàn bộ CSDL
Trang 7phÇn cøng vµ phÇn mÒm cho
t×m tin trùc tuyÕn
• Nh÷ng yªu cÇu tèi thiÓu vÒ phÇn cøng vµ
phÇn mÒm cho t×m tin trùc tuyÕn:
Trang 8phÇn cøng vµ phÇn mÒm cho
t×m tin trùc tuyÕn
+ PhÇn mÒm:
- Khi truy cËp CSDL trªn CD-ROM:
phÇn mÒm t×m kiÕm chuyªn dông sÏ ® îc cung cÊp theo CD-ROM
- Khi truy cËp trùc tuyÕn: Tuú thuéc vµo
hÖ thèng t×m tin (phÇn mÒm chuyªn dông, phÇn mÒm hç trî )
Trang 9Thuận lợi khi tra cứu thông tin trực tuyến
Tốc độ — Chỉ vài giây hay vài phút để thực hiện một cuộc
tra cứu It
Linh động — Liên kết nhanh
Tính biến thiên — Thuật ngữ có thể chặt cụt
Cập nhật — Nhiều thông tin hiện hành hơn
Tiến độ thời gian — Truy cập và phân phối nhanh
Mọi nơi — Nguồn lực có thể tìm trực tuyến từ các máy
tính truy cập từ xa
Đa phương tiện — Thông tin có thể chứa văn bản, âm 19
Trang 10Bất lợi khi chỉ dựa vào nguồn điện
Số bịểu ghi có thể quá lớn nhưng trong đó cũng có số lớn rất nhiều biểu ghi không phù hợp cũng truy xuất ra
Nhiều nguồn lực điện tử chỉ xuất bản sau thập niên 80 Vì vậy những nghiên cứu lịch
sử vẫn phải sử dụng nguồn in ấn.
20
Trang 11
Nguyên tắc và những kỹ
năng nào cần có trong Hệ thống tra cứu thông tin?
Trang 12Quá trình tìm kiếm thông tin
Nhận ra Đánh gía thông tin Trích xuất
Hiệu chỉnh tìm kiếm Thông tin
Phát triển Hay ngừng lại
Kiểm tra Xác định
Kết quả Vấn đề
Chọn một
Thực hiện Nguồn lực Công thức/
biểu thức Tìm kiếmThông tin
UNESCO EIPICT MODULE 3 LESSON 2 6
Trang 13Khái niệm cần biết
1. Toán lô- gíc Boolean
2 Từ bỏ qua
3 Từ khóa
4 Từ ngữ có kiểm soát
Trang 14Toán tử “AND”
AND được dùng để kết nối hai từ
ngữ khi cả hai (hay tất cả) thuật ngữ phải xuất hiện trong biểu ghi
mà bạn truy xuất được.
Trang 15Toán lô gíc Boolean
Biểu đồ Venn
Tài liệu đề cập về cả Việt
Nam lẫn LàoLào
Việt Nam
Trang 16Câu hỏi của người dùng tin:
Tôi muốn có thông tin về mối quan hệ giữa nghèo đói và tội
phạm.
Trang 18Câu hỏi của người dùng tin:
Có quá nhiều thứ
để đọc!
Thật sự là điều mà tôi muốn biết là giữa tội phạm gây ra từ phụ
nữ nghèo có gì khác nhau so với tội phạm
do đàn ông nghèo
Trang 19Thu hẹp phép tra cứu
Trang 21Toán tử Boolean “ OR ”
OR được dùng để kết hợp hai từ đồng nghĩa
hay từ có mối quan hệ với nhau, và hướng công
cụ tra cứu truy xuất ra những biểu ghi nào mà
chứa hoặc là một trong các thuật ngữ đó hoặc là tất cả, vì vậy sẽ mở rộng kết quả tra cứu của
bạn
Trang 22
Toán tử Boolean “ NOT ”
NOT được dùng để loại trừ một từ cụ thể nào đó hoặc một sự kết hợp từ trong kết quả tra cứu của bạn.
Trang 23Tìm kiếm bằng từ khóa
• Dùng “Ngôn ngữ tự nhiên”
• Tìm kiếm một từ hay kết hợp giữa các từ trong một văn bản hay một đoạn cụ thể
nào đó trong văn bản
• Kết quả có thể có những tài liệu không liên quan hay có quá nhiều tài liệu phải xem lại
Trang 24Toán tử Boolean “ OR ”
OR được dùng để kết hợp hai từ đồng
nghĩa hay từ có mối quan hệ với nhau, và hướng công cụ tra cứu truy xuất ra những biểu ghi nào mà chứa hoặc là một trong các thuật ngữ đó hoặc là tất cả, vì vậy sẽ giúp mở rộng kết quả tra cứu của bạn
Trang 25
Đồng nghĩa
Một từ có nghĩa giống hay gần giống với một từ khác hay một từ ở một ngôn ngữ khác
Nghĩ đến các từ đồng nghĩa là rất có ích trong khi tìm kiếm theo từ khóa
Trang 26Bạn hãy tra cứu
Trang 28Từ ngữ có kiểm soát
Từ được chuẩn hóa để mô tả chủ đề
Dùng thuật ngữ giống nhau để củng cố tính thống nhất
Được dùng trong chỉ mục, tiêu đề đề mục mục lục thư viện, và trong CSDL để tổ
chức thông tin theo chủ đề
Trang 31Xem Bảng tiêu đề đề mục của
TV Quốc hội Mỹ
Đến trang web: http://authorities.loc.gov/
Trang 32
Nguyên tắc và những kỹ
năng nào cần có trong Hệ thống tra cứu thông tin?
Trang 33Xác định nhiệm vụ
Chiến lược tìm kiếm thông tin
Định vị và truy cập
Sử dụng thông tin Tổng hợp
Trang 34Theo Eisenberg và Berkowitz (1996)
6 Kỹ năng chính (Big6):
1 Xác định nhiệm vụ : Xác định yêu cầu, xác định
nhu cầu thông
2 Chiến lược tìm kiếm thông tin : Động não tìm ra tất
cả các nguồn có thể tìm, chọn lọc nguồn có khả năng giải quyết vấn đề lớn nhất
2 Định vị và truy cập : Chọn nguồn, Tìm kiếm thông tin trong nguồn lực đó
4 Sử dụng thông tin: Rà soát, truy xuất thông tin phù hợp
5 Tổng hợp: Tổ chức thông tin, trình bày kết quả
6 Đánh giá: Đánh giá kết quả và quy trình tìm kiếm
10
Trang 36Phỏng vấn tham khảo
Một cuộc hội thoại giữa một nhân viên
trong bộ phận Dịch vụ Tham khảo với một bạn đọc để làm rõ nhu cầu thông tin và hỗ trợ bạn đọc thỏa mãn được nhu cầu trên
– Richard E Bopp and Linda C Smith
Trang 37Phỏng vấn tham khảo
Tiếp đón thân thiện
Thể hiện sự quan tâm
Nhắc lại yêu cầu của bạn
đọc
Hỏi
Kiểm tra xem bạn đọc đã
tìm kiếm cái gì rồi
Hỏi về hình thức, mức độ
phù hợp, bề sâu của nội
Lấy được thông tin bạn
đọc cần biết
Hỏi bạn đọc xem thông
tin cung cấp có làm thỏa mãn yêu cầu của họ
không
Kiểm tra xem bạn đọc
còn cần gì khác nữa
Khuyến khích bạn đọc trở
Trang 38Chiến lược tìm kiếm thông tin
Một khi bạn đã xác định thông tin
mà bạn đọc cần làm sao để bạn quyết định bạn sẽ tìm thông tin này
ở đâu?
Trang 39Nguồn lực và công cụ thông tin
Sau khi xác định yêu cầu, chọn CSDL
mà bạn nghĩ là có khả năng lớn nhất
để giải đáp câu hỏi đó.
o Nguồn lực thư mục (OPACs, and CD- ROMs và CSDL trực tuyến)
o Nguồn lực toàn văn
Trang 40Một số tiêu chí để cân nhắc khi quyết định chọn nơi tìm thông tin trực tuyến
Trang 41Định vị và truy cập
• Làm thế nào định vị được tài liệu trong thư viện của bạn?
• Làm thế nào tìm ra thông tin trong tài liệu của thư viện?
Trang 42Một số kỹ thuật định vị thông tin
Trang 43Tìm kiếm theo cụm từ
• Một nhóm từ nào đó theo một trật tự nào
đó chứ không phải bất kỳ từ nào xuất
hiện trong cùng văn bản tài liệu
• Nhóm từ bắt buộc đựơc trình bày theo trật
tự đã định sẵn
• Ví dụ như tên đầy đủ của một người, địa
danh, nhan đề sách, bài hát,…
Trang 44Tìm kiếm theo cụm từ
• Các CSDL khác nhau diễn giải cách tra cứu khác nhau
Một trong số những điểm thường khác nhau đó là cách diễn dịch các từ bạn gõ vào tìm kiếm như một nhóm từ/ ngữ.
• Một số CSDL cho là các từ đứng cạnh nhau phải được tra
cứu như theo cả nhóm từ
• Các CSDL khác tự động cho toán tử Boolean “AND” vào
giữa các thuật ngữ tìm, chỉ yêu cầu chúng hiện diện chứ không nhất thiết từ này phải bắt buộc đứng cạnh từ kia
• Những kiểu tìm như thế này có thể truy xuất rất nhiều kết
quả khác nhau.
Trang 45Dùng dấu ngoặc đơn( )hay
Trang 46Tìm kiếm theo cụm từ
Hầu hết CSDL cho phép bạn tìm kiếm từ theo từ theo trật tự cụm từ.
Dùng dấu () hay dấu " " bao quanh cụm tử tra cứu là
cách thông dụng để tìm kiếm theo cụm từ nhưng không phải bất cứ CSDL hay bộ máy dò tìm thông tin nào cũng
có thể dùng được cách này.
Thường rất dễ dàng để tìm kiếm theo cụm từ nếu dùng
chức năng tìm kiếm nâng cao (Advanced/Guided
Searching) trong một CSDL Bạn có thể chỉ cần nhấp
vào nút xác nhận thông báo rằng bạn muốn các từ tìm kiếm của bạn được xếp như là một cụm từ.
Trang 47 Bạn có thể sử dụng những trường này để giúp mình tìm kiếm một phần nào đó trong
số các biểu ghi của CSDL
Đây gọi là kiểu tìm kiếm theo tên trường
Một trong số các trường thông dụng nhất trong một biểu ghi là Nhan đề và Tác giả nhưng có thể có nhiều trường khác nữa
Trang 49Từ bỏ qua
Từ bỏ qua là những từ nhỏ không được đánh chỉ mục trong các CSDL điện tử ví dụ mục lục thư viện, CSDL báo chí hay máy
dò tìm thông tin
Ví dụ : a, and, in, of, on hay to
Các bộ máy dò tìm thông tin sẽ có danh sách từ bỏ qua khác nhau
Trang 50Hiệu chỉnh phép tìm kiếm
Đôi khi kết quả tra cứu trên 1 CSDL không đáp ứng được Lặp lại phép tra cứu trên 1 CSDL khác Có rất nhiều trường hợp cho thấy nhiều tài liệu trong một CSDL không trùng lắp lại ở một CSDL khác
Nếu kết quả vẫn chưa làm bạn thỏa mãn, xác định lại kiểu tìm kiếm của mình và đổi từ tra cứu khác Bạn có thể dùng các thuật ngữ hay từ mô tả
mà CSDL không xài đến Nên nhớ là máy tính chỉ dò tìm từ chứ nó không hiểu được ý nghĩa của từ đâu 14