Internet Search Hà Nội, Việt Nam, Tháng 8 năm m2007 2Những nội dung chính • Các công cụ tìm kiếm - Đặc điểm • Kỹ thuật tìm kiếm • Các lựa chọn tốt nhất cho nghiên cứu thông tin • Đánh gi
Trang 1Nghiên cứu thông tin:
tìm kiếm trên Internet
Medea Metreveli
Hà Nội, Việt Nam
Thông tin thương mại – Chìa khoá để phát triển xuất khẩu
Trang 2Internet Search Hà Nội, Việt Nam, Tháng 8 năm m2007 2
Những nội dung chính
• Các công cụ tìm kiếm - Đặc điểm
• Kỹ thuật tìm kiếm
• Các lựa chọn tốt nhất cho nghiên cứu thông tin
• Đánh giá các nguồn thông tin trên web
Trang 3Các công cụ tìm kiếm
• Các công cụ tìm kiếm: như Google
– Phụ lục các website được máy tính tạo ra
– Thường được bổ sung danh sách các thư mục
• Các thư mục tìm kiếm: như Yahoo
– Các phụ lục được con người tạo ra thông qua phân loại
– Bổ sung kết quả tìm kiếm từ nhiều công cụ tìm kiếm khác
• Cổng thông tin thương mại
– Các phụ lục website về kinh doanh do các thủ thư, cán bộ nghiên cứu thông tin lựa chọn
Trang 4Internet Search Hà Nội, Việt Nam, Tháng 8 năm m2007 4
• Dung lượng đồ sộ, và có lẽ là công cụ tìm kiếm lớn nhất
• Sử dụng PageRankTM để xếp hạng mức độ phổ biến
• Hiện đã cho phép tìm kiếm cả phần ẩn trong trang Web (dạng file PDF)
• Giao diện đa ngôn ngữ
• Chấp nhận các toán tử (“and”, “or”) (“và”, “hoặc”)
• Chức năng Google Earth (Bản đồ trái đất)
• Chức năng Google Directory
• “Safe search” filtering - sàng lọc những trang web để sử dụng
internet một cách an toàn hơn
• "I'm feeling lucky" (hiển thị trên trang web đầu tiên) - sẽ đưa bạn đến ngay với website thích hợp nhất với nội dung của từ khóa.
• Chức năng dịch thuật
Trang 5• Dung lượng đồ sộ Truy vấn tới hơn 20 tỉ đối tượng web
• Có nhiều phiên bản nội địa hóa cho từng quốc gia (VD:
phiên bản cho người Ấn Độ,…)
• Shortcuts (đường tắt) cho phép truy cập nhanh tới các từ
điển, từ đồng nghĩa, mẫu mã, bách khoa toàn thư,…
• Cấu trúc thư mục
• Chấp nhận các toán tử (AND, OR, NOT or AND NOT)
• Chức năng Yahoo! Groups
• My Yahoo (cá nhân hóa 1 trang web)
• Các dịch vụ bổ sung: dịch vụ hỏi đáp
• Cung cấp dịch vụ dịch thuật (công cụ Babel fish)
Trang 6Internet Search Hà Nội, Việt Nam, Tháng 8 năm m2007 6
• Dung lượng lớn Truy vấn tới hơn 2 tỉ website
• Xếp hạng theo Subject-Specific PopularityTM
• Gợi ý các thuật ngữ rộng hoặc hẹp hơn
• Mặc định toán tử “AND” giữa các từ và chấp nhận toán tử
“OR”
• Nhiều phiên bản theo ngôn ngữ
• Không có chức năng dịch thuật
Trang 7Tỷ lệ lượt tìm kiếm tại 1 công cụ tìm kiếm được người sử dụng web tại nhà
và văn phòng thực hiện tại Mỹ trong tháng 7 - 2006
Trang 8Internet Search Hà Nội, Việt Nam, Tháng 8 năm m2007 8
Vài nét về công cụ tìm kiếm liên thông
(meta-search engines
• Chuyển câu lệnh tìm kiếm của người dùng tới một vài các serch engine khác và tổng hợp kết quả tìm về một cửa sổ duy nhất.
• Biên soạn các kết quả theo dạng thức thuận tiện hoặc đồng nhất
• Một số công cụ tìm kiếm liên thông còn cung cấp các tính năng vượt trội như tìm kiếm có chọn lọc, tùy biến công cu tìm kiếm hoặc thư mục, xác định thời gian tìm kiếm)
• Một số chức năng cần tải về máy tính, số khác là các ứng dụng truy vấn
từ máy chủ
• Hạn chế:
• Phụ thuộc nhiều vào các công cụ tìm kiếm khác
• Một số công cụ tìm kiếm liên thông bỏ qua Google!!!
• Không cho phép người dùng sử dụng các tính năng vượt trội của bất cứ công cụ tìm kiếm nào khác
• Không dự đoán được cách truyền tải một lệnh tìm kiếm phức tạp của các công cụ tìm kiếm liên thông
Trang 9Các thư mục theo chủ đề
• Được xây dựng theo lựa chọn của con người chứ không phải
theo thuật toán
• Được tổ chức thành các danh mục theo chủ đề hoặc theo phân loại
• Nhỏ gọn và chuyên biệt
• Thường được đánh giá và chú thích cẩn thận
– : Librarian’s index – : Infomine
– : Academic Info
Trang 10Internet Search Hanoi, Vietnam, AugustHà Nội, Việt Nam, Tháng 8 năm
m2007 2007
10
Các công cụ tìm kiếm
và tìm kiếm liên thông
- Tìm kiếm bằng các từ khóa, hoặc cụm từ chính xác
- Không hỗ trợ trình duyệt, không phân loại theo chủ đề
- Cơ sở dữ liệu được biên soạn bởi các "spiders"
- Luợng thông tin mà các máy tìm kiếm có thể bao quát thường dao động từ nhỏ và chuyên biệt đến đồ sộ
- Công cụ tìm kiếm liên thông: nhanh nhưng kết quả tìm kiếm không phong phú (thường tìm được khoảng 1% kết quả tìm được ở mỗi máy tìm kiếm mà chúng liên kết)
Google, Yahoo search, Ask.com
Thư mục đối tượng
- Người dùng tự lựa chọn các site mình quan tâm
- Thường được đánh giá cẩn thận và cập nhật thường xuyên
- Được sắp xếp theo hình thức phân lớp, theo chủ đề
- Không hỗ trợ các dữ liệu toàn văn
- Cung cấp hàng ngàn thư mục theo mỗi chủ đề
Phụ lục của thư viện, Thư mục Google,
About.com
Cơ sở dữ liệu
- Được lưu dưới dạng web ẩn
- Có nhiều chủ đề: thông thường, thương mại, chính trị
- Bao gồm cả những kết quả tìm được từ danh bạ trực tuyến của
Trang 11Kỹ thuật tìm kiếm
• Sử dụng các tính năng tìm kiếm nâng cao
– Giúp chuẩn hóa/sàng lọc chiến lược tìm kiếm của người dùng
– Phát huy sức mạnh của công cụ tìm kiếm
• Học các lựa chọn tìm kiếm nâng cao của 2-3 công cụ tìm
kiếm
• Sử dụng các hướng dẫn tìm kiếm
– Các file trợ giúp trực tuyến
– Hướng dẫn tìm kiếm "trung lập“
– Bảng so sánh tính năng của các công cụ tìm kiếm do SearchEngine
Trang 12Internet Search Hà Nội, Việt Nam, Tháng 8 năm m2007 12
• Số đường dẫn (tại các website khác ) liên kết tới trang này
• Yếu tố khiến 1 website “xuống hạng”
– Thư rác
– Lặp từ quá nhiều trong 1 trang hoặc trên các meta-tag
Trang 13Tiêu chuẩn lựa chọn các công cụ tìm kiếm
• Kích thước (phụ lục/ thư mục)
• Mức độ phù hợp của kết quả tìm được
• Mức độ tiện lợi của giao diện
• Các dịch vụ khác:
– Tin tức; email; các danh bạ, mua sắm; thời tiết; phiên dịch;
Trang 14Internet Search Hà Nội, Việt Nam, Tháng 8 năm m2007 14
Trang 15Tiêu đề: title: ”furniture importers”
URL: URL: intracen
Trang chủ: host: tdctrade
Tên miền: domain: com, domain:br
Liên kết: link: brasiltradenet
Tương tự: like:www.intracen.org
Hình ảnh: image: brasilia
Những câu lệnh đặc trưng dùng cho GOOGLE:
Tiêu đề intitle:xxx or allintitle:xxx
URL inurl:xxx or allinurl:xxx
Cache cache:xxx (phiên bản cache của trang web )
Giới hạn phạm vi tìm kiếm
Trang 16Internet Search Hà Nội, Việt Nam, Tháng 8 năm m2007 16
Trang 17Tìm kiếm theo cụm từ
Sử dụng dấu ngoặc kép ‘’ ‘’
“đậu tương” giá thị trường”
“số liệu thống kê thương mại"
“thành phố Hồ Chí Minh”
“báo cáo thị trường”
Trang 18Internet Search Hà Nội, Việt Nam, Tháng 8 năm m2007 18
Các toán tử
katmandu OR kathmandu
importer* AND germany*
AND NOT import* AND NOT important
NEAR iron NEAR furniture
Ghi chú: toán tử “AND” được ngầm định trong hầu hết các công cụ tìm kiếm hiện nay
(Xem tại www.searchengineshowdown.com )
Trang 19thị trường (báo cáo HOẶC nghiên cứu ) Thương mại (dẫn đầu HOẶC cơ hội*)
cơ hội * (kinh doanh HOẶC thương mại)
“nhà nhập khẩu đồ nội thất” và (Đức hoặc Áo)
Trang 20Internet Search Hà Nội, Việt Nam, Tháng 8 năm m2007 20
CHỮ IN /Chữ thường
Nên sử dụng chữ thường trong các thuật ngữ tìm kiếm
ARGENTINA / argentina
PARIS / parisBENIN / benin
Trang 21Tránh sử dụng các dấu trọng âm
cafe / caféelephants / éléphantsinformacion / información
Trang 22Internet Search Hà Nội, Việt Nam, Tháng 8 năm m2007 22
Những công cụ nghiên cứu thông tin tôt nhất?
• Nguồn tin nội bộ:
– Từ trung tâm thông tin, từ đồng nghiệp
• Các dịch vụ thông tin cấp quốc gia
• Các cổng thông tin thương mại
– GlobalEdge, P-MAPs, CBI
• Các công cụ/ thư mục tìm kiếm
– Tìm hiểu các tính năng tìm kiếm nâng cao
– Chọn lựa các công cụ tìm kiếm, danh bạ và các công cụ tìm kiếm liên thông
– Nếu không có kết quả: hãy tra cứu trong thư viện!
Trang 23Đánh giá thông tin Internet
• Tại sao?
– Bất kỳ ai cũng có thể tạo ra một trang web
– Nội dung và vị trí của trang web thay đổi thường xuyên
– Rất nhiều trang web không còn cập nhật
– Không có đơn vị kiểm tra chất lượng
– Không có hướng dẫn lựa chọn các search engine
Trang 24Internet Search Hà Nội, Việt Nam, Tháng 8 năm m2007 24
Cách đánh giá các trang web
• Tên miền có thích hợp với nội dung không?
• Ai là người cung cấp website đó?
– Dễ xác định?
– Nổi tiếng?
– Ít người biết đến
Trang 25Cách đánh giá các trang web
• Xem qua trang web – tìm hiểu xem tác giả là ai?
• Tên của tác giả
• Bạn có nhận ra đó là của tổ chức, viện hay cơ quan nào ko?
• Không có thông tin email đầy đủ
– Hãy kiểm tra đường link tới:
“About us” “Philosophy” “Background” “Vision”
• Lần cập nhật cuối cùng là khi nào?
• Nếu không có đường link
• Xoá URL này
Trang 26Internet Search Hà Nội, Việt Nam, Tháng 8 năm m2007 26
Đâu là các chỉ số để đo chất lượng?
• Dẫn chứng bằng tài liệu
• Đường link, lời chú ở cuối trang
– Càng nhiều chi tiết như bạn nhìn thấy trong bản in?
• Đường link có hoạt động không?
• Thông tin giả mạo hoặc lấy ở chỗ khác
• Tại sao bạn không truy cập vào trang web gốc ban đầu?
• Có đường link tới các nguồn thông tin khác
• thành kiến, xuyên tạc?
Trang 27Đánh giá bên ngoài
• Tìm URL trên alexa.com or Google (link)
– Những trang web nào có đường link tới đây? Ai là chủ tên miền?
– Gõ hoặc dán (paste) URL vào một hộp tìm kiếm
– Traffic for top 100,000 sites
• Kiểm tra xem các đường link tới Google’s Similar pages
• Kiểm tra tên chủ trang web trong Google
Trang 28Internet Search Hà Nội, Việt Nam, Tháng 8 năm m2007 28
Tóm tắt
• Tại sao lại phải đăng tin lên Web ?
• Thông báo số liệu?
• Giải thích, thuyế phục ?
• Bán, lôi kéo?
• Chia sẻ, phơi bầy?
• Bắt chước lại hoặc châm biếm?
• Có phù hợp với mục đích của bạn?