1. Trang chủ
  2. » Luận Văn - Báo Cáo

Tối ưu hóa công cụ tìm kiếm SEO- luận văn tốt nghiệp đại học

80 5K 25
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Tối ưu hóa công cụ tìm kiếm - SEO
Tác giả Văn Thiên Cường
Người hướng dẫn TS. Lê Ngọc Xuân
Trường học Đại học Vinh
Chuyên ngành Công nghệ thông tin
Thể loại Đồ án tốt nghiệp
Năm xuất bản 2011
Thành phố Vinh
Định dạng
Số trang 80
Dung lượng 4,51 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Inverted index giống như danh sách chỉ mục ở phần cuối của cuốn sách,trong đó với mỗi một từ là một danh sách liên kết các tài liệu có từ đó xuất hiện.Biến này có khả năng giúp bộ máy tì

Trang 1

Trêng §¹i häc Vinh Khoa c«ng nghÖ th«ng tin

Trang 2

PHẦN I GIỚI THIỆU VỀ SEARCH ENGINE VÀ PHƯƠNG THỨC

TÌM KIẾM……….…3

1.1 Search engine và tầm ảnh hưởng……….…3

1 Search Engine là gì? 4

2 Phương thức hoạt động và Cơ cấu tổ chức của cổ máy tìm kiếm Search engine 4

2.1 Cấu trúc của một Search engine………4

2.1.1 Web Crawler………….……… ……….4

2.1.2 Document Index (lập chỉ mục tài liệu)……….………… ………5

2.1.3 Document Cache(lưu trữ tài liệu)……….……… ……5

2.1.4 Document Ranking……….………… … 5

2.1.5 Query Processor(bộ xử lý truy vấn)……… 6

2.1.6 Presentation interface(giao diện trình bày)……….… 6

2.2 Phương thức hoạt động……… ….6

2.2.1 “Hybrid Search Engines” - Các hệ thống tìm kiếm tổng hợp… ….7

2.2.2 Các thành phần của một cỗ máy tìm kiếm tự động……… …7

3 Các loại Search engine phổ biến……….……… ………8

3.1 Meta-search engine……… ……… …… 8

3.2 Thư mục đối tượng (Subject Directories)……… …… … 9

3.3 Các cơ sở dữ liệu đặc biệt……… ………9

4 Đặc điểm và phân loại search engine……….… ….10

4.1 Các đặc điểm……… …………10

4.2 Cách thức xếp thứ hạng (ranking)……….……….10

4.3 Phân loại search engine……… 12

4.4 Các Search Engine nên biết……… 12

a Các hổ trợ nâng cao và các phép toán sử dụng trong Search engine……… … 14

1 Dùng dấu '+'……….….…… 14

2 Dùng dấu '-'……….… 14

Trang 3

3 Dùng ngoặc kép " " để tìm cụm từ trong nguyên văn……….……….…15

4 Các phép toán Boolean……….……….… 16

4.1 Phép OR……….……….16

4.2 Phép AND……… 17

4.3 Phép NOT……… 17

4.4 Phép NEAR……….………17

4.5 Chẻ nhánh bằng phép ( )……… ……….……… 18

5 Các hổ trợ nâng cao khác……… 19

5.1 Các từ khoá host:, site:, url.host:, và domain: ………….…….……… 19

5.1.1 Từ khoá host: của Alavista(www.altavista.com) 20

5.1.2 Từ khoá tương tự site:, url.host:, và domain: ……….…….20

5.2 Các từ khoá title:, intitle:, và allintitle: ……….… 20

5.2.1 Từ khoá title: ……… …….21

5.2.2 Từ khoá intitle: và allintitle: ……….….… …………21

5.2.3 Các từ khoá inurl:, allinurl:, orginurl:, và u: ………….……….…….22

5.2.4 inurl: và allinurl: trong google: ……….……… 22

5.2.5: originurl:, u: và url: ………23

5.2.6 Từ khoá Link: và linkdomain: ……….……23

5.2.7 từ khoá filetype: ……….……… 23

5.2.8 Dùng các loại kí tự phỏng định (wildcard character): ……….………24

5.2.9 Dùng kí tự ~ ………24

3.3 Chế độ nâng cao của các search engine ………24

1 Vài đặc thù của các search engines thông dụng….……….……….26

1.1 Tìm thêm dữ liệu theo liên hệ (related search): ……….…….26

1.2 Chống hội tụ (cluster) ……….…………27

1.3 Trang Tương Tự (similar) và trang có chính tả gần giống ………28

1.4 Trang có từ nối dài (stemming) ……… ………28

Trang 4

1.7 Địa chỉ các search engine thông dụng ………29

1.8 Phần mềm search engine ………30

PHẦN II KHÁI NIỆM VỀ SEO VÀ CÁC VẤN ĐỀ CƠ BẢN VỀ SEO 2.1 MỞ ĐẦU ………31

2.1.1 Khái niệm về SEO……… 31

2.1.2 Thực trạng, tầm quan trọng website vai trò và kế hoạch phát triển của SEO trong CNTT……… 33

2.2 CÁC ĐỊNH HƯỚNG SEO……… ………38

1 Tạo tiêu đề trang chính xác, duy nhất………… … ……… 38

2 Biện pháp tốt cho các thẻ tiêu đề trang……… ……… …….……40

3 Sử dụng thẻ meta "description"……….……41

4 Biện pháp tốt cho các thẻ meta mô tả………43

5 Cải tiến cấu trúc URL………44

6 Làm cho trang web dễ điều hướng hơn……….47

7 Cung cấp nội dung và dịch vụ chất lượng……….……49

7.1 Biện pháp tốt cho nội dung……….49

7.2 Tạo nội dung mới mẻ , duy nhất……….50

7.3 Cung cấp nội dung hoặc dịch vụ duy nhất……… 51

8 Viết chuỗi ký tự liên kết tốt hơn………51

9 Sử dụng thẻ tiêu đề một cách thích hợp……… 53

10 Tối ưu hoá việc sử dụng hình ảnh……… 54

11 Sử dụng hiệu quả robots.txt………56

12 rel="nofollow" cho các liên kết……… 58

13 Quy trình thực hiện SEO ………60

14 Thực hiện một chiến dịch SEO ? 61

PHẦN III QUẢNG BÁ TRANG WEB THEO CÁC CÁCH PHÙ HỢP 1 Các nguyên tắc hữu ích dành cho việc quảng bá trang web…….………63

Trang 5

2 Các công việc thành phần để thực hiện SEO………64

KẾT LUẬN……… ………… 70 TÀI LIỆU THAM KHẢO……….…….72

LỜI MỞ ĐẦU

Cuộc cách mạng công nghiệp mới, nền kinh tế tri thức đã phát triển mạnh

Trang 6

nguyên vật liệu, lao động giảm và sản phẩm ngày càng tinh xảo, hoàn thiện hơn.Máy móc đảm nhiệm những công việc nặng nhọc thay cho con người Côngnghệ thông tin là phương tiện và giải pháp hỗ trợ các doanh nghiệp hoạt độnghiệu quả hơn.

Word Wide Web(www) trở thành nguồn tài nguyên khổng lồ và quý giácủa nhân loại Nó cung cấp cho chúng ta thông tin về mọi lĩnh vực đời sống xãhội, khoa học kỹ thuật, v.v… Tuy nhiên đi đôi với sự thuận lợi ấy có một vấn đềđược đặt ra là chúng ta làm thế nào để truy cập và khai phá được nguồn tàinguyên ấy hiệu quả nhất

Từ vấn đề trên người ta đã nghiên cứu và tạo ra bộ máy tìm kiếmweb(Web search engine) Máy này có khả năng tìm kiếm thông tin linh hoạt ,nhanh chóng và rất dễ sử dụng Người sử dụng chỉ cần đặt câu hỏi truy vấn vềvấn đề cần quan tâm là có được tập kết quả liên quan đến câu hỏi truy vấn đó.Hiện nay Google(1), Altavista(2), HotBot(3), Lycos(4), AllTheWeb(5) là những bộmáy tìm kiếm hiệu quả và đang được sử dụng rộng rãi

Thế nhưng việc tìm kiếm thông tin theo những kiểu trên vẫn không hiệuquả , chiếm nhiều thời gian vì:

-Khối lượng dữ liệu khổng lồ và tính động của các trang Web, nên bộmáy tìm kiếm chỉ có thể sắp xếp một phần các chỉ mục của Web

-Người sử dụng đặt câu hỏi truy vấn quá ngắn, không thể hiện được hết ýđịnh của họ , do vậy mà tập kết quả tìm kiếm Web là chung chung

Từ ảnh hưởng hai nhân tố trên tập kết quả tìm kiếm Web có thể từ hàngnghìn đến hàng triệu tài liệu, do đó tìm được đúng tài liệu mình cần là công việc

vô cùng khó khăn

Nội dung đồ án nhằm chỉ ra một loại hình nghiên cứu về CNTT mà hiệuquả của nó rất lớn tuy nhiên hiện nay nhận thức của người thiết kế và quản trịwebsite tại Việt Nam nói riêng và thế giới nói chung nhận biết việc tối ưu hóawebsite để các bộ máy tìm kiếm trỏ tới rất ít Người sử dụng không ý thức được

Trang 7

tầm quan trọng của việc tối ưu hóa website, hoặc các phương thức để các máytìm kiếm trỏ đến

SEO có thể coi như là một kỹ thuật, một bí quyết thực sự đối với mỗingười quản trị, xây dựng website hay đơn thuần là người làm trong lĩnh vựctruyền thông

Trang 8

PHẦN I GIỚI THIỆU VỀ SEARCH ENGINE VÀ PHƯƠNG THỨC TÌM KIẾM

1.1 Search engine và tầm ảnh hưởng

Như chúng ta đều biết www như là từ điển bách khoa toàn thư , là thưviện khổng lồ sẵn sàng phục vụ bất cứ ai quan tâm thông qua việc truy cậpinternet Đối với chúng ta nó là một trong những nguồn tài nguyên thông tin cógiá trị nhất, nếu không có nó thì mọi hoạt động hàng ngày sẽ kém hiệu quả.Nhưng vấn đề đặt ra là chúng ta phải truy cập và sử dụng nguồn tài nguyên ấynhư thế nào để có hiệu quả nhất Để tìm được đúng thông tin cần tìm trongnguồn tài nguyên khổng lồ là một thách thức lớn

Một trong những thành công nhất trong nghiên cứu và giải quyết vấn đềtrên là việc tạo ra được bộ máy tìm kiếm Web Máy này có nhiệm vụ giúp người

sử dụng tìm tài liệu mình quan tâm Các tài liệu chủ yếu có dạng HTML, PDF,

PS, MS Word và MS PowerPoint…

Giao diện bộ máy tìm kiếm thân thiện và rất dễ sử dụng , người sử dụngchỉ cần đặt câu hỏi truy vấn và ra lệnh tìm Máy sẽ trả về tập kết quả tìm

kiếm(được gọi là các sinppet) liên quan đến câu hỏi truy vấn đó Snippet miêu

tả ngắn gọn nội dung của tài liệu Web(trang Web), nó thường bao gồm tựa đề ,

địa chỉ web của tài liệu (được gọi là URL)và một đoạn text trình bày nội dung

liên quan đến câu hỏi truy vấn

1 Search Engine là gì?

Search engine (Công cụ tìm kiếm) là một công cụ phần mềm nhằm tìm racác trang website trên mạng dựa vào các thông tin mà nó có Dữ lượng thông tincủa search engine thực chất là một loại cở sở dữ liệu cực lớn Công cụ này tìm

các tài liệu dựa trên các từ khoá (keyword) và trả về một danh mục của các

trang có chứa từ khoá liên quan

Trang 9

Một số công cụ tìm kiếm mạnh trên thế giới hiện nay: Google.com,Yahoo.com, Altavista.com,

2 Phương thức hoạt động và Cơ cấu tổ chức của cổ máy tìm kiếm -Search engine

Thuật ngữ “Cỗ máy tìm kiếm - Search Engine”được dùng chung để chỉ 2 hệ thống tìm kiếm: Một docác chương trình máy tính tự động tạo ra (Crawler-Based Search Engines) và dạng thư mục internet docon người quản lý (Human-Powered Directories) Hai hệ thống tìm kiếm này tìm và lập danh mụcwebsite theo 2 cách khác nhau

2.1 Cấu trúc của một Search engine

2.1.1 Web Crawler

Web Crawler là một trong hai thành phần trực tiếp tương tác với internet,

nó còn được gọi là web spider hoặc robot Công việc chính của Web Crawler làphát hiện những nguồn tài nguyên mới trên Web Nó giải quyết vấn đề này bằngcách thực hiện tìm kiếm đệ quy theo các đường link từ tất cả các trang đã được

Trang 10

Trong khi khai phá các nguồn tài nguyên mới trên Internet, Web Crawlercòn có nhiệm vụ kiểm tra xem các trang có còn hợp lệ không và chúng ta đãđược cập nhật hay chưa Mục đích của công việc này là giúp cho bộ máy tìmkiếm cập nhật được tất cả tài liệu của Web(kể cả các tài liệu cũ và mới).

2.1.2 Document Index (lập chỉ mục tài liệu)

Mục đích chính của việc lập chỉ mục tài liệu là hỗ trợ tìm kiếm Tìm tàiliệu có chứa những từ trong câu hỏi truy vấn? Để thực hiện công việc này thì đa

số các bộ máy tìm kiếm sử dụng biến dữ liệu có cấu trúc inverted index

Inverted index giống như danh sách chỉ mục ở phần cuối của cuốn sách,trong đó với mỗi một từ là một danh sách liên kết các tài liệu có từ đó xuất hiện.Biến này có khả năng giúp bộ máy tìm kiếm xác định chính xác tài liệu có chứacác từ trong câu hỏi truy vấn Với bảng chỉ mục như vậy , bộ máy tìm kiếm cóthể thực hiện tìm kiếm theo nhóm từ hoặc tìm kiếm từ lân cận

2.1.3 Document Cache(lưu trữ tài liệu)

Nhiều máy phục vụ tìm kiếm vừa lưu trữ bảng chỉ mục tài liệu theo từ(document index), vừa lưu trữ bảng chỉ mục tài liệu gốc Mục đích của việclưu trữ bảng chỉ mục các tài liệu gốc (tài liệu đầy đủ) là tạo ra các sippet và phục

vụ cho việc lưu trữ các phiên bản của tài liệu

2.1.4 Document Ranking

Chắc chắn rằng trong môi trường www, thậm chí đối với cả những câuhỏi truy vấn hoàn thiện và chính xác, thì tập kết quả trả tìm kiếm vẫn là hàng

Trang 11

ngàn hoặc hàng triệu tài liệu Do vậy , cần phải có công nghệ thực hiện sắp xếptập kết quả thu về theo mức độ liên quan và mức độ quan tâm Và đây chính làcông việc của Document Ranking.

2.1.5 Query Processor(bộ xử lý truy vấn)

Vai trò của Query Processor là phối hợp với các bộ trên để thực hiện trảlời câu hỏi truy vấn của người sử dụng Cụ thể , trong quá trình thực hiện QueryProcessor kết hợp các thành phần document index, document cache, documentranking để tạo ra tập kết quả tìm kiếm liên quan đến câu hỏi truy vấn

2.1.6 Presentation interface(giao diện trình bày)

Kết quả tìm kiếm Web được đưa đến người sử dụng thông qua giao diệnnày Do vậy presentation interface đóng vai trò vô cùng quan trọng, nó ảnhhưởng toàn bộ chất lượng của bộ máy tìm kiếm Bởi vì người sử dụng chỉ cầnquan tâm kết quả nhận được thông qua giao diện mà không quan tâm máy hoạtđộng xử lý tìm kiếm web như thế nào

2.2 Phương thức hoạt động

Crawler-Based Search Engines - Hệ thống tìm kiếm trên nền tự độngNhững cỗ máy tìm kiếm tự động, như Google, tạo ra những danh sách của họ tựđộng Chúng sử dụng các chương trình máy tính, được gọi là “robots“,

“spiders”, hay “crawlers” để lần tìm thông tin trên mạng khi có ai đó tìm kiếmmột thông tin, các Search Engine lập tức hiển thị các thông tin lưu trữ tươngứng Nếu ta thay đổi những trang web của mình, những cỗ máy tìm kiếm tựđộng dần dần tìm thấy những sự thay đổi này, và điều đó có thể ảnh hưởng đếnwebsite của mình được liệt kê như thế nào Những tiêu đề trang, nội dung vănbản và các phần tử khác đều giữ một vai trò nhất định

Human-Powered Directories - Các thư mục do con người quản lý và cậpnhật Các thư mục Internet, ví dụ như Dự án thư mục mở - Open DirectoryProject (Dmoz.org) hoàn toàn phụ thuộc vào sự quản lý của con người Chúng ta

Trang 12

các biên tập viên của thư mục viết giúp phần mô tả cho ta, chúng phù hợp vớinội dung và chủ đề của từng danh mục.

Việc thay đổi những trang web của mình không có hiệu lực trên danh mụccủa website Những thứ hữu ích để cải thiện vị trí xếp hạng với một cỗ máy tìmkiếm không có gì để làm với việc cải thiện một vị trí trong một thư mục Ngoại

lệ duy nhất là một site tốt, với nội dung tốt, có lẽ thích hợp hơn để được xem xét

so với một website nghèo nàn

2.2.1 “Hybrid Search Engines” - Các hệ thống tìm kiếm tổng hợp

Ngày trước, mỗi cỗ máy tìm kiếm sử dụng giải thuật riêng để tạo sự khácbiệt Đã là hệ thống tìm kiếm tự động thì không kèm theo một thư mục internet

và ngược lại Nhưng hiện nay, hầu hết hệ thống tìm kiếm đều là sự tổng hợp của

hệ thống tìm kiếm tự động và một thư mục do con người quản lý

Ví dụ: Yahoo có Yahoo Directory, Google có Google directory (dựa trênthư mục Dmoz), MSN và các hệ thống tìm kiếm khác cũng vậy

2.2.2 Các thành phần của một cỗ máy tìm kiếm tự động

Những cỗ máy tìm kiếm tự động có ba phần tử chính Đầu tiên là spider,cũng được gọi là crawlers Spider đến thăm một trang web, đọc nó, và sau đó đitheo sau những mối liên kết tới những trang khác bên trong website Có nghĩa

là, khi có ai đó tìm kiếm đến một trang, các spiders sẽ ghi nhớ điều đó Nó sẽquay lại trang đó và theo chu kỳ 1-2 tháng Như vậy, nếu trang web được tìmthấy càng nhiều, thì các spiders càng năng quay trở lại hơn và như thế, kết quảtìm kiếm của website cũng được cải thiện theo

Mọi thứ spider tìm thấy đi vào trong phần thứ hai của cỗ máy tìm kiếm,Chỉ mục (the index) Chỉ mục, đôi khi gọi là tài liệu, là một kho lưu trữ khổng lồchứa đựng một sự sao chép của mọi trang web mà spider tìm thấy Nếu mộttrang web thay đổi, thì danh sách này được cập nhật với thông tin mới

Cơ sở dữ liệu của các search engine được cập nhật hoá bởi các chươngtrình đặc biệt là "robot", "spider" hay "Webcrawler" Các chương trình này sẽ tựđộng dò tìm và phân tích từ những trang có sẵn trong cơ sở dữ liệu để kiếm ra

Trang 13

các nối kết (links) từ các trang và trở lại bổ xung dữ liệu cho các search enginesau khi phân tích Các chương trình này cũng sẽ báo cáo về các liên kết đã bịđào thải Từ khoá mà người tìm kiếm bỏ vào là để cho search engine kiếm trongbảng chỉ số của nó Kết quả đúng nhất sẽ được xếp ở thứ tự đầu tiên.

Đôi khi, cần phải có thời gian để các spiders lập chỉ mục cho một trangmới hay một trang được thay đổi nội dung Như vậy, sẽ có trường hợp: mộttrang đã được các spiders tìm đến, nhưng lại chưa được lập chỉ mục Và trongkhỏang thời gian này, trang web sẽ hoàn toàn không tồn tại trên Search engine

Phần mềm tìm kiếm chính là phần tử thứ ba của một cỗ máy tìm kiếm.Đây là một chương trình máy tính có chức năng sàng lọc thông tin từ hàng triệutrang tương tự nhau để sắp xếp vị trí từng trang sao cho phù hợp nhất Đây chính

là nơi mà các công ty SEO khai thác để đưa một website nào đó lên vị trí Topkhi được tìm kiếm với một hay nhiều từ khóa chỉ định

Major Search Engines: Các cỗ máy tìm kiếm chính - Giống nhau nhưngcũng khác nhau

Tất cả các cỗ máy tìm kiếm tự động có những phần cơ bản được mô tả ởtrên, nhưng có những sự khác nhau trong những phần này trong việc nó đượcđiều chỉnh tác động như thế nào Đó là lý do tại sao cùng một từ khóa, khi tìmkiếm trên những cỗ máy tìm kiếm khác nhau thường cho ra những kết quả khácnhau

Một ví dụ cụ thể: Nếu ta đánh một từ khóa, thì Google, Yahoo, MSN,AOL, Ask hay Exactseek đều cho ra các kết quả khác nhau, dù có nhiều websitehơi giống nhau

4 Các loại Search engine phổ biến

4.1 Meta-search engine

Ngày nay, người ta còn lợi dụng các search engine sẵn có để thiết kế

Trang 14

không có cơ sở dữ liệu Khi hoạt động thì nó sẽ gởi từ khoá đến các searchengine khác một cách đồng loạt và nhận về tất cả các kết quả tìm được Vànhiệm vụ của nó chỉ là phân tích hay sắp xếp lại các tài liệu tìm được cho ngườidùng Ưu điểm của loại meta-search engine là lợi dụng cơ sở dữ liệu của cácsearch engine nguyên thuỷ để tìm ra nhiều kết quả hơn Nhưng vì loại meta-search engine này chỉ tồn tại nếu có các search engine nguyên thuỷ nên gọi làmeta(tiếp đầu ngữ meta thường dịch là 'siêu hình' hay 'ảo') Điển hình là: http://www.metacrawler.com/

3.2 Thư mục đối tượng (Subject Directories)

Còn gọi là bộ máy tìm kiếm theo phân lớp (hierarchical search engine) search engine kiểu này sẽ phân lớp sẵn các đối tượng vào các thư mục và ngườidùng sẽ lựa rẻ nhánh từ từ cho đến khi tìm ra các trang WEB mà mình muốn.Kiểu này dể cho người tuy cập nhưng có điểm yếu là nó không thể bao gồm hếtmọi chủ đề mà mình muốn kiếm ra Hơn nữa, sự phân loại đôi khi không đượcđầy đủ và chính xác Điển hình của loại này là www.yahoo.com

-3.3 Các cơ sở dữ liệu đặc biệt

Đặc điểm của loại này là dữ liệu kiếm ra không thực sự có được địa chỉtrang WEB cụ thể qua các search engine, dữ liệu này tồn tại trong các cơ sở dữliệu của một computer ở đâu đó mà các trang WEB được phép sử dụng Đặcbiệt, các trang WEB nghiên cứu của các ĐH hay Học Viện như là

http://lii.org/ , http://www.academicinfo.net/ , và http://infomine.ucr.edu/

Trang 15

Ví dụ:

Ngoài ra, lợi dụng google hay yahoo ta cũng có thể tìm ra các tài liệu trong các cơ sở dữ liệu bằng cách thêm vào từ khoá chữ: "database", Nghĩa là: thay vì dùng

từ khoá "ky su cntt" thì viết thành "ky su cntt database".

Các trang WEB mô tả như trên gọi là invisible WEB (tạm dịch 'vô kiếnWEB' )

4 Đặc điểm và phân loại search engine

4.1 Các đặc điểm

Như vậy, tuỳ theo keyword mà có thể tìm số trang liên hệ ít hay nhiều.Trong nhiều trường hợp, số trang tìm ra có đến hàng triệu trang thì vấn đề đặt racho một search engine là làm sao xếp thứ hạng các trang để người dùng có nhiều

cơ hội tìm ra dữ liệu mình muốn nhất?

4.2 Cách thức xếp thứ hạng (ranking)

Trang 16

người dùng máy (chẳng hạn như máy bên Pháp thì trang tiếng Pháp sẽ có ưu tiênhơn và tùy theo cách cho từ khoá đủ "hẹp" trong thị trường tìm kiếm) Mặc dùvậy, khi chưa quen dùng chúng ta sẽ "tìm" được cả đống những cái liên kết(links) không vừa ý và nhiều lúc chúng hoàn toàn vô dụng Lý do chính có thể

là do người dùng đã không hiểu rõ kĩ thuật tìm kiếm của máy và ngược lại cũng

có thể là do kĩ thuật hiện tại của search engine chưa đủ sức để "hiểu" người dùngmuốn gì! (bởi vậy mới phải tả rõ hơn cho search engine hiểu rằng mình muốngì!)

Đa số cách xếp thứ hạng là dựa vào "số lần xuất hiện" (còn gọi là tầnxuất) của từ khoá trong một trang Nghĩa là trang có xuất hiện từ khoá nhiềunhất sẽ được hiển thị trước tiên khi search engine trả lời (Người thiết kế searchengine cho rằng tài liệu nào lặp lại nhiều lần cái từ khoá thì chắc nó sẽ hữu dụngnên được xếp ngay ở hàng đầu tiên của trang trả lời!)

Bởi vậy nếu ta tra tìm trang WEB mà lại dùng từ khoá chung chung hoặc

từ có nhiều nghĩa thì hầu như ta sẽ không tìm được những trang chứa cái mìnhmuốn Trong trường hợp này hoặc ta phải tìm bộ từ khoá khác hơn, chi tiết hơn hoặc dùng những kĩ thuật hổ trợ từ search engine

Có một số search engine ngoài việc xác định tần xuất của từ khoá chúngcòn dựa vào khả năng xuất hiện sớm của từ khoá này trong một hồ sơ như là tìmthấy trong tựa đề (title), trong đầu trang (header), Hoặc giả, họ xác định sựquan trọng của trang WEB bằng cách đếm số trang có liên kết từ các trang kháctới nó (Một trang WEB có hay, có quan trọng thì các search engine ưu tiên cungcấp 'link' và 'reference' trên trang WEB đó!)

Cũng vì lí do này, đa số các search engine lớn đều có thêm chức năng là

"advanced" hay "advanced search" để giúp ta tìm ra cái cần dể hơn

Trang 17

4.3 Phân loại search engine

Phân loại theo kiến trúc hoạt động theo phân định của Berkeley

(http://www.lib.berkeley.edu/) thì có 3 loại công cụ tìm kiếm (search tool): cácsearch engine tồn tại dựa trên chương trình spider, các search engine theo thưmục đối tượng, và invisible WEB

Phân loại theo chức năng theo cách phân loại này thì tùy theo đối tượngtìm kiếm mà có: Kiếm địa chỉ trang WEB, kiếm địa chỉ e-mail, hay kiếm tin tức

về một người hay một tổ chức (ví dụ như website: http://www freeality.com/findrev.htm ), kiếm việc làm, kiếm bản đồ (ví dụ như: http://www.google.com/mapmaker hoặc www.mapquest.com )

4.4 Các Search Engine nên biết

www.Google.com Được xem là search engine kiểu spider tốt nhất (4 lầnthắng do Search Engine Watch lựa chọn) Bằng google, ta có thể dùng để tìmhình ảnh, các bàn luận đang có trên Usenet, và newsgroups(các nhóm tin tức)

Nó cũng cung cấp chức năng kiểm lỗi chính tả, tra cứu các từ điển, tìm giáchứng khoán, bản đồ đi đường, số điện thoại v.v…

Google đầu tiên là một đề án từ ĐH Stanford của các sinh viên Larry Page

và Sergey Brin lúc đó gọi là BackRub Năm 1988, tên này đổi thành Google và

dự án đã được tung ra thị trường trở thành một công ty tư nhân tên Google chođến nay

www.yahoo.com Xuất hiện năm 1994 ban đầu trang này thiết kế theophương pháp thư mục Cho đến tháng 11 năm 2002 yahoo đã thêm vào chứcnăng spider lấy từ Google (để tăng sức cạnh tranh) cho đến tháng 2/2004 Hiệnnay yahoo đã tự có kĩ thuật tìm kiếm độc lập

Trang 18

Đây là trang "số 1" cho những người thích mua sắm vì cách phân loạitheo đối tượng sẽ dể cho người tiêu dùng tìm đến sản phẩm cần thiết.

Kĩ thuật spider của yahoo là sự kết nối kĩ thuật của Altavista, AllTheWeb, vàcủa Inktomi (một đề án serach engine phát khởi từ UC Berkeley)

www.askjeeves.com Khởi sự từ năm 1998 đến 1999 thì trở thành seaechengin có "ngôn ngữ tự nhiên": Nó cho phép ta đặt câu hỏi (dĩ nhiên tiếng Anhhoặc các thứ tiếng mà nó hổ trợ) và trả lời cho chúng ta tất cả những gì dườngnhư có thể là đúng Thật ra, đằng sau bức màn "kĩ thuật cao" này là công ty đã

có khoảng một trăm chuyên viên có nhiệm vụ khảo sát các ghi nhận khi tìmkiếm và từ đó tìm ra những gì dường như là những trang đúng nhất cho sự tìmkiếm đó

Ask Jeeves còn hổ trợ thêm vào đó một chức năng gọi là "smart search"(tạm dịch dò kiếm tinh khôn) chức năng này cung cấp thêm một sự phân loại tốithiểu về loại đối tượng mà ta muốn tìm (hình ảnh, phim, nhạc, ) bằng cáchchọn các biểu tượng và do đó cho ra kết quả chính xác hơn nhiều

Ví dụ những Search engine khác như:

 www.vivisimo.com - meta-search engine

 www.surfwax.com - meta-search engine

 www.copernic.com -meta-search engine

 www.metacrawler.com - meta-search engine

 http://lii.org/ - adcademic search database

 http://www.academicinfo.net/ - adcademic search database

 http://infomine.ucr.edu/ - adcademic search database

Trang 19

1.2 Các hổ trợ nâng cao và các phép toán sử dụng trong Search engine

Các Phép Toán đơn giản dùng để nâng cao hiệu quả của việc tìm kiếm.

Trong hầu hết các trang tìm kiếm, việc dùng các dấu hổ trợ +, - và ngoặc képđều thuận tiện

1 Dùng dấu '+': Khi muốn tìm các trang có mặt tất cả các chữ mà ta muốn

không theo thứ tự thì hãy viết nối các chữ này với nhau bởi dấu + (chừa khoảngtrống giữa các chữ)

Thí dụ muốn tìm trang nói về thiết bị y tế ta có thể điền vào ô tìm bộ từ khoá:

thiet +bi +y +te

Như vậy thì chỉ có những trang nào có đủ các chữ đã nêu mới được tìm ra Bằng cách này ta có thể lọc bớt được một số lớn các trang không cần tìm

Trang 20

Chẳng hạn tìm tin tức về các loại xe dùng kỹ thuật loại mới chưa có bán trên thịtrường nhưng không muốn các trang bán xe lọt vào thì có thể thử từ khoá:

car +hibrid -sale -camry –civic

(Camry and civic là hai kiểu xe hybrid(công nghệ hybrid) đã có bán trên thịtrường của Honda)

3 Dùng ngoặc kép " " để tìm cụm từ trong nguyên văn

Nhiều khi ta muốn tìm bài viết nguyên văn của một câu nói, tên của mộtngười hay một bộ cụm từ thì có thể để tất cả vào trong ngoặc kép Phương phápnày rất tiện lợi cho việc tìm kiếm những trang đặc biệt (thí dụ đánh nguyên vănmột câu thơ "uống nước nhớ nguồn" vào trong công cụ tìm kiếm ta nhận đượccác kết quả có cụm từ trên theo thứ hạng ưu tiên của công cụ tìm kiếm

0.09 giây đã tìm ra câu "uống nước nhớ nguồn".

Phương pháp này rất hiệu quả nhưng nếu đánh sai chính tả thì sẽ không có kếtquả

Trang 21

4 Các phép toán Boolean

Các mệnh lệnh tìm kiếm dùng đại số boolean đã được phát triển từ nhiềunăm Mặc dù vậy, chúng đã khó xử dụng so với những trình độ người trungbình Hầu hết các search engine đều có chấp nhận các mệnh lệnh kiểu này Tuynhiên, hầu hết các trường hợp thì ta có thể tìm ra những gì cần mà không phảixài tới chúng

Các phép toán thông dụng thường được các search engine hổ trợ là OR, AND, NOT và NEAR.

Lưu ý: khi dùng mệnh lệnh Boolean thì các toán tử phải viết bằng chữ hoa

"Nguyễn Trãi" OR "Nguyen Trai"

Xa hơn nữa, một số các search engines sẽ dùng phép toán OR như là phép

toán mặc định (nghĩa là nếu ta gõ "Nguyễn Trãi" "Nguyen Trai" thì kết quả.

Chẳng hạn trường hợp search engine Altavista thì sẽ tìm ra ngay cả những bàiviết không dấu)

Lưu ý: AOL search engine không làm tốt khả năng tìm kiếm khi dùngtoán tử OR Trong khi google sẽ không hoạt động để tìm những cụm từ khácnhau bởi phép toán OR

Trang 22

Các trang có thể dùng OR là: AltaVista, AOL Search, Excite, Google,Inktomi (HotBot, MSN), Ask Jeeves, Lycos, Northern Light, HotBot, vàGigablast.

4.2 Phép AND

Phép toán AND nhằm yêu cầu search engine tìm kiếm các trang có sựhiện diện của tất cả thành tố

Thí dụ : "cong nghe" AND "thuc pham" sẽ tìm kiếm các trang có chữ “cong

nghe” và chữ "thuc pham".

Một số trang tìm kiếm sẽ dùng AND như là mặc định (trong đó cógoogle) Ta cũng có thể thay thế bằng cách dùng dấu + trong một số trường hợpnào search engine không có chức năng Boolean

Các trang có thể dùng AND là: AltaVista, AOL Search, Excite,Inktomi (HotBot,MSN) Northern Light, Yahoo, và Gigablast

4.3 Phép NOT

Phép này hoàn toàn tương tự như cách dùng dấu - Nghĩa là, sự tìm kiếm

sẽ loại bỏ những trang có thành tố đi cùng với phép toán NOT

Các trang có thể dùng NOT là: AOL Search, Excite, Inktomi (HotBot, MSN),Northern Light và Gigablast

4.4 Phép NEAR

Dùng để tìm kiếm những trang WEB có các thành tố của từ khoá nằm gầnnhau Phép toán này rất có lợi để tìm ra những trang có một cụm từ, một kháiniệm, một định nghĩa hay một lời phát biểu mà ta không nhớ hết được nguyênvăn

Trang 23

Ví dụ: Tìm lại nguyên văn câu thơ và tác giả bằng bộ từ khoá: "Nước đi"

NEAR "thề non"

Không nhớ hết câu, vẫn tìm ra tác giả Tản Đà qua Altavista

Các trang cho dùng NEAR là AltaVista (10 words), AOL Search (specifynumber)

4.5 Chẻ nhánh bằng phép ( )

Dùng ngoặc đơn cho phép ta tìm nhiều kết hợp phức tạp Thí dụ:

bootable AND (CD OR CDROM OR CD-ROM) AND (howto or instruction)

Trang 24

Tìm phương pháp làm CD tự khởi động bằng bộ từ khoá có ( )

Hổ trợ cho kiểu phân nhánh bằng ngoặc đơn là AltaVista, AOL Search, Excite,Inktomi (MSN), Northern Light

Lưu ý:

 Trong mọi trường hợp thì từ khoá sai chính tả sẽ không thể có hiệu quả

 Cách tốt nhất là dùng chữ in hoa cho các phép toán

 Các trang tìm kiếm của Hotbot hay MSN thì ta phải chuyển sang chọnchức năng "Boolean phrase" khi dùng các phép toán Boolean

 Trang Lycos (www.lycos.com) có thông báo là họ trợ giúp các phép toánboolean nhưng trong thực tế, chức năng này không hoạt động đúng vàhiệu quả

5 Các hổ trợ nâng cao khác

Ngoài ra, nhiều search engine còn hổ trợ thêm các từ khoá qui ước Khidùng các từ khoá này thì search engine sẽ chuyên biệt hoá các trang WEB, tìmkiếm theo ý nghĩa qui ước mà từ khoá biểu tượng Với các hổ trợ này ta có thểkiểm soát được các loại trang nào mà ta muốn tìm kiếm

Lưu ý: Đằng sau các từ khoá qui ước đều có dấu hai chấm ':' Khi viết bộ từ

khoá có các từ khóa qui ước này thì tốt nhất là viết từ tìm kiếm ngay liền saudấu ':' và không chừa khoảng trống (space) nào

Thí dụ ta viết từ khoá link:http://cnn.com thay vì viết link: ttp://cnn.com

5.1 Các từ khoá host:, site:, url.host:, và domain:

Dùng để thu hẹp các trang WEB tìm ra

Trang 25

5.1.1 Từ khoá host: của Alavista(www.altavista.com ):

Từ khoá này sẽ chỉ cho phép search engine tìm các trang nằm trong một

WEB server (host) mà ta muốn tìm Thí dụ host:mars.jpl.nasa.gov mars

Saturn

Bộ từ khoá trên chỉ tìm trong mars.jpl.nasa.gov tất cả các trang có chứa chữmars và chữ Saturn

Kết hợp với các lệnh khác ta có thể tìm theo cách chuyên biệt:

"carbon nanotech" -host:www.technologyreview.com

Lệnh trên cho phép tìm tất cả các trang nào có chứa cụm từ "carbonnanotech" ngoại trừ các trang xuất sứ từ www.technologyreview.com (Bởi vìmuốn đọc bài từ trang này thì phải trả tiền đăng kí)

Hay là:"heart transplan" +host:edu

Mệnh lệnh trên sẽ tuy tìm các trang có đuôi gốc là edu (vì các trang có tận cùngedu thường là các trang của trường đại học )

5.1.2 Từ khoá tương tự site:, url.host:, và domain:

Làm chức năng hoàn toàn tương tự với từ khoá host: của Altavista thì:

Từ khoá site: được dùng bởi Excite, Google (Netscape, Yahoo)

Từ khoá url.host: dùng bởi AllTheWeb.

Từ khoá domain: dùng bởi Inktomi (HotBot, iWon, LookSmart).

Trang 26

Dùng để tìm các trang có tựa đề chứa từ khoá Tuỳ theo loại search engine

mà chúng ta dùng từ khoá khác nhau

Điều này tiện lợi cho việc tìm kiếm tựa đề (hay các bài viết có chủ đề tậptrung) các bài viết thông thường các bài nghiên cứu được đăng tải sẽ có tựa đềrất rõ ràng Do đó, nếu dùng cách này cũng có thể tìm ra nhiều tài liệu Ngoài ra,dùng cách này ta có thể tìm lại được các trang mà ta chỉ nhớ một hay một phầntựa đề của nó

5.2.1 Từ khoá title:

Có thể dùng trong các trang WEB: AltaVista, AllTheWeb, Inktomi (MSN

và HotBot) Để tuy tìm các trang có có tựa đề chứa 1 từ hay 1 cụm từ đặcbiệt(trường hợp cụm từ thì ta hãy để trong ngoặc kép)

Thí dụ: title: "Mars Landing" sẽ giúp tuy tìm các trang nói về Hoả tinh

Trong trường hợp ta muốt tìm nhiều hơn một chữ nằm trong cùng 1 tựa đề bài

thì có thể dùng hai lần từ khoá title Thí du: title Mars title: water

5.2.2 Từ khoá intitle: và allintitle:

Cho phép dùng trong các trang: google.com và teoma.com

Từ khoá intitle: tương tự như từ khoá title của altavista để tìm một từ hay

1 cụm từ dể trong ngoặc kép

Ví dụ để so sánh với 'title':intitle:"mars landing"

Từ khoá allintitle: được dùng để tìm tựa các bài mà có chứa nhiều hơn 1

từ mà ta muốn tìm Ví dụ để so sánh với việc dùng nhiều lần chữ 'title':allintitle:Mars watwer

Trang 27

Dùng allintitle: tìm trang có tựa bao gồm chữ Mars và water trong google

5.2.3 Các từ khoá inurl:, allinurl:, orginurl:, và u:

Các từ khoá này dùng để tìm những địa chỉ trang WEB mà có chứa cácchữ cần tìm (Rõ ràng là việc này có lợi cho những ai thích mò tới các địa chỉkhác nhau nhưng có cùng 1 tên)

5.2.4 inurl: và allinurl: trong google:

 Cũng như trên muốn tìm địa chỉ các trang WEB có một chữ đặc biệt thì

tìm các trang có đuôi file riêng biệt chẳng hạn như: mars rover inurl:pdf sẽ

giúp tìm các trang có dạng đuôi tệp là pdf mà các trang này chứa từ khoá mars

Trang 28

5.2.5: originurl:, u: và url:

 Việc tìm địa chỉ trong Inktomi (AOL, GoTo, HotBot) sẽ thông qua từ

khoá originurl:

Trong Yahoo thì dùng từ khoá u:

Trong exite ( www.excite.com ) dùng url:

5.2.6 Từ khoá Link: và linkdomain:

Dùng để tìm các trang có dòng liên kết tới trang mà được ghi trong từ khoá

 Từ khoá link dùng được trong google và trong yahoo Tuy nhiên, khi

dùng yahoo ta phải cho đủ tên trang WEB với tiền tố http:// Thí dụ:

từ khoá link:vietsciences.free.fr sẽ tìm được một số trang bởi google Trong khi đó, nếu đánh link:http://vietsciences.free.fr thì sẽ tìm ra nhiều

kết quả hơn trong yahoo

5.2.7 từ khoá filetype:

Khi cần tìm các tư liệu nằm dưới các dạng tệp khác nhau thì từ khoá filetype:

sẽ giúp đỡ ít nhiều Tuy nhiên, tuỳ theo trang mà chúng ta truy kiếm sẽ có cácgiới hạn khác nhau

 Trang google: sẽ hổ trợ tìm kiếm các kiểu tệp: PDF, Word (.doc), Excel(.xls), PowerPoint (.ppt), và Rich Text Format (.rtf) cũng như làPostScript (.ps), Text (.txt), HTML (.htm hay html), WordPerfect (.wpd),

và các file extensions khác

ví dụ: laser filetype:pdf sẽ giúp tìm các trang kiểu đuôi pdf

 Trang yahoo cho phép tìm HTML (htm hay html), PDF, Excel (.xls),PowerPoint (.ppt), Word (.doc), RSS/XML (.xml), and Text Format (.txt)

Trang 29

 Trang MSN chỉ chuyên biệt tìm các loại tệp: HTML, PDF, PowerPoint,Word, or Excel

Lưu ý: Dưới "con mắt" của các search engine thì các tệp có đuôi htm khác vớicác tệp có đuôi html Do đó, nếu muốn tìm một cách chắc chắc tất cả các tệpdạng HTML thì nên tìm làm hai lần một riêng cho htm và một cho html

5.2.8 Dùng các loại kí tự phỏng định (wildcard character): Các dấu này được

hiểu tương tự như khi ta dùng lệnh có dấu phỏng định trong DOS, Windows,hay Linux

Dấu *: dùng thay cho dãy không kể độ dài các kí tự (từ zero trở lên) hổ

trợ dấu này trong các tư khoá có AltaVista, Inktomi (iWon), NorthernLight, Gigablast, google, Yahoo, MSN

Thí dụ: *chnology +laser*

Dấu ?: Dùng thay cho một kí tự bất kì Hổ trợ kiểu tìm này có AOL

Search, Inktomi (iWon)

5.2.9 Dùng kí tự ~

Đặc biệt trong google có một cách để tìm không những các trang có chứa

từ khoá mà còn tìm các trang có chứa chữ đồng nghĩa với từ khoá (trong tiếng

Anh) Ví dụ:~food facts sẽ giúp tìm kiếm các dữ liệu có chữ 'food facts' và các

chữ tương đương như 'nutrition facts' ,

3.3 Chế độ nâng cao của các search engine

Ngoài chế độ tìm kiếm thông thường hầu hết các bộ máy tìm kiếm đều hổtrợ chức năng nâng cao mà dòng liên kết của nó thường viết bởi cụm từ

Trang 30

Bấm lên dòng 'Advanced Search' cho chế độ nâng cao

Một phần hình trong chế độ nâng cao của Google

Trong chế độ này thì sự tìm kiếm được hướng dẫn chi tiết hơn (nhưng cũng không có nghĩa là dể tìm ra tất cả những gì mình muốn)

Đặc điểm chung của các chế độ nâng cao là:

Trang 31

 Giao diện được thêm vào nhiều ô trống có dòng hướng dẫn để tiện ngườidùng điền vào (như điền vào các mẫu đơn xin thi đại học) Không nhấtthiết phải điền hết tất cả các ô trống nhưng các ô này được điền một cáchđúng cách và nhiều chi tiết thì càng giúp cho bộ máy tìm kiếm làm việchiệu quả hơn

 Đa số các search engine cho phép lọc lựa (filter) lại các thông tin như là:lựa chọn ngôn ngữ, lựa chọn ngày tháng của trang WEB, lựa chọn cáckiểu tệp (file type) và ngay cả lọc lựa các nội dung chỉ dành riêng chongười lớn

 Có thể xử dụng các phép toán đã nêu trong bài 2 để nâng cao phép tìmkiếm Tuy nhiên, ta nên cẩn thận vì có thể các kết quả sẽ chịu ảnh hưởng

1 Vài đặc thù của các search engines thông dụng

Mỗi search engine có thể cung cấp thêm một số phương tiện để giảmthiểu khó khăn của của việc tìm kiếm nếu như ta đã gặp (lỡ gõ) phải từ khoá cóquá nhiều trang tìm được, Có nhiều khi số trang tìm được lên đến cả triệu trang!(vậy là từ khoá này quá chung chung) Sau đây là vài công cụ hữu ích

1.1 Tìm thêm dữ liệu theo liên hệ (related search)

Sau khi search, bộ máy tìm kiếm có thể giúp ta đào sâu sự tìm kiếm bằngcách cung cấp các bộ từ khoá chi tiết hơn dưới dạng các dòng link Các link nàythu nhỏ thị trường tìm kiếm (nếu số trang tìm theo từ khóa của ta là quá lớn) Thực ra, nếu ta biết cách chọn từ khoá cho "xít xao" thì sẽ không phải mượn đếnchức năng này

Thí dụ như ta tìm các trang viết về sao hoả mà dùng từ khoá mars thì kểnhư rất khó khăn vì số lượng trang tìm ra sẽ vô cùng lớn Do đó, ta có thể

Trang 32

Những trang có chức năng để tìm dữ liệu theo liên hệ là: AltaVista

(Related Searches), AllTheWeb (Narrow your search) , Excite(Refine Your

Results), HotBot, Lycos, MSN, Yahoo (also try)

Thu hẹp bằng cách lựa bấm vào một link thích hợp

1.2 Chống hội tụ (cluster)

Trong lúc tìm kiếm nếu search engine thấy rằng các trang tìm ra có thể ởchung một trang nguồn thì chỉ chọn ra một trang đại diện còn các trang khác sẽđược xếp gọn vào và ta có thể khai triển rộng ra thành nhiều trang nếu muốn.Như vậy sự tìm kiếm sẽ dể hơn và ít bị "nhiểu loạn" thông tin của cùng mộttrang

Trang 33

1.3 Trang Tương Tự (similar) và trang có chính tả gần giống

Trong một số trường hợp thì chức năng tìm các trang tương tự như cáctrang mà search engine tìm ra có thể hữu dụng Để dùng chức năng này ta chỉviệc bấm vào cái liên kết tương ứng Riêng trong google thì còn có link gợi ýthêm cho việc tìm kiếm bằng chữ "Did you mean "

Các trang có chức năng tìm trang tương tự là: AltaVista (similar pages,

related pages), AOL Search (Show me more like this), Google (did you mean, similar pages).

1.4 Trang có từ nối dài (stemming)

Đây là khả năng của một số bộ máy tìm kiếm cho phép tìm những trang

có chữ mà có chứa từ khoá bên trong nó

Thí dụ, thay vì chỉ tìm chữ tutor trang sẽ tìm luôn các chữ tutors, tutorial,

AOL Search (mặc định), Direct Hit, HotBot(Enable Word Stemming).

1.5 Dùng chức năng tồn trữ (cache) của google

Có nhiều trường hợp trang WEB đã bị xoá sổ không thể hiển thị được nữanhưng thông tin của nó trong cơ sở dữ liệu của search engine vẫn còn mà chúng

ta có thể cần dùng đến Trong thời gian các tin tức này chưa bị xoá khỏi searchengine thì ta có thể đọc được nó nhờ vào chức năng đặc biệt này của google

Trang 34

1.6 Chuyển Dịch (translation)

Một số trang cho khả năng dịch lại trang tìm thấy sang thứ tiếng mà ngườidùng đang có (dịch được ra nhiều thứ tiếng như Anh, Pháp, Đức, hay Tây BanNha… Nhưng cũng chưa được chuẩn xác) Như vậy, ta có thể nắm được mộtphần thông tin có thể dịch ra

Các trang có chức năng chuyển dịch là:

AltaVista(Translate),Google(Translate this page)

1.7 Địa chỉ các search engine thông dụng

1.7.1 Trang kiểu Spider

Trang 35

 Meta Find www.metafind.com tìm trên Meta Find Excite, AltaVista,Infoseek, and WebCrawler

 Meta crawlwr www.metacrawler.com tìm trên Lycos, WebCrawler,Infoseek, Excite, Thunderstone, AltaVista, GoTo, và Yahoo

 copernic: www.copernic.com/

 webFerret www.ferretsoft.com

 Seeker www.bluesquirrel.com/store/

Trang 37

PHẦN II KHÁI NIỆM VỀ SEO VÀ CÁC VẤN ĐỀ CƠ BẢN VỀ SEO

2.1 SEO là gì?

2.1.1 Khái niệm về SEO

Việc tối ưu hóa công cụ tìm kiếm (SEO) sẻ luôn là một khoản đầu tư hiệuquả cho công việc tiếp thị online và bán hàng trực tuyến của khá nhiều công ty,doanh nghiệp, tổ chức, trường học, Việc website của chúng ta xuất hiện trêntrang đầu của kết quả tìm kiếm giúp nâng cao tầm nhìn cũng như hình ảnh củamình trước mạng toàn cầu, hỗ trợ cho tuyển dụng việc làm hay chỉ đơn thuần làquan hệ đối với công chúng trong con mắt nhà đầu tư

Đây thực sự là một thách thức không nhỏ để đi đến một quyết định khônngoan trong chiến lược phát triển hình ảnh, chúng ta cần tìm hiểu rõ ràng mụcđích công việc hoặc ít nhất là khả năng và nguồn lợi của công việc này mangđến cho công việc của mình như thế nào Để chắc chắn chương trình SEO manglại hiệu quả cho website của mình

Trang 38

Định nghĩa:

SEO là viết tắt của cụm từ Search Engine Optimization (SEO) tạm dịch

là tối ưu hóa công cụ tìm kiếm SEO là một tập hợp các phương pháp nhằmnâng cao thứ hạng của một website trong các trang kết quả của các công cụ tìmkiếm Làm SEO là quá trình tối ưu hóa code website, giúp website thân thiệnvới các công cụ tìm kiếm để tăng lượng truy cập qua từ khóa tìm kiếm từ đótăng traffic website - số lượng người truy cập tới một website Một website đượclàm SEO tốt, đồng nghĩa với việc website đó luôn xuất hiện ở thứ hạng cao khingười truy cập sử dụng công cụ tìm kiếm để tìm nội dung mà họ cần SEO cũng

có thể bao gồm nhiều loại mục tiêu khác nhau khi tìm kiếm như: tìm ảnh, tìm từkhóa, tìm theo quốc gia và một số loại SEO khác

Các công cụ tìm kiếm hiển thị một số dạng danh sách trong kết quả tìmkiếm (SERP) bao gồm danh sách trả tiền, danh sách quảng cáo, dánh sách trảtiền theo click và danh sách tìm kiếm miễn phí Mục tiêu của SEO chủ yếuhướng tới việc nâng cao thứ hạng của danh sách tìm kiềm miễn phí theo một số

từ khóa nhằm tăng lượng và chất của khách viếng thăm đến trang

Hiện trên mạng Internet có 3 công cụ tìm kiếm hữu hiệu nhất và phổ biếnnhất:

* Google.com

* Yahoo.com

* Live.com(MSN.com)

Trang 39

Tối ưu hoá công cụ tìm kiếm chỉ ảnh hưởng đến các kết quả tìm kiếm theo hệ thống, không ảnh hưởng đến các kết quả có tính phí hoặc "được tài trợ", như Google AdWords.

Các công cụ tìm kiếm hiển thị một số dạng danh sách trong trang kết quảtìm kiếm bao gồm danh sách quảng cáo, danh sách trả tiền theo click và danhsách tìm kiếm miễn phí Mục tiêu của SEO chủ yếu hướng tới việc nâng cao thứhạng của website trong danh sách tìm kiếm miễn phí theo một số từ khóa nhằmtăng lượng và chất của khách viếng thăm đến trang

SEO đôi khi là một dịch vụ độc lập hay là một phần của dự án tiếp thị.

2.1.2 Thực trạng, tầm quan trọng website vai trò và kế hoạch phát triển của SEO trong CNTT

a, Thực trạng:

Hiện nay, nhận thức của người quản trị website tại Việt Nam nói riêng vàthế giới nói chung nhận biết việc tối ưu hóa website để các máy tìm kiếm trỏ tớirất ít Người sử dụng không ý thức được tầm quan trọng của việc tối ưu hóawebsite, hoặc làm các phương thức để các máy tìm kiếm trỏ đến SEO có thể coi như là một kỹ thuật, một bí quyết thực sự đối với mỗi ngườiquản trị, xây dựng website hay đơn thuần là người làm trong lĩnh vực truyềnthông

Ngày càng nhiều website được thành lập, website của ta sẽ bị lãng quênhoặc "lu mờ" trước các đối thủ của ta nếu ta không thực hiện việc quảng báwebsite trên các bộ máy tìm kiếm Website của ta không có hiệu quả cao khikhông có thứ hạng cao trên Google, Yahoo ,hay Live Search khi tìm với các từkhóa tương ứng với dịch vụ, ngành nghề kinh doanh mà doanh nghiệp của tacung cấp

b, Tầm quan trọng của website và vai trò của SEO:

"Nhờ website, các doanh nghiệp không cần thuê nhà mặt tiền vẫn giới thiệu sảnphẩm đến đông đảo người tiêu dùng Những đơn vị nhỏ có thể có nhiều đơn

Trang 40

cấp, Bộ Kế hoạch Đầu tư, nhận định.Có rất nhiều minh chứng thực tế Ví dụ nhưhiện nay, 80% doanh nghiệp may mặc, da giày của Việt Nam lập website vàkhoảng 30% hợp đồng của các đơn vị này được ký kết qua kênh này Hình thứcthông tin qua trang web cũng giúp một số doanh nghiệp may mặc tư nhân ởHàng Gai (Hà Nội) may đo, bán áo dài cho khách ở nhiều nơi, nhiều nước vànhững sản phẩm thủ công mỹ nghệ, như gốm Bát Tràng, chào hàng ra thế giới.

Trích dẫn trong Hội thảo ứng dụng CNTT trong doanh nghiệp vừa và nhỏViệt Nam, do Sở Bưu chính viễn thông TP HCM và IDG tổ chức

Ngày đăng: 19/12/2013, 11:27

HÌNH ẢNH LIÊN QUAN

Hình ảnh của đã không hiển thị đối với người dùng này vì một số lý do nhưng ít nhất có  phần văn bản thay thế. - Tối ưu hóa công cụ tìm kiếm   SEO- luận văn tốt nghiệp đại học
nh ảnh của đã không hiển thị đối với người dùng này vì một số lý do nhưng ít nhất có phần văn bản thay thế (Trang 62)
Hình dưới đây mô tả quá trình thực hiện SEO cho website - Tối ưu hóa công cụ tìm kiếm   SEO- luận văn tốt nghiệp đại học
Hình d ưới đây mô tả quá trình thực hiện SEO cho website (Trang 67)

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w