Kết quả của việc thực hiện SEO là giúp website của bạn tăng thứ hạng lên cao nhất trong các trang kết quả tìm kiếm của các bộ máy tìm kiếm chính như Google,Yahoo, Bing,...Theo thống kê c
Trang 1LỜI NÓI ĐẦU
Tối ưu hóa SEO (viết tắt của Search Engine Optimization), là cách tối ưu hóa kết quả
tìm kiếm Kết quả của việc thực hiện SEO là giúp website của bạn tăng thứ hạng lên cao nhất trong các trang kết quả tìm kiếm của các bộ máy tìm kiếm chính như Google,Yahoo, Bing, Theo thống kê có đến 80% số người tìm đến website lần đầu tiên qua Search Engine như Google hay Yahoo.
Tối ưu hóa kết quả tìm kiếm và hệ thống quản lý nội dung là hai công việc cần thiết tạo
nên sự phát triển nhanh chóng của một website Điều này được minh chứng bởi lẽ nếu hòa nhập vào bất kỳ một cộng đồng thiết kế web nào hiện nay, bạn đều được nghe nói về chúng như là một thành phần không thể tách rời trong suốt quá trình phát triển và vận hành hệ thống website.
Vậy làm thế nào để có thể thu được hiệu quả tốt và nhanh nhất cho việc tối ưu hóa
website? Như ta đã biết, quy trình tối ưu hóa đã được thực hiện thông qua hệ thống quản trị nội dung Tuy nhiên, trong thực tế, công việc này cần có kinh nghiệm và một quy trình phân tích kỹ lưỡng về tính hiệu quả để có một hướng tối ưu cho website của bạn.
Trong đề tài Luận văn tốt nghiệp “Tìm hiểu và ứng dụng SEO – Search Engine
Optimization vào website Guitarpro.vn”, chúng tôi đã trình bày một cách nhìn tổng quan về các bộ máy tìm kiếm, các phương thức thu thập thông tin, và các cách để tối ưu hóa website (SEO - Search Engine Optimisation) theo hướng phi thương mại.
Trong quá trình thực hiện luận văn, chúng tôi còn gặp nhiều khó khăn và không tránh
khỏi sai sót Song, nhờ sự hướng dẫn nhiệt tình của cán bộ hướng dẫn, chúng tôi đã giải quyết những vấn đề đã đặt ra Nhân đây, tác giả xin gửi lời cám ơn sâu sắc đến cô Nguyễn Cao Hồng Ngọc đã giúp đỡ tận tình trong suốt thời gian qua.
Ngoài ra, xin cám ơn gia đình, bạn bè, đặc biệt là CLB Guitar trường Đại học Cần Thơ,
Ban quản trị trang web Guitarpro.VN đã hỗ trợ để chúng tôi hoàn thành tốt nhất luận văn này.
Cần Thơ, ngày tháng năm
Sinh Viên: Lê Tử Long.
Trang 2MỤC LỤC
CHƯƠNG 1 – TỔNG QUAN 1
1.1 ĐẶT VẤN ĐỀ 1
1.2 LỊCH SỬ GIẢI QUYẾT VẤN ĐỀ 2
1.3 MỤC TIÊU CẦN ĐẠT ĐƯỢC 4
1.3.1 Về lý thuyết 4
1.3.2 Về ứng dụng 4
1.4 PHƯƠNG PHÁP NGHIÊN CỨU – KẾ HOẠCH LÀM VIỆC 4
1.4.1 Phương pháp nghiên cứu và giải quyết vấn đề 4
1.5 BỐ CỤC 6
2.1 TỔNG QUAN BỘ MÁY TÌM KIẾM 7
2.2.1 Bộ máy tìm kiếm hoạt động như thế nào ? 7
2.2.2 Giới thiệu về các search engine thông dụng 9
2.3 CẤU TẠO CHUNG CÁC BỘ MÁY TÌM KIẾM 9
2.2.3 Robot 10
2.2.4 Index – bộ lập chỉ mục 12
2.2.5 Search Engine – bộ tìm kiếm thông tin 14
2.3 HỆ THỐNG RANK 16
2.3.3 Google PageRank 16
2.3.4 Alexa Rank 17
2.4 TÌM HIỂU VỀ SEO 19
2.4.3 SEO là gì? 19
2.4.4 Tại sao cần SEO? 20
CHƯƠNG 3 - ỨNG DỤNG 22
3.1 KHẢO SÁT THÔNG TIN NGƯỜI DÙNG 22
3.1.1 Thành phần người sử dụng 22
3.1.2 Đối thủ cạnh tranh và hướng đi của GuitarPro.VN 22
3.2 XÂY DỰNG WEBSITE 23
3.2.1 Chọn tên miền 23
ii
Trang 33.2.2 Chọn Hosting 23
3.2.3 Mã nguồn phát triển 25
3.3 CÁC PHƯƠNG PHÁP TỐI ƯU HÓA WEBSITE 25
3.3.1 Tối ưu hóa từ khóa (keyword) 25
3.3.2 Tiêu đề: chính xác và duy nhất 26
3.3.3 Meta Description 29
3.3.4 Cải tiến cấu trúc URL 31
3.3.5 Điều hướng 32
3.3.6 Cung cấp nội dung và dịch vụ chất lượng 35
3.3.7 Chuỗi kí tự liên kết 36
3.3.8 Tiêu đề cho nội dung 38
3.3.9 Tối Ưu Hóa Hình Ảnh 39
3.3.10 Robot 41
3.4.1 Cập nhật nội dung 42
3.4.2 Quảng bá website – tạo backlink 42
CHƯƠNG 4 – KẾT LUẬN – HƯỚNG PHÁT TRIỂN 50
TÀI LIỆU THAM KHẢO 53
Trang 4Tối ưu hóa công cụ tìm kiếm bằng những thủ thuật không đáng tin cậy
6 SEO Search Enginee Optimization Tối ưu hóa công cụ tìm kiếm.
8 URL Uniform Re- source Locator Tham chiếu tới tài nguyên trên In- ternet
10 White Hat
SEO
White Hat Search Enginee Opti- mization
Tối ưu hóa công cụ tìm kiếm bằng những thủ thuật tin cậy
iv
Trang 5DANH MỤC HÌNH
Hình 1: Các thẻ meta Khoa CNTT & TT chưa được đặt 4
Hình 2: Tổng quan quá trình nghiên cứu và giải quyết vấn đề 5
Hình 3: Tổng quan cách thức là, việc của bộ máy tìm kiếm 8
Hình 4: Biểu đồ thị phần search engine từ seomoz.org 9
Hình 5: Cấu tạo Search Engine 10
Hình 6: Mô hình xử lý tổng quát hệ thống lập chỉ mục 12
Hình 7: Hệ thống tự động đoán hành vi tìm kiếm 15
Hình 8: Minh họa về chỉ số Reach của Alexa 18
Hình 9: Alexa Rank 18
Hình 10: Minh họa việc chọn Domain 23
Hình 11: Đặt tiêu đề: diễn đàn học guitar online 26
Hình 12: Tiêu đề trang chủ có thể liệt kê tên của website, một số thông tin quan trọng, có thể một vài lĩnh vực hoạt động của site đó 27
Hình 13: Tiêu đề của trang xuất hiện vị trí trên cùng của trình duyệt 27
Hình 14: Truy vấn Google 28
Hình 15: Phân tích Phân Tích Các Description 29
Hình 16: Giống như thẻ <title> thẻ <meta description> cũng được đặt ở thẻ <head> 30
Hình 17: Truy vấn: “học đàn online” 30
Hình 18: URL đơn giản 31
Hình 19: Điều hướng Breadcrumb 33
Hình 20: Điều hướng cho một số mục quan trọng 33
Hình 21: Sử dụng htacess các trang 404 đề được Re-Direct qua Index.php 34
Hình 22: Sắp xếp các thư mục Category cực kì khoa học – giúp cho người dùng dễ dàng tìm kiếm 35
Hình 23: Thống kê các bài viết mới nhất 36
Hình 24: Chuỗi kí tự liên kết được lấy trực tiếp từ title 37
Hình 25: Tiêu Đề bài viết được in đậm và đặt ngay ở đầu bài viết (tự động) 38
Hình 26: Thuộc tính "alt" cho phép chỉ định văn bản thay thế cho hình ảnh nếu hình ảnh đó không thể hiển thị vì một số lý do 39
Hình 27: Hình ảnh được lưu trữ tại Image Folder (quản lý bằng FlashFXP) 40
Hình 28: Robots.txt được đặt ở root 41
Hình 29: Thống kê Backlink 42
Hình 30: Fan Page Facebook 43
Trang 6Hình 31: Sitemap được đăng kí với hơn 130.000 URLs 44
Hình 32: kết quả cùng xuất hiện ở 2 vị trí đầu tiên khi người dùng truy vấn tìm kiếm .44
Hình 33: Biểu đồ so sánh traffic các tháng 45
Hình 34: Thống kê chi tiết traffic các tháng 45
Hình 35: Biểu đồ so sánh traffic từ các tháng 46
Hình 36: Bản đồ thống kê lượng truy cập 47
Hình 37: Thống kê người sử dụng ở các vùng lãnh thổ (có 144 vùng quốc gia/lãnh thổ).47 Hình 38: Biểu đồ so sánh lãnh thổ truy cập với 89,34% đến từ Việt Nam 48
Hình 39: Sơ đồ duy trì và phát triển GuitarPro.VN 52
vi
Trang 7What is SEO? It is an abbreviation for Search Engine Optimization What exactly doesSEO do? It is the method of analyzing and constructing individual web pages, as well as entiresites, so that they can be discovered, analyzed, and then indexed by various search engines
SEO can make the content of your web pages more relevant, more attractive, and moreeasily read by search engines and their crawling and indexing software
Why would this be of great importance to you? Would it be important to you if customers wereunable to find your telephone number or find the address of your business? I do not think thatmany businesses could survive for very long in this situation
This situation could apply to a web site Can potential customers locate your current website easily? Traffic to your web site could be extremely low Potential customers might noteven know that your site exists
“Wait a minute!” you say “We have a beautiful web site, and we include the web site address
in all advertising campaigns Why would people be unable to find our site?”
Of course, your current customers and persons already acquainted with your businesswould be likely to find your web site without difficulty Wouldn’t they?
Are you absolutely sure that your advertising has reached enough potential customers?Did you consider that some people simply do not read the newspapers? How about people whodidn’t get the issue of the magazine where you placed an expensive ad?
Did these people watch the VTV broadcast when your commercial aired? Were they on the rect mail list for which you paid thousands of dollars?
di-So how about those search engines that everyone uses? Potential customers will type aword or two into the box, hit “Enter”, and immediately find a listing for your company’s website One more click and you have another visitor Search engines sure are great, aren’t they ?
Yes, they certainly are great, and the “type-and-click” scenario above does happen.More often than not, however, it doesn’t happen without a little work Search Engine Optimiza-tion is that work
Abstract
In my Graduation thesis “Searching and Applying SEO - Search Engine Optimizationinto Guitarpro.vn Website”, we have presented a general view about Searching Engines, col-lecting information procedures, and the ways to optimize website (SEO- Search Engine Opti-mization) follow non-commercial way, in order to push Guitarpro.vn Website to a high positionwhen users using query in Searching Engines
Trang 8viii
Trang 9CHƯƠNG 1 – TỔNG QUAN
1.1 ĐẶT VẤN ĐỀ
Website – ngôi nhà của Doanh nghiệp trên Internet, nếu nói tên miền là bảng hiệu củamột Công ty thì website chính là văn phòng của Công ty đó, là nơi khách hàng tìm kiếm cácthông tin về doanh nghiệp trước khi kí hợp đồng, là nơi khách hàng và các đối tác liên hệdoanh nghiệp, là bộ mặt của doanh nghiệp… Ngoài ra website còn tạo ra không ít lợi thế khácnhư:
- Hướng hoạt động của doanh nghiệp từ nội địa hoặc cục bộ ra toàn cầu
- Website là nơi trưng bày, giới thiệu sản phẩm, hàng hóa dịch vụ của Doanh nghiệp.Hoạt động lên tục 24x7, không giới hạn thời gian và không gian
- Website là kênh thông tin giới thiệu sản phẩm, dịch vụ hoàn hảo nhất và hữu dụng nhấtvới hình ảnh, các giới thiệu, các media…
- Website còn là một kho hàng khổng lồ, không giới hạn về sức chứa
- Hơn cả, website là một kênh bán hàng tốn ít chi phí nhất
Thông qua website, doanh nghiệp có thể tiếp thị hình ảnh, thương hiệu, dịch vụ, sảnphẩm của mình ra ngoài phạm vi, khu vực của quốc gia Chính vì những lợi ích ấy, việc không
có website đã là một thiệt thòi so với các đối thủ cạnh tranh
Theo Tổng cục Thống kê, tổng số người sử dụng Internet tại Việt Nam tính đến tháng7/2011 là 31,1 triệu người, tăng 24% ( chiếm hơn 30% dân số Việt Nam) và 4 triệu người dùngInternet băng thông rộng, tăng 19% tính theo năm
Trong giai đoạn 2000 - 2010, tỉ lệ tăng trưởng người sử dụng Internet tại Việt Nam đạtmức 12%, tốc độ tăng trưởng nhanh nhất trong khu vực Như vậy sau gần 14 năm kể từ ngàyViệt Nam gia nhập cộng đồng Internet toàn cầu (1/12/1997), lượng người sử dụng Internettrong nước đã tăng nhanh một cách đáng kể
Nhìn chung, Internet là một món ăn không thể thiếu với cuộc sống của mọi người, vớithói quen sử dụng các bộ máy tìm kiếm (Google, Bing, Yahoo…) để tìm kiếm thông tin vềdoanh nghiệp, tài liệu học tập, mua sắm trực tuyến, nạp thẻ điện thoại, thanh toán hóa đơn…
Theo thống kê, có đến hơn 86% lượng truy cập của một website đều đến từ các SearchEngine lớn như Google, Yahoo, MSN… Mỗi ngày có hàng triệu người dùng lướt web sử dụngSearch Engine để tìm những sản phẩm, dịch vụ và thông tin họ đang cần Nhưng liệu với hàng
Trang 10tỉ website hiện đang tồn tại, làm sao khách hàng có thể tìm thấy website của bạn trước màkhông phải của các đối thủ cạnh tranh? Hầu hết người sử dụng các bộ máy tìm kiếm đều khôngkiên nhẫn, họ chỉ tập trung vào các kết quả tìm kiếm ở “Trang nhất” trong hàng trăm, hàngtriệu kết quả trả về khi truy vấn tìm kiếm
Như vậy, câu hỏi được đặt ra là: “làm sao giúp website có thể hiển thị được ở trang đầutiên khi người dùng truy vấn ?” SEO – Search Enginee Optimization: tối ưu hóa công cụ tìmkiếm được đề xuất như là một phương pháp hữu hiệu giúp website có vị trí cao tại trang kết quảtruy vấn đầu tiên, giúp cho người dùng dễ dàng tìm thấy kết quả nhất
Chính vì đa phần người dùng đến 1 website đều thông qua công cụ tìm kiếm nên nếu bỏqua SEO đồng nghĩa với việc bạn mất tiền mỗi ngày cho website của đối thủ cạnh tranh Khôngngười dùng nào đủ kiên nhẫn xem quá 3 trang kết quả sau khi thực hiện tìm kiếm trên SE
Nếu website của bạn không nằm trong top 30 – top 10, khách hàng sẽ không hề biếtwebsite của bạn tồn tại
SEO là hoạt động không thể thiếu đối với bất kỳ trang web nào, nó là con đường để trởthành một trang web được nhiều người biết đến Các phương pháp quảng cáo truyền thốngcàng bị bão hoà đối, chi phí cao nhưng hiệu quả lại giảm sút Nhất là trong giai đoạn khủnghoảng hiện nay, khi mà hiệu quả của việc quảng cáo phải được đặt lên hàng đầu
SEO có rất nhiều ưu điểm so với các phương pháp quảng bá truyền thống như: ngườidùng không phải độc thoại, có thể tiếp cận trao đổi thông tin trực tiếp; linh hoạt hơn trong phânloại người dùng và đặc biệt là Webmaster có thể quản lý được thông tin khách hàng Với rấtnhiều ưu điểm mà truyền hình, báo giấy không có được, Internet sẽ luôn là lựa chọn hàngđầu
1.2 LỊCH SỬ GIẢI QUYẾT VẤN ĐỀ
Webmaster và các nhà cung cấp dịch vụ SEO đã bắt đầu tối ưu hóa các trang web chocông cụ tìm kiếm vào giữa những năm 1990 Ban đầu, các webmaster bắt đầu gửi link liên kếthay url của trang web đến các công cụ tìm kiếm, các công cụ này sẽ gửi một spider đến trangwebsite đó, website sẽ được thu thập dữ liệu, sau đó được index lên máy chủ tìm kiếm, nơi đâycác thông tin về website sẽ được lưu trữ lại, các từ khóa của website, các link liên kết trongwebsite đó, các spider này sẽ làm việc index lên máy chủ theo lịch trình mà các công cụ tìmkiếm quy ước Người sở hữu trang web bắt đầu để nhận ra những giá trị của việc có các trangweb của họ và có thể nhìn thấy được xếp hạng cao trong kết quả công cụ tìm kiếm SEO chia ralàm hai dạng đó là : SEO truyền thống (White Hat SEO) và SEO gian lận (Black Hat SEO)
2
Trang 11Theo nhà phân tích Danny Sullivan, cụm từ “Tối ưu hóa công cụ tìm kiếm” sử dụng rấtnhiều trên mạng vào năm 1997.
Đầu phiên bản của thuật toán tìm kiếm dựa vào quản trị trang web cung cấp thông tinnhư các thẻ meta từ khoá, hoặc tập tin chỉ mục như ALIWEB Thẻ meta cung cấp một hướngdẫn đến nội dung của mỗi trang
Sử dụng dữ liệu meta vào các trang chỉ mục được tìm thấy sẽ được ít hơn đáng tin cậy,tuy nhiên, vì những sự lựa chọn của webmastermà các thẻ meta có sự chính xác trong khả năngđưa thông tin website lên máy chủ tìm kiếm Những dữ liệu không chính xác, không đầy đủ, vàkhông nhất quán trong thẻ meta có thể gây ra sự xếp hạng không đúng vị trí cho các tìm kiếmkhông liên quan Việc cung cấp nội dung đựoc tối ưu hóa và một số thuộc tính trong mã nguồnHTML đối với một trang web cần phải chính xác để có được kết quả tốt trên công cụ tìm kiếm
Bằng cách dựa quá nhiều vào các yếu tố như mật độ từ khóa đó được độc quyền trongvòng kiểm soát của một webmaster, công cụ tìm kiếm sớm bị lạm dụng vào thao tác xếp hạng
Để cung cấp kết quả tốt hơn cho người dùng của họ, công cụ tìm kiếm đã phải thích ứng đểđảm bảo kết quả của các trang đã cho thấy các kết quả tìm kiếm có liên quan nhất, thay vì cáctrang không liên quan nhồi với từ khoá nhiều bởi Black Hat SEO – nhóm Webmaster khôngbao giờ tuân theo các qui định của các bộ máy tìm kiếm, họ luôn lạm dụng quá mức các thủthuật Các công cụ tìm kiếm đã phản ứng lại bằng cách phát triển phức tạp hơn thuật toán xếphạng, có tính đến các yếu tố bổ sung mà gây nhiều khó khăn cho quản trị web để thao tác
SEO tại Việt Nam bắt đầu những nền móng phát triển đầu tiên khoảng vào thời điểmgiữa năm 2006 Sau 5 năm, đến nay SEO đã là một khái niệm mà hầu như bất kì một nhà quảntrị website nào cũng biết đến và tìm hiểu nó dù ít hay nhiều Thậm chí, SEO còn được đưa vàohoạt động của công ty như một hướng đi chiến lược với những kế hoạch dài hơi Điển hình,bạn có thể dễ dàng nhận ra FPT có bộ phận SEO riêng, Zing có bộ phận SEO riêng, VCCORPcũng có bộ phận traffic riêng…
Như đã trình bày ở trên, hầu hết người làm SEO chỉ chú ý đến việc là sao để mộtwebsite Thương mại được lên trang nhất của bộ máy tìm kiếm Vấn đề đặt ra: có thể áp dụngSEO cho một website phi lợi nhuận, mang tính giáo dục và Cộng đồng không ? Liệu SEO chomột trang web phi thương mại có khả năng thành công không…
Luận văn đề tài “Tìm hiểu và ứng dụng SEO – Search Engine Optimization vào websiteGuitarpro.vn” là một minh chứng cụ thể nhất cho việc áp dụng phương pháp SEO vào mộtwebsite phi lợi nhuận, cộng đồng học tập
Trang 12Qua khảo sát: trước đây chưa có một đề xuất về SEO cho lĩnh vực giáo dục,cộng đồnghọc tập tại trường Đại học Cần Thơ Bản thân các trang web của Đoàn thể, các Khoa, và củatrường Đại học Cần Thơ cũng chưa được chú trọng vào việc SEO.
Hình 1: Các thẻ meta Khoa CNTT & TT chưa được đặt
1.3.1 Về lý thuyết
Sau khi hoàn thành luận văn, sinh viên có các kĩ năng sau:
- Tìm hiểu bộ máy tìm kiếm
- Hiểu thế nào là SEO, các biện pháp để tiến hành SEO một trang web
1.3.2 Về ứng dụng
Sau khi áp dụng lý thuyết đạt được vào thực tiễn, sinh viên có được cách để:
- Đưa website vào top 10 của bộ máy tìm kiếm với từ khóa “học guitar online”
- Phương pháp duy trì top 10 khi seo đã thành công
1.4.1 Phương pháp nghiên cứu và giải quyết vấn đề
Việc đầu tiên trước khi SEO một website đã được định hướng đúng đắn bằngnhững ý tưởng độc đáo và mã nguồn tốt thì chúng ta phải biết được SEO là gì? Và cácphương pháp lựa chọn những thành phần hỗ trợ cho website đó Một website được SEOtốt khi và chỉ khi webmaster có được hiểu biết đúng đắn, tránh rơi vào tình trạng BlackHat SEO
4
Trang 13Nhìn chung, quá trình nghiên cứu được phân thành 04 giai đoạn, các giai đoạn này đượcthực hiện liên tục cho đến khi SEO thành công.
Hình 2:Tổngquan quátrìnhnghiêncứu vàgiảiquyếtvấn đề
- Bước1:
Xây dựng ý tưởng, lựa chọn mã nguồn, xây dựng website có nội dung riêng biệt, hỗ trợngười dùng tối đa
- Bước 2: Bắt đầu phát triển website, song song với việc phát triển cả về nội dung lẫn mãnguồn, tác giả bắt đầu áp dụng các biện pháp để tối ưu hóa website
- Bước 3: Thống kê, theo dõi các từ khóa, lượng người truy cập
- Bước 4: Theo dõi các báo cáo cụ thể, duy trì công việc hiện tại nếu SEO thành cônghoặc sữa chữa khi SEO chưa thành công
1.4.2 Kế hoạch làm việc
Trang 141 - 3 Nghiên cứu về Search Engines, cách thức hoạt động, cách thức thu thập
thông tin
4 - 6 Nghiên cứu về SEO, các cách giải quyết vấn đề về SEO
8 - 15 Tối ưu hóa website
Quảng bá website dựa trên các mạng xã hội
Phân tích theo dõi bằng các công cụ miễn phí của các Search Enginescung cấp Xác định hướng đi đúng đắn cho Website
16 Theo dõi, điều chỉnh từ khóa, các nội dung không phù hợp
17 Viết báo cáo
Qua chương 1, tác giả giới thiệu toàn cảnh về đề tài Cách thức nghiên cứu, tiếp cận đềtài và các mục tiêu đạt được khi hoàn thành tốt luận văn
- Chương 2: Cơ sở lý thuyết.
Về cơ sở lý thuyết, tác giả tìm hiểu cách thức làm việc chung của các bộ máy tìm kiếm,các cách thức thu thập thông tin, cách thức để một bộ máy tìm kiếm có thể thấy được trangweb
Trong chương này, tác giả cũng giới thiệu về hai phương thức đánh giá thứ hạng củawebsite là Alexa và GoogleRank, hai phương thức này đã và đang là thước đo quan trọng trongviệc phát triển trang web
6
Trang 15Cũng trong chương này, tác giả giới thiệu SEO, giúp cho người đọc có cái nhìn rõ rànghơn về SEO.
- Chương 3: Ứng dụng.
Sau khi đã tìm hiểu và nắm rõ các phương thức tìm kiếm, các tiêu chí đánh giá xếp hạngtại Chương 2, tác giả áp dụng những hiểu biết trên cơ sở lý thuyết đó để bắt đầu SEO trang webGuitarPro.Vn
Vì vậy, ở chương này, chúng ta sẽ nghiên cứu các phương pháp cơ bản nhất, chính quinhất để có thể tối ưu hóa một website, nhằm đưa website lên các thứ hạng cao khi người dùngtruy vấn
Sau khi đã áp dụng các phương pháp cơ bản và chính qui, tác giả sẽ thống kê các số liệu
và so sánh lúc chưa áp dụng SEO và sau khi áp dụng SEO
Một số phương pháp, kĩ năng mềm mà tác giả đã áp dụng để SEO thành công trang web
- Chương 4: Kết luận – hướng phát triển.
Nội dung của chương 4 sẽ là tổng hợp kết quả các công việc đã làm ở các chương trước.Các kết quả đã đạt được sau khi hoàn thành luận văn
Những nhược điểm của SEO
Hướng phát triển, đề xuất các phương pháp đễ giữ các vị trí cao khi SEO thành công,cũng như cách thức quảng bá website để có thể thu lợi nhuận, tự nuôi sống website
Trang 16CHƯƠNG 2 – CƠ SỞ LÝ THUYẾT
2.1 TỔNG QUAN BỘ MÁY TÌM KIẾM
2.2.1 Bộ máy tìm kiếm hoạt động như thế nào ?
Search Engine hay còn gọi là công cụ tìm kiếm, bộ máy tìm kiếm giúp người xem tìmthấy những thông tin một cách liên quan nhất Người dùng có thể tìm kiếm thông tin theo từkhoá, hình ảnh, địa điểm… trên search engine Khi nhận được câu lệnh yêu cầu tìm kiếm,search engine sẽ phân tích yêu cầu đó, đánh giá, xếp hạng và trả về kết quả liên quan nhất.Search engine hoạt động theo quy trình như sau :
Ban đầu, SE sẽ gửi các Spider (hay còn gọi là con bọ, Crawler) để tiến hành khảo sátmột website khi nó được upload lên Các Spider này được lập trình để có thể tự động lần theoliên kết để đi đến các website khác nhau, sau khi dừng lại ở một website nào đó, Spider này sẽthu thập, đánh giá các thông tin trên website đó trước khi tự động lần theo các liên kết đến cácwebsite khác…
Sau khi nhận được các thông tin từ Spider, SE có nhiệm vụ lưu trữ lại trước khi phântích chúng bằng các thuật toán riêng biệt để trả về các kết quả khi người dùng truy vấn đúngvào nội dung Ta có thể tham khảo cách thức làm việc chung của SE tại hình dưới đây:
là một giai đoạn rất quan
trọng để search engine tham
quan, thu thập thông tin trên website của bạn Search engine có những con bọ (spider haycrawler) được lập trình để có thể tự động theo các liên kết (link) để mò đến các website khácnhau, thu thập và đánh giá các thông tin trên website đó
Lưu trữ - Index: là giai đoạn search engine lưu lại thông tin sau khi đã crawl Với khối
lượng lưu trữ vô hạn, các search engine có thể chứa hàng tỉ kết quả liên quan Một trang web có
8
Trang 17thể được index nhanh hoặc chậm tuỳ thuộc vào tốc độ crawl, độ trust của website và nhiều yếu
tố khác
Phân tích – Analysis: giai đoạn này search engine sẽ làm việc trên các dữ liệu mà nó
thu thập được Sau đó tính toán độ liên quan của dữ liệu so với yêu cầu của người dùng Cácsearch engine khác nhau có những thuật toán phân tích khác nhau từ đây tạo ra sự khác biệtgiữa các search engine Giai đoạn phân tích sẽ tạo tiền đề cho giai đoạn phía sau – Trả về kếtquả
Kết quả - Results: Các kết quả liên quan sẽ được hiển thị trong giai đoạn này Những
kết quả liên quan thường được sắp ở phía trên, cao hơn những kết quả ít liên quan Mặc dùkhông phải lúc nào các kết quả cũng thoả mãn được yêu cầu của người tìm kiếm Nhưng chođến hiện nay, người dùng khá hài lòng với những gì mà search engine trả về
Tuy bức tranh hoạt động của search engine bên ngoài nhìn chung khá đơn giản nhưngbên trong là tập hợp rất nhiều thuật toán phức tạp Search engine nào thoả mãn nhiều nhất nhucầu tìm kiếm người sử dụng sẽ được sử dụng rộng rãi và phát triển mạnh mẽ trong tương lai Ai
là vua trong thị trường tìm kiếm trực tuyến đầy tiềm năng này?
2.2.2 Giới thiệu về các search engine thông dụng
Hiện nay trên thế giới có rất nhiều search engine đang hoạt động Trong đó, phải kể đến
ba chàng khổng lồ đang chi phối 97% thị phần tìm kiếm
Hình 4: Biểu đồ thị phầnsearch engine từ seomoz.org
Google là searchengine được nhiều người sửdụng nhất với 78% số người
sử dụng Tiếp theo là Yahoo9% và Bing 7%, còn lại sốphần trăm ít ỏi dành cho cácsearch engine khác
Hiện nay, ở ViệtNam đa số mọi người cũng
sử dụng Google để tìm kiếm thông tin Nên việc SEO trên Google là ưu tiên hàng đầu đối vớicác website
Trang 182.3 CẤU TẠO CHUNG CÁC BỘ MÁY TÌM KIẾM
Bộ máy tìm kiếm thường cấu tạo bởi 3 bộ phận đó là: Bộ thu thập thông tin, Bộ lập chỉmục và bộ tìm kiếm thông tin, được hoạt động theo mô hình sau:
Hình 5: Cấu tạo Search
Engine
Robot – bộ thu
thập thông tin: Robot
được biết đến dưới nhiều
tên gọi khác nhau: spider,
bot, crawler, hoặc web
worm…Về bản chất robot
chỉ là một chương trình
duyệt và thu thập thông tin từ các website trên mạng, nó tự động duyệt qua các cấu trúc siêuliên kết và trả về các danh mục kết quả của công cụ tìm kiếm Những trình duyệt thông thườngkhông được xem là robot do thiếu tính chủ động, chúng chỉ duyệt web khi có sự tác động củacon người
Index – bộ lập chỉ mục: Các trang web sau khi thu thập về sẽ được phân tích, trích
chọn những thông tin cần thiết (thường là các từ đơn, từ ghép, cụm từ quan trọng) để lưu trữtrong cơ sở dữ liệu nhằm phục vụ cho nhu cầu tìm kiếm sau này
Search Engine – Bộ tìm kiếm thông tin: Tưởng tượng ta muốn tìm vài quyển sách
trong một thư viện rất lớn Với sức lực cá nhân ta không thể xem qua hết tất cả sách, vì vậy tacần một danh mục sách Tương tự, tồn tại hàng triệu trang web trên thế giới và mỗi phút trôiqua số lượng được đẩy lên càng nhiều hơn, cho dù ta có trong tay một công cụ lướt web tuyệtvời đến đâu cũng không thể duyệt hết Tuy nhiên, với sự trợ giúp của SE, ta có thể thậm chí xácđịnh được vị trí của những từ cần tìm trong các trang web khắp nơi trên thế giới
2.2.3 Robot
Robot được chia làm 2 loại đó là: Robot thu thập thông tin, và robot chỉ mục
2.2.3.1 Robot thu thập thông tin có nhiệm vụ
Phân tích – thống kê - Statistical Analysis: Robot đầu tiên được dùng để đếm số
lượng web server, số tài liệu trung bình của một server, tỉ lệ các dạng file khác nhau, kích thướctrung bình của một trang web,độ kết dính…
10
Trang 19Duy trì siêu liên kết – Maintenance: Một trong những khó khăn của việc duy trì một
siêu liên kết là nó liên kết với những trang bị hỏng (dead links) khi những trang này bị thay đổihoặc thậm chí bị xóa Thật không may vẫn chưa có cơ chế nào cảnh báo các bộ duy trì về sựthay đổi này Trên thực tế khi các tác giả nhận ra tài liệu của mình chứa những liên kết hỏng,
họ sẽ thông báo cho nhau, hoặc thỉnh thoảng độc giả thông báo cho họ bằng email Một sốrobot có thể trợ giúp tác giả phát hiện các liên kết hỏng cũng như duy trì các cấu trúc siêu liênkết cùng nội dung của một trang web Chức năng này lặp lại liên tục mỗi khi một tài liệu đượccập nhật, nhờ đó mọi vấn đề xảy ra sẽ được giải quyết nhanh chóng
Ánh xạ địa chỉ web – Mirroring: Mirroring: là một kỹ thuật phổ biến trong việc duy
trì các kho dữ liệu Một ánh xạ (mirror) sẽ sao chép toàn bộ cấu trúc cây thư mục và thườngxuyên cập nhật những file bị thay đổi Điều này cho phép nhiều người cùng truy xuất mộtnguồn dữ liệu, giảm số liên kết bị thất bại, nhanh hơn và ít chi phí hơn so với truy cập trực tiếpvào site thực sự chứa các dữ liệu này
Phát hiện tài nguyên: Có lẽ ứng dụng thú vị nhất của robot là dùng nó để phát hiện tài
nguyên Con người không thể kiểm soát nổi một khối lượng thông tin khổng lồ trong môitrường mạng Robot sẽ giúp thu thập tài liệu, tạo và duy trì cơ sở dữ liệu, phát hiện và xoá bỏcác liên kết hỏng nếu có, kết hợp với công cụ tìm kiếm cung cấp thông tin cần thiết cho conngười
Kết hợp các công dụng trên - Combined uses: Một robot có thể đảm nhận nhiều chức
năng như: vừa thống kê số lượng tài liệu thu được vừa tạo cơ sở dữ liệu… Tuy nhiên nhữngứng dụng như thế còn khá ít ỏi
2.2.3.2 Robot chỉ mục – Robot Indexing
Trong quá trình thu thập thông tin phục vụ cho việc lập chỉ mục, ta cần giải quyết vấn đềsau:
Trong môi trường mạng, robot lấy thông tin từ các site Vậy robot sẽ bắt đầu từ sitenào ? Điều này hoàn toàn phụ thuộc vào robot Mỗi robot khác nhau có những chiến lược khácnhau Thường thì robot sẽ viếng thăm các site phổ biến hoặc những site có nhiều liên kết dẫnđến nó
Ai sẽ cung cấp địa chỉ của các site này cho robot ? Có 2 nguồn; Một là Robot nhận cácURL ban đầu từ user Hai là Robot phân tích các trang web để lấy các URL mới, đến lượt cácURL này trở thành địa chỉ đầu vào cho robot Quá trình này được lặp lại liên tục
Trang 20Chọn dữ liệu nào trong tài liệu để lập chỉ mục? Quyết định chọn dữ liệu nào trong tàiliệu cũng hoàn toàn phụ thuộc vào robot, thường thì những từ được liệt kê như sau được xem làquan trọng :
- Ở góc cao của tài liệu
- Trong các đề mục
- Được in đậm
- Trong URL
- Trong tiêu đề (quan trọng)
- Trong phần miêu tả trang web (Description)
- Trong các thẻ dành cho hình ảnh (ALT)
- Trong các thẻ chứa từ khóa
- Trong các text liên kết
Một số robot lập chỉ mục trên tiêu đề, hoặc một số đoạn văn bản đầu tiên hoặc toàn bộtài liệu (full text) Một số khác lại lập chỉ mục trên các thẻ META(META tags) hoặc các thẻ ẩn,nhờ vậy tác giả của trang web được quyền ấn định từ khoá cho tài liệu của mình Tuy nhiênchức năng này bị lạm dụng quá nhiều do đó các thẻ META không còn giữ được giá trị ban đầucủa chúng nữa (Black Hat SEO)
2.2.4 Index – bộ lập chỉ mục
quát của một hệ thống lập chỉ mục
Trang 21Lập chỉ mục là quá trình phân tích và xác định các từ, cụm từ thích hợp cốt lõi có khảnăng đại diện cho nội dung của tài liệu Như vậy, vấn đề đặt ra là phải rút trích ra những thôngtin chính, có khả năng đại diện cho nội dung của tài liệu.
Thông tin này phải “vừa đủ”, nghĩa là không thiếu để trả ra kết quả đầy đủ so với nhucầu tìm kiếm, nhưng cũng phải không dư để giảm chi phí lưu trữ và chi phí tìm kiếm và để loại
bỏ kết quả dư thừa không phù hợp
Việc rút trích này chính là việc lập chỉ mục trên tài liệu Trước đây, quá trình nàythường được các chuyên viên đã qua đào tạo thực hiện một cách “thủ công “ nên có độ chínhxác cao Nhưng trong môi trường hiện đại ngày nay, với lượng thông tin khổng lồ thì việc lậpchỉ mục bằng tay không còn phù hợp, phương pháp lập chỉ mục tự động mang lại hiệu quả caohơn
- Step of stemming: loại bỏ các hậu tố (Suffixes) để đưa về các từ gốc
Các từ thu được sẽ được lập chỉ mục Tuy nhiên hai bước đầu cũng cần cho quá trình lậpchỉ mục cho các tài liệu tiếng Việt, bước thứ ba không cần vì tiếng Việt thuộc dòng ngôn ngữđơn thể
2.2.4.2 Phương pháp lập chỉ mục
Phương pháp lập chỉ mục gồm hai phần chính yếu sau:
Danh sách hậu tố
CSDL chỉ
mục thông
Trang 22Đầu tiên là xác định các mục từ, khái niệm mà có khả năng đại diện cho văn bản sẽ đượclưu trữ (bao gồm cả việc tách từ, loại bỏ stop-word, xử lý hậu tố…
Thứ hai là xác định trọng số cho từng mục từ , trọng số này là giá trị phản ánh tầm quantrọng của mục từ đó trong văn bản
2.2.4.2.1 Xác định mục từ quan trọng cần lập chỉ mục
Mục từ hay còn gọi là mục từ chỉ mục, là đơn vị cơ sở cho quá trình lập chỉ mục Mục từ
có thể là từ đơn, từ phức hay một tổ hợp từ có nghĩa trong một ngữ cảnh cụ thể Ta xác địnhmục từ của 1 văn bản dựa vào chính nội dung của văn bản đó, hoặc dựa vào tiêu đề hoặc tómtắt nội dung của văn bản đó
Hầu hết việc lập chỉ mục tự động bắt đầu với việc khảo sát tần số xuất hiện của từng loại
từ riêng rẽ trong văn bản Nếu tất cả các từ xuất hiên trong tập tài liêu với những tần số băngnhau, thì không thể phân biệt các mục từ theo tiêu chuẩn định lượng Tuy nhiên, trong văn bảnngôn ngữ tự nhiên, tần số xuất hiện của từ có tính thất thường, do đó những mục từ có thể đượcphân biệt bởi tần số xuất hiên của chúng
2.2.4.2.2 Xác định trọng số cho mục từ
Trọng số của mục từ là sự tần xuất xuất hiện của mục từ trong toàn bộ tài liệu Phươngpháp thường được sử dụng để đánh giá trọng số của từ là dựa vào thống kê, với ý tưởng lànhững từ thường xuyên xuất hiện trong tất cả các tài liệu thì “ít có ý nghĩa hơn” là những từ tậptrung trong một số tài liệu
Ví dụ: tại trang web GuitarPro.vn thì những mục từ có trọng số cao: guitar, hoc guitar,video hoc guitar…
2.2.5 Search Engine – bộ tìm kiếm thông tin
Vì sao ta cần một công cụ tìm kiếm thông tin? Tưởng tượng ta muốn tìm vài quyển sáchtrong một thư viện rất lớn Với sức lực cá nhân ta không thể xem qua hết tất cả sách, vì vậy tacần một danh mục sách Tương tự, tồn tại hàng triệu trang web trên thế giới và mỗi phút trôiqua số lượng được đẩy lên càng nhiều hơn, cho dù ta có trong tay một công cụ lướt web tuyệtvời đến đâu cũng không thể duyệt hết Tuy nhiên, với sự trợ giúp của SE, ta có thể thậm chí xácđịnh được vị trí của những từ cần tìm trong các trang web khắp nơi trên thế giới
2.2.5.1 Các phương thức tìm kiếm:
2.2.5.1.1 Tìm kiếm theo từ khóa
14
Trang 23Đây là phương pháp được áp dụng với hầu hết các search engine Trừ khi tác giả củatrang web xác định từ khóa cho tài liệu của mình, ngược lại điều này phụ thuộc vào searchengine Như vậy các search engine sẽ tự mình chọn và đánh chỉ mục Một số site lập chỉ mụccho tất cả các từ có trong một trang web, một số khác chỉ chọn một số đoạn văn bản.
Các hệ thống đánh chỉ mục trên toàn văn bản (full-text indexing systems) đếm số lầnxuất hiện của mỗi từ trong tài liệu ngoại trừ các từ stopword Có những công cụ tìm kiếm cònphân biệt cả chữ hoa lẫn chữ thường
Những khó khăn khi tìm theo từ khóa: Search engine thường gặp rắc rối với những từđồng âm khác nghĩa hoặc những từ có các biến thể khác nhau do có tiền tố và hậu tố Bên cạnh
đó search engine cũng không thể trả về các tài liệu chứa những từ đồng nghĩa với các từ trongcâu truy vấn
2.2.5.1.2 Tìm kiếm theo ngữ nghĩa
Không giống các hệ thống tìm theo từ khoá, hệ thống tìm theo ngữ nghĩa sẽ ‘đoán’ ýmuốn của người dùng thông qua câu chữ Tìm theo ngữ nghĩa hoạt động dựa trên hình thứcgom nhóm tài liệu, phức tạp hơn thì dựa vào ngôn ngữ học, các thuyết về trí tuệ nhân tạo; tiếpcận dựa vào phương pháp tính toán bằng cách đếm số lần xuất hiện của các từ quan trọng Khinhiều từ hoặc những cụm từ có nghĩa đặt gần nhau trong tài liệu thì cho rằng chúng đang ámchỉ một chủ đề nào đó
Trang 24Hình 7: Hệ thống tự động đoán hành vi tìm kiếm
2.2.5.1.3 Các chiến lược tìm kiếm
Mọi người đều nhận xét rằng web là nơi mà ta luôn có được thông tin về bất kỳ chủ đề
gì Nhưng kết quả cuối cùng thường là lãng phí thời gian cho những URL vô ích
Do đó đã đến lúc ta nghĩ đến các chiến lược tìm kiếm
- Ta khởi đầu với một đống thông tin trên một chủ đề khá rộng ?
- Hoặc ta đã hình dung được cụ thể những gì cần tìm ?
- Hay ta muốn tìm địa chỉ của ai đó ?
16
Trang 25Nếu phạm vi quan tâm của ta quá rộng, ta nên xem xét các thư mục web (web directory).Nếu sau đó ta thu hẹp phạm vi cần tìm, hãy xem xét việc lựa chọn một công cụ tìm kiếm thíchhợp.
Ví dụ: chỉ với từ khóa “học” ta có thể có “học tiếng anh”, “học tài chính”, “học ngânhàng”, “học guitar nhưng với từ khóa rõ nghĩa hơn là học guitar online, học guitar cơ bản…
2.3.3 Google PageRank
2.3.3.1 Google PageRank là gì?
Google PageRank là chỉ số đáng tin cậy chỉ giá trị của một trang web Google đánh giá
và xếp hạng các trang web bằng cả hai phương pháp tự động và thủ công dựa trên hơn 100 chỉ
số chính với những thuật toán xuất sắc
Một vài chỉ số quan trọng quyết định Google PageRank của một trang web: độ hữu dụngcủa thông tin trên trang web, độ phổ biến của trang web, chất lượng kỹ thuật
Google PageRank được chia làm 10 bậc và được biểu hiện bằng vạch màu xanhtrên nền trắng: Giá trị của mỗi trang web theo Google PageRank tăng dần từ 1 đến 10
Thuật ngữ PageRank™ là một thương hiệu được bảo hộ của Google, do Larry Page vàSergey Brin phát triển tại trường đại học Stanford của Mỹ trong một dự án nghiên cứu về công
cụ tìm kiếm năm 1995
2.3.3.2 Google PageRank đem lại lợi ích gì ?
Google PageRank hiện nay được coi là chỉ số đáng tin cậy đánh giá mức độ quan trọngmỗi trang web Một trang web có chỉ số Google PageRank cao sẽ đem lại ấn tượng đáng tin cậycho khách truy cập, điều này đặc biệt có ý nghĩa với các website kinh doanh thương mại điệntử
Google PageRank ảnh hưởng trực tiếp tới vị trí hiển thị của mỗi trang web khi cạnhtranh thứ hạng hiển thị trong danh sách kết quả tìm kiếm của Google Một trang web cóPageRank cao dễ xuất hiện trên đầu danh sách kết quả tìm kiếm của Google hơn
Trang 262.3.3.3 Tăng Google PageRank như thế nào?
Về cơ bản, theo các chuyên gia của Google: "Không được sử dụng các phương pháp giảtạo, hãy tạo ra các trang web cho mọi người chứ không phải cho các công cụ tìm kiếm"
Tăng thứ hạng trong danh sách kết quả tìm kiếm của Google là phương pháp tăngPageRank rất hiệu quả vì vừa tăng độ phổ biến các trang web của bạn, vừa tăng lượng kháchtruy cập
Cấu trúc website, cấp bậc cần rõ ràng, nội dung thông tin cần phong phú, hữu ích
Website không được chứa các liên kết lỗi, các lỗi HTML, lỗi câu lệnh
Đăng ký website vào các danh bạ uy tín cũng như các website chất lượng khác để tăng
2.3.4.2 Alexa Rank mang lại lợi ích gì?
Chỉ số thứ hạng Alexa của một website cao được hiểu là website đó có đông người truycập, phần nào đem lại cho website ấn tượng sống động và uy tín
Trong thị trường quảng cáo trực tuyến, Alexa Rank có thể được sử dụng để đánh giá giátrị quảng cáo
Chỉ số Alexa Rank là thước đo ghi nhận thành quả lao động của các webmaster với cộngđồng và là một công cụ rất hữu ích giúp các webmaster quản trị website hiệu quả
2.3.4.3 Tăng Alexa Rank như thế nào?
Tiến hành các chiến dịch quảng bá website định kỳ nhằm thường xuyên thu hút kháchtruy cập website, tăng cao chỉ số Reach
18
Trang 27Hình 8: Minhhọa về chỉ sốReach của Alexa
Trongwebsite, nên cócác phần thôngtin có giá trị cao,cập nhật để thuhút khách hàngthường xuyênquay lại website, tăng Page views
Bố trí nội dung, cấu trúc website sao cho thu nhận được thật nhiều cú nhấp chuột củakhách truy cập để tăng Page views nhưng vẫn mang lại cảm giác thoải mái, tiện lợi
Trang 28Hình 9: Alexa Rank
2.4 TÌM HIỂU VỀ SEO
20
Trang 29Theo thống kê của tổ chức Verisign, trong Q1 năm 2010 đã có thêm 1 triệu địa chỉInternet, nâng tổng số địa chỉ Internet trên thế giới lên trên 193 triệu và số lượng này sẽ khôngngừng tăng lên đồng nghĩa với việc có bằng đó địa chỉ website đã hoặc sẽ hoạt động trên mạng.
Việc thiết kế xong một website cũng giống như việc chọn và mua được vật liệu để xâynhà từ những cữa hàng vật liệu uy tín mà thôi Thiết kế một website đẹp là do đội ngũ thiết kế
và xây dựng; còn việc website đó có làm ra tiền hay không thì phần lớn lại phụ thuộc vào cách
mà webmaster quảng cáo và khai thác website đó như thế nào ? Như vậy, câu hỏi được đặt ralà: làm thế nào để quảng cáo website tới người dùng ?
Có rất nhiều cách để bạn đưa website của mình đến với người dùng như là quảng cáotrên ti vi, báo chí, quảng cáo tờ rơi, làm hội thảo… Mỗi cá nhân và doanh nghiệp chọn mộtcách quảng bá khác nhau Nhưng một cách vô cùng hiệu quả mà bất kỳ website nào cũng phảilàm đó là tối ưu hóa công cụ tìm kiếm hay còn gọi là SEO Như vậy:
2.4.3 SEO là gì?
SEO là chữ viết tắt của Search Engine Optimization (tối ưu hóa công cụ tìm kiếm) SEO là một tập hợp các phương pháp nhằm nâng cao thứ hạng của một website trongcác trang kết quả của các công cụ tìm kiếm và có thể được coi là một tiểu lĩnh vực của tiếp thịqua công cụ tìm kiếm
Thuật ngữ SEO cũng có thể được dùng để chỉ những người làm công việc tối ưu hóacông cụ tìm kiếm, là những nhà tư vấn đưa ra những dự án tối ưu hóa cho các website củakhách hàng
Làm SEO là quá trình tối ưu hóa mã nguồn website, giúp website thân thiện với cáccông cụ tìm kiếm để tăng lượng truy cập qua từ khóa tìm kiếm từ đó tăng số lượng người truycập tới Một website được làm SEO tốt, đồng nghĩa với việc website đó luôn xuất hiện ở thứhạng cao khi người truy cập sử dụng công cụ tìm kiếm để tìm nội dung mà họ cần SEO cũng
có thể bao gồm nhiều loại mục tiêu khác nhau khi tìm kiếm như: tìm ảnh, tìm từ khóa, tìm theoquốc gia và một số loại SEO khác
Các công cụ tìm kiếm hiển thị một số dạng danh sách trong trang kết quả tìm kiếm(SERP) bao gồm danh sách trả tiền, danh sách quảng cáo, dánh sách trả tiền theo click và danhsách tìm kiếm miễn phí
Mục tiêu của SEO chủ yếu hướng tới việc nâng cao thứ hạng của danh sách tìm kiềmmiễn phí theo một số từ khóa nhằm tăng lượng và chất của khách viếng thăm đến trang
Trang 30SEO đôi khi là một dịch vụ độc lập hay là một phần của dự án tiếp thị và có thể rất hiệuquả ở giai đoạn phát triển ban đầu và giai đoạn thiết kế website Hiện nay, nhận thức của ngườiquản trị website tại Việt Nam nói riêng và thế giới nói chung nhận biết việc tối ưu hóa website
để các máy tìm kiếm trỏ tới rất ít Người sử dụng không ý thức được tầm quan trọng của việctối ưu hóa website, hoặc làm các phương thức để các máy tìm kiếm trỏ đến Hiện trên mạngInternet có 3 công cụ tìm kiếm hữu hiệu nhất và phổ biến nhất:
2.4.4 Tại sao cần SEO?
Đại đa số lưu lượng truy cập đến với các website hiện nay đều từ các bộ máy tìm kiếmlớn như : Google, Yahoo, Bing… Nếu website không được tìm thấy bởi các công cụ tìm kiếmhoặc nội dung không nằm trong cơ sơ dữ liệu của các bộ máy tìm kiếm thì đó chính là mộtthảm họa nếu công ty bạn đang kinh doanh online hoặc có giao dịch trực tuyến hoặc có đichăng nữa nhưng kết quả tìm kiếm luôn nằm ở trang 3, 4, 5… trở đi thì cũng coi như là 1 thấtbại
Một ví dụ nhỏ: website kinh doanh nội thất và…cứ mỗi “khách hàng tiềm năng” lênGoogle, Bing gõ từ khóa tìm kiếm: “đồ nội thất giá rẻ” thì kết quả truy vấn đầu tiên đập vàomắt họ là website của bạn Sau đó, khả năng “khách hàng tiềm năng” trở thành ”khách hàngthân thiết” sẽ cao hơn các đối thủ khác, và dĩ nhiên doanh số tăng theo
Làm SEO hiện tại với thị trường phát triển mạnh và liên tục như hiện nay là điều màcác trang web nên làm và phải làm, hãy bắt đầu ngay vì không bao giờ SEO là quá muộn
Một câu hỏi khác được đặt ra: “Tại sao các công cụ tìm kiếm không thể tìm thấy websitecủa tôi nếu không có sự trợ giúp của SEO?”
Nếu nói là “không thể tìm thấy” thì không hoàn toàn đúng
22
Trang 31Thực ra, sau 1 thời gian dài, website cũng được các cổng tìm kiếm đưa vào index, nhưngchỉ là “cho có” chứ không thật sự như những gì mà chúng ta muốn, vì khi các đối thủ cạnhtranh có sử dụng các biện pháp SEO thì website bạn chẳng bao giờ được lọt vào các trang đầutrên bộ máy tìm kiếm.
Khi có SEO tham gia vào công việc này, nó sẽ giúp website bạn tăng thứ hạng trên cáccông cụ tìm kiếm và hiển thị nội dung ở những nơi mà người dùng dễ thấy và tìm kiếm nhất(kết quả hiển thị ngay trang 1)
Thời đại toàn cầu hóa đã biến bất kỳ môi trường làm việc nào cũng mang tính cạnhtranh, và thế giới ảo cũng không ngoại lệ Những website nào đã và đang quan tâm đến SEO thì
đã có 1 lợi thế hơn so với đối thủ của mình trong việc giành lấy người dùng
CHƯƠNG 3 - ỨNG
DỤNG
Ở chương trước,chúng tôi đã trình bày nguyên lý hoạt động, các nguyên lý thu thập thông tin cũng như Indexmột trang web lên bộ máy tìm kiếm Tại chương này, chúng tôi sẽ áp dụng những nguyên tắc
về lý thuyết đó vào trang web GuitarPro.VN để giúp cho trang web có vị trí cao khi người dùng
Trang 32các cách thức cách thức khảo sát người chùng, cách thức chọn tên miền cũng như các cách đểtối ưu hóa nó sao cho việc Index lên các bộ máy tìm kiếm là dễ dàng nhất.
3.1.1 Thành phần người sử dụng
Đây là bước đầu tiên khi xây dựng một website, tìm hiểu các thành viên cần những gì để
có thể xây dựng một site có thể hỗ trợ tối đa cho họ Diễn đàn Guitarpro được tạo nên với mụcđích hướng cho cộng đồng học sinh – sinh viên một sân chơi - một trang web học tập nghệthuật Đối tượng mà GP hướng đến là cộng đồng bạn trẻ yêu thích âm nhạc, cây đàn Guitarnhưng không có hoặc chưa có điều kiện đến lớp học
3.1.2 Đối thủ cạnh tranh và hướng đi của GuitarPro.VN
Đối thủ cạnh tranh của GP gồm có những diễn đàn sau:
- Guitar.VN Diễn đàn guitar qui tụ nhiều cao thủ Guitar nhất Việt Nam
- Aeguitar.org Diễn đàn guitar lâu đời nhất của Việt nam về Rock
- Viettabs.net Thư viện bài hát lớn nhất Việt Nam
Do các đối thủ trực tiếp cạnh tranh được hình thành từ rất lâu (8-10 năm) Nên việc lựachọn một hướng đi đúng đắn và riêng biệt cho Guitarpro.vn là một điều quyết định đối với sựphát triển của trang web, do đó gướng phát triển của trang web phải mang tính riêng biệt,nhắm vào nhu cầu thực tế của người sử dụng:
- Hướng tới việc học guitar trực tuyến cho người mới bắt đầu
- Xây dựng một trang web với các thao tác dễ nhất, hỗ trợ tối đa cho các bạn có kiến thứctin học chưa cao
- Chia sẻ tài liệu, ebook học Guitar
- Xây dựng một thư viện bài giảng bằng Video hỗ trợ
- Áp dụng Tin học vào Âm nhạc, làm cho Âm nhạc dễ dàng hơn cho cuộc sống
Trang 33Tiêu chí ngắn gọn và dễ nhớ: Với tên miền dễ nhớ, bạn sẽ có nhiều cơ hội để người sử
dụng trở lại với website hơn những tên miền khó nhớ Điều này nói lên rằng, không phải tênmiền ngắn là dễ nhớ đối với người sử dụng, mà nó cần phải làm cho người sử dụng có khảnăng nhớ lại website của bạn khi họ cần tìm đến những nội dung mà bạn có khả năng cung cấp
Hình 10: Minhhọa việc chọnDomain
Tiêu chí liên quan đến vấn đề:
Việc có được
từ khóa chínhtrong tên miềnrất có ý nghĩa,
vì tên miền cóảnh hưởng lớnđến kết quả tìmkiếm trên các công cụ tìm kiếm hiện nay Ngoài ra, nó cũng tạo cho người sử dụng dễ nhớ đếntên miền của bạn hơn khi họ muốn tìm thông tin liên quan đến dịch vụ của bạn
3.2.2 Chọn Hosting
Hosting là một phần quan trọng để quyết định sự thành công của website Một website chỉphát triển tốt khi được chạy trên một hosting tốt Việc lựa chọn Hosting sao cho phù hợp đượcđánh giá theo các tiêu chí sau:
Tốc độ truy cập: tốc độ nhanh sẽ làm cho người dùng giảm bớt khó chịu khi phải chờ
đợi Giúp cho họ có cái nhìn tốt về website
“Tại hội thảo PubCon, Matt Cutts cho biết, Google đang thảo luận nội bộ để đưa thêm một yếu tố nữa vào hệ thống tìm kiếm của mình giúp xác định thứ hạng các website trên Google Yếu tố mới này liên quan đến tốc độ của website và tốc độ tải trang Matt Cutts giải thích thêm rằng, đồng sáng lập Google mong muốn rằng tốc độ tìm kiếm trong tương lai sẽ thực sự nhanh kể cả với các trang báo điện tử Điều này có nghĩa rằng, các trang có tốc độ truy cập nhanh chắc chắn sẽ có thứ hạng cao hơn các trang có tốc độ truy cập chậm Matt cũng nói thêm rằng, tốc độ tải trang hiện đang là