Nhưng liệu với hàng tỷ website hiện đang tồn tại, làm sao khách hàng có thể tìm thấy website của mình trước mà không phải của các đối thủ cạnh tranh?Chính vì đa phần khách hàng đến một
Trang 1TRƯỜNG ĐẠI HỌC VINH
KHOA CÔNG NGHỆ THÔNG TIN
-Phùng Thị Xuân Mận
ĐỒ ÁN TỐT NGHIỆP ĐẠI HỌC Tìm hiểu Kỹ Thuật SEO
Nghệ An, tháng 12 năm 2012
Trang 2LỜI CẢM ƠN
Cuộc cách mạng công nghiệp mới, nền kinh tế tri thức đã phát triển mạnh trongthế kỷ XXI Nhờ sự phát triển mạnh mẽ của Internet nên chi phí sản xuất giảm, chấtlượng sản phẩm cao, mức sử dụng nguyên vật liệu, lao động giảm và sản phẩm ngàycàng tinh xảo, hoàn thiện hơn Công nghệ thông tin là phương tiện và giải pháp hỗ trợcác doanh nghiệp hoạt động hiệu quả hơn
Mạng Internet ngày càng gắn liền với các công ty, doanh nghiệp Word WideWeb(www) trở thành nguồn tài nguyên khổng lồ và quý giá của nhân loại Nó cung cấpcho chúng ta thông tin về mọi lĩnh vực đời sống xã hội, khoa học kỹ thuật, v.v… Tuynhiên đi đôi với sự thuận lợi ấy có một vấn đề được đặt ra là chúng ta làm thế nào đểtruy cập và khai phá được nguồn tài nguyên ấy hiệu quả nhất, làm thế nào để ngườidùng biết đến sản phẩm, dịch vụ của mình một cách nhanh nhất
Xuất phát từ nhu cầu thực tế việc quảng bá website, quảng bá sản phẩm qua
mạng internet, kinh doanh trực tuyến ngày càng phát triển nên em chọn đề tài: “Tìm
hiểu kỹ thuật SEO”( Search engine optimization – Tối ưu hóa công cụ tìm kiếm),
nhằm giúp các doanh nghiệp quảng bá sản phẩm online một cách nhanh chóng và hiệuquả
Đề tài này được hoàn thành với sự giúp đỡ nhiệt tình của thầy giáo: Thạc Sỹ
Nguyễn Công Nhật Em xin bày tỏ lòng biết ơn sâu sắc tới thầy, người đã tận tình giúp
đỡ em trong quá trình học tập, nghiên cứu Đồng thời em cũng bày tỏ lòng biết ơn tớithầy cô giáo khoa CNTT ĐH Vinh cùng toàn thể các ba ̣n đã giúp đỡ em trong thời gianlàm đề tài
Mặc dù em đã cố gắng hết sức hoàn thành đồ án trong phạm vi khả năng chophép nhưng không thể tránh khỏi những thiếu sót Em kính mong nhận được sự thôngcảm và sự tận tình chỉ bảo của quý thầy cô và các ba ̣n để đồ án có thể hoàn thiện hơn
Vinh, tháng 10 năm 2012
Sinh viên
Phùng Thị Xuân Mận
Trang 3MỤC LỤC
Trang
Trang 4CHƯƠNG 1 TỔNG QUAN VỀ ĐỀ TÀI 1.1 Lý do chọn đề tài.
Theo một số thống kê thì có đến hơn 80% số người dùng Internet sử dụng cáccông cụ tìm kiếm như Google, Yahoo, Bing Mỗi ngày có hàng triệu người dùng web sửdụng các công cụ tìm kiếm (Search engines) để tìm những sản phẩm, dịch vụ và thôngtin họ đang cần Nhưng liệu với hàng tỷ website hiện đang tồn tại, làm sao khách hàng
có thể tìm thấy website của mình trước mà không phải của các đối thủ cạnh tranh?Chính vì đa phần khách hàng đến một website đều thông qua các công cụ tìm kiếm, nênnếu như trang web của mình có thứ hạng thấp thì đồng nghĩa với việc mình đã đánh mấtmột lượng lớn khách hàng tiềm năng vào tay đối thủ cạnh tranh
Thực tế có tới 70% người dùng web chỉ xem trang thứ 1, thứ 2 của kết quả tìmkiếm Vì thế, nếu trang web của mình lọt vào trong top 10 của kết quả tìm kiếm thì cơhội được khách hàng viếng thăm là rất lớn Tối ưu hóa máy tìm kiếm (Search engineoptimization - SEO) chính là giải pháp cho vấn đề trên SEO bao gồm các kĩ thuật nhằmgiúp website đạt thứ hạng cao trên các công cụ tìm kiếm
Ngày càng nhiều website được thành lập, website của mình sẽ bị lãng quên hoặc
"lu mờ" trước các đối thủ của mình nếu mình không thực hiện việc quảng bá websitetrên các bộ máy tìm kiếm Website của mình không có hiệu quả cao khi không có thứhạng cao trên Google, Yahoo, hay Live Search khi tìm với các từ khóa tương ứng vớidịch vụ, ngành nghề kinh doanh mà doanh nghiệp của mình cung cấp
Xuất phát từ nhu cầu bức thiết đó em đã chọn đề tài: “Tìm hiểu kỹ thuật SEO”.
Nhằm giúp website của các doanh nghiệp, cũng như các nhân tối ưu hơn với công cụtìm kiếm, qua đó quảng bá hình ảnh công ty, dịch vụ, ngành nghề mà công ty đang kinhdoanh tới người dùng một cách nhanh nhất, hiệu quả nhất
1.2 Phạm vi đề tài.
SEO hay kỹ thuật SEO là một đề tài rất lớn, kiến thức rộng vì thế em chỉ tìm hiểucác phương pháp tối ưu hóa một website chuẩn về SEO, các phương pháp tạo chiến dịchSEO hiệu quả Tìm hiểu các chiến lược, chiến thuật SEO Tìm hiểu các phương phápphân tích, lựa chọn từ khóa
Trang 5CHƯƠNG 2: CÁC THUẬT NGỮ VÀ CÁC CÔNG CỤ SEO
Google PageRank.
PageRank là một thuật toán của Google dùng để đánh giá mức độ quan trọngtương đối của một trang web trên Internet Ý nghĩa cơ bản của thuật toán này là việcmột liên kết từ trang A trỏ đến trang B có thể được coi như là một bình chọn về chấtlượng cho trang B Càng có nhiều liên kết từ nhiều nơi đến trang B, trang B đó càngtăng thêm mức độ quan trọng PageRank có giá trị từ 1 đến 10
Outbound link
Trang 6Outbound link là một liên kết từ trang web của mình đến trang web khác, haycòn gọi là links ra ngoài.
Internal Link
Internal link là một liên kết từ trang này sang trang khác trên cùng một trangweb, còn gọi là links nội bộ Xây dựng hệ thống Internal link tốt sẽ giúp website cảithiện thứ hạng trên công cụ tìm kiếm
PPC
PPC là viết tắt của Pay Per Click (trả tiền theo nhấp chuột) Một loại hình quảngcáo mà trong đó người quảng cáo đặt quảng cáo của mình tại một địa điểm nào đó vàbất cứ khi nào khách thăm nhấp chuột vào quảng cáo của mình, mình sẽ bị mất một chiphí nhất định tương ứng với nhấp chuột đó, giá bỏ thầu cho một click càng cao càngđược liệt kê ở các vị trí cao, do vậy sẽ thu được một lượng khách thăm lớn hơn GoogleAdwords là một chương trình PPC điển hình
Directory
Directory là nghĩa thư mục web, là một trang web có chứa danh sách website,blog Các directory thường được xếp hạng bằng sự phổ biến của chúng và sắp xếp theotừng chủ đề hoặc thể loại Mình nên thêm website của mình vào các thư mục web, nó sẽgiúp tạo ra nhiều lượt truy cập đến website của mình, đặc biệt là khi mình mới bắt đầu
Anchor Text.
Anchor text là phần chữ viết trong một liên kết Việc có một từ khoá trong
“Anchor text” sẽ giúp cho công việc làm SEO thêm hiệu quả vì Google sẽ kết hợp các
từ khoá này với nội dung website của mình Ví dụ nếu mình có một blog viết về các thủthuật máy tính và nếu mình để từ khoá “thủ thuật máy tính” trong “anchor text” Nó sẽgiúp thứ hạng website của mình tăng lên đối với từ khoá này
Spider/Robot
Trang 7Spider là một chương trình của các công cụ tìm kiếm hay còn gọi là “con bọ tìmkiếm”,dùng để thu thập thông tin về các trang web Spider hoạt động dựa trên cácđường liên kết, nếu không có các đường liên kết spider sẽ “Không hoạt động” Spidercòn được gọi là Crawler, Robots…
NoFollow.
NoFollow là một thuộc tính của liên kết được sử dụng nhiều để báo cho Googlebiết để không tiếp tục dò xét website từ liên kết đó Nó có nghĩa là không cho bộ máytìm kiếm tìm kiếm nội dung trên liên kết đó
Meta Description
Meta Description là một mô tả ngắn gọn về một trang website hay bài viết Đó lànơi mình đặt các nội dung liên quan và làm sao để thu hút người click vào website củamình trên trang kết quả tìm kiếm Một đoạn mô tả tốt dài khoảng hai dòng không quá
160 ký tự Nó gần như biển quảng cáo cho website
Meta Keywords
Meta Keywords là gì? Meta Keywords là một yếu tố phổ biến và nổi tiếng nhấttrong lịch sử của các công cụ tìm kiếm, nó được dùng để mô tả nội dung của một trangweb Tuy nhiên, các công cụ tìm kiếm nhanh chóng nhận ra rằng thẻ meta keywords nàythường không chính xác hoặc gây hiểu lầm và thường xuyên dẫn đến các trang web rác
Đó là lý do tại sao thẻ meta keywords không còn được các công cụ tìm kiếm đánh giácao
Keyword Density.
Keyword Density có nghĩa là mật độ từ khoá Mật độ từ khoá của một trang webnào đó được tính rất đơn giản bằng số lần từ khoá được dùng trong một trang chia chotổng số từ trong trang đó Mật độ từ khoá được sử dụng như một nhân tố quan trọngtrong SEO Ngày trước các thuật toán đặt rất nặng vào nhân tố này nhưng ngày naynhân tố này không còn quá quan trọng nữa
Keyword Stuffing.
Trang 8Keyword Stuffing tạm hiểu là nhồi nhét từ khóa Vì “Keyword Density” là mộtnhân tố quan trọng đối với thuật toán tìm kiếm, nhiều webmaster ngày xưa đánh lừa các
bộ máy tìm kiếm nhằm làm tăng mật độ từ khoá bên trong website của họ Ngày nay kỹthuật này không còn mấy tác dụng nữa, mà website của họ có thể bị phạt không đượcxếp hạng
Duplicate Content.
Duplicate Content tạm dịch là nội dung sao chép hay là trùng lặp nội dung.duplicate content được địch nghĩa là một nội dung hoặc một phần nội dung được saochép giống hệt hoặc gần giống từ những website khác
XML Sitemap
XML Sitemap là một tập tin để thông báo danh sách các liên kết trên trang web.XML Sitemap có thể dễ dàng được tạo ra và có rất nhiều công cụ miễn phí để giúp mìnhtạo tập tin này
Robots.txt.
Đây là một file được đặt ở thư mục gốc trong tên miền của mình (root folder) Làtext file mà người quản tri ̣ web ta ̣o ra để hướng dẫn robot (robot của công cu ̣ tìm kiếm)làm thế nào để thu thâ ̣p dữ liê ̣u
2.2.1 Google Webmaster Tools.
Sử dụng Google Webmaster Tools, webmaster có thể tiết kiệm được khá nhiềuthời gian nghiên cứu của mình để tập trung tìm kiếm và chỉnh sửa website thích hợp và
dễ dàng Công cụ này là một trong những công cụ theo dõi và bổ trợ phát triển websitetốt nhất hiện nay để quảng cáo google được rất nhiều webmaster tin dùng
Cài đặt Google Webmaster Tools.
Bước 1: truy câ ̣p đường dẫn sau: http://www.google.com/webmasters/
Trang 9Bước 2: Click nút Sign in Webmaster Tools
Bước 3: Đăng nhâ ̣p Email
Bước 4: Nhâ ̣p domain cần cài Webmaster Tool, sau đó click vào nút ADD A SITE
Bước 5: Verify : download file html được cung cấp ở 1 Trong hình bên dưới
Bước 6: Upload file vừa download lên hosting
Bước 7 : Click nút Verify
Cách sử dụng Google Webmaster Tools
Một gmail có thể quản trị được nhiều website khác nhau, sau khi được đăng nhậpvào Google Webmaster Tools click website mình muốn theo dõi
Trang 10Lỗi Thu thập dữ liệu
Số liệu thống kê thu thập dữ liệu
Trạng thái chỉ mục
Trang 11Phần mềm độc hại
2.2.2 Google analytics
Google Analytics một dịch vụ phân tích, thống kê và theo dõi website được nhiềungười ưa chuộng của Google Google Analytics cung cấp cho chúng ta khá nhiều thôngtin về website như Visit, PageView, Visitor, Traffic Source, Content …
Cài đặt Google Analytics.
Bước 1: truy câ ̣p đường dẫn sau : http://www.google.com/analytics/
Trang 12Bước 2: click vào nút Creat an account
Bước 3: Đăng nhâ ̣p Email
Bước 4: Sau khi đăng nhâ ̣p, ba ̣n sẽ thấy giao diê ̣n như hình bên dưới Click nút Sign up
Bước 5: Cấu hình thông tin về tên tài khoản, website, thời gian…
Bước 6: Kéo xuống dưới, click nút Yes, I agree to the above terms and conditions
Bước 7: Chuyển đến bước tiếp theo : ba ̣n sẽ thấy 1 đoa ̣n code để dán vào website.
Trang 13Bước 8: Lấy đoa ̣n code bên trên dán vào website.
Lưu ý: Dán đoa ̣n code trên vào vi ̣ trí nào xuất hiê ̣n ở mo ̣i trang trên website
Hướng dẫn sử dụng Google Analytics
Các phần cơ bản của Google Analytics bao gồm:
Dashboard
Trang báo cáo các kết quả theo dõi và thống kê rất đơn giản và trực quan Phầntrên là Dashboard hiển thị biểu đồ số lượng khách truy cập từng ngày Ngay bên dưới làmục Site Usage thống kê theo tháng các số liệu: tổng số truy cập (Visits), tổng số trangxem (Pageview), số trang xem trung bình trên một lần truy cập (Pageview/Visit), thờigian trung bình khách truy cập (Avg Time on Site), tỷ lệ phần trăm khách ghé thămwebsite lần đầu (% New Visits)
Những số liệu đáng quan tâm khác cũng đã được sắp xếp để có thể được theo dõi
Trang 14Phần Visitors bao gồm những báo cáo thông tin về khách thăm quan website, vớibáo cáo Visitors Overview mình sẽ có những thông tin như biểu đồ lượng khách thămquan, họ đã tới thăm website của mình bao nhiêu lần, họ đã xem bao nhiêu trang thôngtin, thời gian trung bình họ truy cập website của mình là bao lâu, bao nhiêu người kháchlần đầu tiên ghé thăm website của mình
Những báo cáo này sẽ cung cấp cho mình cả những thông tin sâu hơn như kháchthăm quan sử dụng trình duyệt nào, kết nối Internet của họ là loại nào, ADSL hay Cable,
độ phân giải màn hình bao nhiêu, họ có sử dụng flash hay javascript hay không
Tất cả những số liệu được cung cấp thông qua các báo cáo về Visitors có thểđược sử dụng để sắp xếp, thiết kế lại website của mình sao cho phù hợp nhất đối vớingười dùng Để mỗi khi ghé thăm website của mình, họ sẽ thấy một website được thiết
kế rất vừa mắt và dễ sử dụng, tránh những thông báo lỗi do bất tương thích
Traffic Sources
Với báo cáo thuộc phần Traffic Sources, mình sẽ biết chính xác lượng khách củamình bắt nguồn từ đâu 3 nguồn quan trọng nhất là Direct Traffic, khách thuộc nguồnnày họ vào thẳng website của mình bằng cách gõ địa chỉ trực tiếp vào trình duyệt
Nguồn quan trọng thứ hai là link từ các website khác, mình có thể xem chi tiếthơn là link từ website nào, từ trang nào trên website đó, được bao nhiêu người dùngnhấn vào link đó, vào ngày nào, tháng nào Rất có thể từ đó mình sẽ có thêm một đốitác nữa trong việc phát triển website của mình Nguồn quan trọng thứ 3 và theo đánh giáchủ quan của tôi thì đây là nguồn quan trọng nhất, khách ghé thăm site của mình thôngqua các máy tìm kiếm như Google hay Yahoo
Các máy tìm kiếm luôn là những công cụ đắc lực nhất để thu hút khách mới ghéthăm của mình, nếu mình biết khai thác nó, trong ví dụ tôi nêu ra, 40% lượng khách ghéthăm website là từ các máy tìm kiếm, và 39% trong số 40% đó là từ các kết quả tìmkiếm Google
Trong trường hợp của mình thì có thể khác, nhưng dựa vào những con số này,mình có thể đưa ra những chiến lược đúng đắn nhất để tối ưu nội dung website dành chocác máy tìm kiếm, từ đó thu hút thêm khách thăm quan
Content
Sau tất cả những báo cáo về vấn đề "đối ngoại" thì phần Content sẽ chủ yếu liênquan tới vấn đề "đối nội" Các báo cáo trong phần này sẽ tập trung vào nội dung thôngtin trên website của mình, phần nào được khách ghé thăm nhiều nhất, phần nào làm ngắtluồng thông tin của khách
Trang 15Sâu hơn nữa, một số báo cáo thuộc phần này còn cho mình biết được lượngkhách thăm quan website đang quan tâm tới vấn đề gì dựa trên các từ khóa tìm kiếm họ
đã sử dụng, sau khi tìm thấy thông tin thì họ đã đọc bao nhiêu trang, bao nhiêu lâu trong
số các thông tin tìm được, từ đó mình đánh giá được mức độ hữu ích của các thông tinnày
Một diểm đáng chú ý nữa là nếu một trang thông tin nào đó trở thành exit page(trang cuối cùng khách xem trước khi rời website) quá nhiều thì mình cũng nên xem lạixem trang đó liệu có chứa link tới một nơi khác bổ ích hơn hay không, hay là do nộidung trang đó đề cập tới vấn đề nào gây phản cảm Rất hữu dụng
Goals
Đây là phần ít được dùng nhất, nhưng lại là phần quan trọng nhất đối với một sốngười Ở phần này, chúng ta sẽ có thể tạo lập một số trang "mục tiêu", và GoogleAnalytics sẽ cho chúng ta biết bao nhiêu người, làm cách nào, thông qua những trangnào khác người dùng tới được những trang "mục tiêu" đó
Ví dụ trong trường hợp một site thương mại điện tử, trang mục tiêu sẽ được thiếtlập là trang hiển thị hóa đơn sau khi đã mua hàng chúng ta có thể dựa vào báo cáo này
để biết được những người mua hàng của mình quan tâm tới những gì trước khi muahàng, từ đó tùy biến nội dung những phần thông tin đó để thu hút thêm nhiều khách muahàng, nếu khách dừng lại ở trang quy định vận chuyển hàng hóa chẳng hạn, thì chắcchắn là chúng ta có vấn đề với phương thức vận chuyển của mình
Chúng ta cũng có thể dựa vào những báo cáo ở phần Goals này để tính toán phầntrăm khách thăm quan đạt tới được trang mục tiêu trong tổng số người ghé thămwebsite, từ đó tính toán ra một con số gần đúng tỉ lệ thành công của mỗi khách hàngtiềm năng mình có được thông qua website
Average PageViews:
Tức số trang được xem trung bình trên mỗi lượt truy cập Tỉ lệ này phản ánh sựhấp dẫn của Site đối với người đọc, Average PageViews càng lớn càng chứng tỏ chấtlượng nội dung Website càng cao Ngoài ra, con số này cũng cho thấy việc người đọctìm thấy nhiều thông tin hữu ích và liên quan đến thứ họ cần Nếu website của mình cóchất lượng thì theo thời gian con số này sẽ tăng lên vì mình đạt được số lượng mình đọctrung thành và lượng người đăng kí theo dõi Website (Subscriber) nhất định Ngược lại,nếu con số này quá thấp, mình nên xem lại nội dung website của mình và giao diệnwebsite cũng như nên đặt thêm phần Related Post để người đọc có thể tìm thấy nhữngthông tin hay những bài viết khác liên quan.Vậy Average PageViews như thế nào là phùhợp? Điều này tùy thuộc vào bản chất của website mình