Lý do chọn đề tài: Ngày nay, theo thống kê trên thế giới mỗi năm có gần 3 tỷ người số liệu thống kê năm 2014 sử dụng các dịch vụ internet, trong đó một phần rất lớn người dùng sử
Trang 1KHOA THƯ VIỆN-THÔNG TIN HỌC
ĐỀ TÀI NGHIÊN CỨU KHOA HỌC NGHIÊN CỨU VÀ ỨNG DỤNG SEO (SEARCH ENGINE OPTIMIZATION)
GVHD: ThS Nguyễn Danh Minh Trí
Nhóm SVTH:
1 Trần Huệ Vân – 1356100181
2 Trần Thị Kim Tiến – 1356100159
3 Trương Thị Thái Thảo – 1356100141
4 Nguyễn Thiên Phương – 13561001
5 Võ Thị Hoàng Yến - 1356100191
TP.HCM - 2016
Trang 2MỤC LỤC
PHẦN MỞ ĐẦU 1
1 Lý do chọn đề tài: 1
2 Lịch sử nghiên cứu vấn đề: 2
3 Mục đích và nhiệm vụ của đề tài 3
4 Cơ sở lý luận và phương pháp nghiên cứu 4
5 Phạm vi nghiên cứu của đề tài 4
6 Ý nghĩa khoa học và ý nghĩa thực tiễn của đề tài 4
7 Kết cấu của đề tài 5
PHẦN NỘI DUNG 6
CHƯƠNG 1 BỘ MÁY TÌM KIẾM (SEARCH ENGINE) 6
1.1.Khái quát về bộ máy tìm kiếm: 6
1.1.1 Định nghĩa: 6
1.1.2 Một số bộ máy tìm kiếm thông dụng 7
1.2.Cấu tạo chung của bộ máy tìm kiếm 9
1.2.1 Bộ thu thập thông tin – Spider: 9
1.2.2 Bộ lập chỉ mục – Index: 9
1.2.3 Bộ truy vấn thông tin - Query 10
1.3.Hoạt động của bộ máy tìm kiếm: 11
1.4.Hệ Thống xếp hạng (rank) 13
1.4.1 Alexa rank 13
1.4.2 Google PageRanking 14
Trang 3KẾT LUẬN CHƯƠNG 1 15
CHƯƠNG 2 TỐI ƯU HOÁ WEBSITE TRÊN CÔNG CỤ TÌM KIẾM (Search Engine Optimization – SEO) 16
2.1.Sơ lược về Search Engine Optimization (SEO): 16
2.1.1 Định nghĩa: 16
2.1.2 Các thuật ngữ trong SEO: 17
2.2.Các kỹ thuật SEO: 18
2.2.1 Tối ưu hóa nội dung bài viết: 19
2.2.2 Tối ưu hóa URL: 21
2.2.3 Tối ưu hóa hình ảnh: 22
2.2.4 Tối ưu hóa label: 23
2.2.5 Tối ưu hóa Sitemap: 25
2.2.6 Tối ưu hoá từ khoá: 27
2.2.7 Tối ưu hoá Meta tags: 30
2.2.8 Tối ưu hoá robots.txt: 35
2.2.9 Xây dựng các backlink: 36
KẾT LUẬN CHƯƠNG 2 38
CHƯƠNG 3 KẾT QUẢ NGHIÊN CỨU 39
3.1.Giới thiệu Website: 40
3.2.Kết quả tối ưu website trên công cụ tìm kiếm: 44
KẾT LUẬN CHUNG 47
TÀI LIỆU THAM KHẢO 50
Trang 4PHẦN MỞ ĐẦU
1 Lý do chọn đề tài:
Ngày nay, theo thống kê trên thế giới mỗi năm có gần 3 tỷ người (số liệu thống kê năm 2014) sử dụng các dịch vụ internet, trong đó một phần rất lớn người dùng sử dụng các công cụ tìm kiếm (Search Engine) như Google, Yahoo, Bing… như một kênh gián tiếp để tiếp cận thông tin cần thiết mà không cần mất thời gian tìm kiếm thủ công Việc ra đời của các bộ máy tìm kiếm là bước ngoặc lịch sử quan trọng trong cuộc cách mạng công nghệ thế kỷ hai mươi, rút ngắn khoảng cách tiếp cận giữa con người và khối lượng thông tin khổng lồ trên mạng internet Bộ máy tìm kiếm ngày nay gắn liền mới mọi hoạt động sống của con người, mọi thông tin cần thiết mỗi ngày đều có thể tìm ra bằng các công cụ tìm kiếm, với điều kiện thông tin đó hiện hữu trên mạng internet Có thể nói, các bộ máy tìm kiếm là một trong những thành tựu quan trọng, đóng vai trò to lớn trong
sự phát triển của mạng internet Do đó, nhóm nghiên cứu muốn dành phần đầu trong nội dung đề tài để đề cập một cách sơ lược về bộ máy tìm kiếm như là phần để làm rõ thêm về SEO cũng như các kỹ thuật SEO
Song song đó là việc tối ưu hóa website để thân thiện hơn với công cụ tìm kiếm hay ta còn gọi là SEO một website SEO hiện nay không còn là một khái niệm mới đối với thế giới, nhưng nó chỉ mới quen thuộc với cộng đồng mạng Việt Nam khoảng một thập kỷ trở lại đây SEO thường được áp dụng trong lĩnh vực quảng cáo, marketing, thương mại điện tử và là một phần quan trọng trong chiến lược kinh doanh của bất kỳ công ty hay tập đoàn nào Vì thế, SEO thường
bị bó buộc với các lĩnh vực về kinh tế hay thương mại mà không được nhìn nhận
Trang 5có hiệu quả trong những lĩnh khác Lý do chọn đề tài này là và nghiên cứu về SEO, các kỹ thuật SEO và áp dụng SEO để SEO một website tin tức dành riêng phục vụ cho việc học tập và giải trí cho Sinh viên trường đại học Khoa học Xã hội và Nhân văn Đồng thời đưa website lên top 10 kết quả tìm kiếm với một số
từ khóa cụ thể
2 Lịch sử nghiên cứu vấn đề:
Theo thống kê, hơn 85% lượng truy cập một Website đến từ các công cụ tìm kiếm (Search Engine) lớn như Google, Yahoo, Bing, MSN,… Mỗi ngày, hàng triệu người lướt Web sử dụng Search Engine để tìm những sản phẩm, thông tin, dịch vụ họ cần Vậy làm cách nào để trong hàng tỷ Website đang tồn tại người dùng tìm thấy Website mình muốn khi họ hầu như không đủ kiên nhẫn để di chuyển đến các trang phía sau? Làm sao đưa Website của mình lên những trang đầu khi người dùng truy vấn? Câu trả lời chính là SEO (Search Engine Optimization) - phương pháp giúp Website có vị trí cao trong trang kết quả tìm kiếm
Cụm từ SEO - Tối ưu hóa công cụ tìm kiếm bắt đầu xuất hiện vào năm
1997 Từ đó, trên thế giới, SEO đã phát triển một nghề cụ thể và được ứng dụng phổ biến vào lĩnh vực kinh doanh và bán hàng trực tuyến trên mạng internet Tất
cả các công ty và các tập đoàn lớn trên thế giới đều sử dụng SEO cũng như có một đội ngũ SEO chuyên biệt được coi như một bộ phận quan trọng trong việc marketing trực tuyến
Nghề SEO xuất hiện ở Việt Nam từ 1999 đến 2003 nhưng chỉ thực sự trở nên phổ biến vào năm 2010 Do sự phát triển của công nghệ, SEO ở Việt Nam đi
Trang 6chậm hơn so với thế giới khoảng 3-5 năm Theo thống kê của hiệp hội SEO Việt Nam, tính tới năm 2012 có khoảng 20.000 người làm SEO, 5.000 doanh nghiệp sử dụng SEO và khoảng 3.000 doanh nghiệp làm dịch vụ SEO Ở những nước phát triển trên thế giới, SEO trong kinh doanh chỉ chiếm một phần, phần khác là những lĩnh vực như khoa học, giáo dục, giải trí, v.v Mặt khác, SEO ở Việt Nam hầu hết chỉ được ứng dụng trong lĩnh vực kinh doanh, nhưng lại chưa thực
sự phổ biến trong việc tìm kiếm những thông tin khác, điều nay vô tình tạo nên một định kiến về SEO rằng: SEO chỉ là một hình thức quảng cáo trên các công
cụ tìm kiếm
Do đó, việc nghiên cứu và phát triển SEO trong những lĩnh vực tìm kiếm thông tin cần được quan tâm, chú trọng hơn ở Việt Nam
3 Mục đích và nhiệm vụ của đề tài
Mục đích nghiên cứu của đề tài là thông qua việc nghiên cứu bộ máy tìm kiếm, SEO và các phương pháp để tiến hành SEO một Website Từ đó, đưa Website lên các trang đầu với những từ khoá cụ thể
Nhiệm vụ: Để đạt được mục đích trên, đề tài nghiên cứu “Nghiên cứu và ứng dụng SEO (Search Engine Optimization)” thực hiện các nhiệm vụ sau:
- Tìm hiểu cấu tạo của bộ máy tìm kiếm
- Đi sâu và tìm hiểu kĩ hơn về cách lập chỉ mục trong cơ sở dữ liệu, các
chiến lược tìm kiếm, hệ thống xếp hạng, đánh giá thông tin người dùng
- Xây dựng một Website và SEO Website lên công cụ tìm kiếm Google
Trang 74 Cơ sở lý luận và phương pháp nghiên cứu
Để đạt được mục đích và nhiệm vụ trên một cách khoa học, nhóm đề tài sử dụng tổng hợp các phương pháp nghiên cứu cụ thể sau:
- Phương pháp lý thuyết: phương pháp phân tích và tổng hợp lý thuyết
- Phương pháp thực tiễn: phương pháp thực nghiệm khoa học
5 Phạm vi nghiên cứu của đề tài
SEO và các mảng đề tài liên quan đến nó đều đã được nghiên cứu ở nhiều nơi trên thế giới, trong đó có Việt Nam Vậy nên đề tài sẽ lấy nghiên cứu và ứng dụng SEO (Search Engine Optimization) với không gian nghiên cứu là Việt Nam Đặc biệt là dùng website do chính nhóm xây dựng để tối ưu lên công cụ tìm kiếm làm minh chứng cũng như kết quả của việc áp dụng các kỹ thuật SEO được nêu trong bài viết của nhóm
6 Ý nghĩa khoa học và ý nghĩa thực tiễn của đề tài
Đề tài khoa học này được ứng dụng cho web, với đối tượng sử dụng là sinh viên của trường Khoa học Xã hội và Nhân Văn TP.HCM nói chung và sinh viên khoa Thư viện - Thông tin học nói riêng, giúp sinh viên hiểu như thế nào là SEO một website trên công cụ tìm kiếm, nâng cao khả năng tìm tin của bản thân Bên cạnh đó, khi sinh viên khoa Thư viện – Thông tin đọc đề tài nghiên cứu khoa học này sẽ tìm ra hướng đi cho việc áp dụng SEO vào công việc thực tế sau
Trang 8khi ra trường, giúp họ có khả năng, nền tảng để tự SEO được website thư viện điện tử của thư viện mình lên top của các công cụ tìm kiếm phổ biến hiện nay như Google, Yahoo hay Bing Và hơn hết là giúp người dùng tin dễ dàng tiếp cận gần hơn với nguồn tài nguyên thông tin của thư viện
Mặt khác, đề tài này còn nhằm phá vỡ những định kiến về SEO Bởi lẽ, SEO không chỉ dừng lại ở chỗ là một hình thức quảng cáo trực tuyến chỉ dùng trong kinh doanh mà đó còn là một phương pháp giúp tìm tin một cách hiệu quả, chính xác nhất nhưng không làm mất nhiều thời gian
Ngoài ra, sinh viên khoa sau khi ra trường nếu làm việc trong bộ phận thông tin của các công ty, doanh nghiệp cũng có thể tự SEO được website của doanh nghiệp mình mà không cần đến các dịch vụ SEO bên ngoài, nâng cao năng lực nghề nghiệp và cơ hội thăng tiến trong tương lai nghĩa khoa học: Tính thẩm
mỹ là một trong những đặc trưng văn hóa rất quan trọng đối với dân tộc Nhật Bản Do đó, đề tài của bài nghiên cứu sẽ giúp tìm hiểu được phần nào về tính cách dân tộc cũng như văn hóa Trà đạo của đất nước này Đồng thời mang tính cập nhật, bổ sung thêm về mặt kiến thức, giới thiệu và tìm hiểu về khái niệm cảm thức thẩm mỹ, cách nhìn nhận về cảm thức thẩm mỹ wabi và sabi trong văn hóa Nhật Bản
7 Kết cấu của đề tài
Với mục đích và nhiệm vụ trên, ngoài phần mở đầu; phần kết luận và phần danh mục tài liệu tham khảo thì đề tài được kết cấu thành ba chương, tám tiết và mười tám tiểu tiết
Trang 9PHẦN NỘI DUNG
CHƯƠNG 1
BỘ MÁY TÌM KIẾM (SEARCH ENGINE)
1.1 Khái quát về bộ máy tìm kiếm:
sự thay đổi của ngành dịch vụ SEO
Bộ máy tìm kiếm - Search Engine (tên đầy đủ là Web Search Engine) là
công cụ được xây dựng trên nền tảng web cho phép người sử dụng tìm kiếm thông tin trên mạng World Wide Web Khi người dùng sử dụng công cụ tìm kiếm, họ sẽ cần phải nhập một từ khóa tìm kiếm (keyword) của chủ đề cần tìm hiểu thông tin để có thể nhận về một bảng kết quả tìm kiếm các website, hình ảnh video, địa chỉ bản đồ (đối với tên địa danh) hoặc các loại files tài liệu,… có liên quan đến chủ đề tìm kiếm đó
Các kết quả trả về này sẽ được sắp xếp theo một thứ tự nhất định bằng các thuật toán tìm kiếm của Search Engine, và tùy vào mỗi Search Engine mà chúng
ta tại có một thuật toán tìm kiếm khác nhau Do không hề được can thiệp bởi con người, nên các kết quả trả về này còn được gọi là kết quả tìm kiếm tự nhiên (Organic Search Traffic)
Trang 10Bộ máy tìm kiếm được tạo thành bởi ba bộ phận là: bộ phận thu thập dữ liệu – Spider , bộ phận lập chỉ mục – Index, bộ phận đảm nhận truy vấn và xếp hạng website – Query
1.1.2 Một số bộ máy tìm kiếm thông dụng
Hiện nay, Search Engine là một mảng thị phần cạnh tranh rất gay gắt trên toàn cầu, với ngôi đầu bảng tạm thời rơi vào tay Google Search, với thị phần người dùng trung bình trên toàn cầu rơi vào khoảng trên 70% Cụ thể:
Hình 1.1: Thị phần tìm kiếm trên toàn cầu của Search Engine năm 2014
Ảnh: dautuseo.com
Tuy nhiên, tại Nga và một số các quốc gia Đông Á, Google lại để mất vị thế dẫn đầu của mình vào tay các đối thủ khác Cụ thể, Yandex là công cụ tìm kiếm
Trang 11được sử dụng nhiều nhất tại Nga với 61,9% thị phần tìm kiếm Tại Trung Quốc, Baidu là công cụ tìm kiếm phổ biến nhất, Naver tại Hàn Quốc, Yahoo! Japan tại Nhật Bản và Yahoo! Taiwan tại Đài Loan [2]
Việt Nam là một trường hợp khá đặc biệt khác Tại Việt Nam, Cốc Cốc là công cụ tìm kiếm có lượng người truy cập hàng tháng và hàng ngày nhiều nhất Tuy nhiên, các kết quả tìm kiếm trả về trên công cụ tìm kiếm này phần lớn được thực hiện bởi Google Search Vì vậy, trên lý thuyết, Google Search sẽ là công cụ tìm kiếm được sử dụng nhiều nhất tại Việt Nam hiện nay
Sự khác nhau giữa các công cụ tìm kiếm
Mặc dù nguyên tắc hoạt động cơ bản của tất cả các công cụ tìm kiếm là như nhau, sự khác biệt nhỏ giữa chúng dẫn đến những thay đổi lớn trong các kết quả liên quan Đối với các công cụ tìm kiếm khác nhau, các yếu tố khác nhau rất quan trọng Có những lúc, khi các chuyên gia SEO nói đùa rằng các thuật toán của Bing được cố ý làm chỉ với mục đích đối nghịch với những người của Google
Có rất nhiều ví dụ về sự khác biệt giữa các công cụ tìm kiếm Ví dụ, đối với Yahoo! và Bing, các yếu tố từ khóa trên trang quan trọng hàng đầu, trong khi đó đối với Google thì các liên kết và nội dung lại rất quan trọng [3] Ngoài ra có một
sự khác biệt rất lớn giữa các công cụ tìm kiếm đó là về khả năng lập chỉ mục (các
từ khoá), đối với Yahoo! hoặc Bing bạn sẽ cần rất nhiều thời gian để một website được lập chỉ mục trong kết quả tìm kiếm, tuy nhiên đối với Google bạn chỉ cần vài tiếng Điều này chứng tỏ khả năng lập chỉ mục của Google nhanh hơn rất nhiều lần so với Yahoo! và các công cụ khác
Trang 121.2 Cấu tạo chung của bộ máy tìm kiếm
Bộ máy tìm kiếm thường được cấu tạo bởi 3 bộ phận: bộ thu thập thông tin,
bộ lập chỉ mục và bộ truy vấn thông tin
1.2.1 Bộ thu thập thông tin – Spider:
Mỗi bộ máy tìm kiếm có một spider với tên gọi riêng, của Google là Googlebot, của Bing là Bingbot, của Baidu là Baiduspider…
Một cách đơn giản bạn có thể hiểu rằng đây là một quá trình mà spider sẽ đi
từ trang này sang trang khác để khám phá nội dung và các liên kết trong website của bạn Chính vì thế, spider có thể coi là một chương trình thu thập dữ liệu và phát hiện ra các website mới, thay đổi các website hiện có và truy tìm các liên kết không tồn tại, các dữ liệu này được sử dụng để cập nhật cho các chỉ mục của
nó
Tuy Spider được lập trình là một bộ phận thông minh nhưng nội dung và cấu trúc phức tạp của website (không phân biệt được nội dung quảng cáo, nội dung phụ so với nội dung chính), các đoạn nhúng Javascript, AJAX, Flash hay các tập tin đa phương tiện như image, video,… cũng sẽ gây ra khó khăn trong việc tìm kiếm và rút trích thông tin của Spider Muốn khắc phục được điều này cũng như giúp cho việc SEO website hiệu quả, chúng ta có thể viết theo đúng chuẩn Html5, sử dụng các phương pháp tăng ngữ nghĩa cho nội dung web, đối với nội dung đa phương tiện bằng các kỹ thuật: mô tả, chú thích, đính kèm,…
1.2.2 Bộ lập chỉ mục – Index:
Hệ thống lập chỉ mục hay còn gọi là hệ thống phân tích và xử lý dữ liệu, thực hiện việc phân tích, trích chọn những thông tin cần thiết (thường là các từ đơn, từ ghép, cụm từ quan trọng), loại bỏ những stopword (các từ quá thông
Trang 13dụng như mạo từ a, an, the,…) từ những dữ liệu mà spider thu thập được và tổ chức thành cơ sở dữ liệu riêng để có thể tìm kiếm trên đó một cách nhanh chóng, hiệu quả Hệ thống chỉ mục là danh sách các từ khoá, chỉ rõ các từ khoá nào xuất hiện ở trang nào, địa chỉ nào
Giống như chỉ mục ở phía sau của một cuốn sách, Google lập chỉ mục cũng bao gồm thông tin về các từ và vị trí của chúng Khi bạn tìm kiếm, ở mức cơ bản nhất, các thuật toán của chúng tôi sẽ tra cứu những cụm từ tìm kiếm của bạn trong chỉ mục để tìm các trang phù hợp.[4]
1.2.3 Bộ truy vấn thông tin - Query
Là những gì người dùng nhìn thấy hay còn gọi là giao diện khi sử dụng bộ máy tìm kiếm Nó bao gồm ô để gõ từ khóa và ra lệnh tìm kiếm Bộ máy tìm kiếm sẽ đưa ra những website phù hợp, liên quan đến từ khóa của bạn Tuy vậy, thực chất thì bộ phận chịu trách nhiệm truy vấn query không trực tiếp tìm kiếm các website, nó chỉ lấy ra các dữ liệu đã được bộ phận lập chỉ mục index lưu trữ, đánh giá và sắp xếp
Các bộ phận này hoạt động liên tục từ lúc khởi động hệ thống, chúng phụ thuộc lẫn nhau về mặt dữ liệu nhưng độc lập với nhau về mặt hoạt động Bộ máy tìm kiếm tương tác với người dùng thông qua giao diện web, có nhiệm vụ tiếp nhận và trả về những tài liệu thoả yêu cầu của người dùng
Trang 141.3 Hoạt động của bộ máy tìm kiếm:
Hình 1.2: Sơ đồ hoạt động của Search Engine
Ảnh: www.seotongthe.vn
Có 3 loại công cụ tìm kiếm cơ bản: chương trình máy tính tự động – robot (được biết đến dưới tên gọi khác nhau crawler, spider) – bộ thu thập thông tin; các thư mục do con người quản lý và cập nhật; kết hợp cả tìm kiếm tự động và các thư mục do con người quản lý
Các công cụ tìm kiếm dựa trên chương trình tự động
Các công cụ tìm kiếm dựa trên chương trình tự động, tức là các công việc được tự động hoá theo một quy trình đã được lập trình sẵn mà không có sự can thiệp của con người Đầu tiên bộ máy tìm kiếm, tiêu biểu là Google sẽ tạo danh sách tất cả các chủ đề, ví dụ như du lịch, ẩm thực, vật lý…, sau đó các bộ thu thập thông tin đưa các spider đã được lập trình tự động dò quét các website, đi
Trang 15theo các liên kết nội bộ, xem xét nội dung Tiếp theo bộ lập chỉ mục sẽ đánh chỉ mục cho từng website và lưu vào trong danh sách có sẵn theo chủ đề Giờ đây bản lưu của tất cả website bọ tìm kiếm quét được đã có sẵn trong cơ sở dữ liệu của Google Khi người dùng tìm kiếm, bộ truy vấn thông tin sẽ tìm kiếm trong
cơ sở dữ liệu, chứ không phải tìm kiếm trong toàn bộ thế giới Internet nên chỉ mất một khoảng thời gian cực ngắn Ngoài ra các spider tìm kiếm cũng được lập trình dò quét theo chu kỳ, thường là 1-2 tháng để cập nhật lại sự thay đổi trên các website Tất cả các công đoạn đều hoàn toàn không có sự can thiệp của con người cho nên có thể nói các công cụ tìm kiếm dựa trên chương trình tự động
Các thư mục do con người quản lý
Các thư mục do người quản lý, ví dụ Open Directory (Dự án Thư mục mở - Dmoz1 - sẽ phụ thuộc vào sự quản lý của con người Bạn đăng ký một website vào thư mục với vài dòng mô tả ngắn gọn hay biên tập viên có thể viết phần mô
tả các website Điều này có nghĩa, việc tìm kiếm chỉ phù hợp với những nội dung
mô tả đã được đăng ký
Việc thay đổi những website của bạn không có ảnh hưởng đến danh mục của bạn Những cách thức để cải thiện danh mục với công cụ tìm kiếm sẽ chẳng liên quan đến cách thức cải thiện vị trí cho một thư mục Ngoại lệ duy nhất là
1
Dmoz: là thư mục quan trọng nhất trên Internet, các website được đăng ký miễn phí tại đây
sẽ được chỉnh sửa kỹ càng và đưa vào một danh mục đặc thù tại đây Chỉ có những website có chất lượng và đăng ký nghiêm túc mới được đưa vào danh bạ của Dmoz Dmoz là con đường duy nhất để có mặt trong danh bạ của Google Dmoz là danh bạ trực tuyến – danh bạ Internet,
nó bắt buộc phải đăng ký vào thư mục thích hợp và sẽ được xem xét bởi biên tập viên tình nguyện Còn những Search Engine khác đều sử dụng phương thức đăng ký website tự động.[5]
Trang 16một website tốt với nội dung tốt sẽ có khuynh hướng được đánh giá cao hơn là một website có nội dung sơ sài
Kết hợp 2 dạng trên
Hiện nay, việc kết hợp 2 dạng tìm kiếm dựa trên chương trình tự động và các thư mục do con người quản lý đã trở nên cực kỳ phổ biến Sau này nhiều công cụ tìm kiếm hỗ trợ người dùng qua nhiều cách thức khác nhau, nên người ta khó thấy ranh giới phân chia của các công cụ tìm kiếm, thay vào đó là các hệ thống công cụ tìm kiếm gồm nhiều kiểu chức năng khác nhau.Ví dụ, MSN Search, Yahoo! và Yahoo! Directory, Google và Google Directory…
Các số liệu thống kê của Alexa dựa trên những dữ liệu thu thập được từ người dùng cài đặt
2
Page View: là số lượt người dùng truy cập vào website đó, hoặc reload website đó qua một
địa chỉ URL của website
3Reach: là số lượng người dùng đã truy cập vào website, dựa theo Cookies trình duyệt và địa
chỉ IP của người dùng
Trang 17Alexa Toolbar: Cứ 3 tháng 1 lần, Alexa tiến hành tổng kết số liệu và xếp hạng các website Alexa Toolbar là một tiện ích giúp người dùng lướt web, (hiện
có khoảng hơn 10 triệu người dùng Internet trên thế giới sử dụng công cụ này) Chỉ số Alexa rank là thước đo ghi nhận thành quả lao động của các webmaster với cộng đồng và là một công cụ rất hữu ích giúp các webmaster quản trị website hiệu quả
1.4.2 Google PageRanking
Hiện nay Google PageRank được xem là chỉ số đáng tin cậy nhất đánh giá giá trị của mỗi websitesite Chỉ số Google PageRank cao sẽ đem lại ấn tượng đáng tin cậy cho khách truy cập vào một websitesite, điều này đặc biệt có ý nghĩa với các website kinh doanh thương mại điện tử Google PageRank hiện là chỉ số đáng tin cậy nhất chỉ giá trị của một websitesite, không chỉ bởi những thuật toán xuất sắc dựa trên hơn 100 chỉ số mà còn vì Google đánh giá và xếp hạng các website bằng cả hai phương pháp tự động và thủ công Một vài chỉ số quan trọng quyết định Google PageRank của một website: độ hữu dụng của thông tin trên website, độ phổ biến của website, chất lượng kỹ thuật…Google PageRank được chia làm 10 bậc và được biểu hiện bằng vạch màu xanh trên nền trắng: Google PageRank image Giá trị của mỗi website theo Google PageRank tăng dần từ 1 đến 10
Thuật ngữ PageRank™ là một thương hiệu được bảo hộ của Google, do Larry Page và Sergey Brin phát triển tại trường đại học Stanford của Mỹ trong một dự án nghiên cứu về công cụ tìm kiếm năm 1995
Google PageRank ảnh hưởng trực tiếp tới vị trí hiển thị của mỗi website, khi cạnh tranh thứ hạng hiển thị trong danh sách kết quả tìm kiếm của Google Nếu muốn website tăng thứ hạng trong danh sách kết quả tìm kiếm của Google,
Trang 18nên nâng cao Google PageRank cho các website trong website Google PageRank là một công cụ hỗ trợ các webmaster quản trị website Đồng thời, một website có Google PageRank cao phần nào chứng minh năng lực quản trị tốt của webmaster website đó
KẾT LUẬN CHƯƠNG 1
Song song với sự phát triển của công nghệ thông tin, Search Engine cũng ngày càng phát triển, không ngừng đổi mới và trở thành ứng dụng được nhiều người sử dụng nhất, trở thành một phần không thể thiếu của cuộc sống Ở mỗi quốc gia có mỗi một Search Engine phổ biến khác nhau; và tuỳ theo mỗi Search Engine lại trả về cho người sử dụng những kết quả khác nhau Riêng ở Việt Nam thì Google Search vẫn là công cụ tìm kiếm được sử dụng nhiều nhất Dựa vào cấu tạo và hoạt động của Search Engine mà người dùng có thể tìm kiếm thông tin một cách dễ dàng và nhanh chóng Bên cạnh đó, nhờ vào hệ thống xếp hạng, các webmaster có thể đưa website của mình lên thứ hạng cao và được nhiều người biết đến hơn Trong đó, đặc biệt phải kể đến Google Pagerank – chỉ số ảnh hưởng đến vị trí của các website và cũng chứng minh được năng lực của webmaster đó
Trang 19CHƯƠNG 2
TỐI ƯU HOÁ WEBSITE TRÊN CÔNG CỤ TÌM KIẾM
(Search Engine Optimization – SEO)
2.1 Sơ lược về Search Engine Optimization (SEO):
2.1.1 Định nghĩa:
Khi đề cập đến SEO, có rất nhiều định nghĩa về nó Chẳng hạn như: định nghĩa về SEO của iNET “SEO (Search Engine Optimization) là tập hợp những phương pháp tối ưu hóa để website trở lên thân thiện với máy chủ tìm kiếm (Search Engine) từ đó nâng cao thứ hạng website khi người dùng tìm kiếm với các từ khóa liên quan” Hay định nghĩa về SEO của WIKI “Tối ưu hóa công cụ tìm kiếm (SEO - Search Engine Optimization) là một quá trình tối ưu nội dung văn bản và cấu trúc website để các công cụ tìm kiếm chọn lựa website phù hợp nhất phục vụ người tìm kiếm trên Internet Có thể hiểu đơn giản SEO là một tập hợp các phương pháp nhằm đưa website lên vị trí TOP 10 (trang đầu) trong các trang kết quả của các Search Engine”
Sau thời gian tìm hiểu cũng như tham khảo và dựa trên những định nghĩa có sẵn về SEO thì nhóm nghiên cứu đề tài đưa ra định nghĩa sau: SEO (Search Engine Optimization – Tối ưu hóa công cụ tìm kiếm): là quá trình bao gồm các phương pháp tối ưu hóa website với mục đích nâng cao thứ hạng của website đó trên các trang kết quả của các công cụ tìm kiếm khi người dùng tìm kiếm với các
từ khóa liên quan
Trang 202.1.2 Các thuật ngữ trong SEO:
Dưới đây trình bày các thuật ngữ phổ biến trong SEO:
SERP: Search Engine Results Page – trang kết quả tìm kiếm [1, 236]
Anchor text: là phần nhìn thấy của liên kết tới một website hoặc một file
trên mạng [1, 236]
Sitemap: sơ đồ website – liệt kê các nội dung trên website theo cấu trúc
Có hai định dạng: XML cho Google và HTML cho người dùng [1, 236]
Crawler (tên gọi khác: Robot, Spider):là một phần mềm có khả năng tự
động tìm và đọc nội dung các tài nguyên trên mạng [1, 236]
nghiêm trọng, thường là do thực hiện các kỹ thuật SEO mũ đen [1, 236]
Blackhat SEO (SEO mũ đen):là tập hợp những phương pháp SEO giúp
tăng thứ hạng của website bằng việc tập trung vào cơ chế của bộ máy tìm kiếm
mà không mang lại giá trị gì cho người dùng cuối.[6]
Keyword: từ khóa - là từ hoặc cụm từ được dùng để tìm kiếm [1, 236]
Từ khóa chính: là từ khóa quan trọng nhất, là chủ đề chính của trang
Mỗi trang chỉ nên SEO với một và chỉ một từ khóa chính [1, 236]
Từ khóa phụ: là những từ khóa dài và chứa từ khóa chính Mỗi website
chỉ có một từ khóa chính, nhưng có thể có nhiều từ khóa phụ [1, 236]
HTML: Hyper Text Markup Language – là ngôn ngữ dùng để định dạng
nội dung website Google phân tích cú pháp HTML của một website để trích lọc
Trang 21thông tin nội dung chính của website đó và sau đó dùng nó để xếp hạng website [1, 236]
SEO Onpage: công việc tối ưu các yếu tố bên trong một website SEO
Onsite: tối ưu các yếu tố trên toàn bộ website [1, 236]
SEO Offpage: bao gồm công việc xây dựng liên kết và tăng lượng
khách truy cập vào website, từ đó làm tăng độ uy tín và thứ hạng website [1, 236]
Inbound link: liên kết trỏ về (VÀO) website của bạn, từ những website
khác [1, 236]
Outbound link: liên kết đi ra khỏi website của bạn, đến những website
khác [1, 236]
Backlinks – Link Back – Link Popularity: Liên kết ngược, độ phổ biến
của liên kết Các thông số này đánh giá mức độ phổ biến của liên kết đến website của bạn, bạn có càng nhiều liên kết từ những trang khác đến website của bạn, các công cụ càng đánh giá cao website của bạn [1, 237]
website bạn, số lượng page views, số Kilobyte tải về [7]
2.2 Các kỹ thuật SEO:
Để tối ưu được một Website trên công cụ tìm kiếm thành công, chúng ta cần phải áp dụng một hoặc nhiều kỹ thuật SEO khác nhau Sau đây, nhóm nghiên cứu đề tài xin giới thiệu một số kỹ thuật SEO thông dụng và đã được nhóm áp dụng trên Website do nhóm xây dựng:
Trang 222.2.1 Tối ưu hóa nội dung bài viết:
Bài viết là yếu tố chính để đánh giá chất lượng của website Một bài viết tốt
là bài viết đáp ứng được nhu cầu thông tin của người dùng, lợi ích nó đem lại chính là độ tin cậy của người dùng và đó yếu tố chính quyết định thành công trong chiến lược SEO của các công ty/tập đoàn Website có được độ tin cậy cao sẽ thu hút được nhiều lượt truy cập và có traffic tập trung hơn là những website
có độ tin cậy thấp Bên cạnh đó, một bài viết tốt cũng là một bài viết thân thiện với bộ máy tìm kiếm
Bài viết tốt phải chuẩn SEO từ hình thức cho đến nội dung
Về phần hình thức, thứ nhất lời văn không nên quá cầu kỳ và hoa mỹ, câu chữ càng chân thành, mộc mạc càng dễ đi sâu vào lòng người Thứ hai, nên ngắn gọn cả trong cách trình bày, càng ngắn gọn, xúc tích càng tốt, tránh viết lan man, dài dòng Nhưng cũng đừng vì quá tập trung vào các tiêu chuẩn mà làm bài viết trở nên khô khan, buồn chán, cần phải thêm yếu tố thuyết phục, thân thiện và đem lại hứng thú cho người đọc để họ có thể quay lại website của chúng ta Thứ
ba, phải có lời mở đầu điều hướng, có nghĩa là nội dung bài viết phải có phần mô
tả để dẫn dắt người dùng Do đó chúng ta nên bắt đầu với những lợi ích thuyết phục nhất cũng như mục đích mà bài viết đang hướng đến Tránh kêu gọi hành động như like, share hay giật tít ngay đầu bài viết, điều này sẽ khiến cho người dùng không vui khi chưa nhận được giá trị gì mà họ quan tâm và họ sẽ rời khỏi bài viết của chúng ta Một bài viết có chất lượng đối với Google là khi bài viết đó được nhiều người dùng đọc và quay lại website của chúng ta
Về phần nội dung, trước khi bắt tay vào viết thì bạn cần phải nắm rõ mình sẽ viết cái gì, sử dụng các công cụ phân tích từ khóa để xem xem từ khóa nào tốt
Trang 23nhất để đưa vào bài viết, sau đó mới nghĩ đến viết như thế nào Nội dung bài viết cần có cấu trúc rõ ràng, vừa có sự nhất quán, vừa phải tuân thủ các tiêu chuẩn về nội dung Chúng ta nên tập trung vào nhu cầu của những khách hàng thường xuyên ghé thăm website và những triển vọng của nó trong tương lai Ngoài ra còn là nhất quán trong cách chọn font chữ, màu chữ Ngoài ra, google còn đánh giá chất lượng của một webpage bằng thời gian từ khi người dùng truy cập vào bài viết đến khi họ nhấn back và thoát ra ngoài, nếu như khoảng thời gian này dài chứng tỏ rằng bài viết đáp ứng được nhu cầu tin của người dùng Bên cạnh đó, cũng nên sử dụng công cụ Google Trends để nắm bắt những chủ đề, xu hướng đang hot trong cộng đồng mạng Những bài viết có chủ đề được nhiều người quan tâm, bình luận sẽ tạo nên những Traffic tuyệt vời cho website của bạn, từ
đó nâng cao thứ hạng trên bảng kết quả tìm kiếm
Đối với từ khóa:
• Trong tiêu đề bài viết phải chứa từ khóa mà mọi người thường sử dụng để tìm kiếm và tỉ lệ từ khóa này phải phù hợp với các từ khóa phần nội dung
• Tuyệt đối tránh việc lạm dụng từ khóa quá nhiều, tức là từ khóa xuất hiện với tần suất quá dày đặc trong bài viết
• Nên tạo các Archor Text với đường link dẫn tới các bài viết liên quan đến nội dung đề cập trong bài viết Các Archor text được khuyến khích là các từ khóa Trùng lặp nội dung là lỗi mà các website thường hay gặp phải, nó xảy ra khi hai website khác nhau có nội dung giống nhau Tuy cơ chế tìm kiếm của Google không quy định hình phạt với các trang có nội dung trùng lặp nhưng đối với những website trùng lặp nội dung có chủ đích, tức là số lượng bài trùng lắp quá nhiều với những trang khác Hậu quả là bộ máy tìm kiếm phải phân vân và lựa
Trang 24chọn xem trang nào phù hợp nhất trong số hàng tá website có nội dung giống nhau Cho nên tốt nhất là nên hạn chế việc sao chép bài viết ở những trang khác
mà không hề sửa chữa, điều đó hoàn toàn không tốt cho website của bạn trên bảng xếp hạng tìm kiếm
2.2.2 Tối ưu hóa URL:
Địa chỉ URL là một trong những thành phần của website mà Google dùng
để đánh giá thứ hạng website Khi tối ưu URL thì tỉ lệ người dùng nhớ và gõ lại URL đó nếu họ muốn quay lại website sẽ nhiều hơn Với mỗi URL nên đưa một
từ khóa chính vào, các từ nên phân cách bởi dấu gạch ngang, khi thay đổi một địa chỉ đã có nhớ sử dụng redirect 301 từ trang cũ sang trang mới để thông báo cho máy tìm kiếm hay trình duyệt, máy chủ rằng website hiện tại đã được chuyển rời tới địa chỉ mới Vì trước đó Google đã đánh chỉ mục (index) toàn bộ các trang trên website của bạn, URL của một hay nhiều trang đó thay đổi sẽ dẫn tới việc các kết quả tìm kiếm link đến trang đó sẽ mất tác dụng Và chỉ nên sử dụng một URL duy nhất cho một tên miền và việc sử dụng URL tĩnh là điều cần ưu tiên vì khi sử dụng URL động sẽ làm cho bộ máy tìm kiếm gặp khó khăn khi đọc
và hiểu URL đang mô tả cái gì Địa chỉ URL không nên quá dài, vượt quá 55 ký
tự và có quá nhiều từ khóa Địa chỉ URL được gọi là tối ưu khi URL ngắn và có tính mô tả rõ ràng
URL đã được tối ưu: phap-hoc-dai-hoc-hieu-qua.html
Trang 25http://newshcmussh.blogspot.com/2016/02/phuong-Hình 2.1: Liên kết cố định trong Blogspot
Ảnh: blogspot.com
Không nên để các ký tự như "?", "#", "=", "@", "%","%", "$" trong URL của mình vì khi có những ký hiệu này thì URL đó chính là những URL động, URL động này sẽ gây khó khăn cho công cụ tìm kiếm (Search Engine - SE) đồng thời giảm index Tùy thuộc vào chiến lược SEO mà chúng ta tính toán khi đưa từ khóa vào và cách phân bổ sao cho thích hợp Từ khóa chính nên nằm ngay đầu URL
Ví dụ URL động:
http://www.newshcmussh.blogspot.com/?category=media%title
2.2.3 Tối ưu hóa hình ảnh:
Hình ảnh là một phần không thể thiếu trong một bài viết, bài viết có hình ảnh minh họa sẽ thu hút người đọc hơn là những bài viết chỉ có câu chữ khô cứng Khi chèn hình ảnh vào bài viết, chúng ta phải luôn sử dụng thẻ mô tả hình ảnh ALT cho bất kỳ hình ảnh nào trong website Tên hình ảnh, thẻ title của hình
Trang 26ảnh, URL chứa hình ảnh và thẻ head của bài viết phải chứa từ khóa mô tả nội dung hình ảnh(từ khóa mà khách hàng sẽ dùng để tìm kiếm hình ảnh của chúng ta) Nên chọn những định dạng ảnh như *.jpg hoặc *.png để nâng cao tốc độ tải đồng thời kích thước và dung lượng của hình ảnh nên ở mức độ trung bình dưới 100KB Ngoài ra phải đảm bảo những đoạn text mô tả xung quanh hình ảnh có liên quan đến nội dung hình ảnh, đường dẫn tới hình ảnh phải thật đơn giản và ngắn gọn và cả hai đều phải chứa từ khóa Một điều nữa chúng ta cần phải lưu ý
là khi chèn hình ảnh vào bài, để người dùng trỏ link vào hình ảnh hoặc văn bản
để link đi thì ta phải thêm thẻ <a> kẹp hình </a> [8] và rel="nofollow" : báo cho
bộ máy tìm kiếm biết rằng website đang trỏ liên kết đi không ủng hộ cho website đích và mối liên kết được tạo ra cũng không phải do mối quan hệ công việc giữa các website với nhau mà liên kết đó chỉ mang ý nghĩa với người dùng Và khi muốn chèn một hình ảnh vào website hãy upload hình ảnh đó lên hosting rồi hãy chèn vào bài viết [9]
2.2.4 Tối ưu hóa label:
Khái niệm lable/categories trong Blogspot hoặc tags trong Wordpress là những khái niệm quen thuộc với những người làm web đi lên từ nền tảng blog Ở đây, vì sử dụng website tạo từ Blogspot như kết quả nghiên cứu của đề tài nên nhóm đề tài xin phép chỉ đề cập đến label / categories trong Blogspot Label hay
là các nhãn dưới hình thức các Archor text có tác dụng xâu chuỗi các bài viết có chung một chủ đề (lĩnh vực) có liên quan với nhau Còn Categories là một chủ đề của website, nằm trên sơ đồ website, nơi chứa những bài viết thuộc chủ đề đó giúp phân loại các bài viết vào các mục riêng biệt [10] Cụ thể hơn, tác dụng của
Trang 27nó nhằm giúp cho người đọc có thể tìm thấy những bài viết khác có cùng chủ đề, liên quan đến bài viết họ đang đọc [11] Label giống như những từ khóa với liên kết nội, tạo cho ta thêm nhiều mạng nhện trong website [8] Bên cạnh đó, một bài viết có nhiều từ khóa thì tương đương cũng cũng có nhiều label tùy theo các số lượng từ khóa có đề cập tới trong bài viết, do đó với những người sử dụng blogspot thì label có ý nghĩa gần tương dương với từ khóa
Hình 2.2: Categories trong website Ảnh: www.newshcmussh.com