1. Trang chủ
  2. » Tất cả

cách tạo và sử dụng file robots

2 385 1
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Cách tạo và sử dụng file robots
Tác giả Adam Thiên
Người hướng dẫn RichdadLoc – Cố vấn
Trường học Trường Đại Học ONNET
Chuyên ngành Công Nghệ Thông Tin
Thể loại Bài viết hướng dẫn
Năm xuất bản 2013
Thành phố Hà Nội
Định dạng
Số trang 2
Dung lượng 342,39 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

File robots.txt là một dạng file rất đơn giản có thể được tảo bởi công cụ Notepad.. Bạn tạo 1 file robots.txt vào đặt vào thư mục root của trang web File Robots.txt được sử dụng để hướng

Trang 1

ONNET.EDU.VN

Tác giả: Adam Thiên - Cố vấn: RichdadLoc – Bản quyền ©2013 ONNET

Cách tạo và sử dụng file robots.txt

File Robots.txt là gì?

File robots.txt là một dạng file rất đơn giản có thể được tảo bởi công cụ Notepad Bạn tạo 1 file robots.txt vào đặt vào thư mục root của trang web

File Robots.txt được sử dụng để hướng dẫn công cụ tìm kiếm tự động đến những trang nào mà bạn muốn nó tìm kiếm và sau đó thì index trang đó Hầu hết trang web nào cũng có những thư mục và files không cần đến robot của công cụ tìm kiếm ghé thăm Do vậy tạo ra file robots.txt có thể giúp bạn trong SEO

Các User Agent của Google

Google có vài user-agent chính Bạn có thể ngăn chúng bằng cách thêm tên của

bọ tìm kiếm tương ứng và trong dòng User-agent tương ứng trong bảng ghi robots.txt Nếu bạn chặn Googlebot thì có nghĩa là bạn chặn tất cả các bọ tìm kiếm với từ khóa “Googlebot”

- Googlebot: Đánh chỉ số từ các chỉ mục cũ và mới của Google

- Googlebot-Mobile: Đánh chỉ số cho các thiết bị cầm tay hoặc di động

- Googlebot-Image: Đánh chỉ số các tệp tin ảnh

- Mediapartners-Google: Xuất hiện trong các trang dăng quảng cáo của Google Adsense

- Adsbot-Google: Đánh chỉ số các trang được nhà quảng cáo sử dụng giới thiệu sản phẩm hay dịch vụ thông qua Google Adwords Nó cho phép đánh giá chất lượng của trang dùng dịch vụ Adwords

Cách sử dụng Google boot

Trang 2

ONNET.EDU.VN

Tác giả: Adam Thiên - Cố vấn: RichdadLoc – Bản quyền ©2013 ONNET

Nếu bạn sử dụng WordPress một file robots.txt sẽ có dạng như sau:

User-agent: *

Disallow: /wp-

Disallow: /feed/

Disallow: /trackback/

Trong đó:

“User-agent”:* có nghĩa là tất cả những robot tìm kiếm từ Google, Yahoo và MSN nên sử dụng hướng dẫn này của bạn để tìm kiếm trang web

“Disallow: /wp-“: dòng code này báo cho công cụ tìm kiếm biết nó không nên “lục lọi” ở những

file của WordPress bắt đầu bằng wp-

Nếu bạn không sử dụng WordPress, bạn chỉ việc thay thế dòng Disallow với files

và folders mà bạn không muốn nó “dòm ngó”,

ví dụ:

User-agent: *

Disallow: /images/

Disallow: /cgi-bin/

Tự động tạo robots.txt

Nếu bạn có sử dụng Google Webmaster thì họ cũng cho phép bạn tạo robots.txt hoặc bạn có thể sử dụng Robots.txt Generator để tự động tạo file robots.txt cho mình

Sau khi bạn đã tạo xong file robots.txt đừng quên save, bạn chỉ việc upload lên thư mục gốc là hoàn thành

Rồi vậy là bạn đã hiểu thêm về file robot.txt phải không nào, không quá khó khăn cũng không hề phức tạp Chúc bạn thành công khi thực hành phần này

Ngày đăng: 08/08/2013, 11:39

TỪ KHÓA LIÊN QUAN

w