1. Trang chủ
  2. » Công Nghệ Thông Tin

Tạo và sử dụng file robots.txt – Seo doc

4 420 2
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 4
Dung lượng 93,72 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Tạo và sử dụng file robots.txt – Seo... Dưới đây là hướng dẫn tạo và sử dụng file robots.txt cho website, để các bộ máy tìm kiếm quản lý index nội dung của website bạn robots.txt là file

Trang 1

Tạo và sử dụng file robots.txt – Seo

Trang 2

Dưới đây là hướng dẫn tạo và sử dụng file robots.txt cho website, để các bộ máy tìm kiếm quản lý index nội dung của website bạn

robots.txt là file văn bản có cấu trúc, khi các spider (bot, crawler) của các SE (Search engine) vào website để thu thập

dữ liệu thì sẽ vào file robots.txt để xem các chỉ dẫn trong file này

robots.txt có thể quy định từng loại bot khác nhau của các SE khác nhau có thể vào website hay từng khu vực của website hay không?

Vài loại bot của các SE: Googlebot (Google), Googlebot-Image(Google), Yandex(SE của Nga), Bingbot(Bing)/Yahoo Slurp(Yahoo)…

Những cú pháp thông dụng trong file robots.txt

User-agent: đối tượng bot được chấp nhận

Disallow/Allow: URL muốn chặn/cho phép

Trang 3

*: Đại diện cho tất cả

Ví dụ: User-agent: * (Có nghĩa là chấp nhận tất cả các loại bot.)

Khóa toàn bộ site

Disallow: /

Chặn 1 thư mục và mọi thứ nằm trong nó

Disallow: /wp-admin/

Chặn 1 trang

Disallow: /private_file.html

Loại bỏ 1 hình từ Google Images

User-agent: Googlebot-Image

Disallow: /images/sexy.jpg

Bỏ tất cả các hình từ Google Images:

User-agent: Googlebot-Image

Disallow: /

Chặn 1 file hình bất kỳ, ví dụ gif

User-agent: Googlebot

Disallow: /*.gif$

Trang 4

Những điều cần tránh trong file robots.txt

- Phân biệt chữ hoa chữ thường

- Không được viết dư, thiếu khoản trắng

- Không nên chèn thêm bất kỳ ký tự nào khác ngoài các cú pháp lệnh

- Mỗi một câu lệnh nên viết trên 1 dòng

Cách tạo và vị trí đặt file robots.txt

- Dùng notepad hay bất cứ chương trình nào tạo file, sau đó đổi tên file là robots.txt

- Đặt ở thư mục gốc của website ( sanduatin.com/robots.txt )

Ngày đăng: 25/03/2014, 17:20

TỪ KHÓA LIÊN QUAN

w