Seo với file robotsThực chất, file robots.txt là một tập tin văn bản đơn giản (không chứa mã HTML) được đặt trong thư mục gốc của web site ví dụ *http://www.example.com/robots.txt. Vậy, làm thế nào để tạo ra một file robots.txt? Rất đơn giản, bạn có thể mở chương trình Notepad hay bất cứ chương trình soạn thảo văn bản nào, lưu file với tên robots.txt là xong. Các dòng lệnh trong file này có cấu trúc như sau: User-agent: googlebot Disallow: /cgi-bin/ Trong đó User-agent: là đại diện của một search engine, Googlebot là spider của Google. ...
Nội dung trích xuất từ tài liệu:
Seo với file robots Seo với file robotsThực chất, file robots.txt là một tập tin văn bảnđơn giản (không chứa mã HTML) được đặttrong thư mục gốc của web siteví dụ *http://www.example.com/robots.txt.Vậy, làm thế nào để tạo ra một file robots.txt?Rất đơn giản, bạn có thể mở chương trìnhNotepad hay bất cứ chương trình soạn thảo vănbản nào, lưu file với tên robots.txt là xong. Cácdòng lệnh trong file này có cấu trúc như sau:User-agent: googlebotDisallow: /cgi-bin/Trong đó User-agent: là đại diện của một searchengine, Googlebot là spider của Google. Trongví dụ này, chỉ các spider của Google là đượcphép index web site. Disallow: là không chophép thực hiện điều gì đó. ở ví dụ trên là khôngcho phép các spider index thư mục “cgi-bin”trong web site.robots.txtMột ví dụ nữa:User-agent: googlebotDisallow: /supportTất cả các trang nằm trong thư mục support, haysupport-desk sẽ không được index.Nếu bạn muốn tất cả các search engine có thểindex web site của bạn, nhưng không được indexcác trang trong thư mục “cgi-bin” thì sử dụnglệnh sau:User-agent: *Disallow: /cgi-bin/Những điều nên tránh: +Không sử dụng các chú thích trong filerobots.txt, nó có thể làm cho các spider củasearch engine bị lầm lẫn.Ví dụ: ”Disallow: support # Don’t index thesupport directory” might be misinterepreted as“Disallow: support#Don’t index the supportdirectory”. + Không được để khoảng trắng ở đầu dònglệnh Không thay đổi trật tự của các dòng lệnh.Ví dụ:Disallow: /supportUser-agent: * Không sử dụng quá một thư mục trong dònglệnh Disallow.Ví dụ:User-agent: *Disallow: /support /cgi-bin/ /images/Các search engine không hiểu định dạng trên.bạn nên viết thế này:User-agent: *Disallow: /supportDisallow: /cgi-bin/Disallow: /images/ Phải chắc chắn các mệnh đề, từ sử dụngtrong lệnh là đúng. Ví dụ, thư mục của bạn là“cgi-bin” (viết thường, không viết hoa), nhưngkhí vào lệnh, bạn lại viết là “Cgi-Bin” thì cácspider sẽ “bó tay”. Không nên dùng lệnh Allow trong filerobots.txt, bởi vì trong web site của bạn chắcchắn sẽ có một số trang hoặc một số thành phầnbạn không muốn bị người khác “nhòm ngó”. nếubạn sử dụng lệnh Allow, tất cả mọi ngóc ngáchtrong web site của bạn sẽ bị index!
Seo với file robots
Số trang: 5
Loại file: pdf
Dung lượng: 132.24 KB
Lượt xem: 19
Lượt tải: 0
Xem trước 2 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Tìm kiếm theo từ khóa liên quan:
Tối ưu hoá Công cụ Tìm kiếm Công cụ Tìm kiếm Google tài liệu quản trị web cải thiện tương tác trang web chiến lược SEOTài liệu có liên quan:
-
Tìm kiếm thông minh hơn với Google
4 trang 226 0 0 -
SEO từ khóa cho Video trên Youtube
8 trang 49 0 0 -
Chiến lược từ khâu soạn email marketing
4 trang 48 0 0 -
Khóa luận tốt nghiệp: Công cụ tìm kiếm google và một số dịch vụ tìm kiếm tiêu biểu của google
61 trang 44 0 0 -
Thủ thuật SEO video trên youtube
5 trang 42 0 0 -
Nghiên cứu các công cụ Digital Marketing trong thời đại công nghiệp 4.0
10 trang 41 0 0 -
Một số lời khuyên khi SEO Video
11 trang 41 0 0 -
Nghề SEO - 'Bầu sô' của website
3 trang 40 0 0 -
6 trang 39 0 0
-
Các kiểu quảng cáo mà người dung ghét nhất
7 trang 39 0 0