Cách tạo và sử dụng file Robots.txt
- August 25, 2008
- 8 comments
File Robots.txt được sử dụng để hướng dẫn công cụ tìm kiếm tự động đến những trang nào mà bạn muốn nó tìm kiếm và sau đó thì index trang đó. Hầu hết trang web nào cũng có những thư mục và files không cần đến robot của công cụ tìm kiếm ghé thăm. Do vậy tạo ra file robots.txt có thể giúp bạn trong SEO.
File robots.txt là một dạng file rất đơn giản có thể được tảo bởi công cụ Notepad. Nếu bạn sử dụng WordPress một file robots.txt sẽ có dạng như sau
User-agent: * Disallow: /wp- Disallow: /feed/ Disallow: /trackback/
“User-agent”:* có nghĩa là tất cả những robot tìm kiếm từ Google, Yahoo và MSN nên sử dụng hướng dẫn này của bạn để tìm kiếm trang web.
“Disallow: /wp-“: dòng code này báo cho công cụ tìm kiếm biết nó không nên “lục lọi” ở những filé của WordPress bắt đầu bằng wp-.
Nếu bạn không sử dụng WordPress, bạn chỉ việc thay thế dòng Disallow với files và folders mà bạn không muốn nó “dòm ngó”, ví dụ:
User-agent: * Disallow: /images/ Disallow: /cgi-bin/
Tự động tạo robots.txt
Nếu bạn có sử dụng Google Webmaster thì họ cũng cho phép bạn tạo robots.txt hoặc bạn có thể sử dụng Robots.txt Generator để tự động tạo file robots.txt cho mình
Sau khi bạn đã tạo xong file robots.txt (đừng quên chữ S), bạn chỉ việc upload lên thư mục gốc là hoàn thành
« Chiến lược phát triển một trang web
Những điều nên tránh khi tối ưu hoá công cụ tìm kiếm »
Các bạn cho mình hỏi chút. nếu không sử dụng file robots.txt thì mặc định bộ máy tìm kiếm sẽ index được hết trang mình hay là sao? THANKS!
em dùng joomla thì viết file robots.txt ntn vậy anh
Anh ơi cho em hỏi cái file robots.txt này của em có đúng ko vậy anh ->http://mythuat24h.net/robots.txt
Cám ơn anh!
cảm ơn bài viết của bạn,
mình có một ý kiến là liệu disallow những folder quan trọng có tạo điều kiện cho các hacker tìm ra được folder admin của mình ko, mình cũng đã tạo ra file robots.txt của mình, khi chạy với url dạng domain/robots.txt thì sẽ hiện ra nguyên nội dung file của mình.
Hiện tại mình đang SEO cho trang web kết quả xổ số, kết quả, tường thuật trực tiếp kết quả xổ số, nhanh nhất và chính xác nhất
http://ketqua.org
Chân thành cảm ơn những kiến thức bổ ích bạn mang lại cho độc giả.
A ơi, e tưởng nếu mà bot của Google lục lọi vào thì phải tốt cho SEO chứ ạ
ví dụ mình xài mình disalow config của mình
nhưng hacker sẽ lợi dụng vào đấy để tìm ra config
cái này 2 mặt..
lợi là như thế nhưng chả khác nào share thư mục mình không muốn google bot.
hi! cái robots.txt này không biết có hiệu quả không? lục lọi lại thấy bài này có vè hay… hihi
Thanks !