Có hai loại sitemap một loại là HTML sitemap và XML Sitemap. HTML sitemap được sử dụng chủ yếu cho người đọc biết được sơ đồ của trang web và họ có thể dễ dàng tìm kiếm thông tin hơn. Loại thứ hai là XML Sitemap được tạo ra để dành riêng cho các công cụ tìm kiếm. Nó báo cho các công cụ tìm kiếm về cấu trúc của trang web, tần suất cập nhật nội dung của trang và trang nào được ưu tiên hơn trong kết quả tìm kiếm.

Trong bài này chúng ta sẽ chỉ nghiên cứu đến loại thứ 2 là XML Sitemaps được Google giới thiệu lần đầu tiên từ năm 2005. XML Sitemap đơn giản là một danh sách bao gồm tất cả các trang trong trang web của bạn. Tạo và khai báo Sitemap cho google giúp Google biết về sự tồn tại của tất cả các trang trong trang web của bạn, bao gồm địa chỉ URL mà có thể robot của Google không tìm thấy được.

site map

Sau khi Google giới thiệu XML Sitemap, Yahoo! và MSN cũng sử dụng Sitemap để index các trang web. Nếu bạn tạo XML Sitemap cho Google, bạn không cần phải thay đổi gì hết bởi vì cả 3 công cụ tìm kiếm này đều có cùng chung một tiêu chuẩn.

Tại sao bạn nên dùng Sitemap
  • Nếu trang web của bạn rơi vào một trong những hạng mục sau thì Sitemap sẽ rất có ích cho trang web của bạn
  • Trang web của bạn là web động
  • Trang web của bạn sử dụng AJAX hoặc Flash làm cho robot tìm kiếm của Google khó tìm thấy được
  • Trang web của bạn vừa được phát triển và ít có liên kết đến. Bởi vì Googlebot crawl web bằng cách đi theo các đường link liên kết từ trang này qua trang khác, cho nên nếu trang web của bạn không được link đến nhiều, sẽ rất khó cho Googlebot tìm được trang của bạn.
  • Trang web của bạn có nhiều trang nội dung khác nhau nhưng không được liên kết với nhau hoặc liên kết giữa chúng không nhiều.

Bên cạnh đó, Sitemap có thể giúp Google biết được những thông tin khác về trang web của bạn như là

  • Nội dung của bạn được cập nhật thường xuyên hay không. Ví dụ bạn có thể post bài thường xuyên trong blog của bạn, nhưng những trang như Liên Hệ ít được cập nhật hơn.
  • Ngày chỉnh sửa nội dung cuối cùng của trang.
  • Bạn có thể thiết lập tầm quan trọng của từng trang khác nhau. Ví dụ Trang Chủ sẽ có tầm quan trọng là 1.0 điểm, trang con nằm trong trang chủ như Categories được 0.8 điểm, và các bài post được 0.5 điểm. Thang điểm này chỉ có tác dụng chỉ ra tầm quan trọng của một địa chỉ URL cụ thể so với những địa chỉ URL khác trong trang của bạn, nó không ảnh hưởng đến PageRank của trang trong kết quả tìm kiếm của Google
Định dạng XML Sitemap

Trong phần này bạn sẽ học qua về định dạng của XML Sitemap và các thẻ XML của nó. Tất cả các thẻ của Sitemap đều phải có thẻ đóng ở cuối cùng và Sitempa buộc phải được mã hoá với UTF-8.

Dưới đây là một trang Sitemap ví dụ, chỉ có một đường link URL và các thẻ tuỳ biến đi kèm. Nếu bạn muốn tạo Sitemap cho trang của mình, bạn phải khai báo TẤT CẢ các địa chỉ URL của trang web.

   http://www.tentrangweb.com/ 2008-01-01 daily 0.1  
Kết luận

XML Sitemap cung cấp thêm thông tin cần thiết về trang web của bạn cho Google mà phương pháp crawl thông thường của Google có thể bỏ sót. Tạo XML Sitemap không hề mất thời gian, khai báo với Google cũng rất đơn giản. Nhưng hiệu quả mà nó mang lại cho trang web của bạn cũng rất lớn. Bất cứ thứ gì có lợi cho trang web của bạn, bạn cũng nên áp dụng cho mình.