Sitemap là gì?
Sitemap hay còn gọi cái tên khác là sơ đồ trang web là một danh sách thu thập các trang của một trang web. Sơ đồ trang web là một cách để báo cho Google về các trang trên trang web của bạn, trong trường hợp Google không khám tìm ra các trang trên trang web của bạn thì việc tạo và gửi Sơ đồ trang web sẽ giúp đảm bảo rằng Google tìm thấy tất cả các trang trên trang web của bạn, bao gồm cả các URL mà có thể không được phát hiện bởi quá trình thu thập thông tin bình thường của Google.
Có hai phiên bản phổ biến của một bản đồ trang web. Sitemap cho người dùng có tên gọi là Sitemap HTML, Sitemap cho Google spider có tên gọi là Sitemap XML.
Ngoài ra, bạn cũng có thể sử dụng Sơ đồ trang web để cung cấp cho Google dữ liệu về các loại hình cụ thể của nội dung trên trang web của bạn, bao gồm video, hình ảnh, điện thoại di động, và Tin tức. Ví dụ, một mục Sơ đồ video trên trang web có thể xác định thời gian chạy, thể loại của một video. Một Sơ đồ trang web hình ảnh có thể cung cấp thông tin về vấn đề loại đối tượng, một hình ảnh.
Bạn cũng có thể sử dụng một Sơ đồ trang web để cung cấp thêm thông tin về trang web của bạn, chẳng hạn như nó đã được cập nhật lần cuối ngày, và thường xuyên như thế nào bạn mong đợi trang để thay đổi. Google khuyên bạn nên sử dụng Sơ đồ trang web riêng biệt để gửi thông tin Tin tức.
Sơ đồ trang web là đặc biệt hữu ích nếu:
- Trang web của bạn có nội dung động.
- Trang web của bạn có các trang web chưa nhiều Ajax hoặc hình ảnh khiến Googlebot gặp khó khăn trong quá trình thu thập thông tin.
- Trang web của bạn mới và có số liên kết ít. (Googlebot thu thập dữ liệu các trang web bằng cách lần theo các liên kết từ trang này sang trang khác, do đó, nếu trang web của bạn có ít liên kết, điều này có thể gây khó khăn cho Googlebot thu thập thông tin.)
- Trang web của bạn có một nhiều nội dung nhưng các trang nội dung đó không được liên kết với nhau.
Google không đảm bảo rằng Googlebot sẽ thu thập dữ liệu hoặc lập chỉ mục tất cả các URL của bạn. Tuy nhiên, Google sử dụng các dữ liệu trong Sơ đồ trang web của bạn để tìm hiểu về cấu trúc trang web của bạn, và sau đó sẽ cho phép Googlebot cải tiến lịch trình thu thập thông tin và trong tương lai sẽ thu thập dữ liệu trang web của bạn một cách tốt hơn. Trong hầu hết các trường hợp, Sơ đồ trang web sẽ mang lại rất nhiều lợi ích cho trang web của bạn, và trong một số trường hợp sơ đồ trang web lại không tốt với trang web của bạn.
Google tuân thủ Giao thức Sơ đồ trang web 0,9 theo quy định của sitemaps.org. Sơ đồ trang web tạo ra cho Google bằng cách sử dụng Giao thức Sơ đồ trang web 0,9 do đó tương thích với các công cụ tìm kiếm khác áp dụng tiêu chuẩn của sitemaps.org.
Sitemap XML
Google giới thiệu Google Sitemaps vì vậy các nhà phát triển web có thể công bố danh sách các liên kết trên các trang web của họ. Những tiền đề cơ bản là một số trang web có một số lượng lớn các trang động mà chỉ có sẵn thông qua việc sử dụng các hình thức và các mục người dùng. Các tập tin Sơ đồ website chứa URL để các trang này để trình thu thập web có thể tìm thấy chúng. Bing, Google, Yahoo và Ask tại cùng hỗ trợ các giao thức Sơ đồ trang web.
Google tuân thủ Giao thức Sơ đồ trang web 0,9 theo quy định của sitemaps.org. Sơ đồ trang web tạo ra cho Google bằng cách sử dụng Giao thức Sơ đồ trang web 0,9 do đó tương thích với các công cụ tìm kiếm khác áp dụng tiêu chuẩn của sitemaps.org.
Kể từ khi Bing, Yahoo, Ask, và Google sử dụng cùng một giao thức, có Sơ đồ trang web cho phép bốn công cụ tìm kiếm lớn nhất có trang thông tin cập nhật. Sơ đồ trang web không đảm bảo tất cả các liên kết này sẽ được thu thập thông tin, thu thập dữ liệu không đảm bảo lập chỉ mục. Tuy nhiên, một Sơ đồ website vẫn luôn đảm bảo công cụ tìm kiếm để tìm hiểu về toàn bộ trang web của bạn một cách tốt nhất. Google Webmaster Tools cho phép chủ sở hữu trang web có thể tải lên một sitemap giúp Googlebot thu thập dữ liệu, hoặc có thể thực hiện điều tương tự với các robot txt.
Sitemap XML đã thay thế phương pháp cũ của “trình công cụ tìm kiếm” bằng cách điền vào một biểu mẫu trên trang công cụ tìm kiếm của trình. Bây giờ các nhà phát triển web chỉ cần gửi một Sơ đồ trang web trực tiếp đến các công cụ tìm kiếm, hoặc chờ đợi cho công cụ tìm kiếm tự tìm đến nó.
Lợi ích của XML Sitemap để tối ưu hóa trang web Flash
Dưới đây là một ví dụ của một sitemap XML xác nhận cho một trang web có ba trang đơn giản. Sơ đồ trang web là một công cụ hữu ích để giúp cho các trang web được xây dựng trong Flash. Lưu ý rằng bởi vì điều hướng trang web được xây dựng với Flash (Adobe) là điều rất khó khăn, Googlebot không thể tìm được nội dung nếu như không có một sitemap XML.