Los mapas de sitio basados en XML (aka sitemap.xml) ayudan a Google a conocer la estructura de tu sitio. Es importante saber, que—de un tiempo a esta parte—Google incluye en los resultados de búsquedas (aka SERP) los archivos sitemap.xml
El mapa de sitio no es una directiva de rastreo, menos aún de indexación.
Ahora bien, que Google incluya o no el archivo sitemap.xml en los resultados de búsqueda no tiene impacto alguna en la clasificación del sitio ni de las páginas que lo componen; no obstante ello, algún webmaster puede no querer que dicho archiso sea incluído en los resultados de búsqueda.
—Hay alguna forma de evitar que Google haga esto?
—Sí. Y la solución se presenta de manera sencilla.
Sólo hay que agregar las siguientes líneas dentro del archivo .htaccess (si es que tu servicio de host corre Apache). Estas líneas sólo tienen por misión incluir un encabezado con una etiqueta no indexar
<Files sitemap.xml>
Header set X-Robots-Tag "noindex"
</Files>
Sólo resta—luego de actualizar estas líneas en el servidor—que Googlebot visite el sitio (1) y se de por enterado de estas directivas
Estos consejos están basados en un tweet de @JohnMu
Tip: some Sitemap files have a lot of text (eg images), serve them with a noindex x-robots-tag to prevent indexing.
— John Mueller (@JohnMu) octubre 29, 2010
Visto en Digital Inspiration
nota (1) Esto dependerá de la frecuencia de rastreo que Google tenga asignado a tu sitio.