Indexación: Qué es y cómo indexar contenido en Google

Indexar | 

De nada sirve contar con una página web o tienda online con un gran diseño, una usabilidad y accesibilidad excepcional, y unas funciones y contenido de alta calidad, si al final ningún usuario la visita.

Conseguir visibilidad para un proyecto web es fundamental para atraer visitantes y poder alcanzar los objetivos fijados. Para lograrlo es fundamental que las URLs que formen una web sean indexadas por Google y que así aparezcan en sus páginas de resultados cuando los usuarios realizan una búsqueda relacionada.

A continuación, veremos qué es la indexación, cómo se puede indexar una web en Google, y cómo saber si el contenido de un sitio web se está posicionando.

Tabla de contenidos

¿Qué es la indexación en el SEO?

La indexación es un proceso por el cual Google u otro motor de búsqueda examina y valora un sitio web, para añadirlo de forma adecuada dentro de su ranking. Los crawlers de Google se pasan cada tanto tiempo por un sitio web para revisar si existen modificaciones, y así actualizar su base de datos de sitios web.

Cuando se dice que una página se encuentra indexada en Google, quiere decir que ya está incluida en su base de datos y puede aparecer en las SERPs tras búsquedas relacionadas con sus palabras clave.

¿Por qué mi web debe estar indexada?

El motivo principal y muy importante por el que una página web debe estar indexada en Google es para que les pueda aparecer a los usuarios cuando realizan búsquedas por sus palabras clave relacionadas.

Si una web no está indexada en Google, significa que no se encuentra dentro de su base de datos, por lo que nunca aparecerá en las páginas de resultados o SERPs. Sin una URL de un sitio web no se encuentra indexada no podrá conseguir tráfico orgánico ya que será invisible para Google.

Google solo muestra en sus SERPS páginas que se encuentren indexadas.

Consejos para indexar tu web en Google

A continuación, ofrecemos una serie de recomendaciones para facilitar la indexación del contenido de un sitio por parte de Google.

Actualización constante

A Google le gustan los sitios webs dinámicos que ofrecen nuevo contenido de forma periódica. Si una página web, eCommerce o blog actualiza de forma constante su contenido, los bots de Google se pasarán más a menudo a revisarla, consiguiendo que se indexe mucho más rápido cualquier nueva página que se añada.

No te quedes corto de enlaces internos

El enlazado interno ayuda a navegar de forma más fluida y sencilla por una web, dándole una estructura lógica. Con un buen enlazado interno se podrá aprovechar mejor el crawl budget o presupuesto de rastreo, facilitando que los Googlebots accedan a todas las URLs de valor del sitio, para poder indexarlas de forma apropiada.

Crea sitemaps

Existe una forma muy rápida y sencilla de “forzar” el indexado de las páginas de una web. Consiste en la creación de un archivo sitemap, normalmente en formato XML o texto, donde se incluye una lista de todas las URLs que se quieren indexar, facilitando a Google el proceso de revisarlas e incluirlas en su base de datos.

El archivo sitemap se envía a Google a través de su herramienta Search Console. En la barra lateral izquierda de GSC hay una opción llamada sitemaps, desde la cual se puede seleccionar un archivo para enviarlo directamente a Google.

Usa robots.txt

El robots.txt es un archivo que revisan los bots de Google al comienzo del rastreo de un sitio web. En este archivo se pueden establecer reglas que favorezcan la indexación de las URLs del sitio, evitando que los bots pierdan tiempo en URLs que no se quieran indexar por no aportar valor, pudiendo dedicar ese sitio a rastrear las webs realmente importantes a indexar.

En el robots.txt se pueden añadir reglas para evitar que los bots de Google visiten ciertas páginas del sitio.

Errores comunes en la indexación de contenidos

Veamos una serie de fallos o errores que se suelen cometer en relación a la indexación de contenidos de una web:

No utilizar un sitemap

Este es el mayor error que puede cometerse en relación a la indexación, pues es una forma rápida y sencilla de acelerar la indexación. Si no se utiliza un sitemap habrá que:

  • Perder mucho tiempo subiendo una a una las distintas URLs a Google Search Console para que sean indexadas.
  • Esperar a que los bots de Google pasen por sí mismos por el sitio web para indexar su contenido (proceso indefinido que puede tardar mucho tiempo).

Hay que tener en cuenta que, aunque el archivo sitemaps se puede crear de forma manual y personalizada, en la mayoría de los casos, bastará con generarlo de forma automática (proceso que apenas tarda unos segundos).

Crear y subir un archivo sitemap es un proceso gratuito y muy sencillo, que apenas ocupará unos minutos.

Mala configuración del archivo robots.txt

Este archivo es muy útil para evitar que los Googlebots pierdan tiempo rastreando URLs del sitio que no son interesantes. Sin embargo, si se realiza una mala configuración, el robots.txt puede indicarle a Google que no indexe ciertas páginaa importantes del sitio.

A la hora de configurar el archivo robots.txt es muy importante revisar y verificar que no se va a bloquear ningún contenido importante.

Indexar contenido duplicado

No utilizar enlaces canónicos para indicar contenido original es un error que cometen muchos sitios web, sobre todo tiendas virtuales. El contenido duplicado es penalizado por Google con un peor posicionamiento, por lo que es importante tener cuidado a la hora de posicionar contenido similar o relacionado, como por ejemplo distintos productos similares de un eCommerce.

Indexar contenido de baja calidad

Hay que evitar indexar thin content o contenido de baja calidad ya que Google penalizará el posicionamiento web si un sitio tiene muchas URLs de este tipo. 

No optimizar el crawl budget

Aunque Google es un auténtico gigante de internet, sus recursos tienen ciertas limitaciones y son millones las webs que debe rastrear. Por este motivo, los bots de Google solo tienen un tiempo limitado para rastrear cada sitio.

No optimizar este presupuesto de rastreo, indicando a Google qué URLs no debe visitar, es uno de los errores más comunes en la indexación de contenido.

¿Qué contenido de mi web está indexando Google?

Para conocer el contenido que ha indexado Google de una página web, blog o eCommerce se pueden realizar dos acciones diferentes, utilizar el propio buscador de Google, o acudir a la herramienta gratuita Google Search Console.

Comprobación en los resultados de búsqueda

Desde el propio buscador de Google se puede realizar una búsqueda específica para poder comprobar qué URLs del sitio están indexadas. Para ello, hay que utilizar el comando site: en la barra de búsquedas de Google, seguido del dominio del que se quieran conocer las páginas que se encuentran indexadas.

El formato de la búsqueda sería el siguiente:

site:www.nombredelaweb.com.

Al introducir una búsqueda de este estilo, en la página de resultados de Google obtenida, se mostrará un listado con todas las URLs del sitio que se encuentran indexadas, es decir, que están en la base de datos de Google y que, por lo tanto, los usuarios podrán encontrarlas.

Comprobación en Google Search Console

Utilizando Google Search Console se puede averiguar el contenido o páginas que Google tiene incluidas en su base de datos. Para consultar esta información hay que seguir los siguientes pasos:

  • Acceder a la plataforma web de Google Search Console (que tiene que estar vinculada con el sitio web).
  • En el menú lateral izquierdo seleccionar la opción Inspección de URLs.
  • Introducir la URL de la página que se quiere comprobar.
  • Visualizar si se encuentra ya incluida en el índice.
  • En caso de no estar indexada, Google Search Console ofrecerá la opción de indexarla (proceso que se realizará en unos días tras su solicitud).

Hemos visto qué es la indexación y por qué es fundamental que las distintas URLs de una página web, tienda online o blog sean indexadas lo antes posible.