Google Search Console es una herramienta gratuita de Google que te permite monitorear y analizar el rendimiento de tu sitio web, tanto para PC como para móviles. Con ella, puedes conocer cómo Google visualiza tu sitio web y saber qué debes mejorar para obtener un mejor posicionamiento en los resultados de búsqueda. Además, con Google Search Console podrás:
Analizar el tráfico en tu web, de forma diferente a como lo hace Google Analytics.
Conocer qué páginas web se están posicionando y para qué palabras clave.
Identificar los enlaces entrantes y los enlaces internos.
Detectar los errores que afectan a tu sitio web.
Optimizar la estructura de tu sitio web.
Enviar páginas nuevas para que las arañas de Google las indexen.
Detectar problemas de seguridad en tu web.
Eliminar URLs que no quieras que aparezcan en los resultados de búsqueda.
Conocer cuáles son las páginas de mayor éxito de tu web.
Ayuda recomendada: Empezar a utilizar Search Console
El CMS ya esta conectado con Google Search Console al momento cuando se pone en producción el sitio, en caso de que no tengas acceso a la consola, puedes solicitarlo por ticket desde Soporte Técnico
¿Cansado de esperar a que Google indexe su nuevo contenido? Ayúdalo a lo largo de asegurándose de que sus páginas sean rastreables. La indexación es el proceso de descargar información de su sitio web, categorizarla y almacenarla en una base de datos. Esta base de datos, el índice de Google, es la fuente de toda la información que se puede encontrar a través de la Búsqueda de Google. Las páginas que no están incluidas en el índice no pueden aparecer en los resultados de búsqueda, sin importar cuán bien se ajusten a una determinada consulta.
Pero antes de que puedas ver cómo está haciendo la página en la Búsqueda de Google, tienes que esperar a que se indexe.
El índice de Google contiene cientos de miles de millones de páginas web y ocupa más de 100 millones de gigabytes de memoria. Además, Google no limita cuántas páginas de un sitio web pueden ser indexadas. Si bien algunas páginas pueden tener prioridad en la cola de indexación, las páginas generalmente no tienen que competir por la indexación. ¿Todavía debería haber espacio para una página más pequeña en esta colosal base de datos, verdad? ¿No hay necesidad de preocuparse por la entrada de tu blog? Desafortunadamente, es posible que tengas que hacerlo. Google admite que no todas las páginas procesadas por sus rastreadores serán indexadas. En enero de 2021, el defensor de la búsqueda de Google, John Mueller, elaboró sobre el tema, revelando que es bastante normal que Google no indexe todas las páginas de un sitio web grande. Explicó que el desafío para Google es tratar de equilibrar el deseo de indexar tanto contenido como sea posible con la estimación de si será útil para los usuarios del motor de búsqueda. Por lo tanto, en muchos casos, no indexar un contenido dado es la elección estratégica de Google. Google no quiere que su índice incluya páginas de baja calidad, contenido duplicado o páginas poco probables de ser buscadas por los usuarios. La mejor manera de mantener el spam fuera de los resultados de búsqueda es no indexarlo. Pero siempre y cuando mantengas tus publicaciones de blog valiosas y útiles, todavía se están indexando, ¿verdad? Un experto en indexación calculó que, en promedio, el 16% de las páginas valiosas e indexables en sitios web populares nunca se indexan.
No hay una respuesta definitiva a esta pregunta de indexación. No podrás establecerte un recordatorio en el calendario el día en que se supone que se indexará tu nota.
La frecuencia con la que Googlebot vuelve a rastrear su sitio web ciertamente afecta la rapidez con la que se indexará su nueva página, y eso depende de la naturaleza del contenido y la frecuencia con la que se actualiza. Algunas consideraciones interesantes:
Los sitios web de noticias que publican contenido nuevo a menudo necesitan ser rastreados con frecuencia. Podemos decir que son sitios con alta demanda de rastreo.
Google determina automáticamente si el sitio tiene una demanda de rastreo alta o baja . Durante el rastreo inicial, comprueba de qué trata el sitio web y cuándo se actualizó por última vez.
La decisión de rastrear el sitio con mayor o menor frecuencia no tiene nada que ver con la calidad del contenido: el factor decisivo es la frecuencia estimada de las actualizaciones.
Dado que la indexación lleva tiempo, uno también puede preguntarse: ¿exactamente en qué se invierte ese tiempo? ¿Cómo se clasifica e incluye la información de su sitio web en el índice de Google? Analicemos los eventos que deben suceder antes de la indexación.
Descubrimiento de contenido: Volvamos al ejemplo en el que publicaste una nueva nota. El robot de Google necesita descubrir la URL de esta página en el primer paso del proceso de indexación.
Puede suceder por:
Siguiendo enlaces internos que proporcionaste en otras páginas propias.
Seguir enlaces externos creados por personas que encontraron útil su nuevo contenido.
Revisando el mapa del sitio XML que el CMS subió automáticamente a Google Search Console. Artículo Recomendado: La Paradoja del Sitemap
El hecho de que la página haya sido descubierta significa que Google conoce su existencia y su URL, sin embargo puede que Google no la indexe en el momento y lo haga más tarde. Aparecerá como "Rastreada: actualmente sin indexar". No hay forma de forzar a que las indexe más rápido.
No puedes obligar a Google a indexar tu sitio ni sus notas. La rapidez con la que esto sucede también está fuera de su control. Sin embargo, se puede optimizar el sitio para que el descubrimiento y el rastreo se realicen con la mayor fluidez posible, el CMS ya está optimizado para tal fin y no son necesarias acciones adicionales por parte del equipo de redacción.
En Google Search Console, hay varias razones naturales por las cuales las páginas de un sitio pueden no estar indexadas, y algunas de estas situaciones no deben ser motivo de preocupación. A continuación, una lista enumerada de estos casos, junto con los estados correspondientes que Google utiliza en la consola:
URL Canónica Distinta:
Estado en la Consola: Página alternativa con etiqueta canónica adecuada
Motivo: Si hay páginas con una etiqueta canonical que apunta a una URL diferente, Google puede optar por no indexar la página señalada por la canonical. Esto es común y no necesariamente indica un problema.
Páginas con Etiqueta noindex:
Estado en la Consola: Excluida por una etiqueta "noindex"
Motivo Natural: Si las páginas tienen la etiqueta meta noindex en su código HTML, indican explícitamente a los motores de búsqueda que no deben indexarse. Esto puede ser una elección consciente del webmaster.
Redirecciones:
Estado en la Consola: Página con redirección
Motivo Natural: Las redirecciones pueden llevar a que Google no indexe la página redirigida.
Páginas rastreadas pero áun no indexadas
Estado en la Consola: Rastreada: actualmente sin indexar
Motivo: Google ha rastreado la página, pero por alguna razón, ha decidido no incluirla en su índice de búsqueda por el momento. Esto puede deberse a diversas razones naturales y no necesariamente indica un problema. En muchos casos, incluirá las páginas en otro momento. No es posible forzar a que las incluya "inmediatamente".
Páginas bloqueadas
Estado en la Consola: Bloqueada por robots.txt
Motivo: Se ha decidido a través del archivo Robots.txt, que esas páginas no se indexen por decisión estratégica.
Páginas duplicadas
Estado: Duplicada: Google ha elegido una versión canónica diferente a la del usuario
Motivo: Google ha identificado contenido duplicado en el sitio, pero en lugar de utilizar la versión que el usuario ha marcado como canónica, ha seleccionado otra versión como canónica. La versión canónica es la URL preferida que Google elige para indexar y mostrar en los resultados de búsqueda.
Estado: Duplicada: el usuario no ha indicado ninguna versión canónica
Motivo: Google ha detectado contenido duplicado, pero el usuario no ha especificado una versión canónica mediante la etiqueta <link> canonical o mediante otros métodos que informen a Google sobre la preferencia de la versión canónica.