Erreurs d'exploration : fonctionnalités nouvelle génération

Niveau webmaster : tous


La page "Erreurs d'exploration" fait partie des fonctionnalités les plus appréciées des outils pour les webmasters. Aujourd'hui, nous mettons en œuvre quelques améliorations importantes qui la rendront encore plus utile. 

Désormais, nous détectons et signalons une multitude de nouveaux types d'erreurs. Afin de vous aider à interpréter correctement ces nouvelles données, nous avons créé deux catégories : les erreurs liées au site et les erreurs liées aux URL

Erreurs liées au site

Les erreurs liées au site ne concernent pas une URL précise, mais la totalité de votre site. Il peut s'agir de problèmes de résolution du DNS, de connectivité avec votre serveur Web ou de récupération de votre fichier robots.txt. Auparavant, nous signalions ces erreurs URL par URL. Toutefois, ce classement n'était pas très logique dans la mesure où ces problèmes ne concernaient pas des URL précises. En réalité, ces erreurs empêchent même Googlebot de demander une URL ! Dorénavant, nous étudions de près les taux d'échec pour chaque type d'erreur se produisant à l'échelle du site. Nous essaierons également de vous envoyer des alertes si ces erreurs deviennent trop fréquentes et requièrent donc une attention particulière.



Évolution du nombre et du taux d'erreurs à l'échelle du site


En outre, si, comme beaucoup de webmasters, vous ne rencontrez actuellement aucun problème dans ces domaines, et si vous n'en avez pas rencontré récemment, cette section ne vous est pas proposée. À la place, nous vous présentons seulement les points vérifiés pour vous informer qu'il n'y a aucune erreur à signaler.


Site ne présentant aucune erreur récente

 

Erreurs liées aux URL

Les erreurs liées aux URL ne concernent qu'une page en particulier. Cela signifie que lorsque Googlebot a exploré l'URL en question, votre DNS a pu être résolu, la connexion avec votre serveur a été établie et votre fichier robots.txt a été récupéré et lu, puis la demande d'URL a été effectuée, mais qu'une erreur s'est ensuite produite. Nous classons les erreurs liées aux URL dans plusieurs catégories en fonction de leur cause. Si votre site comporte des données Google Actualités ou destinées aux mobiles (CHTML/XHTML), nous affichons des catégories distinctes pour ces erreurs.


Classement par type et évolution du nombre d'erreurs liées aux URL

 

S'en tenir à l'essentiel

Auparavant, nous vous présentions jusqu'à 100 000 erreurs par type. Il vous était impossible de traiter toutes ces informations, et vous n'aviez aucun moyen de distinguer les erreurs graves (la page d'accueil de votre site n'est plus disponible) des erreurs moins problématiques (un lien renvoyant vers votre site comporte une coquille sur le site personnel de quelqu'un). Aucune solution réaliste n'était envisageable pour afficher l'ensemble des 100 000 erreurs. Vous ne pouviez pas effectuer de recherches, ni trier les erreurs, ni suivre votre avancement. Dans cette nouvelle version, nous avons fait en sorte que les erreurs les plus importantes apparaissent en priorité. Pour chaque catégorie, nous vous présentons les 1 000 erreurs les plus importantes selon nous et qui nécessitent une action de votre part. Vous pouvez trier et filtrer ces erreurs, afficher des informations détaillées les concernant et nous prévenir lorsque vous pensez les avoir corrigées.


Filtrez et triez instantanément les erreurs dans toutes les colonnes.


Certains sites présentent plus de 1 000 erreurs pour chaque catégorie. Par conséquent, nous vous avons laissé la possibilité de connaître le nombre total d'erreurs pour chaque type et d'accéder à un graphique affichant des données historiques remontant à 90 jours. Certains d'entre vous pensent peut-être que 1 000 erreurs détaillées et un nombre total d'erreurs ne seront pas suffisants. Sachez que nous envisageons d'ajouter une interface de programmation (une API) pour vous permettre de télécharger toutes les erreurs rencontrées. Si vous avez besoin d'autres fonctionnalités, n'hésitez pas à nous l'indiquer.

Nous avons également supprimé la liste des pages bloquées par le fichier robots.txt. En effet, bien qu'elles puissent parfois être utiles lors du diagnostic d'un problème relatif à votre fichier robots.txt, il s'agit bien souvent de pages que vous avez bloquées volontairement. Nous voulions vraiment nous concentrer sur les erreurs. Par conséquent, la fonctionnalité "Accès du robot d'exploration" sous "Configuration du site" devrait bientôt proposer des informations à propos des URL explorées.

Détails des erreurs

Lorsque vous cliquez sur une erreur liée à une URL dans la liste principale, un volet contenant des informations supplémentaires s'affiche. Il indique notamment à quand remonte la dernière exploration de l'URL, le jour où nous avons détecté le problème pour la première fois, ainsi qu'une brève explication de l'erreur.


Informations détaillées relatives à chaque erreur liée à une URL


Dans ce volet, vous pouvez cliquer sur le lien de l'URL à l'origine de l'erreur afin de voir par vous-même ce qu'il se passe lorsque vous tentez de consulter la page correspondante. Vous pouvez également marquer l'erreur comme étant corrigée (plus d'informations à ce sujet ci-dessous), afficher de l'aide pour ce type d'erreur, répertorier les sitemaps qui contiennent l'URL, voir les autres pages contenant un lien renvoyant vers cette URL et même demander à Googlebot d'explorer cette URL maintenant, soit pour obtenir davantage d'informations, soit pour vérifier que vous avez réussi à résoudre le problème.


Affichez la liste des pages contenant un lien vers cette URL.

 

À vous de jouer !

S'il existe un aspect dont nous sommes particulièrement fiers dans cette nouvelle version de la page "Erreurs d'exploration", c'est la possibilité de se concentrer sur la correction des principaux problèmes. Nous avons classé les erreurs de sorte que celles que vous pouvez résoudre soient situées en haut de la liste des priorités, qu'il s'agisse de réparer des liens non fonctionnels sur votre propre site, de corriger des bugs dans votre logiciel serveur, de mettre à jour vos sitemaps afin de supprimer les URL ne fonctionnant plus ou bien d'ajouter une redirection 301 pour rediriger les internautes vers la bonne page. Nous déterminons ce classement en fonction de plusieurs facteurs. Nous regardons si l'URL est incluse dans un sitemap ou non, si l'URL a récemment généré du trafic issu de la recherche, et nous prenons en compte le nombre de pages contenant des liens redirigeant vers cette URL (et nous regardons si ces pages appartiennent à votre site).

Dès que vous pensez avoir résolu le problème (vous pouvez vous en assurer en utilisant l'outil "Explorer comme Googlebot"), vous pouvez nous l'indiquer en marquant l'erreur comme étant corrigée, à condition que vous bénéficiiez d'un
accès complet. L'erreur est ainsi supprimée de la liste. À l'avenir, les erreurs que vous aurez marquées comme étant corrigées ne seront plus incluses dans la liste des principales erreurs, sauf si nous rencontrons la même erreur lors d'une nouvelle exploration d'URL.


Sélectionnez les erreurs et marquez-les comme étant corrigées.


Nous nous sommes beaucoup investis dans cette nouvelle version de la page "Erreurs d'exploration", aussi nous espérons qu'elle vous sera très utile. N'hésitez pas à nous donner votre avis et à nous faire part de vos suggestions en vous rendant sur le
forum !

Publié par
Kurt Dresner, équipe des outils pour les webmasters, sur googlewebmastercentral.blogspot.com

 

Comments