Le contenu dupliqué : mythes et réalités

Greg Gothaus, ingénieur de l’équipe de Qualité Google, vient de publier un post sur le contenu dupliqué dans Webmaster Central Blog.

http://googlewebmastercentral.blogspot.com/2009/09/duplicate-content-and-multiple-site.html

 Je vous résume (en français) les points importants de cette présentation :

  • La pénalité de contenu dupliqué est un mythe. Pour une requête, Google veut montrer une diversité des résultats et éviter d’avoir plusieurs fois la même version d’une page (page originale et version à imprimer par exemple). Pour cette requête, Google choisira donc une seule version si plusieurs sont disponibles.
  • Dans les consignes de qualité,  vous trouvererez plus de détails sur le contenu dupliqué : http://www.google.com/support/webmasters/bin/answer.py?&answer=66359
  • La grande majorité du contenu dupliqué n’est pas là pour manipuler les résultats de recherche, et on veut donc montrer des résultats différents.
  • Le contenu dupliqué créé pour manipuler les résultats de recherche ou « spam » est là pour générer du trafic et n’apporte rien aux utilisateurs par rapport au contenu original. On va donc enlever ce contenu de nos résultats de recherche ou le rendre moins visible. L’intention est clairement de manipuler le classement et de tromper les utilisateurs.
  • Qu’est-ce que le contenu dupliqué ? Exemples d’URLs différentes (diapo 6) mais avec le même contenu sur un site:

exemple.fr/  exemple.fr/ ?  www.exemple.fr/

  • Il n’y a pas de pénalité associée à ces URLs avec le même contenu mais par contre cela va affecter :

-          la popularité des liens (diluée sur les pages)

-          Google agrège les résultats et choisit de montrer une URL. Si vous souhaitez montrer une URL spécifique, vous pouvez nous aider à choisir la bonne URL.

-          Google va passer du temps à crawler toutes ces URLs avec le même contenu au lieu de passer du temps à crawler le plus récent.

  • Comment régler ce problème :

-     choisir et définir une URL canonique

http://www.google.com/support/webmasters/bin/answer.py?hl=fr&answer=139394

-          structurer le site de façon à ce que les liens pointent vers l’URL canonique

-          redirections 301 des URLs

-          utiliser l’attribut rel = "canonical" pour les URLs, par exemple pour les breadcrumbs

-     l’URL canonique ne peut pas être utilisée d’un domaine vers un autre domaine.

-          l’URL canonique peut être utilisée pour choisir une version http au lieu de https

-          pour une redirection permanente, il est possible d’utiliser la redirection 301 ou rel=canonical

  • Les domaines multiples ne posent pas de problème pour les différentes versions d’un site comme .fr, .be, .ch mais il arrive que :

-  la réputation soit distribuée sur les domaines multiples

-  si le même contenu est réparti sur plusieurs domaines, Google va choisir la page la plus pertinente sur une requête, pas forcément sur tous les domaines.

 Présentation sur le contenu dupliqué faite par Greg lors de la conférence SES à San Jose en août 2009.

 

Nathalie

Comments