Travailler avec des sites multilingues

Travailler avec des sites multilingues

Niveau webmaster : intermédiaire

Un site multilingue est un site dont le contenu est proposé dans plusieurs langues. Il peut s'agir, par exemple, d'une entreprise canadienne dont le site est disponible en français ou en anglais, ou d'un blog sur le football en Amérique latine dont le site est disponible en espagnol et en portugais.

En règle générale, si vous ciblez des visiteurs qui parlent plusieurs langues, vous avez intérêt à créer un site multilingue. Si votre blog sur le football en Amérique latine cible le Brésil, vous pouvez décider de publier votre site uniquement en portugais. Par contre, si vous souhaitez également cibler les fans de football en Argentine, vous avez tout intérêt à proposer aussi votre contenu en espagnol.

Google et la reconnaissance de la langue

Google tente de déterminer les langues principales de chacune de vos pages. Vous pouvez faciliter cette reconnaissance en vous limitant à une langue par page et en évitant les traductions sur une même page. Même si Google est en mesure d'identifier plusieurs langues sur une même page, il est conseillé de rédiger tout le contenu d'une page (en-têtes, barres latérales, menus, etc.) dans une seule langue.

Notez que Google ignore toutes les informations de langue dans le code, depuis les attributs "lang" aux définitions de type de document (DTD). Dans certains éditeurs Web, ces attributs sont créés automatiquement. Ils ne sont donc pas suffisamment fiables pour déterminer la langue d'une page Web.

Un visiteur qui accède à Google et lance une recherche dans sa langue s'attend à obtenir des résultats de recherche localisés. C'est à ce moment précis que vous intervenez, en tant que webmaster : si vous décidez de localiser le contenu, mettez-le en évidence dans les résultats de recherche en suivant nos conseils ci-dessous.

Anatomie d'un site multilingue : structure de l'URL

Vous n'avez pas besoin de créer d'URL spéciales lorsque vous développez un site multilingue. Toutefois, vos visiteurs souhaiteront peut-être identifier la section de votre site dans laquelle ils se trouvent simplement en jetant un coup d'œil à l'URL. Ainsi, les URL suivantes indiquent aux visiteurs qu'ils se trouvent dans la section anglaise du site :

http://example.ca/en/mountain-bikes.html
http://en.example.ca/mountain-bikes.html


Avec les URL suivantes, les internautes savent qu'ils visualisent la version française de la page :

http://example.ca/fr/mountain-bikes.html
http://fr.example.ca/mountain-bikes.html


En outre, cette structure d'URL vous permet d'analyser plus facilement la manière dont votre contenu multilingue est indexé.

Si vous souhaitez créer des URL comportant des caractères spécifiques à d'autres langues, vous devez utiliser le codage UTF-8. Lorsqu'elles sont insérées dans votre contenu, les URL codées en UTF-8 doivent contenir les caractères d'échappement appropriés. Pour ajouter manuellement des caractères d'échappement dans vos URL, n'hésitez pas à faire appel à un encodeur d'URL en ligne. Vous pourrez facilement en trouver un sur Internet. Imaginons que nous souhaitions traduire l'URL suivante de l'anglais vers le français :

http://example.ca/fr/mountain-bikes.html

L'URL en français pourrait se présenter de la manière suivante :

http://example.ca/fr/vélo-de-montagne.html

Cette URL contient un caractère spécifique au français avec "é". Vous devez donc utiliser les caractères d'échappement appropriés dans le lien affiché sur vos pages, comme suit :

http://example.ca/fr/v%C3%A9lo-de-montagne.html

Exploration et indexation de votre site Web multilingue

Nous vous conseillons de ne pas autoriser l'indexation des traductions automatiques. Les traductions automatiques ne sont pas toujours pertinentes et peuvent être considérées comme du spam. Autre point encore plus important : un site multilingue est destiné à atteindre une audience plus large en proposant un contenu intéressant dans plusieurs langues. Si vos visiteurs ne comprennent pas le sens d'une traduction automatique ou si les termes employés ne leur semblent pas naturels, demandez-vous si vous souhaitez réellement leur proposer ce type de contenu.

Vous avez décidé de localiser votre site ? Dans ce cas, vous devez permettre à Googlebot d'explorer facilement chacune des versions de votre site. Pensez à associer les pages dans différentes langues à l'aide de liens internes. En d'autres termes, vous pouvez utiliser des liens renvoyant vers les différentes versions d'un même contenu. Ces liens peuvent également être d'une grande utilité pour vos visiteurs. Reprenons l'exemple précédent et supposons qu'un visiteur francophone accède à la page http://example.ca/en/mountain-bikes.html. Désormais, en un seul clic, il peut afficher la page http://example.ca/fr/vélo-de-montagne.html, où il visualisera le même contenu en français.

Pour faciliter l'exploration de l'ensemble du contenu de votre site, vous devez éviter les redirections automatiques basées sur la détection automatique de la langue du visiteur. En effet, celles-ci risquent d'empêcher les internautes (et les moteurs de recherche) de consulter toutes les versions de votre site.

Enfin et surtout, vous devez utiliser des URL distinctes pour chaque langue. N'employez pas de cookies pour afficher les versions traduites.

Utilisation du codage des caractères

Google extrait directement le codage des caractères à partir des en-têtes HTTP, des en-têtes des pages HTML et du contenu. À part vous assurer que les informations (contenu et en-têtes, par exemple) n'entrent pas en conflit les unes avec les autres, vous n'avez pas à vous soucier du codage des caractères. Même si Google est en mesure de reconnaître des codages de caractères différents, nous vous conseillons de coder autant que possible votre site Web en UTF-8.

Si vous vous mélangez les pinceaux...

Lorsque vous parlez plusieurs langues, il peut vous arriver de vous mélanger les pinceaux. Cette confusion est totalement exclue sur votre site !

Pour plus d'informations, lisez notre post relatif aux sites ciblant plusieurs zones géographiques. En attendant, n'hésitez pas à consulter le forum d'aide et à participer à la discussion !

Traduit du post original de Xavier deMorales, Equipe Google Qualité de recherche 19/03/2010

Comments