Moteur de recherche

Un moteur de recherche web est une application du web permettant d'obtenir des liens hypertextes vers des documents sur le web à partir de mots-clés.

Utilisation

Sur la page web du moteur de recherche, l'utilisateur saisit une requête constituée de mots-clés. Le moteur construit une liste de documents qui satisfont la requête (en général, les documents qui contiennent les mots-clés de la requête) qu'il retourne à l'utilisateur sous la forme d'une page web contenant des hyperliens vers ces documents.

Remarque : les moteurs de recherche ne sont pas intelligents ! Même s'ils peuvent répondre à des questions simples pour lesquelles ils ont été spécialement programmés, ils sont incapables de comprendre le sens d'une question et d'y répondre de manière pertinente.

Fenêtre d'un navigateur web montrant la page d'accueil

du moteur de recherche DuckDuckGo (duckduckgo.com) :

Exemples de moteurs de recherche web

Les moteurs de recherche web les plus employés en 2015 sont :

Exemples de requêtes

Avec le moteur de recherche Google, la requête « moteur avion fonctionnement » renvoie une page web contenant une liste de liens vers d'autres pages web qui contiennent les mots de la requête (qui apparaissent en gras dans l'extrait de la page qui suit chaque lien).

Les moteurs de recherche modernes utilisent également les synonymes ou les mots proches des mots de la requête. Généralement, ils ne tiennent pas compte des accents ni des marques de pluriel. Par exemple, la requête « marche puce » renvoie des liens vers des pages traitant des marchés aux puces. La requête « comment marche puce » renvoie des liens vers des pages qui ne contiennent pas le mot « marche » mais qui contiennent le mot « fonctionne ».

Fonctionnement

Des « robots » (logiciels fonctionnant sur les ordinateurs du moteur de recherche) parcourent sans cesse le web en suivant de proche en proche les hyperliens qu'ils rencontrent dans les pages web. A partir du contenu de chaque page, les robots complètent un index de mots et associent à chaque mot la liste des documents dans lesquels il apparaît.

Lorsque un client soumet une requête au moteur de recherche, l'index permet de trouver rapidement tous les documents qui contiennent tous les mots de la requête.