Moteur de recherche sur Internet
Un moteur, c’est tout d’abord un robot qui récupère chaque jour, sur la Toile, des millions de pages Web et qui en extrait les mots pour les stocker dans un index. C’est ensuite un logiciel (search engine) qui, lorsque vous « interrogez le moteur », parcourt cet index afin d’identifier les termes correspondant à votre question. Il trie les pages trouvées selon différents critères avant d’afficher le résultat sous forme d’une liste de références accompagnées du contexte, phrases ou portion de texte, ayant permis leur sélection.
Le moteur ne peut trouver que les pages qu’il a préalablement aspirées et indexées. Par conséquent, un des premiers critères d’efficacité d’un moteur est le nombre de pages qu’il est capable de référencer.
Si, pour un moteur donné, on met en parallèle le nombre total de pages référencées (plusieurs centaines de millions) et le nombre de pages qu’il est capable d’aspirer par jour (de 2 à 10 millions), on comprend les délais de mise à jour des bases qui varient de 15 jours à plusieurs mois.