article(s) dans votre panier VOIR

Comment fonctionnent les moteurs de recherche ?

  • Vidéo 10 sur 57
  • 3h31 de formation
  • 57 leçons

Un contenu flash devrait s'afficher ici. Votre navigateur ne comporte pas de plugin flash, ou il ne s'est pas correctement initialisé.

Vous pouvez télécharger le plugin flash depuis le site d'Adobe à l'adresse suivante : http://get.adobe.com/flashplayer/.

Pour accéder à la suite de cette formation, vous devez vous abonner.
previous
summary
resume
next
play
Comment fonctionnent les moteurs de recherche ?
00:00 / 03:40
HD
fullscreen
Je m’abonne
à partir de 16,6 € / mois
  • Visionnage en ligne
  • Accès illimité à toutes nos formations
OU
J'achète uniquement
la formation
69,00€
  • Téléchargement + VOD à vie
  • Accès uniquement à cette formation

Sommaire de la formation

Détails de la formation

Nous allons désormais découvrir comment fonctionnent les moteurs de recherche. À la base, il y a ce que l'on appelle un index. Google ne peut pas aller chercher les informations en temps réel sur le web, son système récupère les pages web pour finalement récréer en quelques sortes un deuxième web tel qu'il est à un instant T. C'est donc dans cette base de données-là que Google va aller rechercher ses résultats. On estime que l'index de Google comporte plusieurs centaines de milliards de pages. Pour maintenir cet index, les moteurs de recherches vont utiliser ce que l'on appelle des robots, spiders ou encore crawlers. À titre d'exemple, celui de Google se nomme Googlebot. Ce robot arrive et li dans un premier temps le code HTML de la page et l'envoyer aux moteurs de recherche. Dans un second temps, il va rechercher les liens à l'intérieur de la page, qu'ils soient internes, c'est-à-dire vers d'autres pages du site ou encore externes, vers d'autres sites. Le crawler continue ainsi sur toutes les pages qu'il rencontre sur son chemin. En quelque sorte, on peut dire que Googlebot clique et suit un lien tout comme un internaute peut le faire. On compare souvent le robot à un internaute fou, qui cliquerait sur tous les liens qu'il rencontre et qui à chaque fois sauvegarderai le code source de la page sur laquelle il arrive. Point important, le spider adapte ses fréquences de visite à la fréquence de mise à jour qu'il constate sur les pages.