fbpx
Comment fonctionnent les moteurs de recherche

Comment fonctionnent les moteurs de recherche

Du point de vue de l’utilisateur, les moteurs de recherche sont un miracle des temps modernes. Vous tapez une requête dans une boîte de recherche et, dans la plupart des cas, les résultats du web sont triés et classés en millisecondes. 

Les moteurs de recherche populaires comme Google ont même commencé à répondre à certaines requêtes directement dans les résultats de recherche, ce qui permet de gagner du temps et de réduire le nombre de clics.

Mais comment fonctionnent les moteurs de recherche comme Google?

Qu’est-ce qu’un moteur de recherche ?

Un moteur de recherche se compose de deux éléments principaux : une base de données d’informations et des algorithmes qui calculent les résultats à renvoyer et à classer pour une requête donnée. 

Dans le cas des moteurs de recherche web comme Google, la base de données se compose de milliards de pages web, et les algorithmes prennent en compte des centaines de facteurs pour fournir les résultats les plus pertinents.

Comment fonctionnent les moteurs de recherche ?

Les moteurs de recherche recensent  une liste d’URL connues, qui vont ensuite dans le programmateur. Ce dernier décide du moment où il doit explorer chaque URL. Les pages explorées sont ensuite envoyées à l’analyseur où les informations essentielles sont extraites et indexées. Les liens analysés vont au programmateur, qui donne la priorité à leur exploration et à leur réinterprétation.

Lorsque vous recherchez quelque chose, les moteurs de recherche renvoient les pages correspondantes et les algorithmes les classent par pertinence. 

Voici un diagramme de Google montrant ce processus :

Nous aborderons bientôt les algorithmes de classement. Tout d’abord, nous allons approfondir les mécanismes utilisés pour construire et maintenir un index web afin de nous assurer que nous comprenons leur fonctionnement. Il s’agit de la programmation, de l’exploration, de l’analyse et de l’indexation.

Remarques. Ce processus ne s’applique qu’aux moteurs de recherche sur le web comme Google, Bing et DuckDuckGo. Il existe d’autres types de moteurs de recherche comme Amazon, YouTube et Wikipedia qui n’affichent que les résultats de leur site web.

La programmation

Le programmateur évalue l’importance relative des URL nouvelles et connues. Il décide ensuite quand il faut explorer de nouvelles URL et à quelle fréquence il faut explorer de nouveau des URL connues.

L’exploration

Le crawler (ou explorateur) est un programme informatique qui télécharge des pages web. Les moteurs de recherche découvrent de nouveaux contenus en remontant régulièrement les pages connues où de nouveaux liens sont souvent ajoutés au fil du temps.

Par exemple, chaque fois que je publie un nouvel article de blog, il est poussé en haut de la page d’accueil de mon blog, où se trouve un lien.

Lorsqu’un moteur de recherche comme Google revoit cette page, il télécharge le contenu de la page avec les liens récemment ajoutés.

Le crawler transmet ensuite la page web téléchargée à l’analyseur.

Remarque. L’exploration (Crawling) ne consiste pas à « suivre » les liens d’une page à l’autre, comme beaucoup de gens le croient. 

L’analyse

L’analyseur extrait les liens de la page, ainsi que d’autres informations clés. Il envoie ensuite les URL extraites à l’ordonnanceur et les données extraites pour l’indexation.

Indexation

L’indexation consiste à ajouter les informations analysées des pages explorées à une base de données appelée index de recherche. Il s’agit d’une bibliothèque numérique d’informations sur des milliards de pages web.

Qu’est-ce qu’un algorithme de moteur de recherche ? 

La découverte et l’indexation du contenu ne sont que la première partie du puzzle. Les moteurs de recherche ont également besoin d’un moyen de classer les résultats correspondants lorsqu’un utilisateur effectue une recherche. C’est le travail des algorithmes des moteurs de recherche. 

Chaque moteur de recherche a ses propres algorithmes pour classer les pages web. Mais comme Google est de loin le moteur de recherche le plus utilisé (du moins dans le monde occidental), c’est celui sur lequel nous allons nous concentrer dans la suite de cet article.

Comment fonctionne Google ?

Google fonctionne à peu près de la même manière que celle décrite ci-dessus. Il parcourt le web et indexe le contenu qu’il trouve. Ensuite, lorsque vous recherchez quelque chose, il trouve les résultats correspondants et les classe par algorithme en fonction de leur pertinence en une fraction de seconde.

h2lL9gD p6NljWDAo3lEpGfkNbX4zhm8qUDVme gYEMZD3FO 67z61N5EgKtnlXO8ovCD5ez wRMpeWmde6j5Rhz2htRj5mwN 1GLvmDbQ1iiPRHIfQzQR1A7u8ce5 joK8Vu7sr

Si Google fonctionne si bien comme moteur de recherche, c’est pour trois raisons : 

Premièrement, il explore et ré-analyse le web à une plus grande échelle que n’importe qui d’autre. Cela leur a permis de créer et de maintenir l’index le plus important et le plus récent de la planète.

Deuxièmement, ils ont beaucoup investi dans des modèles linguistiques qui leur permettent de comprendre le vrai sens des requêtes, même les plus obscures ou incorrectes. 

Par exemple, ils comprennent que si vous cherchez « restora senegalais », vous voulez dire « restaurant sénégalais ».

oEX5aktr3Z3RysZv jn64yUd6iX4JuvJCpAKTCdLg DdoDHpvcJsjutTg2rVyLIopTMYO2DeamSLXqLLDfjr2n5tXyRFIGQ54f1bbQZMtbsuZ2NhLpN721Qf0krhzDvNPQoMIKsH

Au-delà de cela, ils comprennent aussi les synonymes. 

C’est pourquoi, lorsque vous cherchez « comment gagner de l’argent en ligne », vous voyez dans les résultats des synonymes en gras comme « internet » et « encaisser ».

Ils sont si bons que certains résultats de recherche ne mentionnent même pas la requête de recherche exacte.

Troisièmement, et c’est le point le plus important, leurs algorithmes de classement renvoient sans doute les résultats les plus pertinents de tous les moteurs de recherche

Comment fonctionnent les algorithmes de recherche de Google

Google examine des centaines de facteurs pour trouver et classer les contenus pertinents. Personne ne sait ce que sont tous ces facteurs, mais nous connaissons les plus importants. 

Examinons quelques-uns d’entre eux. 

La Pertinence thématique

Google affirme que lorsqu’une page web contient les mêmes mots clés que la requête de recherche, en particulier à des endroits bien visibles comme les titres, c’est un signe de pertinence. 

Mais cette idée n’est pas infaillible, c’est pourquoi Google recherche également la présence d’autres mots pertinents sur la page.

Voici comment Google l’explique :

Imaginez : lorsque vous recherchez « chiens », vous ne voulez probablement pas que le mot « chiens » apparaisse des centaines de fois sur une page. C’est pourquoi les algorithmes déterminent si une page contient d’autres contenus pertinents que le mot-clé « chiens », comme des photos de chiens, des vidéos ou même une liste de races.

Pour donner un autre exemple, disons que vous avez un article sur « comment obtenir un permis de conduire ». Il devrait probablement comporter des sous-sections sur le permis de conduire pour les voitures, les motos et les bus, et mentionner des mots et des expressions comme « route », « conduite », « permis », « examen », « sécurité » et « permis de conduire à part entière ».

La présence de mots et d’expressions connexes comme ceux-ci contribue probablement à renforcer la confiance de Google dans le fait que votre page est à peu près ce qu’elle dit être. 

Pour donner un autre exemple, imaginez que vous vouliez créer une liste des meilleurs acteurs. 

Regardez les résultats de la première page, et vous remarquerez quelque chose d’intéressant : ils mentionnent presque tous des personnes comme Robert De Niro, Jack Nicholson et Meryl Streep.

La mention de ces personnes, ou termes, sur votre page peut contribuer à renforcer la confiance de Google dans la pertinence de la page pour des requêtes telles que « meilleurs acteurs ».

L’intention de recherche

Google sait que les gens effectuent des recherches pour une raison, et que la compréhension de cette raison les aide à obtenir de meilleurs résultats de recherche et à créer des utilisateurs plus satisfaits. 

En d’autres termes, ils travaillent dur pour classer les contenus que les utilisateurs s’attendent à voir.

C’est pourquoi les meilleurs résultats pour « Deballage Iphone X » sont des vidéos…

j6EupARDsqheVnklloYbjlciiwfo0Hn4 qIo8a N4TqZHQhgM5g33KhE8wslVRqhHKBq0sC0tL4gdIANB60zX44XGsX weV0jcAH605PEWr6 F 6Mkr4lNfCezYLn43HDLLYvmU

… tandis que les résultats pour « Boite iPhone X » sont des images et des listes de produits :

cnqS02Pz802h05BotXQriclIzNiK ODlmGSFVW3NMoxW8TbKjrxv0zxUFrqBXin8KYuqbbH5WMxP tEj RJGuREcI xO0ZrJCps TGfF fQd4gDcNHnHg0Pp49lAnOJ OWrzhckC

Google comprend que malgré l’utilisation d’un langage similaire, l’intention derrière ces recherches est entièrement différente. Ils s’efforcent de fournir des résultats correspondant au style de contenu, au type de contenu, au format de contenu et à l’angle de contenu que les utilisateurs souhaitent voir.

C’est ce que l’on appelle les 4 C de l’intention de recherche. 

Le style de contenu

Le style du contenu peut être divisé en trois catégories : vidéos, images et contenu textuel.

Pour la plupart des requêtes, le style de contenu dominant et le plus souhaitable dans les résultats est assez clair. Pour d’autres, comme les « roses roses », Google comprend que l’intention est mixte et présente plusieurs styles de contenu. 

wdJRiAYqYKDX NGWaj6clJ33c7nczuV40hZF 5BsIpQIyrWseIBKSRLSqZT0PY8ruaSDQCRE618zXSzoqpUWrODrSZKbODjv3CXlvGm8LpUHyLmOH7IEAVMZpQKNcDA1gWb0uYtA

Le type de contenu

Le type de contenu est généralement classé en quatre catégories : articles de blog, produits, catégories et pages d’accueil.

Par exemple, tous les résultats de « comment démarrer un blog » sont des articles de blog.

UNiT4P6FpWSqrSsBzDPubxLkF6jBLGiH6K9UVdwmVKpqHO 98XOX98n7dBlYAlMvROZy812tcpD livo42tGDmsr4qaVM 1Va9osAODpe1d0rHG2jV 6YKPVEhHOsFbRnVRWdGrl

Le format du contenu

Le format du contenu s’applique principalement aux articles de blog, aux vidéos et aux pages de destination. Pour les articles de blog, les styles les plus courants sont « comment faire », les articles de liste, les tutoriels, les articles d’opinion et les articles de nouvelles. 

La majorité  des résultats pour les « conseils de blog » sont des articles de liste.

dqUFJjOCACITKX0Nt9257wFfAoqCMGrlHNbLMvf2ANLQgpOgW7GTPFfko8YZDIF2zO3scKD7q32wOv4pZX0G7Rglj4o XufXrDEkBo CoakrRwQ9b2EPhPwMq1iWIoXb arWm 5q

L’ angle du contenu

L’angle du contenu fait référence au principal argument de vente du contenu. Pour la plupart des requêtes, il y a un angle dominant dans les résultats de la recherche. 

Par exemple, la plupart des résultats les mieux classés pour les « conseils de blogging » sont axés sur les débutants. 

La fraîcheur

Google sait que la fraîcheur des résultats est plus importante pour certaines recherches que pour d’autres. 

Par exemple, une requête telle que « Quoi de neuf sur Netflix » nécessite des résultats très frais car les chercheurs veulent connaître les films et les émissions de télévision qui ont été récemment ajoutés à la plateforme de diffusion vidéo. Par conséquent, Google donne la priorité aux résultats de recherche qui ont été publiés ou mis à jour très récemment.

eOm WhkhRNwEy67Bf0JhQUmsDUcwzWJ5XwmH8qISD9RJa48jNKcC1pUDEy  lFA08d7ZhcMYE6TyrVtU8fKqLLPdUAFyFwWMcJi34xQ

Pour des questions comme « meilleur casque », la fraîcheur compte toujours – mais pas autant. En d’autres termes, il est peu probable qu’une liste datant de 2015 soit d’une grande utilité, car la technologie des casques d’écoute évolue rapidement. Elle n’évolue pas si vite qu’un article publié le mois dernier n’est plus utile. 

Google le sait et affiche les résultats qui ont été mis à jour ou publiés au cours des derniers mois. 

Il y a aussi des questions pour lesquelles la fraîcheur des résultats n’est généralement pas pertinente, comme « comment nouer une cravate ». Rien n’a changé dans ce processus depuis des décennies (ou est-ce le cas ?), donc peu importe que les résultats de la recherche datent d’hier ou de 1998. Google le sait et n’hésite pas à classer un résultat de 2013 en position n°2

La qualité du contenu

Google veut classer les contenus de haute qualité au-dessus des contenus de basse qualité. Le problème est que la qualité du contenu est objectivement délicate à cerner, c’est pourquoi Google s’est penché sur un projet appelé E-A-T pour tenter de le faire. 

Que signifie E-A-T ?

Expertise ;

L’autorité ; et :

Confiance

Voici en quelques mots comment fonctionne l’E-A-T :

Disons que vous cherchez « comment écrire une chanson ». Si vous avez le choix, vous préférerez certainement lire quelque chose de Beyonce plutôt que de moi. Pourquoi ? Parce que Beyonce est une experte en écriture de chansons et une figure d’autorité à qui vous faites confiance pour vous donner des conseils utiles sur le sujet. 

Maintenant, si l’E-A-T est important pour toutes les recherches, il est crucial pour ce que Google aime appeler les recherches YMYL ou Your Money or Your Life. 

Selon Google, les requêtes YMYL sont celles qui pourraient avoir un impact sur le bonheur, la santé, la stabilité financière ou la sécurité d’une personne. 

Par exemple, prenez une requête comme « dose sûre d’ibuprofène ? 

Dans ce cas, le fait de renvoyer des résultats qui ne démontrent pas une E-A-T pourrait avoir des conséquences mortelles. Si une page est inexacte, elle ne doit pas apparaître dans les résultats de la recherche, même si elle est « pertinente » sur le plan thématique. 

Cela dit, le contenu lui-même n’est pas la seule chose qui influence l’E-A-T. Des éléments comme les backlinks pointant vers la page ont également leur importance.

Considérez les backlinks comme des votes provenant d’autres sites web. Lorsqu’une personne crée un lien vers une page, elle se porte garante de ce contenu et le recommande à ses lecteurs. 

C’est probablement la raison pour laquelle la plupart des études à grande échelle montrent une corrélation claire entre les backlinks et les classements

Cela dit, il est important de noter que tous les backlinks ne sont pas créés égaux. La pertinence et l’autorité du site web et de la page web de liaison sont également importantes. 

Par exemple, disons que vous avez un article sur la création d’une entreprise. Google accordera plus de poids à un backlink provenant du guide d’un site de l’administration qu’à un lien similaire provenant d’un article sur le site de blog de votre ami sur ce qu’il a fait le week-end dernier. 

L’utilisabilité

Google veut classer les pages web qui rendent ses utilisateurs heureux, et cela va au-delà du simple fait de renvoyer des résultats pertinents. Le contenu doit également être accessible et facile à consommer.

Il existe plusieurs facteurs de classement confirmés qui y contribuent.

Vitesse de la page

Personne n’aime attendre que les pages se chargent, et Google le sait. C’est pourquoi il a fait de la vitesse des pages un facteur de classement pour les recherches sur ordinateur en 2010, puis pour les recherches mobiles en 2018.

Compatibilité mobile

65 % des recherches sur Google s’effectuent sur des appareils mobiles, ce qui explique pourquoi la compatibilité avec des téléphones mobiles est un facteur de classement pour les recherches mobiles à partir de 2015.

Et, depuis juillet 2019, la compatibilité mobile est également un facteur de classement pour les recherches sur le bureau grâce au passage de Google à l’indexation « mobile-first ». Cela signifie que Google « utilise principalement la version mobile du contenu pour l’indexation et le classement » sur tous les appareils.

Personnalisation

Google indique que des informations telles que votre localisation, votre historique de recherche et vos paramètres de recherche  aident à adapter les résultats à ce qui est le plus utile et le plus pertinent pour vous à ce moment-là.

Par exemple, une recherche sur le « meilleur restaurant sénégalais » utilise votre position pour obtenir des résultats locaux, même en dehors des cartes.

CjLB4iQ933IfCFVGlL8uia7Kdeexz8BLuHVykSw Kx7AmE3TSXcb6LM3OyA03O6WyAUHv jD18VB

Cela se produit parce que Google sait que vous n’allez pas vous rendre à l’autre bout du monde pour déjeuner. 

C’est une histoire similaire pour une requête comme « acheter une maison ». Google renvoie des pages avec des listes locales plutôt que nationales car il y a de fortes chances que vous ne cherchiez pas à vous installer dans un autre pays.

La langue est un autre facteur important. Après tout, il ne sert à rien de montrer les résultats en anglais aux utilisateurs français. 

Pourquoi devriez-vous vous soucier du fonctionnement de Google ?

Savoir comment Google trouve et classe le contenu améliore votre capacité à créer des pages qui apparaissent dans les résultats de recherche. Si vous y allez à l’aveuglette sans comprendre les valeurs de Google, ni même la façon dont il découvre le contenu, vos chances de classement sont minces, voire nulles. 

Faire des efforts pour être mieux classé dans Google est connu sous le nom d’optimisation pour les moteurs de recherche (SEO).

Le SEO est une priorité pour de nombreuses entreprises car : 

  • Le trafic est « gratuit »
  • Le trafic est constant mois après mois (tant que vous pouvez maintenir votre classement) ; 
  • Dans certains cas, il permet d’atteindre un large public.

Conclusions

De nombreuses personnes étudient les algorithmes des moteurs de recherche, en cherchant continuellement les failles qui leur permettent de se classer avec une relative facilité. Bien que cela fonctionne parfois pendant un court moment, cela fonctionne rarement à long terme et peut même entraîner une redoutable pénalité de Google.

La clé d’un classement à long terme est de se concentrer sur la création d’un contenu qui fournit les meilleures informations pour le mot-clé cible et la meilleure expérience utilisateur. 

En d’autres termes, il faut créer du contenu principalement pour les utilisateurs, et non pour les moteurs de recherche. 

Vous avez des questions ? Faites-le moi savoir dans les commentaires ou sur Twitter.

Retour haut de page

S'abonner à ma newsletter

Des conseils en SEO et de stratégies marketing livrées directement dans votre boîte de réception 2x par semaine
1 Share
Share via
Copy link
Powered by Social Snap