Google utilise une technologie de Machine Learning qu’on appelle RankBrain pour aider à fournir ses résultats de recherche

Il y a peu, on a appris que Google utilisait une technologie de Machine Learning doté d’une intelligence artificielle qui s’appelle RankBrain, cette technologie permet à Google de trier de façon pertinente ses résultats de recherche. Vous vous demandez comment cela fonctionne et s’ajuste avec le système de classement général de Google?

Les informations que vous êtes sur le point de lire sont issues de plusieurs sources différentes. Tout d’abord du site Internet « Bloomberg Story », ensuite des informations dévoilées par Google au site web « Search Engine Land » et pour finir la réflexion de ce même site sur le sujet.

google

Le logo que tout le monde connait.

Qu’est-ce que RankBrain ?

RankBrain est le nom donné par Google à cette technologie de Machine Learning utilisée pour aider à traiter ses résultats de recherche, comme cela a été rapporté par Bloomberg et confirmé par Google.

Qu’est-ce qu’une technologie de Machine Learning ?

Machine Learning est un ordinateur qui apprend automatiquement comment faire quelque chose, plutôt que de suivre un enseignement humain ou un programme détaillé.

Qu’est-ce que l’intelligence artificielle ?

On parle de véritable intelligence artificielle quand un ordinateur peut-être aussi intelligent qu’un être humain, au moins dans le sens de l’acquisition de connaissances. À la fois par l’enseignement mais aussi en construisant par ce qu’il sait déjà et en créant de nouvelles connexions.

En quoi l’intelligence artificielle est-elle différente de la technologie de Machine Learning ? En termes de RankBrain, elles nous paraissent relativement similaires.

Donc, RankBrain est la nouvelle façon pour Google de classer ses résultats de recherches ?

Non. RankBrain est une partie de l’algorithme du classement général de Google, c’est un programme informatique qui est utilisé pour trier les milliards de pages que Google connait, pour afficher les résultats les plus pertinents aux requêtes des internautes.

Comment s’appelle l’algorithme du classement général de Google ?

Il s’appelle Hummingbird depuis 2013.

Donc, RankBrain fait partie de l’algorithme général Hummingbird de Google ?

C’est ce que l’on comprend. Hummingbird est l’algorithme de recherche global, que l’on peut comparer au moteur d’une voiture. Le moteur peut être fait de différentes pièces, comme un filtre à huile, une pompe à carburant, un radiateur etc… De la même manière, Hummingbird est composé de différents composants, dont le plus récent est RankBrain.

Cependant, l’article de Bloomberg montre clairement que RankBrain ne contrôle pas toutes les recherches, ce que seul l’algorithme général peut faire.

Hummingbird contient également d’autres composants dont les noms seront familiers à ceux qui sont dans le monde du SEO, comme Panda, Penguin et Payday conçus pour lutter contre le spam, Pigeon destiné à améliorer les résultats locaux, Top Heavy conçu pour rétrograder les pages contenant trop de publicités, Mobile Friendly dont le but est de récompenser les pages responsives et Pirate conçu pour lutter contre la violation du droit d’auteur et bien d’autres.

Je pensais que l’algorithme général de Google s’appelait « PageRank ».

PageRank est une partie de l’algorithme général Hummingbird qui donne du crédit d’une manière spécifique à des pages en se basant sur les liens qui proviennent d’autres pages.

PageRank est spécial car c’est le premier nom qui a été donné par Google à une des parties de son algorithme de classement, au moment où le moteur de recherche a été créé en 1998.

Qu’en est-il des « signaux » qu’utilise Google pour le classement ?

Les signaux sont les instruments qu’utilise Google pour aider à déterminer comment classer les pages web. Par exemple, il va lire les mots inscrits dans une page web, donc, les mots sont des signaux. Si certains mots sont en gras, ce sera peut-être un autre signal pour Google. Les calculs utilisés dans le cadre de PageRank donnent à une page un score de PageRank, qui est utilisé comme un signal. Si une page est considérée comme responsive, un autre signal sera comptabilisé.

Tous ces signaux seront traités par les différents éléments qui composent l’algorithme Hummingbird pour comprendre quelles pages seront affichées en réponse aux diverses recherches.

Combien de signaux existent ?

Google a toujours dit avoir plus de 200 principaux signaux de classement, ces signaux pourraient avoir jusqu’à 10 000 variations ou sous-signaux. En général, Google dit des « centaines » de facteurs pour brouiller les pistes comme cela a été dit dans l’article de Bloomberg.

Et RankBrain est le troisième plus important signal ?

C’est juste. Sorti de nulle part, ce nouveau système est devenu, d’après ce que dit Google, le troisième facteur le plus important quant au classement des pages web. Ce qu’en dit l’article de Bloomberg :

RankBrain est un des signaux parmi les « centaines » de signaux qui entrent en compte dans l’algorithme qui détermine quels résultats apparaissent sur une page de recherche Google et où ils sont placés. Pendant les quelques mois où il a été déployé, RankBrain est devenu le troisième signal le plus important contribuant aux résultats qui s’affichent après la requête d’un internaute.

Quels sont les deux facteurs les plus importants ?

Google ne dira pas quels sont les deux premiers facteurs qui sont les plus importants.

C’est embêtant et sans doute un peu trompeur de la part de Google de ne pas dire quels sont les deux premiers.

Mais, pour réellement évaluer cette percée, il est utile de connaitre les autres facteurs importants qu’utilise Google maintenant, et aussi ce qui a été placé derrière RankBrain. C’est pour cette raison que Google devrait rendre des comptes.

À ce propos, certains pensent que les liens restent le signal le plus important, les liens sont comptabilisés par Google comme des « votes ».

Concernant le deuxième signal le plus important, la plupart pensent que ce sont les « mots ».

Que fait exactement RankBrain ?

On pense que RankBrain est principalement utilisé comme un moyen d’interpréter les recherches que les internautes soumettent pour trouver des pages web qui n’ont pas forcément les mêmes mots utilisés pour la recherche.

Est-ce que Google disposait d’un moyen de trouver des pages au-delà de la requête ?

Oui, Google trouvait des pages au-delà des termes exacts qui étaient utilisés par un internaute depuis bien longtemps. Par exemple, il y a des années, si vous aviez inscrit quelque chose comme « chaussure », Google pouvait ne pas trouver les pages où il était écrit « chaussures » car techniquement, ce sont deux mots différents. Cependant, les « mots clés exacts » ont permis à Google de devenir plus intelligent, de comprendre que « chaussures » est une variation de « chaussure » comme « lire » est une variation de « livre ».

Qu’en est-il du Knowledge Graph ?

Le Knowledge Graph, lancé en 2012, était une façon pour Google de devenir encore plus intelligent quant à la connexion entre les mots.

Le Knowledge Graph est une base de données de faits, à propos d’informations dans le monde et des relations entre eux. C’est pour cela que si vous cherchez quelque chose comme « Quand est née la femme d’Obama », vous allez avoir des réponses concernant Michelle Obama, même si vous n’utilisez pas son prénom.

Comment RankBrain aide à approfondir les requêtes ?

Les méthodes déjà utilisées par Google pour affiner les requêtes, reviennent généralement au travail d’un humain, en ayant créé des listes de synonymes ou des bases de données reliant des informations les unes aux autres. Bien sûr, une certaine automatisation est impliquée, cependant, cela dépend majoritairement du travail d’un humain.

Le problème est que Google traite 3 milliards de recherches par jour. En 2007, Google a dit que 20 à 25% de ses recherches n’avaient jamais été demandées auparavant. En 2013, ce chiffre a baissé à 15%, il a encore été utilisé dans l’article de Bloomberg, ce qui a été confirmé par Google. Mais 15% de 3 milliards est toujours un très grand nombre de recherches n’ayant jamais été effectuées par un internaute. Cela revient à 450 millions de nouvelles recherches par jour.

Parmi celles-ci, il peut y avoir des recherches complexes étant composées de plusieurs mots. RankBrain est conçu pour aider à mieux interpréter ses requêtes et d’y répondre de façon pertinente, son but étant de trouver les meilleures pages pour l’internaute.

Un exemple ?

Google a donné un exemple qui ne concerne malheureusement que les anglophones.

« How many tablespoons in a cup? ». Google dit qu’il fait une distinction entre la tasse américaine et la tasse australienne, car il y a une différence quantitative. Ainsi, si vous utilisez Google.com, il y aura une différence avec Google Australie.

Est-ce que RankBrain aide vraiment ?

La plupart des personnes pensent que RankBrain fait clairement une très grande différence et a un impact énorme, comme le clame Google. La société est assez conservatrice et ne dévoile que peu ce qu’il se passe dans son algorithme. Google pratique de petits tests tout le temps. Mais la compagnie ne lance de grands changements que lorsqu’elle est extrêmement sûre d’elle.

Quand a commencé RankBrain ?

Google a dit qu’il y avait eu un lancement progressif de RankBrain début 2015, cela fait quelques mois maintenant qu’il est entièrement et mondialement déployé.

Quelles requêtes sont touchées ?

Google a dit à Bloomberg qu’une grande partie des requêtes est traitée par RankBrain.

Est-ce que RankBrain apprend sans cesse ?

Tout ce qu’apprend RankBrain se fait hors-ligne, dit Google. Des lots d’historiques de recherches lui sont donnés pour qu’il apprenne à faire des prédictions.

Ses prédictions sont testées et si elles s’avèrent exactes, alors la dernière version de RankBrain voit le jour. Puis, le cycle d’apprentissage hors-ligne et les tests sont répétés.

Est-ce que RankBrain fait plus que de l’affinement de requête ?

En règle générale, la façon dont une requête est affinée (que ce soit par l’expression exacte, les synonymes ou maintenant RankBrain) n’est pas considérée comme un facteur ou un signal de classement.

Les signaux sont, le plus souvent, des facteurs qui sont liés au contenu, comme par exemple les mots présents sur une page, les backlinks, ou encore le fait qu’un site web soit sur un serveur sécurisé ou non etc… Ils peuvent également être liés à l’utilisateur, selon où il est localisé, ses recherches et son historique de recherches.

Donc, quand Google parle de RankBrain comme étant le troisième signal le plus important, est-ce qu’il veut vraiment dire en tant que signal de classement ? Oui, Google a confirmé qu’il y avait une composante de RankBrain qui contribuait directement à savoir où se place une page dans le classement.

Article traduit et inspiré de http://searchengineland.com/faq-all-about-the-new-google-rankbrain-algorithm-234440

Comment utiliser «Google Trends» pour améliorer votre référencement ?

Pour continuer à grandir et à prospérer, il est essentiel pour une société d’être en évolution permanente. Se tenir au courant de l’actualité dans son domaine d’activité, analyser et décrypter les tendances (« trends » en anglais), qu’elles soient locales, nichées ou...

Google Search Console : analysez et optimisez facilement vos performances SEO

Pour mesurer vos performances SEO et optimiser le référencement de votre site Internet, la Search Console de Google est un outil indispensable. Découvrez notre “guide ultime” sur le sujet.

SEMrush : analyse des fonctionnalités SEO, SEA, Contenu

SEMrush, ses fonctionnalités décortiquées Que vous gériez un ou plusieurs sites, il devient de plus en plus complexe au fil des années de se démarquer et d'obtenir du trafic. Pour vous y aider, il apparaît essentiel d'utiliser des outils efficaces et complets tel que...

Analysez vos textes, optimisez le champ lexical et sémantique avec 1.fr

A l’heure actuelle, le référencement se présente plus que jamais comme un levier indispensable à travailler pour augmenter la notoriété, le trafic et les conversions de votre site. Si nous savons depuis de nombreuses années que les backlinks et les optimisations...

1 Commentaire

  1. Je trouve que ce n’est pas très raisonnable, voire étrange de la part de Google de ne pas révéler les deux premiers facteurs, sur lesquels les référenceurs doivent se baser.