comment hacker rankbrain : bien se référencer à l’heure de l’intelligence artificielle

A l’heure du Big Data et de l’intelligence artificielle, Google, il y a deux ans, a déployé Rankbrain pour affiner la pertinence de ses pages de résultats.

Google qui se veut maintenant moteur de réponse, n’a de cesse de faire évoluer les algorithmes de classement de ses pages de résultat : le géant de Mountain View veut rester pertinent sur ses résultats tandis que la communauté SEO veut utiliser son savoir-faire pour « manipuler » ces résultats et favoriser leurs clients.
Rankbrain a été donné comme étant le 3ème critère le plus important pour le référencement naturel de son site, certainement après le netlinking et le contenu. L’algorithme de machine learning a donc une importance majeure pour qui s’intéresse au marketing digital.

Deux ans après, est-il vraiment impossible de dompter Google et son Rankbrain ? Les agences SEO et les pro du référencement sur Google sont ils encore utiles?

Un petit recap’ historique pour bien tout appréhender (il est incomplet mais concentré sur ce qui nous intéresse ici):

  • 1997 : Invention de la notion de Page Rank (Google n’existe pas encore, il s’agit du projet « BlackRub »
  • 1998 : Naissance de Google
  • 2003 : Mise à jour de l’algorithme Esmeralda. Les pages à faible contenu sont déclassées.
  • 2003 : Mise à jour de l’algorithme Florida. Il semble que Google ait intégré l’algorithme de Hilltop conçu par Krishna Bharat.
  • 2004 : Mise à jour de l’algorithme Austin. L’effet Hilltop semble se confirmer avec cette mise à jour. Le « stemming » se développe (la reconnaissance des fautes de frappes).
  • 2004 : Mise à jour de l’algorithme Brandy. Google classe les sites par thèmes. La sémantique prend de l’importance et les liens sortants qui pointent vers un site du même thème augmentent désormais le pagerank des deux sites sur ce thème.
  • 2005 : Mise à jour de l’algorithme, Bourbon. Google met une gifle aux sites sur-optimisés en réponse à la répétition du mot clé pour lequel on voulait positionner sa page. La technique du bourrin, c’est fini !
  • 2007 : Classement des recherches des internautes en fonction des intentions navigationnelles, transactionnelles et informationnelles.
  • 2010 : Données méta et co-occurrences, le champ contextuel de la requête se développe, Google associe Mark Hamill et Luke Skywalker. Les données structurées, « rich-snippets », arrivent sur le moteur, ce qui permet l’affichage de résultats enrichis (nombre d’étoiles par évaluation, prochaines dates de concert, etc.).
  • 2011 : Mise à jour de l’algorithme, Panda. C’est la pénalité pour le contenu dupliqué, le contenu pauvre ou sur-optimisé, mais pour le cloaking également (quand on montre une page au robot de Google qui est différente de ce que l’on montre aux internautes) ou l’abus de liens dans le footer. C’est aussi le début de l’expérience utilisateur et donc le début de l’intégration du Machine Learning .
  • 2012 : Mise à jour de l’algorithme, Pingouin. C’est la mise à jour qui pénalise la manipulation de liens. C’est aussi le lancement Knowledge Graph : Google commence à répondre à nos questions.
  • 2016 : Lancement du « Featured snippet » ou Position zéro, Google se veut moteur de réponse. Lancement de Rank Brain : procédé de machine learning visant à affiner ses résultats en les analysant, en les comprenant !

Avec Rankbrain, Google peut classer les pages en se basant sur des comportements passés pour prédire les intentions futures. Il s’agit de la plus grosse révolution pour les référenceurs depuis Panda car les classements de pages ne se feront plus que sur une panoplie de critères plus ou moins important mais en intégrant l’évolution permanente de l’expérience utilisateur.

L’avenir du SEO sera résolument tourné vers l’UX (User eXperience) ce qui explique l’apparition du SXO (Search Expérience Optimization). Si ce nom ne vous dit rien, je ne peux que vous conseiller la lecture de cet article : Stratégie SEO+UX, l’enjeu en 2016 du SXO

C’est quoi Rankbrain ? Comment ça fonctionne le « deep learning » ?

Rankbrain, évolution de l’algorithme de classement de Google, a été conçu pour « comprendre » les requêtes aussi complexes soient elles afin de proposer des résultats toujours plus pertinents.

Google place l’apprentissage automatique, le  machine learning  au centre de ses recherches afin de développer l’analyse prédictive. L’algorithme de classement est maintenant en mesure de connecter de grandes quantités de données et d’informations afin d’ « apprendre » des requêtes et des choix des internautes.

Le  deep learning  est une des facettes du machine learning . La techno deep learning, basée sur un système de neurones artificiels, est un système profond qui valide ses résultats par plusieurs étapes. Il fonctionne par association de données et peut reconnaître un sujet dans des images, une voix, etc. Par exemple, pour la reconnaissance d’un chat, nous pouvons imaginer que le système va comparer les formes, présence de 4 pattes, une queue, des moustaches, un museau en triangle : c’est un chat !

Rankbrain est capable de créer des liens entre les requêtes des internautes. Ces vecteurs d’intentions entre les différents mots lui permettent d’intégrer des requêtes complexes et d’y répondre au mieux. Google peut donc positionner une page répondant à une requête même si celle-ci ne contient pas ce mot-là. Grâce à ce programme, Google peut comprendre une phrase ou une question qu’il n’a jamais vu, en la comparant à des requêtes déjà traitées avant. Rankbrain gère donc très efficacement les requêtes de longue traine. De plus, en tant que système d’apprentissage automatique, RankBrain apprend également en analysant les comportements des internautes face aux résultats de leur requête. Si un grand nombre d’internautes boude un résultat, l’algorithme le déclassera, il en va de même pour une page d’où les utilisateurs repartent immédiatement pour cliquer sur une autre réponse (pogosticking).

Pour résumer :

  1. Rankbrain collecte des données, les compare et les associe, de ça il trace des vecteurs entre les mots, les images, les données pour « comprendre » quelles sont les intentions derrière la requête.
  2. Rankbrain étudie les effets des résultats qu’il renvoie. Une page à plus de succès ? Une autre attire le clic mais les utilisateurs en sortent rapidement pour cliquer sur un autre lien (« pogosticking ») ? Ces informations lui serviront pour la prochaine requête similaire (on peut ajouter aussi le CTR, le temps passé sur la page, la rapidité d’affichage, bref tout ce qui a attrait à l’expérience utilisateur).

Comment bien se référencer après Rankbrain ?

Les statistiques d’usage

Le taux de rebond et le CTR (Click Through Rate –le nombre de fois où un résultat est choisi par rapport au nombre de fois où il apparaît) sont donc des indicateurs importants pour Google et pour Rankbrain.

  • Afin d’obtenir un taux de rebond faible, optimisez vos pages ! Une page = une idée, un produit ou un service. Ne mélangez pas tout, faites en sorte que les informations que vous délivrez soient visibles, accessibles et compréhensibles, ayez des pages limpides ! Peut être que vous avez des pages qui sont indexées et qui n’apportent rien ou pas grand chose (de plus elles consomment du crawl budget qui pourrait servir à indexer des pages plus pertinentes pour votre activité).
  • La Search Console peut vous aider à y voir plus clair, notamment pour ce qui est des requêtes qui déclenchent les impressions de vos pages. Identifiez les mots clefs, pertinent pour votre activité, qui sont utilisés massivement mais ne vous apportent que peu de clics (Trafic de recherche > Analyse de la recherche sur la Search Console) et travaillez le contenu et le netlinking.
  • Afin de booster votre taux de clic, travaillez la façon dont vos pages sont présentées dans les SERP (Search Engine Response Pages).Pensez à vos meta-descriptions, travaillez les, donnez envie aux internautes de cliquer sur votre résultat. Faites des tests, changez vos meta-desciption et comparez vos CTR, optez bien sûr pour celle qui offre les meilleures statistiques. Vous pouvez travailler vos meta title de la même manière tant que vous ne changez pas d’URL.
  • Vous avez une ou plusieurs page(s) qui ne sont pas permanente(s), comme une page « promotions de noël » ou « soldes d’été », pensez à faire des redirections temporaires afin de ne pas perdre l’autorité de ces pages. Ne les créez pas tous les ans.
  • N’oubliez pas non plus les données structurées ! Faites votre balisage « schema.org », vous pourriez avoir des infos complémentaires associées aux 3 infos de bases (nom, URL, meta description) comme une photo, des avis sous forme d’étoiles, la liste de vos prochains concerts ! Evidemment des résultats enrichis emportent d’avantage de clics.
  • Pour Rankbrain, et plus gobalement pour Google, un site dont les pages se chargent vite est un plus indéniable. De plus, une page trop longue à charger dissuadera pas mal d’internautes.

Le contenu et l’univers sémantique

« Content is king », cette « punchline » de Bill Gates est toujours d’actualité. Vos pages sont d’abord sélectionnées pour apparaître dans les SERP en fonction de votre contenu. Les résultats sont ensuite classés par Google et les autres moteurs de recherche en fonction de plusieurs facteurs plus ou moins importants, comme le nombre et la qualité de vos backlinks (liens pointant vers votre page), mais ce qui déterminera leur sélection avant compétition, ce sont bien les mots utilisés !

Donc oui, créer un contenu inédit (on ne copie pas une autre page), un contenu d’actualité qui est mis à jour, un contenu riche (n’espérez pas la première place avec une page comptant 50 mots), lisible et compréhensible, un contenu intéressant ! Je ne saurai que trop vous conseiller de vous intéresser aux techniques de rédaction et plus particulièrement à la rédaction web. Il faudra veiller à organiser votre contenu en paragraphes, en idées, il faudra captiver vos lecteurs immédiatement mais il faudra également réussir à les garder intéressés jusqu’au bout. Structure de la pyramide inversée ? Story telling ? Faites votre choix, mais gardez vos lecteurs accrochés !

Gardez également en tête l’emploi des mots importants pour votre positionnement. Le TF-IDF (de l’anglais term frequency-inverse document frequency) ou Okapi BM25 sont des méthodes de pondération qui permettent d’évaluer l’importance d’un terme contenu dans un document, relativement à une collection, un corpus ou dans notre cas, parmi les contenus des pages des premiers résultats. Le poids augmente proportionnellement au nombre d’occurrences du mot dans les pages. Il varie également en fonction de la fréquence du mot.

Sur ce point j’aimerai vous présenter deux outils qui vont vous permettre d’enrichir l’univers sémantique de votre texte, de votre page, et donc booster votre référencement.

SEOQuantum est une merveilleuse appli, développée par Anthony Técher (@yannoth et @seo_quantum sur twitter)

Cette solution vous propose :

  • Une aide à la rédaction en vous proposant l’emploi de mots-clefs classés en fonction de la méthode Okapi BM25, soit en fréquence et en indice en fonction d’un mot clef que vous renseignez (il peut s’agir d’un ou de plusieurs mots, vous pouvez travailler vos longues traines de cette façon).
  • Une proposition de clusters pour une organisation en silo de votre site ou une organisation de vos différents paragraphes pour le contenu d’une page.
  • Une réflexion autours de l’intention de l’utilisateur (que cherche l’internautes qui taperait cette requête ?)
  • Une analyse du classement avec le score de performance du contenu, la nature de la page (informationnelle, transactionnelle, commerciale) ainsi que le nombre de mots issu du « wordprint » proposé lors de l’aide à la rédaction et le nombre total de mots recensés sur la page.
  • ·        Un outil d’aide à l’optimisation de votre texte. Il vous suffit de rentrer l’URL de la page concernée par l’optimisation ou de copier/coller le texte voulue pour obtenir un score sémantique global et un score sémantique par phrase afin d’optimiser chacune d’elles sans toutefois sur-optimiser.

Un outil seo ultra complet que je vous recommande vivement.

Comme j’aime bien multiplier les points de vue, je voudrais également vous présenter 1.fr (https://textoptimizer.com pour la version U.S.). Il s’agit également d’une solution d’aide à l’optimisation sémantique de votre contenu mais également sous forme d’extension Chrome et WordPress. Vous rentrez votre mot clef (là aussi vous pouvez bien sûr travailler vos longues traines), l’URL de la page à optimiser ou collez directement votre texte. L’outil vous fournit un score sémantique (qui varie parfois pas mal du score fourni par SEOQuantum d’où l’intérêt de comparer les deux) et des propositions, par ordre d’importance, de mots à inclure dans votre texte. Vous n’obtenez pas de données sur les mots proposés, leur importance étant simplement notifiée par la mise en gras du mot et l’épaisseur du rectangle qui l’entoure. Vous pouvez par contre nuancer vos propositions en éliminant des thématiques que vous ne souhaitez pas développer dans votre texte. Vous obtenez également un score sur la forme de votre contenu (longueur des phrases, diversité du vocabulaire), l’orientation du texte ou de la page (encyclopédique, commerciale, discussion, actualité,..) ainsi que des questions relatives à la requête pouvant donner une idée sur les intentions des utilisateurs.

Ces deux outils SEO peuvent-être d’une aide précieuse pour la rédaction de vos contenus. Néanmoins, ne perdez jamais de vue que, même si vous souhaitez satisfaire aux exigences des moteurs de recherche et plaire à Google, vous vous adressez à des gens ! Lire un texte qui « transpire » l’optimisation de son contenu, qui s’étale sur 1000 mots alors que tout aurait pu être dit en 500, est pénible et fait généralement fuir le visiteur.

Les intentions des utilisateurs.

Comme nous l’avons vu dans la première partie de cet article, Rankbrain permet à Google de comprendre nos requêtes. En fonction du contexte qui nous entoure au moment où l’on cherche, Google essaie d’identifier notre intention réelle. Quand je recherche « brosse à dents électrique », il y a toutes les chances pour que mon souhait soit d’en acheter une. Il parait donc important de répondre à l’intention de l’internaute. Dorénavant, en tant que propriétaire d’un site ou en tant que SEO, nous ne devons plus nous dire « j’ai un produit à vendre, je vais le rendre visible » mais « que veulent les internautes ? Voilà comment je vais leur présenter mon produit. » Travailler ses pages en fonction des intentions des internautes et non en fonction de notre offre est bénéfique tant du point de vue du classement de nos pages dans les SERP que du point de vue de l’utilisateur à qui nous pouvons proposer exactement ce qu’il recherche.

Answer the public est un site qui vous permet de trouver les principales questions et prépositions associées au mot-clef que vous avez renseignez, et ce en 13 langues différentes. Très pratique pour avoir un aperçu des possibles intentions des utilisateurs, de plus vous pouvez exporter vos données en csv.

Ce service vous sera utile tant pour la rédaction, pour vous assurez que vous répondez bien aux questions que se posent les internautes sur votre mot clef et pour atteindre le « featured snippet » ou position 0, que pour l’organisation / maillage interne de votre site en cocon sémantique (à la création ou si vous envisagez une refonte) en créant une arborescence qui réponde aux questions de vos utilisateurs ou, de manière plus large, qui réponde à leur demande.

Pour conclure :

J’espère avoir été le plus exhaustif et le plus clair possible, dans tous les cas, il y a déjà pas mal de réflexion et de stratégie à mettre en place si vous souhaitez améliorer votre référencement, et donc votre visibilité et votre notoriété sur Google et le net. N’hésitez pas à poser des questions si vous en avez, je me ferai une joie d’y répondre. Si vous n’avez pas le temps ou les compétences pour mettre tous mes conseils en pratique, vous pouvez faire appel à mes services de consultant SEO. Merci d’avoir lu jusqu’au bout !

Laisser un commentaire