15 janvier 2020 /Temps de lecture : 7 minutes / ecrit par Camille
Google Bert : une révolution dans le monde du Search ?
Annoncée par Google comme étant la mise à jour la plus importante du Search depuis 5 ans, BERT, pour Bidirectional Encoder Representations from Transformers, a été conçue afin d’améliorer les capacités de compréhension des requêtes faites par les internautes par le moteur de recherche. Il nous semble important d’analyser en quoi consiste cette mise à jour, ce qu’elle changera dans les SERPs, mais également si des optimisations SEO sont possibles dans l’attente de son déploiement en France.
[UPDATE DU 10/12/2019] Google a annoncé le déploiement de la mise à jour BERT dans plus de 70 langues différentes, dont le français notamment, à partir du lundi 9 décembre. Il va donc falloir s’attendre à une probable variation dans les résultats de recherches, surtout sur les requêtes qui auront le plus à profiter de l’utilisation de BERT par Google. Comme mentionné dans l’article, nous vous rappelons qu’il n’est pas possible d’optimiser son site web pour BERT, cette mise à jour se concentrant essentiellement sur l’intention des utilisateurs et la compréhension de leurs requêtes.
C’est quoi Google BERT ?
BERT est une mise à jour de l’algorithme de recherche de Google qui se base sur le machine learning afin de mieux comprendre le langage naturel (NLP) utilisé par ses utilisateurs. En effet, les internautes ont aujourd’hui pour habitude de rechercher des informations sur Google en utilisant des mots-clés plutôt que des questions rédigées dans un langage naturel, puisque le moteur de recherche propose parfois des résultats peu pertinents s’il ne comprend pas le sens de la question.
C’est cette habitude qui est dans le viseur de Google par le biais de cette mise à jour de son algorithme. BERT a pour principal objectif de comprendre l’intention précise d’une requête tapée par un utilisateur, en s’intéressant au lien qui peut exister entre les différents mots. Basé sur des efforts titanesques en termes de machine learning, cet algorithme existe en réalité depuis 2018, diffusé par Google en open source sur Git Hub.
Il a d’abord été entraîné sur Wikipedia afin de pouvoir en améliorer les capacités et le tester, avant d’être intégré au moteur de recherche. Cet algorithme est bidirectionnel car il utilise une méthode consistant à regarder les mots qui sont avant mais aussi après chaque entité constituant une requête. Un objectif final : décrypter le langage naturel afin de donner du sens aux phrases qui sont lues.
Pour pouvoir utiliser cet algorithme dans les meilleures conditions, Google a par ailleurs dû s’affranchir des limitations que pouvait lui imposer le hardware classique, en créant son propre matériel. C’est ainsi que toutes les opérations de machine learning sont effectuées sur des TPU (Tensor Processing Units), qui sont des suites de circuits intégrés conçus par Google pour supporter des opérations très lourdes.
Annoncé être utilisé par Google le 25 octobre 2019, BERT ne serait aujourd’hui déployé que sur les requêtes faites aux USA, en particulier pour 10% de celles-ci. Cette mise à jour ne doit donc théoriquement pas impacter l’ensemble des requêtes qui peuvent être faites sur le moteur de recherche, mais uniquement celles qui pourraient voir leur résultats améliorés. Pour démontrer l’impact de la mise à jour BERT, Google a publié les exemples suivants :
- Pour la requête ci-dessous, Google affichait auparavant un article de journal sur les voyageurs américains voulant se rendre au Brésil, ce qui n’avait rien à voir avec la requête qui était faite. Avec BERT, le moteur de recherche comprend l’intention de l’utilisateur et propose alors des informations officielles disponibles sur un site du gouvernement américain pour aider les voyageurs brésiliens.
- Ce nouvel exemple ci-dessous permet aussi d’identifier l’amélioration des capacités de Google. Auparavant, le moteur de recherche n’aurait pas compris le sens de la phrase recherchée, proposant un article expliquant la manière d’avoir une ordonnance médicale. Avec BERT, le premier résultat est encore une fois plus pertinent, avec une page tirée d’un site officiel répondant précisément à la question posée.
Ainsi, il est clair que l’évolution du moteur de recherche se situe notamment sur sa manière d’interpréter les prépositions utilisées dans les requêtes qui lui sont faites. Que ce soit “to” dans le premier exemple, ou bien “for” dans le second, BERT permet à Google d’utiliser ces expressions afin de pouvoir déterminer la véritable intention de l’utilisateur. Ces “stop words”sont habituellement peu utilisés dans les requêtes des internautes, ce qui implique que les résultats sans BERT sont pour l’instant rarement pertinents.
Plutôt que de se concentrer sur les mots-clés pris de manière indépendante, BERT donne à Google les capacités nécessaires pour pouvoir déterminer le sens précis d’une requête, afin de pouvoir proposer des SERPs de meilleur qualité. Les résultats naturels ne sont pas les seuls à être impactés par BERT, puisque les featured snippets pourront eux aussi se baser sur cet algorithme pour afficher des informations plus en rapport avec les requêtes tapées par les internautes.
À cela s’ajoute le fait que l’un des objectifs de cette mise à jour est de pouvoir mieux répondre aux nombreuses nouvelles requêtes qu’enregistre Google chaque jour, certaines pouvant être très originales. Comme l’indiquait Google en 2017 d’ailleurs, 15% des requêtes qui lui sont faites sont totalement nouvelles et n’avaient jamais été faites auparavant.
Des optimisations pour Google BERT sont-elles envisageables ?
Selon Google, il est impossible d’optimiser son site web pour l’arrivée de la mise à jour BERT. L’algorithme n’impactant pas un type de mot-clé précis mais plutôt la manière qu’a le moteur de recherche de comprendre les textes qu’il rencontre, il paraît très difficile de trouver un levier d’optimisation pour que ses contenus soient plus visibles sur des requêtes conversationnelles.
Il faudra ainsi attendre le déploiement de BERT sur les requêtes en langue française pour voir quel sera son impact sur les SERPs. Il est toutefois évident que cette mise à jour a pour but d’apporter des réponses plus pertinentes aux internautes qui se posent des questions parfois complexes. Ainsi, il semblerait logique que les pages contenant des contenus très minces, ou qui n’apportent rien à l’utilisateur, ne seront pas celles qui bénéficieront le plus de BERT en termes de référencement naturel. Il est toujours capital de créer des contenus qui seront les plus utiles possibles pour les internautes qui cherchent des informations sur les moteurs de recherche.
Des sites très spécialisés qui ne bénéficiaient jusqu’alors de peu de visibilité sur le moteur de recherche pourrait éventuellement tirer un avantage de cette mise à jour, grâce à une meilleure compréhension de requêtes parfois exotiques, voire farfelues. De plus, le fait de pouvoir mieux comprendre les nouvelles requêtes qui sont tapées par les internautes permettra peut-être à Google de donner une chance à de nouveaux sites web, ce qui permettrait de faire naître plus de diversité dans les SERPs.
On ne sait pas encore quand sera déployé BERT en France. La date de sa sortie sera notamment conditionnée par la réussite des tests faits actuellement sur les requêtes américaines qui en bénéficient déjà. Ce qui est sûr, c’est que qu’elle ne touchera qu’environ 10% des requêtes faites, de nombreux sites auront beaucoup à gagner grâce à cette mise à jour.
Que faut-il en retenir ?
Pour conclure, la mise à jour BERT de Google est très impressionnante d’un point de vue technique, mettant en oeuvre un grand savoir-faire en termes de machine learning, mais aussi d’infrastructure.
Cette mise à jour va vraiment révolutionner la manière dont le moteur de recherche réagit à certaines requêtes qui lui seront faites. Bien qu’elle ne touche pour l’instant qu’une partie restreinte des requêtes, nous pouvons toutefois nous demander si cet algorithme ne sera pas utilisé sur une proportion de plus en plus importante de requêtes, à force d’entraînement.
Du point de vue du référencement naturel, aucune optimisation ne semble à ce jour possible pour se préparer à l’arrivée de BERT, néanmoins, le but étant de mieux répondre aux internautes, il reste important d’apporter un grand soin à la qualité de ses contenus.
Enfin, la recherche vocale est elle aussi clairement la cible de cette mise à jour, les requêtes qui sont faites par le biais d’assistants virtuels étant bien évidemment le plus souvent formulées en langage naturel par les utilisateurs. Un point qu’il sera évidemment important de suivre pour les sites constatant des forts volumes de recherches vocales sur leur secteur d’activité.