Google est le moteur de recherche de référence, que ce soit pour les internautes ou pour les professionnels du SEO. Au fil des mises-à-jour de Google, certaines règles ont changé, des améliorations ont été introduites, et les propriétaires de sites de tous genres ont dû s’adapter.
Créé en 1998, Google a vu le jour dans la Silicon Valley. Le moteur de recherche a vu le jour deux années après l’algorithme créé par Larry Page et Sergey Brin. Ce premier algorithme était très loin de ce que l’on connaît aujourd’hui : le but est d’attribuer des notes allant de 0 à 10 aux différents sites référencés, créant un classement dans les SERP.
Cette note était alors attribuée en fonction de la valeur de confiance et d’autorité d’un site. Ces valeurs se trouvaient influencées par la distribution de liens des autres sites. Google choisissait alors de considérer cela comme un jugement de valeur.
Pour plus de précision sur la démarche user-centric de Google, voici un historique des mises-à-jour du moteur de recherche :
Les mises-à-jour de Google : de 2000 à 2004
En 2000, la population d’internautes dans le monde est passée de 304 millions en mars à 361 millions en décembre. C’est en décembre que le moteur de recherche fait la première mise-à-jour majeure de son système.
La Google Toolbar
En 2000, donc, Google introduit la Toolbar, accompagnée du ToolBar PageRank (TBPR). Le but de cette barre d’outils était d’afficher un aperçu de la note, précédemment mentionnée, donnée à chaque site sur les SERP. Pour les webmasters, cette indication visuelle représentait l’indicateur principal de la réussite de la stratégie de référencement naturel effectuée sur un site.
Certains sites ont commencé à monnayer cette note, au moyen de liens placés, servant d’indicateur public. Ces liens permettaient alors d’afficher aux yeux de tous l’autorité de la page web, créant ainsi un marchandage de link juice (jus de lien, traduit littéralement), déplaisant à Google.
La Google Dance, Fritz et Florida
Quelques années après le lancement de la Toolbar, Google cherche à offrir toujours plus de précision et de qualité dans la recherche de ses utilisateurs. Pour ce faire, la firme lance, en 2003, une mise-à-jour et introduit la Google Dance.
La Google Dance représente la période mensuelle durant laquelle le PageRank était recalculé. Cette période, durant laquelle l’ensemble des résultats bouge, n’est pas optimale pour le moteur de recherche.
Pour pallier le problème d’irrégularité dans les SERP, Google propose la mise-à-jour Fritz. Cet ajout permet au moteur de recherche d’adopter une approche plus discrète de la Google Dance, avec des changements évolutifs quotidiens.
En novembre 2003, l’arrivée de la mise-à-jour Florida marque la fin des stratégies SEO appliquées dans les années 1990 et au début des années 2000. Un filtre SEO a notamment permis au moteur de recherche de pénaliser un grand nombre de sites “tricheurs” en les faisant chuter sur les SERP.
Brandy
Au début de l’année 2004, Google effectue sa mise-à-jour Brandy. Cet apport marque le début de l’analyse sémantique latente exécutée par le moteur de recherche.
Aussi appelée LSA (Latent Semantic Analysis), cela représente un procédé de traitement des langues naturelles. C’est le début de la prise en compte de la récurrence de certains mots-clés et de leur pondération dans le texte par Google.
En plus de cela, Brandy vise à améliorer le processus d’analyse des liens et de la qualité des textes d’ancrage utilisés par les sites, tout en introduisant le contexte de voisinage (link neighborhoods). Cela désigne l’analyse des liens échangés entre les sites ainsi que leur pertinence.
En théorie, cette mise-à-jour de Google introduisant l’analyse sémantique latente permet de proposer du contenu de meilleure qualité aux lecteurs tout en limitant le spam de liens.
Les mises-à-jour de Google : de 2005 à 2009
L’année 2005 fut chargée de mises-à-jour chez Google. La première, introduite le 1er janvier de cette année, fait la présentation de l’attribut nofollow. Ce préambule de l’attribut a pour but de contrôler et combattre le spam de liens. Cet apport est suivi par une seconde mise-à-jour :
Bourbon, Jagger
En mai de cette même année, Bourbon est annoncé et mis en place sur le moteur de recherche. L’objectif est punitif, pénalisant les sites :
- ayant une URL non-canonique
- ayant du contenu dupliqué
- ayant des redirections 302
- …
Cette mise-à-jour fut plus tard renforcée par l’update Big Daddy, nouveauté infrastructurelle ayant pour but d’aider Google dans sa manipulation de la canonisation des URLs, des redirections, …
Entre septembre et novembre 2005, Google effectue une série de petites mises-à-jour englobées sous le nom de Jagger. L’objectif est d’intensifier les efforts pour lutter contre les liens de mauvaise qualité, en s’attaquant cette fois aux liens monétisés.
Le sitemap XML
1 mois seulement après, deux mises-à-jour de Google sont effectuées :
- La première affectant la personnalisation des recherches en se basant sur l’historique des utilisateurs. Google propose des résultats adaptés aux recherches effectuées précédemment ;
- La seconde introduisant le sitemap. Le moteur de recherche donne la possibilité aux professionnels de soumettre leur sitemap via Webmaster Tools (l’ancêtre de la Search Console). Le but de cette mise-à-jour est de contourner les sitemaps HTML.
Le Local Business Center
L’ancêtre de Google Business Profile fait son apparition durant l’année. Le but est d’offrir aux professionnels l’opportunité de référencer leur entreprise et de leur fournir un profil dédié sur le moteur de recherche. Cela introduit la notion de référencement local. Pour ce faire, Google a profité de Google Maps pour proposer une cartographie complémentaire.
La recherche universelle
En 2007, Google développe la page de ses résultats de recherche et l’enrichit de nouvelles fonctionnalités. Les SERP incluent désormais :
- les Nouvelles (ancêtre de Google Actualités)
- les Vidéos (Google profitant du rachat de YouTube en octobre 2006)
- les Images
- les Résultats Locaux (particulièrement pertinents depuis l’intégration de Local Business Center)
Dewey et les suggestions de Google
Entre mars et avril 2008, le moteur de recherche introduit ses propres contenus, comme les Google Books. Celle-ci a été suivie d’une seconde mise-à-jour de Google, qui après avoir travaillé sur la refonte de son logo a introduit les suggestions de recherche.
Se servant de la popularité de certaines recherches, Google essaie dorénavant d’anticiper les requêtes des utilisateurs. L’auto-complétion permet de fluidifier l’expérience utilisateur au maximum et à montrer que le moteur comprend les intentions de recherche.
Les tags canoniques
Dans un effort commun avec Microsoft et Yahoo!, l’une des mises-à-jour de Google appuie encore une fois sur les URLs canoniques, en offrant aux webmasters la possibilité d’envoyer des signaux de canonisation aux bots des moteurs de recherche. Tout cela se fait sans que ça ait un impact sur les visiteurs humains de leur site.
Cette fonction est représentée de la manière suivante :
link rel=”canonical”
Cela permet aux webmasters de soigner la présentation de leurs URLs en indiquant une localisation bien particulière aux moteurs de recherche.
Google Places
Originellement introduites à la rentrée 2009, les pages Google Places sont en réalité une mise à niveau de Local Business Center. Le changement de nom est accompagné d’améliorations, avec l’implémentation de services tels que :
- le référencement poussé des entreprises locales dans des “Services Areas” (zones de desserte) ;
- le listing amélioré, à 25$ par mois permettant une mise en avant (Enhanced Listing), renommé Tags ;
- la publication gratuite de photo de l’entreprise ;
- la customisation de QR codes ;
- l’ajout d’endroits préférés (Favorite Places), permettant de lister 30 grandes villes dans le monde, visitables en digital.
May Day
Déployée sur deux mois (avril et mai 2009), la mise-à-jour de Google a permis d’introduire des requêtes plus longues. Le trafic “longue requête” représente les visiteurs ayant accédé à un site en recherchant des termes très précis, voire en faisant de longues recherches (exemple : ‘chaussures’ – ‘chaussures rouges femmes taille 37’). Les sites proposant du contenu à faible valeur, en forte quantité, ont été les plus impactés par cette mise-à-jour.
Les résultats en temps réel
En décembre 2009, les résultats en temps réel apparaissent. Ceux-ci sont placés en fin de page, sur les SERP, et sont appelés “Derniers Résultats”. Ils sont visibles, reprenant des actualités, provenant de différents flux comme Twitter, Google News (à l’époque), …
Cette mise-à-jour offre aux professionnels l’opportunité d’optimiser le référencement naturel de leurs sites d’actualité grâce à un média en ligne ou un blog.
Les mises-à-jour de Google : de 2010 à 2014
L’année 2010 commence avec l’annonce de l’abandon de l’ancien index de recherche de Google. Supposé améliorer la vitesse d’exécution de Google, Caffeine vient avec de nouvelles règles de référencement naturel. Ce nouvel index de recherche permet aux utilisateurs d’avoir accès à davantage de ressources, diversifiées et pertinentes et ce, en temps réel.
Google Instant, les aperçus instantanés et les avis négatifs
Pour optimiser la suggestion de résultats, Google introduit Instant, précisant davantage les requêtes des utilisateurs sur le moteur de recherche. La mise-à-jour fut accompagnée du développement des aperçus instantanés en novembre 2010. Ceux-ci permettent aux utilisateurs d’avoir un aperçu des résultats de recherche sans avoir à cliquer sur le site, leur faisant alors gagner du temps.
Seulement un mois après, Google fait une mise-à-jour particulière. Celle-ci fut effectuée à la suite d’une affaire dévoilée par le New York Times. Le journal a effectivement remarqué qu’une boutique en ligne, du nom de DecorMyEyes, était très bien classée sur les SERP malgré une majorité d’avis négatifs. Le moteur de recherche a immédiatement réagi en ajustant son algorithme, pénalisant les boutiques récoltant trop d’avis de la sorte.
Panda
Le 23 février 2011, Google lance Panda. Cette mise-à-jour avait été introduite en début d’année par quelques modifications pénalisant les sites abusant du spam. Malgré son lancement, Panda n’influence que 12% des résultats déjà en place dans les SERP. L’objectif de cette mise-à-jour est majoritairement de traquer les sites posant une grande quantité de contenus, notamment des publicités (alors appelées ad-to-content).
Cette première version est suivie de Panda 2.0 impactant fortement les recherches anglophones. Des changements mineurs ont suivi avec Panda 2.1, puis :
- Panda 2.2 : le but de ce nouvel apport est de limiter le web scraping (technique d’extraction de contenus de sites web). Cette technique améliorant le référencement est désormais punie par Google ;
- Panda 2.3 : cette version sert à aider le moteur de recherche à différencier les sites de mauvaise qualité des sites de bonnes qualité, facilitant le tri dans l’affichage des résultats ;
- Panda 2.4 : Panda est globalisé et s’applique désormais aux résultats de toutes langues, hormis trois : le Chinois, le Coréen, le Japonais ;
- Panda 2.5 : cette compilation de petites mises-à-jour a été appelée Panda Flux
- Panda 3.1 : après le déploiement progressif de Flux, Google officialise cette version avec un rafraîchissement des données de son moteur de recherche.
Les réseaux sociaux de Google
Cela ne compte pas à proprement parler comme l’une des mises-à-jour de Google, mais comme des fonctionnalités annexes ajoutées à son moteur de recherche. La popularité de nouvelles plateformes sociales telles que Facebook et Twitter a poussé Google à intégrer des fonctionnalités “sociales” à son moteur de recherche. C’est ainsi qu’est né le bouton +1, qui permettait alors aux utilisateurs de voter pour leurs résultats favoris.
En parallèle, le moteur de recherche a lancé le réseau Google+, permettant aux utilisateurs de créer des cercles d’amis et d’y partager des contenus. Cet effort fut lancé après de multiples essaies de réseaux sociaux de la part de Google, qui avait déjà tenté l’expérience avec :
- Google Talk / Google Chat (2005-2017) : service de messagerie instantanée utilisant l’écriture et la voix ;
- Google Wave (2009-2010) : une plateforme informatique incluant une messagerie instantanée et d’autres fonctionnalités rappelant celles que l’on connaît sur les réseaux sociaux traditionnels ;
- Google Buzz (2010-2011) : remplaçant de Wave. Cette plateforme mêlait réseau social et micro-blogging, en plus de la messagerie instantanée. Buzz se trouvait également sur la plateforme Gmail.
L’attribution et le chiffrement des données
Afin de pallier le problème des contenus et sites entièrement dupliqués, Google lance une mise-à-jour de son système de pagination. Cette nouvelle vient avec l’apparition de deux nouveaux attributs utilisables par les webmasters :
rel=”prev”
rel=”next”
Ceux-ci permettent de renvoyer l’utilisateur à la page indiquée.
En fin d’année 2011, l’une des mises-à-jour de Google consiste au lancement du chiffrement des requêtes. Dans le respect de la vie privée, Google chiffre donc les requêtes effectuées par les utilisateurs sur son moteur de recherche. Plus tôt dans l’année, encore une fois en compagnie de Yahoo! et Microsoft, Google développe de nouveaux schémas, permettant aux utilisateurs d’obtenir des contenus plus personnalisés et pertinents.
L’optimisation de Panda, Venice, la publicité et le Knowledge Graph
Les améliorations de l’algorithme Panda se poursuivent en 2012, avec les versions de Panda 3.2 à 3.9.2. Ces améliorations ont notamment permis de contrer des bugs de domaine et d’améliorer l’expérience des utilisateurs lors des recherches effectuées sur Google. En 2014, deux nouvelles versions paraissent : 4.0 (impactant 7,5% des résultats au total) et 4.1 (impactant entre 3 et 5% des résultats au total).
Google revient sur le local avec Venice. Cette mise-à-jour vise à agrémenter les résultats locaux afin de pousser davantage les entreprises. Ce n’est pas le seul changement apporté au SERP puisque des publicités font désormais leur apparitions. Quelques lignes payantes sont placées en haut des résultats de la recherche.
Le graphique de connaissances (ou Knowledge Graph) permet de placer une case (Knowledge Panel) en haut à droite de la première page. Lorsqu’un utilisateur fait une recherche sur une marque, une personnalité, …, la fonctionnalité affiche une case directe et instructive sur la requête effectuée.
Penguin
Penguin est l’une des grandes mises-à-jour de Google. 2012 marque l’introduction du compère de Panda. D’abord simplement connue comme une amélioration visant à limiter le spam, celle-ci prend le nom de Penguin. Le but de cette nouvelle avancée est encore une fois de traquer les sites abusant de ces pratiques avec les liens et la sur-utilisation de certains mots-clés.
Une seconde version, Penguin 1.1, voit le jour en mai 2012 pour mettre à jour l’algorithme, elle-même suivie par une suivante en octobre. L’année suivante, Phantom vient renforcer Penguin avant l’introduction de sa version 2.0.
Les articles de fond
La notion d’article de fond est introduite dans la rubrique News de Google. Il est alors possible pour les utilisateurs d’accéder à des articles plus longs et instructifs que de la simple actualité au sein de cet onglet. Cela a notamment influencé un grand nombre de professionnels du marketing à développer une stratégie de contenu, leur permettant d’optimiser leur site pour apparaître dans cette rubrique.
Hummingbird, Payday Loan et Pirate
Hummingbird est la suite logique de Caffeine, que nous avons mentionné précédemment. Cette fois-ci, Google cherche à améliorer les recherches sémantiques de son moteur.
A la suite de cette mise-à-jour de son moteur, Google revient aux sites usant de méthodes de spam pour arriver en haut des SERP avec Payday Loan. Déployée en 3 versions, l’objectif est de ralentir ces pratiques de manière globale en influençant le classement de l’ensemble des sites concernés.
En 2012, Google avait présenté Pirate, supposé ralentir puis arrêter le piratage passant par son moteur de recherche. En 2014, la mesure est déployée. Très ciblée, elle permet toutefois de faire chuter le classement de certains sites de piratage.
Pigeon
Toujours dans le but de favoriser le référencement local, Google déploie la suite de Venice en introduisant Pigeon. Cette mise-à-jour a pour but de mettre les algorithmes locaux et généraux au même plan et de les rapprocher.
Ce rapprochement ne favorise pas seulement le référencement des entreprises locales, puisque cela permet également d’optimiser la sécurité. La mise-à-jour vise alors à avantager les sites cryptés dans le classement, notamment grâce à des certificats SSL.
Les mises-à-jour de Google : de 2015 à 2019
La popularisation des smartphones et de la navigation sur mobile a poussé Google à mettre son algorithme à jour :
Mobilegeddon et RankBrain
Google a anticipé le déploiement massif des smartphones dans le monde et a rapidement choisi de mettre en avant les pages mobile-friendly. Cette vague de mises-à-jour a été séparée en deux, avec une suite de mobilegeddon en 2016.
En 2018, les webmasters ont remarqué des migrations sur la Search Console, indiquant que leur site serait déplacé dans l’indice mobile-first. Pour choisir quels sites feront partie de cet indice, Google n’analyse plus seulement la version ordinateur d’un site, mais aussi sa version mobile. Afin de pousser les sites à s’adapter au mobile, Google fait une seconde mise-à-jour prenant désormais en compte la vitesse de chargement d’une page web sur mobile.
Pour optimiser son algorithme, Google s’en remet, depuis 2015, au machine learning. L’intelligence artificielle intègre donc officiellement les processus du moteur de recherche. RankBrain s’implante directement dans Hummingbird, alors déployé deux années auparavant.
La sécurité et les extraits optimisés
Dans un effort d’amélioration de la sécurité de ses utilisateurs, Google a lancé une nouvelle campagne, particulièrement à destination des internautes sur mobile. Les sites abusant de pop-ups sur leurs versions mobiles, accompagnées d’intrusions interstitielles (failles de sécurité), ont écopé d’une pénalité de la part du moteur de recherche. Dans ce sens, Google met également son navigateur à jour avec la version 62, qui prévient les utilisateurs quand ils arrivent sur une page non sécurisée.
L’ultime mise-à-jour de Google en 2017 concerne les méta-descriptions, affichées en-dessous du nom du site dans les SERP. Ces extraits optimisés ne sont ainsi plus limités à 155 caractères, mais à 300. Cela a notamment pour effet d’influencer l’expérience utilisateur, espaçant la page de résultats de recherche. L’année suivante, Google revient sur cette décision et réintroduit la version précédente des méta-descriptions.
BERT
Cette mise-à-jour est l’une des plus grosses effectuées par Google sur les 5 années qui ont précédé. En 2019, le moteur de recherche annonce BERT. Le but de ce nouveau modèle de processus est d’analyser chacune des requêtes effectuées par les utilisateurs du moteur de recherche, afin d’apporter des résultats de meilleure qualité. Google serait ainsi en mesure de comprendre les différentes expressions, ainsi que les différents niveaux de langage utilisés par les internautes.
Les mises-à-jour de Google : de 2020 à aujourd’hui
Depuis BERT, le moteur de recherche enchaîne les mises-à-jour des données de son algorithme. Des changements et des tests sont régulièrement observés par les professionnels, comme la disparition de la position 0, pour la voir revenir quelques jours plus tard, par exemple.
Page Experience
Google met beaucoup de ses efforts sur l’expérience utilisateur. Dans ce sens, le moteur de recherche prend désormais de nouvelles métriques en compte afin de classer ses résultats. Parmi celles-ci, des indicateurs de vitesse de chargement de la page :
- LCP
- FID
- CLS
Pour aider les propriétaires de sites à identifier les potentielles problématiques d’UX sur leurs pages, le rapport d’expérience apparaît désormais sur la Search Console.
Les avis produits
Cette mise-à-jour est clairement orientée E-commerce et protection du consommateur. Effectivement, Google donne davantage d’importance aux avis des internautes, qui peuvent ajouter des preuves (photo, audio, liens spécifiques) à leur opinion en commentant leur expérience.
MUM
MUM veut dire Multitask Unified Model (Modèle unifié multitâches). L’objectif de cette mise-à-jour est de rendre Google plus intuitif et inclusif grâce à l’utilisation de l’intelligence artificielle. En somme, ce nouveau modèle devrait remplacer BERT.
Pour améliorer ses résultats de recherche, Google analysera ainsi différents médias à sa portée et les proposera s’ils répondent plus précisément qu’un contenu écrit. L’objectif de cet algorithme est donc d’interpréter ces médias et de les faire ressortir s’ils correspondent à la requête de l’utilisateur.
Crédit image : Stephen Andrew Murrill