- SEO
Agence SEO
Exploitez le premier levier d’acquisition de trafic en confiant votre référencement à une agence digitale expérimentée en SEO.
- SEA
Agence SEA
Développez rapidement votre business grâce au référencement payant (SEA). - Social Ads
Social ads
Optimisez vos campagnes publicitaires sur les réseaux sociaux pour améliorer vos performances.TikTok adsDevenez viral grâce à vos publicités sur TikTok
- Agence
L'agence
Keyweo est née de l’envie de créer une agence répondant aux principes de transparence, de confiance, d’expérience et de performance.
- Blog
- Contact
Indexation Google
Accueil > Agence SEO > Encyclopédie SEO > Indexation Google
Définition
L’index de Google est un vaste répertoire contenant toutes les pages qui sont répertoriées sur Google dès qu’une requête de recherche est effectuée. Cela permet à Google de trier les pages puis de les afficher dans le SERP (Page de Résultats du Moteur de Recherche). L’index est donc une grande base de données avec des milliards de pages que l’algorithme de Google utilise pour offrir aux utilisateurs les meilleurs résultats possibles pour leurs requêtes de recherche. Cependant, il est conseillé de faire attention lors de l’utilisation des termes classement et indexation de Google. Une distinction supplémentaire est faite ici.
ACCÈS RAPIDE
- Qu'est-ce qu'un Googlebot
- Référencement et Indexation
- Ma page est-elle indexé ?
- Comment indexer ses pages ?
- Causes d'une non indexation
- Maillage interne
- Balise nofollow
- Structure de liens
- Contenu de mauvaise qualité
- Obtenir des backlinks
- Quand ne pas indexer une page ?
- Empêcher l'indexation d'une page
- Robots.txt
- Balise noindex
- Mot de passe
- Pages supprimées de l'index
- Conclusion
Qu'est-ce qu'un Googlebot et quel est le rapport avec l'indexation Google ?
Le Googlebot est un robot d’exploration qui parcourt toutes les pages et les enregistre dans son index. Ces robots peuvent être considérés comme de petites araignées qui se frayent un chemin de lien en lien et tissent une vaste toile de sites web. Si le Googlebot trouve sur un site web un lien vers un site web externe, un crawler suit le site web externe jusqu’à ce qu’il y trouve un nouveau lien.
Il faut faire la distinction entre le Googlebot pour ordinateur et le Googlebot pour smartphone. Dès que le Googlebot a visité une nouvelle page, il enregistre les données. Celles-ci peuvent ensuite être indexées. Dès que la page et ses données sont dans l’index, elle peut être affichée aux utilisateurs sur la SERP.
Comme vous pouvez le voir, il est essentiel de figurer dans l’index pour être affiché sur les pages de résultats des moteurs de recherche. Selon Google, le Googlebot accède à un site web toutes les secondes et essaie de parcourir le plus grand nombre de pages possible.
Différence entre le référencement et l'indexation par Google ?
Une fois que votre page est indexée, elle n’est pas automatiquement dotée d’un PageRank élevé. Il faut en effet faire une distinction claire entre l’indexation et le positionnement d’une page. La présence de votre site dans l’index est bon signe. Mais si vous voulez viser les premières positions, vous allez devoir il aller encore plus loin.
Par exemple, le contenu de la page et sa pertinence pour les utilisateurs sont pratiquement les éléments les plus importants. Tout comme un bon profil de liens. Google examine attentivement les pages qui renvoient aux vôtres et leur accorde plus ou moins de confiance, contribuant ainsi au bon positionnement de votre site. Toutefois, les paramètres exacts utilisés par Google pour établir son classement restent confidentiels.
Comment savoir si mon site est indexé par Google ?
Vous ne savez pas si l’une de vos pages est indexée ? Il existe pourtant un moyen très simple de le savoir. Il vous suffit d’introduire la requête “site :”, avec l’URL correspondante dans la barre de recherche. Google ne recherchera alors que l’URL introduite. Si votre requête n’aboutit à aucun résultat, la page n’est pas dans l’index. Un petit exemple :
La page n'est pas indexée
La page est indexée
Une autre façon de savoir si votre URL est présente dans l’index de Google est de consulter votre Google Search Console. Vous y trouverez toutes les informations nécessaires pour chaque page, ainsi que des informations sur son indexation par Google.
Comment faire pour que Google indexe mes pages ?
Comme nous l’avons déjà mentionné, les nouvelles pages de votre site web sont généralement indexées automatiquement par les robots d’indexation de Google. Il est donc important de bien travailler le maillage interne de votre nouvelle page au sein de votre site, pour faciliter son indexation par les robots de Google. Un maillage interne optimisé permet de faciliter la découverte de votre nouvelle page par les crawlers.
N’oubliez pas que chaque page dispose d’un certain budget de crawl. Si ce budget s’épuise, aucune nouvelle page ne sera explorée. Pour optimiser l’utilisation de ce budget, il est conseillé de réduire les temps de chargement de votre site web et d’éviter les erreurs techniques. Plus la page est profonde dans votre site web, plus le temps nécessaire pour l’atteindre avec le budget d’exploration sera important. Une page liée directement à la page d’accueil est donc plus facilement explorée qu’une page qui n’est accessible qu’après de nombreux clics.
Il peut s’écouler quelques jours, voire quelques semaines, entre le crawl et l’indexation. Il est toutefois possible de déclencher artificiellement l’indexation de Google. Toute personne qui vient de publier un nouveau site web ou qui a apporté des modifications importantes à son site peut soumettre son sitemap à Google. Ce sitemap contient toutes les URL de votre site web. Vous pouvez utiliser cette méthode pour accélérer l’indexation.
En outre, vous pouvez également faire indexer des URL individuelles directement par Google. Effectuez cette opération dans votre Google Search Console en saisissant l’URL souhaitée dans la barre de recherche. Si votre URL ne figure pas dans l’index, vous pouvez la demander à Google en sélectionnant “Demander l’indexation”. Mais attention ! Vous ne pouvez effectuer qu’un certain nombre de demandes. Si vous rencontrez souvent le problème d’indexation insuffisante ou lente de vos pages, vous devriez essayer de résoudre ce problème.
Pourquoi mes pages ne sont-elles pas indexées par Google ?
Si vous constatez que vos pages nouvellement ajoutées ne figurent toujours pas dans l’index après quelques semaines, vous devriez vérifier quelques points. Il existe un certain nombre de possibilités pour expliquer pourquoi elles n’ont pas encore été indexées par Google.
Votre page n'est pas bien maillée
Il est possible que vous ayez créé une page dite orpheline en oubliant d’inclure votre nouvelle page dans les liens internes de votre site web. Si aucun lien ne mène à votre nouvelle page sur votre site web, les robots d’indexation de Google et les utilisateurs n’ont aucun moyen d’atteindre votre page. Il s’agit alors d’une “page orpheline“. Pour trouver les pages orphelines sur votre site, de nombreux outils, tels que Screaming Frog, sont disponibles pour vous aider à identifier ces pages. Une fois ces pages identifiées, vous pouvez alors les inclure dans le maillage interne de votre site web.
Il est également conseillé d’inclure la page dans le sitemap. Ce dernier aide Google à trouver et à indexer les pages plus rapidement. Vous pouvez le trouver en recherchant votre URL et en ajoutant “/sitemap.xml” à la fin. Celui-ci doit contenir toutes les pages de votre site web. La plupart des sitemaps sont automatiquement mis à jour par des modules d’extension des systèmes de gestion de contenu (CMS). Si vous ne disposez pas d’un tel module, vous devez ajouter manuellement de nouvelles pages au sitemap. Vous pouvez également vérifier si une page que vous venez de créer est présente dans le sitemap via votre Google Search Console. Pour ce faire, cherchez l’URL concernée et trouvez les informations pertinentes dans la section “Sitemap”.
Un lien nofollow a été créé par erreur
Dans ce cas, votre page est bien maillée, mais une balise nofollow lui a été attribuée. Pour l’utilisateur, cela ne change rien ; il peut cliquer sur le lien comme d’habitude et être redirigé vers la page suivante. Cependant, pour les robots Google, une balise nofollow indique que la page liée ne doit pas être suivie par les robots d’exploration de Google. Par conséquent, cette page ne sera pas visitée, ce qui empêche Google de l’indexer.
Revoyer votre structure de liens
Vous avez vérifié que votre page figure dans le maillage interne avec un lien en dofollow, mais celle-ci n’est pas indexée ? Il se peut alors que les liens existants sur votre site soient trop faibles.
Comme mentionné précédemment, les pages qui sont liées depuis la page d’accueil ont beaucoup plus de chances d’être explorées que celles qui ne sont accessibles qu’après de nombreux clics. Si vous constatez que vos pages sont indexées très lentement ou pas du tout, il est possible que la structure de votre site soit trop profonde et que les liens déjà établis ne soient pas assez puissants. Avant que le Googlebot n’atteigne votre site, le budget d’exploration a déjà été consommé. Pour cette raison, il est conseillé de placer un lien sur une page plus proche de la page d’accueil afin d’augmenter la probabilité d’indexation par Google.
Mais bien sûr, vous ne pouvez pas lier chaque nouvelle page que vous créez à votre page d’accueil. Il existe d’autres pages puissantes sur votre site qui pourraient être intéressantes. Pour découvrir lesquelles, vous pouvez utiliser, par exemple, l’outil Ahrefs Site Explorer.
Un contenu de mauvaise qualité
L’objectif de Google est de présenter à ses utilisateurs des pages de haute qualité qui leur fournissent des réponses claires et rapides à leurs requêtes. Si vous avez créé une nouvelle page contenant peu d’informations utiles et offrant des réponses inadéquates pour l’utilisateur, cela peut être une raison pour Google de ne pas indexer votre page. Alors, réexaminez le contenu de votre page et posez-vous les questions suivantes :
- Le texte répond-il aux questions de l’utilisateur ? Astuce : Saisissez des requêtes de recherche correspondant à votre page dans Google et examinez les “Autres questions” de Google. Avez-vous répondu à toutes ces questions dans votre texte ?
- Le texte couvre-t-il de manière exhaustive le sujet décrit ? Astuce : Utilisez des outils comme Thruu pour déterminer la quantité de texte que votre page devrait contenir et quels sujets vos concurrents abordent.
- Le contenu est-il présenté de manière claire et concise ? Astuce : Utilisez des points clés, des marqueurs épais, des images et des vidéos pour rendre votre contenu plus attrayant et informatif.
- Le contenu existe-t-il déjà sur votre site ? Le contenu dupliqué doit être évité à tout prix. Si vous avez simplement copié un texte d’une autre page, par exemple, vous devriez absolument rectifier cela !
Obtenir des backlinks
Vous avez tout essayé et votre page n’apparaît toujours pas dans l’index de Google ? Vous avez alors la possibilité d’ajouter à votre page un backlink provenant d’un site web externe afin de bénéficier du jus de lien et d’augmenter les chances de votre page d’être explorée. En effet, lorsqu’un backlink est créé, Google attribue davantage de confiance et de popularité au site web lié. Prenons l’exemple suivant :
Max et Sarah parlent de vacances. Max aimerait passer ses vacances en Grèce. Sarah lui recommande un hôtel en Crète. Grâce à cette recommandation, Max fait immédiatement plus confiance à l’hôtel de Crète qui lui a été recommandé qu’à d’autres hôtels.
Google fonctionne de la même manière. Supposons que Sarah soit, dans ce cas, un blog de voyage qui renvoie à l’hôtel en Crète. Google, dans notre exemple Max, verrait que l’hôtel est particulièrement pertinent et classerait donc cette page comme ayant plus de valeur qu’auparavant.
Par conséquent, si votre site web rencontre fréquemment des problèmes de non-indexation ou d’indexation très lente des nouvelles pages, il est utile de créer un lien retour fort d’une autre page vers la vôtre.
Quand faut-il exclure une page de l'indexation de Google ?
Vous pouvez bien entendu demander à Google de ne pas indexer certaines pages. Il y a plusieurs raisons pour lesquelles cela peut s’avérer utile.
- La page n’est pas encore terminée et est en cours de révision (par exemple, une page pour les prochaines ventes de Noël).
- La page ne doit être accessible que pour certaines personnes et ne doit donc pas apparaître sur la SERP. (par exemple, une page réservée aux membres d’un club, aux employés, etc.)
- La page ne doit être visible que si les utilisateurs ont effectué une conversion sur la page (ex : panier d’achat, pages de remerciement, etc.).
- Les pages qui n’offrent aucune valeur ajoutée aux utilisateurs, mais qui doivent figurer sur le site web (par exemple, les informations juridiques, la politique de confidentialité, etc.)
En résumé, toutes les pages qui n’offrent pas aux utilisateurs une grande quantité d’informations sans contexte ne devraient pas figurer dans l’index. Cela ne fera que réduire votre budget d’exploration et ralentir l’indexation des pages réellement pertinentes. Par conséquent, il peut également être intéressant d’examiner toutes les pages indexées de votre site web et d’en réduire le nombre. Vous pouvez ensuite supprimer de l’index les pages qui ne sont pas très pertinentes pour les utilisateurs.
Comment exclure des pages de l'index de Google ?
Il existe plusieurs façons d’empêcher Google d’indexer une URL spécifique. Les options les plus courantes sont répertoriées ci-dessous :
Robots.txt
Les blocs de suivi empêchent les robots d’indexation de visiter l’ensemble de votre site web, des catégories entières ou même des pages individuelles. Ces blocs de suivi se présentent généralement comme suit :
User-agent: Googlebot
Disallow: /
User-agent: *
Disallow: /
Ces “crawl blocks” peuvent être ajoutés au fichier robots.txt à l’aide de ce code. Si un site web entier est bloqué, vous ne verrez que le symbole de la barre oblique. Si seules des URL individuelles sont bloquées, vous pouvez saisir l’URL dans Disallow : /no-real-page. Cela empêchera Google d’explorer cette page spécifique.
Cependant, vous pouvez également exclure des catégories entières en spécifiant la catégorie.
La balise noindex empêche l'indexation par Google
Si vous ne souhaitez pas que votre page soit indexée, vous pouvez définir une balise noindex pour empêcher cette indexation. Ces balises noindex se trouvent dans le code HTML et ressemblent à ça :
<meta name=’robots’ content=’noindex’
<meta name=’googlebot’ content=’noindex’
Cela signifie que vous pouvez également indiquer à Googlebot, via le code HTML, si vous ne souhaitez pas qu’une page de votre site web soit indexée.
Protéger certaines sections avec un mot de passe
Si vous souhaitez que certaines parties de votre site web ne soient accessibles que par vos employés ou par les membres d’un certain cercle, etc., vous avez également la possibilité de protéger certaines pages par un mot de passe à l’aide de différentes méthodes. Cette option est également utile si votre contenu est déjà accessible via les recherches Google et que vous souhaitez le protéger.
Pages supprimées de l'index de Google
Il arrive parfois que Google supprime des pages de l’index après qu’elles ont été indexées. Si cela affecte des pages qui ont précédemment généré des conversions importantes pour vous, il s’agit d’un risque réel pour votre entreprise et il convient d’en faire une analyse détaillée.
La plupart du temps, ce phénomène est le résultat de stratégies black-hat SEO qui ont été employées sur votre site. Voici quelques pratiques qui peuvent conduire à une exclusion de l’index Google :
- Profil de liens douteux
- Textes d’ancrage trop optimisés
- Bourrage de mots-clés
- Contenu dupliqué
- Cloaking
- Pages satellite
- Et bien plus encore
Si vous voulez être sûr que Google conservera votre site dans son index, vous devez obtenir un classement honorable dans les SERP grâce à un contenu clair et de grande qualité qui offre une valeur ajoutée aux utilisateurs. Les stratégies de “black-hat SEO” ne doivent pas être utilisées. Bien qu’elles semblent promettre des résultats rapides et fructueux dans les SERP, ces stratégies ne font qu’entraîner des pénalités et des pertes de trafic à long terme.
Toutefois, si Google a supprimé vos pages de l’index, vous trouverez une note à ce sujet dans votre Google Search Console. Google vous donnera des informations sur ce qui a pu conduire à la suppression de votre page de l’index. Examinez attentivement la page concernée et corrigez-la. Vous pouvez ensuite demander un réexamen dans la Google Search Console. Pour en savoir plus, consultez notre glossaire sur le thème de la pénalité Google.
Conclusion
Le fonctionnement de Google est complexe et parfois très difficile à comprendre. Mais vous pouvez aussi en tirer parti et en bénéficier. En règle générale, Google indexe votre site automatiquement. Avec un peu de patience et un contenu de qualité, vous ne devriez pas avoir de problème à ce que vos pages soient trouvées dans l’index au bout d’un certain temps. Toutefois, si vous rencontrez des problèmes, vous pouvez utiliser quelques astuces pour faciliter l’exploration de votre site web par Google et accélérer son indexation.
Veillez à ce que la structure de votre site soit aussi simple que possible, mettez régulièrement à jour le plan du site et construisez vos liens internes de manière stratégique. Vous ne devriez plus avoir de problèmes de non-indexation de votre site web par Google à l’avenir.
Les définitions les plus populaires
accessibilité web
algorithme google
crawler
google EAT
google search console
budget crawl
pagerank google
recherche vocale
keyword stuffing
google penguin
filtre google
moteur de recherche
Boostez votre visibilité
N’hésitez pas à nous contacter pour obtenir un devis gratuit et personnalisé.
Notez ce page