Google Sandbox : Cas précis   

Accueil > Articles > Google Sandbox : Cas précis

Google Sandbox : Cas précis

Première partie Deuxième partie Troisième partie Quatrième partie Cinquième partie
Google Sandbox : Généralités Google Sandbox : Cas précis Google Sandbox : éviter le bac à sable Google Sandbox : Désensablement Google Sandbox : Conclusions

Pourquoi Google a créé la sandbox?

Logo Google
Logo Google

L'effet SandBox a semble-t'il été créé pour lutter contre le spam sur le web et également lutter contre les sites qui essaient de tricher ou d'améliorer de manière industrielle le positionnement de leur site. Ce dernier est un véritable fléau que Google et les autres moteurs de recherche essaient de combattre pour proposer aux internautes des résultats de recherche pertinents. Il est vrai que Google possède de nombreux algorithmes très poussés pour déterminer si un site propose du contenu intéressant et de qualité, mais malheureusement cela prend un peu de temps à analyser un site et c'est souvent à partir de la quantité de liens entrants qu'il est possible de découvrir un site de spam.

Avant la mise en place du bac à sable, Google pouvait donc indexer un site très rapidement et le mettre en place dans ses résultats. Si le site se révèle être que du « vulgaire spam », Google arrive à le déterminer et le supprime de son index. Malheureusement, cela peut parfois prendre un peu de temps, de quelques jours à quelques semaines. Et pendant ce laps de temps le site de spam a récolté un nombre impressionnant de visiteurs en provenance de Google.

Anti-spam

Vous me direz que maintenant la menace est loin, mais vous vous trompez. Les spammeurs sont malins et peuvent facilement et rapidement créer un nouveau site, il leur suffit d'acheter un autre nom de domaine et de changer éventuellement un peu le contenu de leur site, puis de mettre en ligne le tout et de recommencer le spam pour ce nouveau site. Encore une fois Google finira par découvrir la supercherie mais cela prendra du temps et pendant ce temps là le site de spam récoltera des visiteurs en provenance de Google. Ce type de manipulation est finalement très lucrative.

Pour lutter contre cette technique, la sandbox de Google met chaque nouveau site dans une sorte de purgatoire pour savoir s'il est bon ou mauvais. Au début, quelques référenceurs pensaient qu'il fallait juste attendre une période de X mois avant de sortir de ce purgatoire. Malheureusement il faut se mettre à la place des spammeurs pour comprendre comment ceux-ci ont fait face à cette nouvelle arme que Google a entre ses mains. S'il faut juste 8 mois (par exemple) pour qu'un site devienne confiant, il est ainsi possible de créer une armée de nom de domaine avec aucun contenu (une page: « site en construction ») et d'attendre cette période pour lancer le spam.

A cause de ce comportement possible, il est certains que Google prend en compte certaines autres données pour savoir s'il faut sortir le site du purgatoire. D'ailleurs c'est la raison pour laquelle certains sites restent plus ou moins longtemps dans la sandbox. C'est pour cela qu'en anglais il y a un référenceur qui a renommé la sandbox par « trustbox » (anglicisme pour dire "boite de confiance"). Il faut bel et bien faire ses preuves dans le bac à sable et cela peut prendre plus ou moins de temps selon les cas.

Sandbox plus forte pour certaines thématiques?

Certains indiquent que la sandbox serait plus forte (plus sévère et pour une plus longue durée) dans certains domaines très concurrentiels. D'autres pensent que Google ne fait pas de distinction ou d'éventuelle « préférence » et qu'en réalité tous les nouveaux sites entrent en sandbox. Encore un sujet où les avis diverges. Personnellement j'ai vu les statistiques d'un site qui s'est vu sortir de la sandbox pour certains mots-clés très concurrentiels alors qu'il n'a jamais été enlisé pour des mots-clés un peu moins concurrentiels.

Dans le cas de figure d'une thématique très concurrentielle, ce qui peut sembler comme une pénalité plus forte, n'est peut-être que la résultante que les domaines concurrentiels sont plus compliqués à percer. Sur ce point-là, il est assez difficile de véritablement savoir lesquels ont raison.

Comment savoir si un site est dans la sandbox?

Il est très courant de rencontrer sur des forums des webmasters ou blogueurs qui pensent être dans la sandbox. C'est le cas par exemple lorsqu'un site qui était bien positionné sur une expression chute précipitamment, par exemple le site d'une entreprise qui n'arrive même pas à être présent en bonne position sur Google lors d'un recherche avec le nom de la marque ou le nom de domaine.

La sandbox génère la peur, de nombreux webmasters soupçonnent d'être sandboxés car ils ne se positionnent pas très bien sur leurs mots-clés. Or il s'avère que parfois c'est tout simplement parce que le site est mal optimisé.

Pour soupçonner un sandboxage il faut tout d'abord avoir un outil d'analyse des visiteurs qui viennent sur le site. L'idéal est ensuite d'utiliser un second outil qui analyse le positionnement du site pour les mots-clés choisis par le webmaster. Si sur l'outil d'analyse vous remarquez que du jour au lendemain il y a une chute des visiteurs en provenance de Google et ce, non pas pendant un jour ou deux mais pendant une plus longue durée, vous êtes probablement dans la sandbox. Pour avoir un deuxième avis il faut alors jeter un œil sur l'outil qui analyse le positionnement sur Google et si le positionnement a pris une claque, c'est que le sandboxage se confirme.

Il existe quelques méthodes ou points particuliers à analyser pour savoir plus précisément si un site est dans la sandbox. Voici une petite liste de points et de questions à vous poser pour savoir si un de vos sites est en sandbox:

  1. Premièrement il faut vous assurer que votre site est bien dans l'index de Google. Pour cela il faut faire la recherche suivante sur Google avec l'url de votre site:
    site:http://www.example.com
    Si la recherche ne présente aucun résultat c'est que votre site n'est pas encore indexé ou alors qu'il est dans la blacklist.
  2. Les autres moteurs de recherche n'ont pas de Sandox et mis à part cela ils ont des algorithmes un peu similaires. En réalité tous les moteurs de recherche sont différents, mais lorsqu'un site est en bonne position sur Google il a des chances d'être également bien positionné sur Yahoo ou MSN.
    Si pour une requête particulière vous êtes bien positionné sur Yahoo et MSN et très mal positionné sur Google, alors cela signifie que vous êtes peut-être sandboxé.
  3. Première étape: Prenez une page de votre site, vérifiez qu'elle est bien indexée sur Google en faisait une recherche telle que:
    site:http://www.example.com/ma-page.html
    Deuxième étape: Prenez exactement le titre de la page (celui présent dans la barre du navigateur ; celui inclus entre les deux balises title) et faites une recherche avec ces mots sur Google. Si votre page n'est pas présente en bonne position sur Google pour ces mots, c'est qu'il y a sûrement un souci.
    Troisième étape: Vous pouvez également refaire une recherche en mettant votre site entre guillemets, ce qui a pour avantage de rechercher exactement ces mots-ci dans cet ordre. Normalement il y a aura moins de concurrents sur Google et vous devriez apparaitre en bonne position sur Google.
    Quatrième étape: Répéter cette méthode avec plusieurs pages pour être sûr de vous.
    Attention: il faut vous assurer que vous avez plusieurs mots-clés dans votre titre. Si votre titre ne possède que deux mots (concurrentiels) ce serait sûrement normal que vous soyez mal positionné dans les résultats de recherche.
  4. Première étape: Prenez une page de votre site en vous assurant qu'elle est présente dans l'index Google.
    Deuxième étape: Faites une liste de nombreux mots-clés présents sur cette page. Vous pouvez par exemple copier/coller toute une phrase (plus il y a de mots et mieux c'est).
    Troisième étape: Faites la recherche associée à ces mots-clés. Si votre site n'est pas bien positionné c'est encore une fois un indice qu'il y a sûrement sandboxage.
  5. Vous avez constaté une dégringolade de votre positionnement pour un mot-clé particulier. Essayer de faire une recherche Google comme celle-ci:
    allinanchor:mot-clé
    Si lors de cette recherche vous êtes très bien positionné, comparé à la même recherche sans le « allinanchor », c'est que vous êtes sûrement dans le bac à sable.
  6. Faite le même type de recherche que le point précédent avec une longue phrase et avec les fonctionnalités: allintext, allintitle et allinurl.
    Si vous êtes trop loin dans le positionnement c'est surement encore à cause de cette fichue sandbox.
  7. D'après une source anglaise si une page est en Sandbox, Google ne lui attribue pas de PageRank. Mais je ne suis vraiment pas sûr de cela, je dirais même que je ne suis pas d'accord. L'article est rempli de contradictions et de points donc je ne suis pas d'accord, c'est la raison pour laquelle je préfère prendre cette information « avec des pincettes ».
  8. D'après la même source dont je fais peu confiance, il semblerait que si l'on fait la commande « link:http://www.example.com » sur Google s'il n'y a aucun résultat, cela peut être un indice pour indiquer que le site est en sandbox.

Télécharger gratuitement l'ebook sur la Google Sandbox

Cet article vous à plu, vous pouvez télécharger gratuitement l'e-book qui résume l'ensemble des article sur la Google Sandbox. Cela permet de comprendre en détail tout ce qu'il faut savoir sur la Google Sandbox:
icône pdf E-book Google Sandbox (format pdf ; 15 pages).

Creative Commons License
Google Sandbox by Tony Archambeau est mis à disposition selon les termes de la licence Creative Commons Paternité-Pas de Modification 2.0 France.
Basé(e) sur une oeuvre à www.infowebmaster.fr.


Article rédigé par Tony_ le 02/04/2009 à 18h59 dans la catégorie "Référencement" du site InfoWebMaster.fr.

Lire les 1 commentaire

Ajouter un commentaire