Forum > Questions diverses sur le référencement > Contre le duplicate content

Contre le duplicate content

Auteurs Messages
icone offline stc # Posté le 01/01/2011 à 20h57
avatar de stc
Rang: membre
Salut j'ai un site qui se trouve régulièrement dans la sandbox, je soupçonne un duplicate content, comme le site est un fichier index.php qui inclus d'autre page j'ai mis dans ce fichier cette ligne de code(dans <head>) :
Code:
<link rel="canonical" href="http://<?php echo $_SERVER["HTTP_HOST"].$_SERVER["REQUEST_URI"]; ?>"/>

Je ne sais pas si c'est une bonne idée, en gros chaque page reçoit la balise avec sa propre adresse.
Qu'en pesez vous ?
Merci
icone online funnycat # Posté le 01/01/2011 à 23h53
avatar de funnycat
Rang: administrateur
Bonjour.
Je ne pense pas que ce soit utile. La balise canonical n'est pas en rapport avec la sandbox. De plus, l'effet de la balise canonical pourrait être accaparé à une redirection vers la page indiqué dans la canonical. Donc ce bout de code ne sert à rien.
Pour le duplicate content je pense qu'il n'y a pas encore beaucoup trop de chose à faire de plus que ce que j'avais écrit sur deux vieux articles:

Ma page préférée? Le dossier référencement qui présente une multitude d'informations utiles. smiley
Sinon hors internet je suis développeur web PHP.
icone offline stc # Posté le 02/01/2011 à 23h04
avatar de stc
Rang: membre
Merci pour ta réponse, a vrai dire je fais attention quand je code mais la c vrai qu'il y a pas mal de page générée qui sont similaires.
J'aimerais savoir si il n'existe pas un outil en ligne qui teste si un site est en duplicate content (tout le site pas juste une page).
Merci
icone online funnycat # Posté le 03/01/2011 à 21h17
avatar de funnycat
Rang: administrateur
Bonsoir.
Je ne connais pas de tel sites ou outils qui pourrait analysé tout un site. Je ne sais de quel type de site il s'agit, mais il est possible d'avoir un contrôle du contenu mais sur des sites de type "annuaire". Il y a sur internet des petits scripts qui vérifient le nombre de résultat retourné sur Google pour une phrase ou suite de mot en tout genre. L'essentiel étant de l'utiliser régulièrement lors de l'ajout de nouveaux contenu par des internautes.
Tu parle de pages générées qui sont similaire, par curiosité comment génère-tu tes pages?
Cordialement
Bonne soirée.
Ma page préférée? Le dossier référencement qui présente une multitude d'informations utiles. smiley
Sinon hors internet je suis développeur web PHP.
icone offline stc # Posté le 03/01/2011 à 22h48
avatar de stc
Rang: membre
en fait il s'agit du site le-bon-troc.fr je génère des pages pour toutes les catégories elles ne sont pas a 100% identique mais a 90% je dirais, il y a aussi le formulaire de recherche, comme il y a peu d'annonce il y a beaucoup de page similaire qui disent qu'il n'y a aucune annonce.
Merci
icone online funnycat # Posté le 05/01/2011 à 20h09
avatar de funnycat
Rang: administrateur
Ah d'accord, je comprend mieux. Les pages sans contenu sont tellement ... sans contenu (mis à part la sidebar, le fil d'Ariane ...) que c'est normal que Google ai du mal à ingurgiter ces pages.
Peut-être que pour que Google apprécie mieux le site, il faudrait éviter d'ajouter dans le menu des liens vers les pages qui sont pour le moment vide. Et de les ajouter dès qu'il y a au moins un contenu dans la catégorie. De cette manière, il y aura moins de pages vide et le nombre de pages du site augmentera de façon plus naturel.

Cette méthodologie n'est pas nouvelle. Certaines personnes qui ont développées des annuaires ont commencés par mettre seulement un petit nombre de catégorie générale et on ajoutées les sous-partie au fur et à mesure que l'index grandissait. Il y a aussi des référenceurs qui ont lancés des annuaires qu'à partir du moment où il y avait un certain nombre de contenu déjà présent.

Cordialement.
Ma page préférée? Le dossier référencement qui présente une multitude d'informations utiles. smiley
Sinon hors internet je suis développeur web PHP.
icone offline stc # Posté le 05/01/2011 à 20h12
avatar de stc
Rang: membre
Oui c'est tout a fait possible mais j'ai toujours ce souci d'optimiser (vieux réflexe de demomaker) et la si je dois tester le contenu je vais perdre en rapidité, enfin je vais y réfléchir, merci de ta réponse.
icone offline stc # Posté le 05/01/2011 à 20h27
avatar de stc
Rang: membre
j'ai pensé a une solution, si le contenu est vide je fais un rel="nofollow", qu'en penses tu ?
icone offline stc # Posté le 06/01/2011 à 16h39
avatar de stc
Rang: membre
ça y est je suis sorti du bac a sable !! en espérant pas y retourner !
icone online funnycat # Posté le 07/01/2011 à 19h44
avatar de funnycat
Rang: administrateur
Content que tu sois or du bac-à-sable.
Le nofollow est une solution, mais je ne la préconiserais car Google visite et index tout de même les pages liées via un nofollow. De plus, il y aurait de la perte de PageRank (mais bon, cet argument est surtout pour les sites qui possède un gros PageRank à optimiser).
Au mieux, mettre une balise meta noindex sur les pages qui n'ont aucun contenu. C'est pas très propre non plus, mais c'est provisoire. smiley
Ma page préférée? Le dossier référencement qui présente une multitude d'informations utiles. smiley
Sinon hors internet je suis développeur web PHP.
icone offline stc # Posté le 07/01/2011 à 21h11
avatar de stc
Rang: membre
Ah je pensais que les pages liés par un lien en nofollow n'étaient tout simplement pas "suivie" par le bot
icone online funnycat # Posté le 07/01/2011 à 22h57
avatar de funnycat
Rang: administrateur
Oui, c'est une source de confusion commune. Google à indiqué que l'algorithme de popularité ne suivais pas les liens en nofollow. Mais ce qu'il ne dit pas, c'est que l'algorithme qui est chargé de trouver les nouvelles pages, quant à lui, suis un maximum de liens pour trouver le plus de ressources possible. smiley
Ma page préférée? Le dossier référencement qui présente une multitude d'informations utiles. smiley
Sinon hors internet je suis développeur web PHP.
icone offline stc # Posté le 07/01/2011 à 23h00
avatar de stc
Rang: membre
donc mieux vaut utiliser la balise :
Code:
<meta name="ROBOTS" content="NOINDEX, NOFOLLOW"/>

Si je comprends bien ?
icone online funnycat # Posté le 08/01/2011 à 10h58
avatar de funnycat
Rang: administrateur
Oui, c'est une solution envisageable de placer ces balises sur les pages sans contenu. De cette façon, les pages vide ne sont pas indexées et donc seul les pages ayant un contenu sur ce site seront présente dans l'index de Google.
Certes ce n'est pas une solution merveilleuse, mais à terme toutes les pages sont destinées à avoir un contenu, donc cette balise sera inutile.

Je souhaite une bonne continuation à ce site. En espérant qu'il ai une bonne réussite sur Google.
Ma page préférée? Le dossier référencement qui présente une multitude d'informations utiles. smiley
Sinon hors internet je suis développeur web PHP.