Balise canonical : Éviter le contenu dupliqué   

Accueil > Articles > Balise canonical : Éviter le contenu dupliqué

Balise canonical : Éviter le contenu dupliqué

Pour optimiser le référencement d'un site, il faut éviter le contenu dupliqué. C'est-à-dire éviter d'afficher le même contenu sur plusieurs pages (ou plusieurs URL). Pour lutter facilement contre ce phénomène il existe une balise dites canonique qui est lue par les moteurs de recherche.

L'intérêt de cette balise c'est d'indiquer à Google et Bing quel est l'adresse unique d'un contenu. De cette façon, même si un contenu est dupliqué, les moteurs savent quels pages privilégier parmi tout une liste de contenu identique (ou similaire).

Problèmes du contenu dupliqué

Le contenu dupliqué, aussi appelé "duplicate content" est un véritable cauchemar pour les moteurs de recherche. Chaque contenu dupliqué fait perdre inutilement de la place dans leurs bases de données. Sachant que Google indexe plusieurs milliers de milliards de pages, le soucis est réel!

En plus du problème de place, les moteurs ont pour devoir de proposer des résultats pertinents à leurs visiteurs. Or, ils est très difficile pour eux de déterminer quels pages doivent être présentées aux visiteurs s'il existe des dizaines de version d'un même contenu. D'autant plus qu'il n'y a aucun intérêt à présenter 20 fois le même contenu dans les résultats de recherche.

Solutions pour éviter le duplicate content

Avant même de parler de la balise canonical, il convient de limiter en amont les causes du contenu dupliqué. Il faut par exemple éviter de copier volontairement un même gros contenu à afficher sur plusieurs pages. Chaque page d'un site doit avoir un contenu unique et pertinent.

S'il y a pour une raison ou pour une autre une page qui est disponible sur plusieurs adresse, il faut choisir qu'une version et effectuer une redirection permanente de toutes les versions dupliquées vers la version unique de ce contenu. Cette solution est à privilégier avant même de vouloir utiliser la balise canonical.

Il n'y a que certains cas où il n'y a pas d'autres possibilités que d'utiliser la balise canonical. Cela inclue les scénarios suivants:

  • Si les identifiants de session sont passés en paramètre.
  • S'il y a des paramètres pour le tracking des visiteurs. C'est le cas pour certains agrégateurs RSS qui ajoutent des paramètres aux URLs pour que les sites web savent que le visiteurs est venu à partir de tel ou tel agrégateur. Si un internaute fait un lien vers l'article avec le paramètre de tracking ça deviens une nouvelle URL. Mais aux yeux des moteurs de recherche, s'il y a la balise canonical il n'y a qu'une seule adresse.
  • Si pour une raison technique il n'est pas possible d'utiliser une redirection permanente. C'est le cas notamment pour certains logiciels de création de site web.
  • S'il y a un tableau (exemple: pour afficher des produits) et qu'il y a plusieurs URLs pour trier les résultats de façons différentes. Par exemple pour classer par ordre croissant ou décroissant ou pour choisir la colonne sur lequel s'effectue le tri.

Pour tous ces cas, la balise canonical est l'allier de force pour optimiser le référencement des pages web concernées.

A savoir : il convient de lire l'article pour éviter le duplicate content simple afin de limiter l'utilisation abusive de la balise canonical dans certains cas.

Utiliser la balise canonique

L'utilisation de cette balise est simple. Il suffit d'insérer le code suivant dans le des pages web concernées par le duplicate content:

Code:
<link rel="canonical" href="http://www.example.com/ma-page.html" />

L'adresse en rouge doit être l'URL de la page avec le contenu unique. Quelques petites règles à savoir sur cette URL :

  • Il est possible d'inscrire l'URL d'un site externe. C'est pratique par exemple pour éviter le duplicate content entre plusieurs versions d'un site (différents noms de domaine ou sous-domaine, site disponible avec sans le sous domaine "www" ...).
  • L'URL peut être relative ou absolue. C'est à dire commencer par "http://" ou faire le lien selon l'emplacement du répertoire (exemple: "../../dossier/ma-page.html". Il est toutefois recommandé d'utiliser une URL absolue (commencer par http://).

Erreur à ne pas faire

Attention, il convient de bien comprendre l'utilisation de cette balise car utilisée à mauvais escient elle peu nuire au référencement. Il faut bien comprendre que pour les moteurs de recherche, la balise fait en quelque sorte une redirection vers l'URL indiquée dans la balise. Voici une liste d'erreurs à éviter:

  • Faire pointer toutes les balises canonical d'un site sur une seule page (exemple: la page d'accueil). Ca serait désastreux pour le référencement de tout le site (sauf la page d'accueil).
  • Insérer une URL qui n'existe pas.
  • Indiquer l'URL d'un mauvais site externe. Cela aurait pour effet d'optimiser le mauvais site! Pour cette raison, il ne faut pas se faire duper par un webmaster ou référenceur qui vous demande d'insérer l'URL d'une de ses pages. Et il faut aussi éviter de se faire pirater son site web, car des petits malins place des balises canonical avec l'URL de leurs sites web!

Pour obtenir d'autres conseils sur le référencement, il est possible de consulter le dossier sur le référencement disponible sur ce site. Bonne lecture.


Article rédigé par Tony_ le 10/08/2011 à 21h37 dans la catégorie "Référencement" du site InfoWebMaster.fr.