Proposée par les principaux moteurs de recherche depuis février 2009, la balise link rel="canonical" permet de spécifier l'URL principale d'un contenu dans les cas où celui-ci est dupliqué sur plusieurs pages. Jusque ici, la balise ne fonctionnait qu'à l'intérieur d'un domaine.

Désormais, il est possible d'utiliser la balise canonical pour gérér la duplication de contenus entre plusieurs domaines. Le fonctionnement reste inchangé : il suffit simplement d'insérer dans le <head> des pages dupliquée le code <link rel="canonical" href="URL" /> en remplaçant "URL" par l'adresse de la page canonique (c'est-à-dire celle devant être indexée par les moteurs).

Dans son billet, Google précise qu'avant de recourir à cette technique, il convient autant que possible d'éliminer la duplication de contenu, et que concernant les migrations de pages, les redirections 301 (redirections permanentes) restent encore la meilleure solution, la balise rel="canonical" n'étant qu'indicative.

Quelques précisions sur le bon usage du rel="canonical" sont également apportées :

  • Les pages canonicalisées n'ont pas à être strictement identiques, mais elles doivent être similaires.
  • Il est déconseillé de spécifier une même URL générique (par ex la homepage d'un site) pour des pages spécifiques.
  • Il est permis pour les sites proposant du contenu à syndiquer de demander aux sites reprenant son contenu d'utiliser le rel="canonical".
  • Il ne faut pas bloquer l'indexation des pages dupliquées car le contenu de la balise canonical ne pourrait alors pas être pris en compte.