Lors de vos recherches web, il vous est probablement arrivé de tomber sur certains sites affichant des caractères spéciaux dans leur balise <title> ou leur snippet, dans le seul but de capter l'attention de l'utilisateur dans une page de résultats (exemple).

Les caractères utilisés sont multiples (➜, ►, ♥, ♫, ☼...) et peuvent être combinés (exemples : ••▷, II►, ➜➜➜).

Cette technique est-elle constitutive de spam ? Certes, ces caractères n'ont pas d'influence sur le positionnement, mais ils donnent aux sites qui les emploient une visibilité accrue dans les pages de résultats, sans que cela soit lié à leur pertinence.

Il est d'ailleurs intéressant de constater que les moteurs traitent différement ces caractères : Google, Live et Exalead peuvent les afficher aussi bien dans le lien que dans le snippet des sites, tandis que Yahoo semble avoir choisi de les filtrer complètement.

Afin, d'en savoir plus, j'ai interrogé les Googlers via le groupe Google d'entraide pour les webmasters. Il apparaît que l'usage abusif de caractères Unicode ou ASCII dans les balises <title> ou <meta> est bien considéré comme une forme de spam par les équipes qualité du moteur, pouvant justifier une pénalisation du site. Google, fidèle à l'esprit de ses guidelines, décourage clairement l'utilisation de ce type de technique.

Reste à savoir ce qui relève de l'abus ou pas. Google ne souhaite volontairement pas fixer de limites claires, afin de ne pas légitimer un usage même léger de la technique. On en revient donc à la question suprême, qui est à l'évaluation du spam ce que le rasoir d'Occam est à la science : "Ce qui est fait est-il fait pour l'utilisateur, ou bien uniquement pour les moteurs de recherche ?".