Si l'on entend régulièrement parler du concept de longue traîne, qu'il s'agisse de vendre des produits sur le web ou d'améliorer sa visibilité dans les moteurs de recherche, les illustrations concrètes de celle-ci restent encore rares.

Je me suis donc interessé à la répartition des mots-clés tapés pour accéder à l'un de mes sites, un annuaire de taille moyenne consacré à la création numérique. A la différence d'un blog, la structure et le contenu d'un annuaire évoluent assez peu, ce qui en fait un site au comportement plus proche de celui d'un site institutionnel ou marchand, et donc plus représentatif.

Voyons maintenant cette répartition (image GIF) : le bargraphe en rouge représente le nombre de visites par mots-clés, tandis que la courbe en bleu représente la part de trafic en pourcents pour les x mots-clés les plus populaires.

On observe bien un phénomène de longue traîne, à savoir un pic de visites pour les requêtes les plus populaires, suivi très rapidement d'une longue suite de mots clés peu populaires, mais dont le trafic cumulé est supérieur au premier groupe. Ainsi, les 5 premiers mots-clés ne représentent que 16% du trafic, les 20 premiers 25%, les 100 premiers 40%, les 250 premiers 50%, les 1000 premiers 65%, les 5000 premiers 81% et les 10000 premiers 87% sur un total de 21568 mots-clés analysés.

Il ne faut donc pas être obnubilé par une poignée de mots-clés : s'ils peuvent constituer un échantillon permettant d'apprécier en partie la visibilité d'un site, il faut toujours garder à l'esprit que la majorité du trafic se fera de toute façon sur des termes moins populaires. Il est donc plus intéressant de produire du contenu de façon à être visible sur une grande variété de mots-clés, que de chercher à optimiser uniquement pour un nombre restreint d'expressions-clés, même si elles sont individuellement les plus populaires. Ce qui n'empêche pas d'optimiser son site également pour ces expressions stratégiques...