Référencement, Design et Cie

Attention ce blog a déménagé et est en lecture seule. Cliquez ici pour accéder à mon nouveau blog SEO

Aller au contenu | Aller au menu | Aller à la recherche © Sébastien Billard

20/02/2007

La longue traîne en pratique

Si l'on entend régulièrement parler du concept de longue traîne, qu'il s'agisse de vendre des produits sur le web ou d'améliorer sa visibilité dans les moteurs de recherche, les illustrations concrètes de celle-ci restent encore rares.

Je me suis donc interessé à la répartition des mots-clés tapés pour accéder à l'un de mes sites, un annuaire de taille moyenne consacré à la création numérique. A la différence d'un blog, la structure et le contenu d'un annuaire évoluent assez peu, ce qui en fait un site au comportement plus proche de celui d'un site institutionnel ou marchand, et donc plus représentatif.

Voyons maintenant cette répartition (image GIF) : le bargraphe en rouge représente le nombre de visites par mots-clés, tandis que la courbe en bleu représente la part de trafic en pourcents pour les x mots-clés les plus populaires.

On observe bien un phénomène de longue traîne, à savoir un pic de visites pour les requêtes les plus populaires, suivi très rapidement d'une longue suite de mots clés peu populaires, mais dont le trafic cumulé est supérieur au premier groupe. Ainsi, les 5 premiers mots-clés ne représentent que 16% du trafic, les 20 premiers 25%, les 100 premiers 40%, les 250 premiers 50%, les 1000 premiers 65%, les 5000 premiers 81% et les 10000 premiers 87% sur un total de 21568 mots-clés analysés.

Il ne faut donc pas être obnubilé par une poignée de mots-clés : s'ils peuvent constituer un échantillon permettant d'apprécier en partie la visibilité d'un site, il faut toujours garder à l'esprit que la majorité du trafic se fera de toute façon sur des termes moins populaires. Il est donc plus intéressant de produire du contenu de façon à être visible sur une grande variété de mots-clés, que de chercher à optimiser uniquement pour un nombre restreint d'expressions-clés, même si elles sont individuellement les plus populaires. Ce qui n'empêche pas d'optimiser son site également pour ces expressions stratégiques...

Google : Retour à la normale pour la commande "site:"

J'avais évoqué il y a environ un mois un changement de comportement de la commande "site:" sur Google. Depuis quelques jours il semble que tout soit rentré dans l'ordre. La commande "site:" affiche désormais bien les pages du seul sous-domaine spécifié.

19/02/2007

L'écriture web : buzz de l'année ?

L'écriture pour les utilisateurs et pour les moteurs serait-elle en passe de devenir la nouvelle "hype" du référencement en 2007 ? C'est bien possible...

On ne peut que constater que les signaux se multiplient : des tables rondes sont organisées sur le sujet, des agence publient des livres blancs sur la relation entre référencement et contenu, la blogosphère en discute ici et (et aussi ici), et Abondance consacre même dans sa lettre d'information une série d'articles à l'écriture pour les moteurs.

Cet interêt soudain pour le contenu est bienvenu. L'aspect éditorial du référencement a en effet été, et reste encore très souvent négligé. Certains s'inquiètent, parfois à juste raison, des possibles effets de bord de cette popularisation de l'optimisation par le contenu : pour les journalistes, les contraintes de l'écriture web peuvent être ressenties comme une atteinte à leur créativité. Pour les observateurs du monde du référencement, il n'est pas exclu que l'on assiste à un développement du "contenu pour le contenu", qui ne serait finalement qu'une nouvelle forme de spam. Cela est possible.

Mais les plus malins auront compris qu'un contenu rédigé avec soin est gagnant sur tous les plans : utilisabilité, efficacité de la communication, et référencement. Il faut aussi voir au delà des contraintes : un écrit original dans la forme peut parfois avoir un potentiel de visibilité plus grand qu'un écrit strictement descriptif, par les liens spontanés qu'ils va générer. Bien assimilées, les contraintes deviennent ainsi des opportunités...

Les bonnes pratiques au format poche

J'avais eu l'occasion il y a quelques temps de vous présenter les Mementos "CSS" et "XHTML" de Raphael Goetter publiés par Eyrolles.

La collection s'enrichit ce mois-ci d'un nouvel opus, avec la sortie du Memento "Sites web - Les bonnes pratiques", écrit pas Elie Sloïm et recensant les 153 bonnes pratiques du référentiel Opquast. Avec ce memento, vous disposez donc d'un référentiel facilement transportable et consultable ;)

Acheter le memento sur Amazon

15/02/2007

Une méthode pour trouver les bons mots-clés

En matière de communication web, il est essentiel peut-être plus qu'ailleurs de parler le langage de l'utilisateur : vous améliorez ainsi non seulement votre visibilité dans les moteurs de recherche, mais vous vous assurez également une communication plus efficace auprès des utilisateurs.

Comment alors identifier les expressions-clés réellement utilisées par vos visiteurs potentiels ? Google et Yahoo proposent certes des outils de suggestion de mots-clés, mais les résultats de ces outils sont parfois altérés par les interrogations automatiques des moteurs. Voici donc une méthode complémentaire, basée uniquement sur l'expression des utilisateurs. Il s'agit avec cette méthode non pas de trouver les termes les plus recherchés sur les moteurs, mais d'identifier les expressions les plus utilisées par un groupe d'utilisateurs, et de détecter éventuellement des tendances.

1ère étape : Identifiez une communauté liée à votre thématique, par exemple les produits de régime. Pour ce thème, j'ai choisis les forums Doctissimo qui sont parmi les plus actifs sur ce sujet.

2ème étape : Collectez un nombre important de pages du forum, avec l'aide d'un outil comme HTTrack. Respectez cependant le site en espaçant vos requêtes, et en limitant la bande passante utilisée pour la collecte. Veillez également à la qualité des pages collectées, en ne téléchargeant pas les pages "citer" et "répondre". J'ai ainsi collecté environ 4000 pages de discussion que j'ai converti en fichiers .txt grâce à Htmlastext. Plus le corpus sera important, plus il sera fiable.

3ème étape : Procédez à l'analyse de ce corpus à l'aide du logiciel d'analyse linguistique Antconc. Ses fonctionnalités sont nombreuses, mais celles qui nous intéressent le plus sont le concordancier et l'analyse des "clusters" (amas de mots) qui permet de rechercher la fréquence des expressions de n mots contenant le mot-clé de votre choix, et même de rechercher les n-grammes, c'est-à-dire l'intégralité des expressions de n mots sans spécifier de mot-clé.

Importez votre corpus via le menu "File/Open dir", cliquez sur l'onglet "Clusters", définissez une taille de cluster entre 2 (Min. Size) et 5 (Max. Size) afin d'identifier les expressions composées de 2 à 5 mots, entrez un mot-clé ou une expression régulière, comme "r?gime+", cliquez sur "Start" et... patientez, l'analyse pouvant être longue. Vous devriez obtenir une liste d'expressions, qu'il vous faudra ensuite dégrossir à la main en vous aidant du concordancier, en supprimant le bruit et les aberrations, comme les mots-clés contenus dans les signatures de membres très actifs. Au final, on obtient une liste de ce type sur le thème "régime", classée par fréquence décroissante :

  • Regime dukan
  • Régime HP
  • Régime dukan
  • Régime hypocalorique
  • Regime WW
  • Régime soupe
  • Régime hyperprotéiné
  • Régime équilibré
  • Régime protéiné
  • Régime WW
  • Regime soupe
  • Regime pates
  • Regime hyperproteiné
  • Régime soupe aux choux
  • Régime des protéines pures
  • Régime hypo
  • Regime equilibré
  • Regime hypocalorique
  • Régime hyper protéiné
  • Regime chocolat

Sur le thème "perdre", on obtient les expressions suivantes :

  • Perdre du poids
  • Perdre des kilos
  • Perdre quelques kilos
  • Perdre un peu de poids
  • Perdre du ventre
  • Perdre un kilo

Etc.

11/02/2007

Retours sur un Blog en Nord dédié à l'écriture web

Vendredi avait donc lieu l'édition de Blog en Nord consacrée à l'écriture web, en présence de Jean-Marc Hardy, Sébastien Bailly, Gilles Klein, Eric Delcroix, et... de votre serviteur, invité sur le plateau un peu par surprise :) Muriel Vandermeulen était également de la partie, mais coté public.

Une des premières questions portait sur la pertinence d'une distinction entre écriture papier et écriture web. Pour Jean-Marc Hardy et Sébastien Bailly, nul doute que l'écriture web est bien spécifique, même si les techniques qu'elle utilise trouvent leur source dans l'écriture papier, en particulier journalistique. Les régles de la pyramide inversée et de cinq "W" sont ainsi rappelées. Les deux spécialistes de l'écritures web rappelle à juste titre l'apport de l'hypertexte, la technique du "front loading' et l'importance de prendre en compte le référencement. Au passage, Sébastien Bailly insiste sur le fait qu'écrire pour le web, ce n'est pas forcément écrire court. Gilles Klein est plus nuancé, et pense qu'il n'y a pas de réelle frontière entre les supports, en prenant l'exemple du journal 20 Minutes, écrit de façon à être lu rapidement et facilement, même si l'attention du lecteur est faible. Gilles Klein remarque quand même que le web a ses spécificités : on n'y est pas limité par la place comme sur une publication papier. Pour Eric, l'écriture web se caractérise également par une plus grande liberté.

Concernant la relation entre référencement et écriture, Gilles Klein se montre un peu agacé par cette contrainte et dénonce le "name dropping". Pour Jean-Marc Hardy, il y a un équilibre à trouver entre référencement et qualité du texte, et l'on va parfois trop loin dans le référencement au détriment de la qualité des contenus. Pour ma part, je pense qu'il n'y a pas d'équilibre à trouver, dans le sens où il n'y a pas à sacrifier de la visibilité pour gagner en lisibilité ou l'inverse. C'est plus une harmonie qu'il faut rechercher : les directives d'accessibilité, les techniques éditoriales et celles de référencement vont dans le même sens, et un texte bien conçu devrait être performant sur tous ces plans (même si les moteurs sont encore trop souvent abusés par des textes grossièrement "rédigés").

Autre question abordée, les perspectives d'avenir pour les spécialistes de l'écriture web : Gilles Klein pense que l'on se dirige vers une spécialisation et non une polyvalence. Jean Marc Hardy est assez optimiste pour le futur, et je le rejoins sur ce point : même si l'écriture web est encore peu popularisée, les entreprises y viendront (doucement), tout comme elles sont venues au référencement il y a quelques années. Après tout, ce métier existe déjà outre-atlantique, et le référencement aussi bien que l'accessibilité et l'efficacité commerciale appellent des textes bien conçus, et donc des gens pour les écrire. Une certaine transversalité entre éditorial, référencement et accessibilité est donc, à mon avis, un atout.

Voila pour les principaux sujets traités, j'espère avoir retranscris fidèlement les propos des différents intervenants. D'autres compte-rendus sont accessibles via le site Blog en Nord. Très curieusement, peu de questions techniques sur l'écriture ont été posées lors de cette rencontre. Il est aussi étonnant, comme le fait remarquer Eric, que peu de professionnels du web se soient déplacés. Sont-ils à ce point doués pour la conception-rédaction, sont-ils simplement débordés, la communication autour de l'évènement était-elle défaillante, ou ces professionnels se positionnent-ils seulement comme des "metteurs en page" et non comme des architectes de contenus ? La question reste ouverte...

8/02/2007

Ecrire pour le web, un blog sur le "copywriting"

Ecrire pour le web est un jeune blog dédié principalement, comme son nom l'indique, à l'écriture web mais aussi à l'utilisabilité. Ecrire pour le web est maintenu par Muriel Vandermeulen.

Les blogs sur ce sujet n'étant pas si nombreux, je me devais de le signaler ;)

7/02/2007

Analysez vos liens avec Google

Le service d'outils pour webmasters Google s'enrichit de nouvelles fonctionnalités, avec l'apparition d'une rubrique "liens" dans son interface (accessible uniquement une fois que Google aura vérifié que vous êtes bien le gestionnaire du site).

L'outil propose ainsi l'accès pour chacune de vos pages indexées à une liste des liens externes ou internespointant vers ces pages, avec mention de la date de la dernière indexation. Chose très intéressante, l'ensemble des données est téléchargeable au format CSV, ce qui facilite les traitements et analyses ultérieures.

Attention cependant : bien que la quantité de données soit infiniment supérieure à celle retournée par la commande "link:" (56018 liens pour ce domaine par exemple), l'outil ne garantit pas que tous les liens y soient présents, et limite à 1 million le nombre maximum de résultats retournés. D'autre part, il semble que les données ne soient pas mises à jour en temps réel : ainsi à la date d'aujourd'hui (7 février), je n'ai pas pu trouver de liens indexés postérieurement au 15 janvier.

Ces limitations évoquées, il s'agit néanmoins d'un excellent outil, supérieur à Yahoo Site Explorer en ce qui concerne le nombre de liens retournés et les possibilité d'export (limitées à 1000 liens chez Yahoo).

1/02/2007

Un nouvel agrégateur dédié à l'accessibilité

Sébastien Delorme, déjà co-auteur de Tentatives Accessibles, vient de lancer Planète Accessibilité, un agrégateur consacré à l'actualité francophone de l'accessibilité numérique.

Assurément une très bonne initiative :)