Référencement, Design et Cie

Attention ce blog a déménagé et est en lecture seule. Cliquez ici pour accéder à Référencement Design et Cie 2.0

Aller au contenu | Aller au menu | Aller à la recherche © Sébastien Billard

23/03/2007

Cartographiez et auditez votre site avec XML Sitemap Tool

XML Sitemap Tool est une application Java accessible en ligne permettant de crawler et de générer un plan de site. Les applications de ce type sont nombreuses, tant coté client que coté serveur. Mais XML Sitemap Tool sort à mon avis du lot sur de nombreux points, jugez plutôt :

  • Respect des protocoles robots.txt, meta name="robots" et rel="nofollow".
  • Possibilité d'exclure les images du crawl.
  • Possibilités étendues de filtrage des URLs.
  • Possibilité de réglage de la vitesse de crawl, afin de ménager le serveur.
  • Affichage d'informations utiles au référencement : réponses HTTP, balise <title>, nombre de liens entrants et sortants
  • Possibilité d'exportation du sitemap dans de multiples formats : TXT (une URL par ligne), CSV, XML, Google Sitemap et HTML.
  • Sauvegarde des audits en local pour réutilisation ultérieure.

Bref, un service à conserver dans ses favoris ;)

17/03/2007

W3 Campus : Jour J-13 !

On me dit que quelques places restent encore disponible pour :W3 Campus, le séminaire organisé par Webmaster Hub les 30 et 31 mars à Marseille... Ne tardez donc pas trop pour réserver ;)

A noter que le thème de la dernière conférence a été modifié : les intervenants présenteront dans une première partie quelques méthodes avancées et innovantes de référencement, puis débattront ensuite des techniques sur les techniques de référencement "white hat" et "black hat".

16/03/2007

Un apero référencement en Mars et ça repart

Bientôt le printemps ! Les oiseaux chantent, les arbres fleurissent et les aperos référencement lillois reprennent... Cette édition aura lieu vendredi 23 mars à partir de 19h dans cette vénérable institution que sont les 3 Brasseurs.

14/03/2007

AOL France abandonne Exalead

Le site AOL France se démarquait jusque ici des autres portails du groupe par son moteur de recherche, basé sur la technologie Exalead. Cette époque est en passe d'être révolue, puisque le contrat qui liait Exalead et AOL France ne sera pas renouvelé. Ce sera donc Google qui désormais fournira sa technologie de recherche au portail.

Que reste-t-il à Exalead ? En France, pas grand chose puisque AOL était le seul portail important utilisant cette technologie (Netscape.fr l'avait été aussi pendant un temps). Le moteur devra donc abolument développer l'audience de son propre site. En Hollande, Exalead vient de signer un partenariat avec Ilse Media.

12/03/2007

A quand AskCity en France ?

La dernière fonctionnalité du service AskCity est assez géniale : il est possible de dessiner un polygone sur une carte, pour ensuite faire des recherches sur ce seul périmètre. Les outils de dessin peuvent également servir à annoter la carte. Il devient alors très aisé de chercher un restaurant français près de Central Park (par exemple), puis de partager les résultats de sa recherche avec ses amis. Dommage que le service ne fonctionne pour l'instant que pour les Etats-Unis...

Ce type de fonctionnalité serait également très intéressante sur un site immobilier : on pourrait ainsi sélectionner des zones où rechercher, et un clic sur les épingles afficherait en pop-up la description du bien.

11/03/2007

Un service en ligne pour vérifier l'orthographe et la grammaire de vos écrits

Le Patron est un correcteur orthographique et grammatical en ligne, accessible gratuitement. A la différence d'autres outils qui ne font que vérifier la concordance des mots avec un dictionnaire de référence, une véritable analyse grammaticale est menée, ce qui permet par exemple de détecter les fautes de pluriel, les usages incorrects ou les mauvais accords des verbes. Certaines fautes de typographies sont également signalées, comme l'omission d'une espace devant les signes à deux points (:;?!). Il faut cependant noter qu'une vérification humaine est nécessaire, l'outil pouvant parfois générer quelques faux positifs, ou au contraire ne pas détecter des fautes bien réelles.

L'interface est plutôt bien pensée : les erreurs potentielles sont signalées en couleur, et des suggestions s'affichent au survol par la souris.

Pour les personnes souhaitant automatiser la vérification de leur site web, Rankspirit a créé une interface permettant de dresser la liste des pages du site pour ensuite soumettre leur contenu au correcteur.

Lecteurs et qualité perçue des blogs : nouvelle étude

Parmi les raisons pouvant amener au désintérêt d'un blog, les raisons liées à la qualité de l'écriture et au non-respect de sa ligne éditoriale figurent en bonne place (cf mon précédent billet).

Une étude (PDF) menée par la société américaine Vizu semble encore confirmer cette tendance : ainsi, à la question "comment choisissez-vous les blogs que vous lisez régulièrement ?" 43.9% des lecteurs répondent "la qualité de l'écriture", 43.6% répondent "la spécialisation sur un thème" et 24.8% "la réputation de l'auteur".

A la question "Comment jugez-vous de la crédibilité des blogs que vous lisez", les lecteurs plébiscitent encore la qualité de l'écriture (51.5%), et dans une moindre mesure la réputation de l'auteur (38%).

Lorsqu'on leur demande "ce qui fait la qualité d'un blog", la qualité de l'écriture emporte 56.3% des suffrages, suivie par la fréquence de publication (47.9%). La réputation de l'auteur ne fait que 21.4%, ce qui semble indiquer que notoriété et qualité ne vont pas forcément de pair. D'ailleurs, pour l'ensemble des questions, la popularité du blog semble être un critère peu déterminant pour les lecteurs.

Concernant la lecture de blogs dans le cadre professionnel, ceux-ci sont surtout utilisés pour de la veille, tant générale (26.9%), que spécialisée (27.3%).

7/03/2007

34 raisons qui poussent à se désabonner d'un blog

Suite à un sondage auprès de ses lecteurs, Darren Rowse a identifié 34 raisons pouvant mener à se désabonner d'un flux RSS, classées par ordre décroissant d'importance :

  • Fréquence de publication trop élevée
  • Fréquence de publication trop faible (ou inactivité du blog)
  • Flux RSS en version courte (publication partielle)
  • Changement de thème (ou trop de billets hors-sujet)
  • Trop de billets déjà vus ailleurs (information redondante)
  • Contenu inintéressant
  • Contenu non pertinent
  • Ego surdimensionné (trop d'auto-promotion)
  • Contenu de mauvaise qualité
  • Trop de billets très longs
  • Trop de billets négatifs
  • Erreurs de flux, en particulier quand ceux-ci affichent systématiquement comme nouveaux les 10-20 derniers billets
  • Contenus offensant, attaques personnelles, discrimination
  • Publi-information (trop de billets à vocation commerciale)
  • Titres non explicites
  • Médiocre mise en page des billets
  • Changement des centres d'intérêt du lecteur
  • Perte de l'utilité du blog
  • Trop de liens dans les billets et pas assez de contenu
  • Publicité
  • Inconsistance de l'écriture
  • Grammaire et orthographe déficientes
  • Découverte de meilleurs flux
  • Thématique trop restreinte
  • Trop de rabâchage
  • Arrivisme du blogueur
  • Pas de réponses aux commentaires
  • Pas d'images dans le flux
  • Manque de confiance et d'opinions personnelles
  • Manque de personnalité du blogueur
  • Trop de post-scriptum et d'extras à la fin des billets
  • Condescendance
  • Trop de citations
  • Changement de blogueur principal

Et vous, quelles raisons vous poussent à délaisser un flux ?

20/02/2007

La longue traîne en pratique

Si l'on entend régulièrement parler du concept de longue traîne, qu'il s'agisse de vendre des produits sur le web ou d'améliorer sa visibilité dans les moteurs de recherche, les illustrations concrètes de celle-ci restent encore rares.

Je me suis donc interessé à la répartition des mots-clés tapés pour accéder à l'un de mes sites, un annuaire de taille moyenne consacré à la création numérique. A la différence d'un blog, la structure et le contenu d'un annuaire évoluent assez peu, ce qui en fait un site au comportement plus proche de celui d'un site institutionnel ou marchand, et donc plus représentatif.

Voyons maintenant cette répartition (image GIF) : le bargraphe en rouge représente le nombre de visites par mots-clés, tandis que la courbe en bleu représente la part de trafic en pourcents pour les x mots-clés les plus populaires.

On observe bien un phénomène de longue traîne, à savoir un pic de visites pour les requêtes les plus populaires, suivi très rapidement d'une longue suite de mots clés peu populaires, mais dont le trafic cumulé est supérieur au premier groupe. Ainsi, les 5 premiers mots-clés ne représentent que 16% du trafic, les 20 premiers 25%, les 100 premiers 40%, les 250 premiers 50%, les 1000 premiers 65%, les 5000 premiers 81% et les 10000 premiers 87% sur un total de 21568 mots-clés analysés.

Il ne faut donc pas être obnubilé par une poignée de mots-clés : s'ils peuvent constituer un échantillon permettant d'apprécier en partie la visibilité d'un site, il faut toujours garder à l'esprit que la majorité du trafic se fera de toute façon sur des termes moins populaires. Il est donc plus intéressant de produire du contenu de façon à être visible sur une grande variété de mots-clés, que de chercher à optimiser uniquement pour un nombre restreint d'expressions-clés, même si elles sont individuellement les plus populaires. Ce qui n'empêche pas d'optimiser son site également pour ces expressions stratégiques...

Google : Retour à la normale pour la commande "site:"

J'avais évoqué il y a environ un mois un changement de comportement de la commande "site:" sur Google. Depuis quelques jours il semble que tout soit rentré dans l'ordre. La commande "site:" affiche désormais bien les pages du seul sous-domaine spécifié.

19/02/2007

L'écriture web : buzz de l'année ?

L'écriture pour les utilisateurs et pour les moteurs serait-elle en passe de devenir la nouvelle "hype" du référencement en 2007 ? C'est bien possible...

On ne peut que constater que les signaux se multiplient : des tables rondes sont organisées sur le sujet, des agence publient des livres blancs sur la relation entre référencement et contenu, la blogosphère en discute ici et (et aussi ici), et Abondance consacre même dans sa lettre d'information une série d'articles à l'écriture pour les moteurs.

Cet interêt soudain pour le contenu est bienvenu. L'aspect éditorial du référencement a en effet été, et reste encore très souvent négligé. Certains s'inquiètent, parfois à juste raison, des possibles effets de bord de cette popularisation de l'optimisation par le contenu : pour les journalistes, les contraintes de l'écriture web peuvent être ressenties comme une atteinte à leur créativité. Pour les observateurs du monde du référencement, il n'est pas exclu que l'on assiste à un développement du "contenu pour le contenu", qui ne serait finalement qu'une nouvelle forme de spam. Cela est possible.

Mais les plus malins auront compris qu'un contenu rédigé avec soin est gagnant sur tous les plans : utilisabilité, efficacité de la communication, et référencement. Il faut aussi voir au delà des contraintes : un écrit original dans la forme peut parfois avoir un potentiel de visibilité plus grand qu'un écrit strictement descriptif, par les liens spontanés qu'ils va générer. Bien assimilées, les contraintes deviennent ainsi des opportunités...

Les bonnes pratiques au format poche

J'avais eu l'occasion il y a quelques temps de vous présenter les Mementos "CSS" et "XHTML" de Raphael Goetter publiés par Eyrolles.

La collection s'enrichit ce mois-ci d'un nouvel opus, avec la sortie du Memento "Sites web - Les bonnes pratiques", écrit pas Elie Sloïm et recensant les 153 bonnes pratiques du référentiel Opquast. Avec ce memento, vous disposez donc d'un référentiel facilement transportable et consultable ;)

Acheter le memento sur Amazon

15/02/2007

Une méthode pour trouver les bons mots-clés

En matière de communication web, il est essentiel peut-être plus qu'ailleurs de parler le langage de l'utilisateur : vous améliorez ainsi non seulement votre visibilité dans les moteurs de recherche, mais vous vous assurez également une communication plus efficace auprès des utilisateurs.

Comment alors identifier les expressions-clés réellement utilisées par vos visiteurs potentiels ? Google et Yahoo proposent certes des outils de suggestion de mots-clés, mais les résultats de ces outils sont parfois altérés par les interrogations automatiques des moteurs. Voici donc une méthode complémentaire, basée uniquement sur l'expression des utilisateurs. Il s'agit avec cette méthode non pas de trouver les termes les plus recherchés sur les moteurs, mais d'identifier les expressions les plus utilisées par un groupe d'utilisateurs, et de détecter éventuellement des tendances.

1ère étape : Identifiez une communauté liée à votre thématique, par exemple les produits de régime. Pour ce thème, j'ai choisis les forums Doctissimo qui sont parmi les plus actifs sur ce sujet.

2ème étape : Collectez un nombre important de pages du forum, avec l'aide d'un outil comme HTTrack. Respectez cependant le site en espaçant vos requêtes, et en limitant la bande passante utilisée pour la collecte. Veillez également à la qualité des pages collectées, en ne téléchargeant pas les pages "citer" et "répondre". J'ai ainsi collecté environ 4000 pages de discussion que j'ai converti en fichiers .txt grâce à Htmlastext. Plus le corpus sera important, plus il sera fiable.

3ème étape : Procédez à l'analyse de ce corpus à l'aide du logiciel d'analyse linguistique Antconc. Ses fonctionnalités sont nombreuses, mais celles qui nous intéressent le plus sont le concordancier et l'analyse des "clusters" (amas de mots) qui permet de rechercher la fréquence des expressions de n mots contenant le mot-clé de votre choix, et même de rechercher les n-grammes, c'est-à-dire l'intégralité des expressions de n mots sans spécifier de mot-clé.

Importez votre corpus via le menu "File/Open dir", cliquez sur l'onglet "Clusters", définissez une taille de cluster entre 2 (Min. Size) et 5 (Max. Size) afin d'identifier les expressions composées de 2 à 5 mots, entrez un mot-clé ou une expression régulière, comme "r?gime+", cliquez sur "Start" et... patientez, l'analyse pouvant être longue. Vous devriez obtenir une liste d'expressions, qu'il vous faudra ensuite dégrossir à la main en vous aidant du concordancier, en supprimant le bruit et les aberrations, comme les mots-clés contenus dans les signatures de membres très actifs. Au final, on obtient une liste de ce type sur le thème "régime", classée par fréquence décroissante :

  • Regime dukan
  • Régime HP
  • Régime dukan
  • Régime hypocalorique
  • Regime WW
  • Régime soupe
  • Régime hyperprotéiné
  • Régime équilibré
  • Régime protéiné
  • Régime WW
  • Regime soupe
  • Regime pates
  • Regime hyperproteiné
  • Régime soupe aux choux
  • Régime des protéines pures
  • Régime hypo
  • Regime equilibré
  • Regime hypocalorique
  • Régime hyper protéiné
  • Regime chocolat

Sur le thème "perdre", on obtient les expressions suivantes :

  • Perdre du poids
  • Perdre des kilos
  • Perdre quelques kilos
  • Perdre un peu de poids
  • Perdre du ventre
  • Perdre un kilo

Etc.

11/02/2007

Retours sur un Blog en Nord dédié à l'écriture web

Vendredi avait donc lieu l'édition de Blog en Nord consacrée à l'écriture web, en présence de Jean-Marc Hardy, Sébastien Bailly, Gilles Klein, Eric Delcroix, et... de votre serviteur, invité sur le plateau un peu par surprise :) Muriel Vandermeulen était également de la partie, mais coté public.

Une des premières questions portait sur la pertinence d'une distinction entre écriture papier et écriture web. Pour Jean-Marc Hardy et Sébastien Bailly, nul doute que l'écriture web est bien spécifique, même si les techniques qu'elle utilise trouvent leur source dans l'écriture papier, en particulier journalistique. Les régles de la pyramide inversée et de cinq "W" sont ainsi rappelées. Les deux spécialistes de l'écritures web rappelle à juste titre l'apport de l'hypertexte, la technique du "front loading' et l'importance de prendre en compte le référencement. Au passage, Sébastien Bailly insiste sur le fait qu'écrire pour le web, ce n'est pas forcément écrire court. Gilles Klein est plus nuancé, et pense qu'il n'y a pas de réelle frontière entre les supports, en prenant l'exemple du journal 20 Minutes, écrit de façon à être lu rapidement et facilement, même si l'attention du lecteur est faible. Gilles Klein remarque quand même que le web a ses spécificités : on n'y est pas limité par la place comme sur une publication papier. Pour Eric, l'écriture web se caractérise également par une plus grande liberté.

Concernant la relation entre référencement et écriture, Gilles Klein se montre un peu agacé par cette contrainte et dénonce le "name dropping". Pour Jean-Marc Hardy, il y a un équilibre à trouver entre référencement et qualité du texte, et l'on va parfois trop loin dans le référencement au détriment de la qualité des contenus. Pour ma part, je pense qu'il n'y a pas d'équilibre à trouver, dans le sens où il n'y a pas à sacrifier de la visibilité pour gagner en lisibilité ou l'inverse. C'est plus une harmonie qu'il faut rechercher : les directives d'accessibilité, les techniques éditoriales et celles de référencement vont dans le même sens, et un texte bien conçu devrait être performant sur tous ces plans (même si les moteurs sont encore trop souvent abusés par des textes grossièrement "rédigés").

Autre question abordée, les perspectives d'avenir pour les spécialistes de l'écriture web : Gilles Klein pense que l'on se dirige vers une spécialisation et non une polyvalence. Jean Marc Hardy est assez optimiste pour le futur, et je le rejoins sur ce point : même si l'écriture web est encore peu popularisée, les entreprises y viendront (doucement), tout comme elles sont venues au référencement il y a quelques années. Après tout, ce métier existe déjà outre-atlantique, et le référencement aussi bien que l'accessibilité et l'efficacité commerciale appellent des textes bien conçus, et donc des gens pour les écrire. Une certaine transversalité entre éditorial, référencement et accessibilité est donc, à mon avis, un atout.

Voila pour les principaux sujets traités, j'espère avoir retranscris fidèlement les propos des différents intervenants. D'autres compte-rendus sont accessibles via le site Blog en Nord. Très curieusement, peu de questions techniques sur l'écriture ont été posées lors de cette rencontre. Il est aussi étonnant, comme le fait remarquer Eric, que peu de professionnels du web se soient déplacés. Sont-ils à ce point doués pour la conception-rédaction, sont-ils simplement débordés, la communication autour de l'évènement était-elle défaillante, ou ces professionnels se positionnent-ils seulement comme des "metteurs en page" et non comme des architectes de contenus ? La question reste ouverte...

8/02/2007

Ecrire pour le web, un blog sur le "copywriting"

Ecrire pour le web est un jeune blog dédié principalement, comme son nom l'indique, à l'écriture web mais aussi à l'utilisabilité. Ecrire pour le web est maintenu par Muriel Vandermeulen.

Les blogs sur ce sujet n'étant pas si nombreux, je me devais de le signaler ;)

< 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 >