Référencement, Design et Cie

Attention ce blog a déménagé et est en lecture seule. Cliquez ici pour accéder à Référencement Design et Cie 2.0

Aller au contenu | Aller au menu | Aller à la recherche © Sébastien Billard

30/11/2006

Optimisation du contenu : travaillez votre text appeal !

Pour ceux n'ayant pu assister aux Search Engine Strategies 2006, voici une version légèrement remaniée de mon intervention lors de la session "Optimiser son site pour les moteurs de recherche" :

Optimiser son contenu pour les moteurs de recherche

L'optimisation pour les moteurs de recherche est souvent traité sous un angle technique. La structure des sites influence en effet fortement le référencement. Mais intéressons nous plutôt à ce qui fait le coeur de l'information : le contenu.

Qu'est-ce qu'on entend par contenu ? Quand on parle de contenu, on parle le plus souvent du contenu textuel des sites : il s'agit donc des textes à proprement parler, mais aussi des métadonnées relatives aux éléments non-textuels, comme les attributs alt des images, ou les contenus alternatifs des clips Flash et des scripts.

L'optimisation du contenu est encore trop souvent négligée. Dans un projet web, typiquement, on confie la réalisation graphique à des spécialistes (le directeur artistique et le graphiste), le développement à des spécialistes (l'intégrateur et le programmeur), et la rédaction des textes... à des non-spécialistes : des gens du service marketing, une assistante, voire un stagiaire !

Bien sûr, on lit régulièrement dans la presse spécialisée qu'il faut beaucoup de contenu, que les mots-clés soient présents dans les textes... Mais ces aspects sont le plus souvent abordés sous un angle technique, et non éditorial. Si vous fréquentez les forums dédiés au référencement et au webmastering, vous y verrez une quantité de discussions : sur les algorithmes, le PageRank, la réécriture d'URLs, le balisage, le choix cornélien entre la balises <strong> et la balise <b>... et pratiquement aucune discussion sur l'architecture des contenus, ou sur l'écriture web.

Pourtant, le contenu texte devrait être au cœur des préoccupations des webmasters : ce par quoi vous communiquez, c'est du texte. Ce que les utilisateurs utilisent pour chercher, c'est du texte : les mots-clés. Ce que les moteurs indexent, c'est du texte. Le balisage HTML lui-même est d'abord un langage de description de texte. Il est donc vraiment essentiel pour un site de travailler son "text appeal" aussi bien pour le référencement que pour l'utilisateur. Soyez de véritables "obsédés textuels" !

Teneur du contenu

Pour parler de contenu, il faut déjà que celui-ci existe : plus un site comportera de texte et de pages, plus son potentiel de visibilité sera élevé. On aura beau dire qu'une image vaut 10.000 mots, si votre site n'affiche pas de texte, personne ne verra votre image !

N'hésitez donc pas à utiliser du texte en abondance : décrivez précisément votre métier, vos expertises, vos produits, vos spécificités, rédigez des articles d'information sur votre domaine d'activité, ou des fiches conseils. Si vous avez un catalogue en ligne, pensez à fournir au moins un paragraphe de description pour chaque produit. Un bon moyen de produire du contenu est aussi d'adjoindre un blog au site, parlant de votre métier, de l'actualité du secteur...

Deuxième point, très important : les moteurs de recherche utilisent essentiellement des méthodes statistiques pour déterminer la pertinence d'une page. Les moteurs ne comprennent pas le sens des mots. Si vous souhaitez être visible sur certains mots-clés, faites donc en sorte que ces mots-clés soient présents dans vos textes, et un nombre de fois suffisant pour que le contenu soit jugé pertinent pour ces mots-clés. Idéalement vos mots-clés devraient être présents dans la balise <title> de la page, dans les titres internes de la page, et plusieurs fois dans les paragraphes.

Le positionnement n'est pas tout : vous souhaitez logiquement être visible sur les mots-clés réellement tapés par les utilisateurs : parlez donc leur langage ! Le langage simple et clair devrait être la règle sur Internet. Ecrivez vos textes, non pas avec les mots que vous, vous emploieriez pour vous décrire, mais avec les mots que vos clients et vos utilisateurs potentiels utiliseraient pour vous décrire et pour rechercher vos produits.

Evitez l'utilisation des "buzzwords", des jargons, du langage marketing. Ce type d'écrit est creux, pénible à lire, apporte peu d'information, et surtout se référence très mal.

Favorisez donc les mots communs (utilisez "augmenter" au lieu de "maximaliser"), évitez les mots trop abstraits (comme le terme "solutions" : tout le monde vend des "solutions"), n'utilisez des termes techniques que si le langage commun est insatisfaisant, ou si vous savez que votre audience utilise couramment ce terme.

Le français est une langue riche et chacun recherche différemment : utilisez donc les versions au singulier et au pluriel de vos mots-clés, ainsi que des synonymes.

Structuration du contenu

Intéressons-nous maintenant aux aspects structurels du contenu : nous avons vu qu'il fallait un contenu à la fois abondant, riche en mots-clés, et écrit dans un langage clair. Mais cela ne suffit pas : il faut aussi que ce contenu respecte la structure technique des documents HTML, et qu'il soit lui-même logiquement structuré.

Premier élément structurel : la balise <title>. C'est elle qui apparait comme lien dans les pages de résultats des moteurs. Cette balise est extrêmement importante pour le référencement, puisque son rôle est d'identifier le contenu des documents. Son contenu se voit donc reconnaître un poids fort par les moteurs de recherche.

La balise <title> doit décrire précisément l'objet de votre page, et comporter des mots-clés pertinents par rapport à ce contenu. Evitez à tout prix les balises <title> génériques. Concernant la quantité de texte à insérer dans la balise, celle-ci n'est pas critique, mais un titre comportant entre 50 et 80 caractères est une bonne fourchette.

Deuxième élément structurel : les balises meta. Bien qu'elles jouent aujourd'hui un rôle marginal dans le référencement, renseignez quand même les balises meta description et meta keywords. Insérerez un paragraphe de description spécifique à la page dans la balise meta description, comportant vos mots-clés, et 5 à 6 mots-clés dans la balise meta keywords.

La structuration du contenu se joue aussi au niveau rédactionnel. Les textes écrits en langage clairs et logiquement structurés auront tendance à mieux se positionner. Il existe plusieurs techniques rédactionnelles permettant d'assurer à la fois une bonne lisibilité des textes, et un bon référencement :

Première technique : efforcez-vous de produire des pages monothématiques (càd dire qu'à un thème correspond une page). Par exemple, si vous être un distributeur de boissons, il est préférable de créer des pages dédiée à une seule famille de vin, plutôt que des pages évoquant en vrac ces différentes familles. Pourquoi ? D'abord parce que chaque page aura une balise <title> unique, et optimisée en conséquence, et ensuite parce que la densité des mots-clés propres à chaque thème sera naturellement augmentée.

Dans le même ordre d'idée, rédigez vos textes de telle façon qu'a chaque paragraphe corresponde une idée, un concept : la densité sur les mots-clés sera là aussi augmentée, et les pages bénéficieront de l'effet de proximité des mots-clés (qui est prise en compte par les moteurs), ce qui contribue au positionnement.

Deuxième technique : utilisez des titres informatifs et riches en mots-clés (je parle ici des titres dans les pages, pas de la balise <title>). Bien trop souvent, soit les pages ne comportent pas de titres, soit ces titres ne contiennent aucun mot-clé (exemple typique : le "Bienvenue !"). Pourtant, les titres descriptifs sont extrêmement intéressants : ils améliorent la lisibilité du contenu, mais surtout, ils se voient reconnaitre un poids fort par les moteurs de recherche, quand ils sont balisés de façon adéquate (càd avec les balises de titrage, <h1> à <h6>).

Troisième technique : énoncez d'entrée le sujet principal d'une phrase ou d'un paragraphe (on parle de "front-loading"). Cette recommandation est avant tout ergonomique, mais elle influence le référencement, en forçant à rédiger un contenu dense en mots-clés. Si on l'applique à une page, cette recommandation est d'autant plus intéressante, puisque elle force à placer les mots-clés en tout début du texte, ce qui est bénéfique au référencement, les moteurs favorisant le contenu placé haut dans le code. Il est donc important d'introduire votre contenu, que ce soit au niveau de la page entière ou de ses sous-parties.

Enfin, le contenu, c'est du sens, utilisez donc les possibilités sémantiques du language HTML : balisez les titres comme des titres (avec les balises <hn>), les listes comme des listes (balises <ul> et <ol>) et utilisez les emphases (mise en gras) avec la balise <strong>.

Pour aller plus loin

24/11/2006

Des polices de caractères plus accessibles ?

Repérée via le blog Conseil Recherche Innovation, la famille de caractères Tiresias vise à améliorer la lisibilité des textes pour les personnes malvoyantes. Ces polices, payantes, sont disponibles pour différents usages : lecture à l'écran, sous-titrage, impression, signalétique... Il semble que leur pertinence, au moins en ce qui concerne le sous-titrage, soit cependant sujette à discussion.

Mais Tiresias n'est pas la seule police prévue spécifiquement pour les utilisateurs malvoyants. L'American Printing House for the Blind a ainsi mis au point APHont, une police avec des caractères sans sérif plus espacés, plus ouverts, et des ponctuations sur-dimensionnées. APHont peut être téléchargée gratuitement.

22/11/2006

Des critères personnalisés pour Google CSE

Google Custom Search Engine permettait déja d'associer son compte Adsense à ses moteurs de recherche personnalisés.

Depuis aujourd'hui, il est également possible de définir ses propres critères personnalisés, pour mesurer les performances de ses différents CSE. Pour cela, rendez vous dans l'espace de gestion de votre moteur, cliquez sur l'onglet "make money" et spécifiez le nom de critère de votre choix, par exemple le nom du moteur. Lorsque vous vous rendrez dans votre espace d'administration Adsense à la page "rapport", vous verrez alors les affichage et revenus de vos CSE s'afficher en cliquant sur "meilleurs supports publicitaires".

Autre nouveauté : il est maintenant possible de spécifier la langue de ses CSE.

17/11/2006

Voir le web comme un robot avec Firefox et la barre Web Developer

Plusieurs outils permettent de simuler approximativement la vision des robots d'indexation, par exemple Spider Simulator. Ce type d'application présente des avantages : elles sont accessibles en ligne et faciles à utiliser. Mais elles ne permettent pas de tester une page off-line, ni de naviguer facilement de lien en lien.

Voici donc une méthode basée sur l'extension Web Developer de Chris Pederick qui permet de simuler à peu près correctement la vision d'un robot d'indexation (les clips Flash restent cependant visibles, l'extension ne permettant pas de désactiver Flash actuellement) :

  • Les moteurs n'interprêtent pas javascript, ni les applets java : activez dans le menu Disable les options "disable java" et "disable javascript".
  • Les moteurs n'acceptent pas les cookies : activez dans le menu Cookies l'option "disable cookies | allcookies".
  • Les moteurs ignorent les couleurs des pages ainsi que les feuilles de style : activez dans le menu Disable l'option "disable page colors", puis l'option "disable styles | all styles" dans le menu CSS.
  • Les moteurs ne savent pas lire les images, mais tiennent compte des attribut alt : supprimez l'affichage des images en activant l'option "disable images | all images" dans le menu Images et activez l'option "replace images with alt attributes" dans le même menu.
  • Les moteurs lisent le contenu dans l'ordre du code : activez donc l'option "linearize page" dans le menu Miscellanous.

Surtout, n'oubliez pas pas d'activer l'option "persist style" dans le menu "options" afin de conservez ces paramètres lors de votre navigation ;)

16/11/2006

Un standard pour les sitemaps

Google, Yahoo et Microsoft viennent de s'accorder sur un standard commun de protocole sitemap. Ce système permet de fournir aux moteurs de recherche une liste d'URLs à indexer, ainsi que d'autres informations, comme la priorité d'indexation ou la fréquence de modification des pages, sous la forme d'un fichier XML.

Les spécifications du protocole, qui passent pour l'occasion à la version 0.90, sont disponibles sur le site sitemaps.org, et placées sous licence Creative Commons.

Les anciennes sitemaps continuent cependant d'êtres supportées par Google.

L'eye tracking du pauvre

Pour ceux souhaitant se rendre compte par eux-même des mouvements de l'oeil lors de la lecture d'un texte ou d'une page web, voici une méthode de pseudo eye tracking que j'ai expérimentée ce matin :

  • Fixez très attentivement une forme claire sur fond sombre (celle-ci par ex), pendant au moins 30 secondes. Votre regard ne doit pas dévier. Pour un meilleur résultat, clignez des yeux de temps à autre, puis refixez encore la forme (vous devriez voir votre forme en négatif lors du clignement). Plus la fixation sera longue, plus l'effet sera durable.
  • Lisez ensuite votre page web ou votre document : grâce à la persistence rétinienne, la forme apparaitra alors en surimpression à l'endroit où votre regard se porte ;)

L'expérience est très intéressante : lors d'une lecture de texte, on s'aperçoit par exemple que le regard ne défile pas linéairement, mais au contraire fait des bonds de 3-4 mots. On s'aperçoit également que le regard (en tout cas la conscience visuelle) tend à sauter partout sur la page, plus qu'à balayer.

9/11/2006

Dyslexie, contraste et lisibilité

Dans une série d'articles, Accessites s'intéresse au design web pour les dyslexiques. La dyslexie est un trouble cognitif qui affecte l'identification des mots écrits. Elle pourrait concerner 8 à 10% de la population, bien que ces chiffre soient controversés.

Parmi les facteurs affectant la lisibilité pour les dyslexiques, il semblerait que le contraste entre la police et son arrière-plan joue un rôle important : Un contraste trop élevé aurait tendance à faire "trembler" ou "bouger" les textes. Ce phénomène est décrit sous le nom de syndrome d'Irlen ou "syndrome de sensibilité scotopique" et ne concerne pas uniquement les dyslexiques.

Une limitation du contraste pour les textes est donc préférable : celui-ci doit être suffisant, mais pas maximal, un trop fort contraste affectant la lisibilité pour les dyslexiques, mais aussi pour les seniors et les personnes sensibles à la lumière.

8/11/2006

Recherche cartographique : Virtual Earth passe à la 3D

Virtual Earth, le moteur de recherche cartographique de Microsoft Live, permet désormais d'accéder à ses services en trois dimensions (et en beta), à la manière de Google Earth. A la différence de ce dernier, la navigation ne se fait pas dans un logiciel dédié, mais directement dans le navigateur, après avoir installé le plugin adequat*.

Le service est assez impressionnant. Si concernant les vues aériennes on n'atteint pas pour la France des résolutions aussi élevées que dans Google Earth ou Geoportail (2D pour l'instant), l'outil offre en revanche une excellente résolution en mode carte (données fournies par Navteq, comme pour Ask). En terrain montagneux, cela permet une vue de type GPS très agréable (ici la route du Col des Montets avec le massif du Mont-Blanc en arrière-plan).

Autre point notable : Des bâtiments 3D détaillés et texturés. Les grosses villes américaines sont bien entendues privilégiées (ex : Dallas, New York), mais Paris affiche quand même quelques bâtiments emblématiques comme le Louvre, Notre-Dame, les Invalides... ainsi que le Stade de France et Roland-Garros :)

(*Note pour l'installation : les options régionales de Windows doivent être configurée en anglais américain)

7/11/2006

La non-utilisabilité en pratique

Découvert sur Ergonomia, le Bad Usability Calendar (PDF) illustre de façon humoristique les mauvaises pratiques en terme de conception d'interfaces web. Hilarant et didactique à la fois :)

3/11/2006

Les Search Engine Strategies reviennent à Paris

Les 28 et 29 Novembre aura lieu au CNIT de La Défense à Paris la deuxième édition française des Search Engine Stratégies.

J'aurai le plaisir d'intervenir lors de plusieurs conférences, dont une sur la conception de sites web "search engine friendly", et une autre sur les stratégies de liens. Une session d'examen clinique du référencement des sites de l'auditoire est également prévue (voir le programme complet).

2/11/2006

Google Custom Search a son blog

Le service de moteur de recherche personnalisé Google CSE possède désormais son blog officiel.

Pendant ce temps-là de nouveaux CSE apparaissent : Igor lance un CSE sur les standards du web, Jean Pierre lance un CSE indexant les sites référencés par Webonorme, tandis que SEOplug se spécialise dans l'indexation des sites liés au référencement. Un annuaire spécialisé, Guide to Custom Search Engines, fait également son apparition.

Lycos signe un partenariat avec Ask

Affichant jusque ici les résultats de recherche Microsoft Live et les liens sponsorisés Google, Lycos vient de signer mercredi dernier un partenariat de recherche avec Ask/IAC.

Les sites du réseau Lycos (Lycos.com, Hotbot.com, Tripod, Angelfire) afficheront donc désormais les résultats de recherche web et image fournis par Ask, ainsi que les liens sponsorisés du même moteur. Cet accord ne semble toutefois pas concerner les sites du réseau Lycos Europe, qui continuent de délivrer les résultats fournis par Yahoo Search.