Référencement, Design et Cie

Attention ce blog a déménagé et est en lecture seule. Cliquez ici pour accéder à mon nouveau blog SEO

Aller au contenu | Aller au menu | Aller à la recherche © Sébastien Billard

29/09/2005

Spam 2.0

Splogs, XSS, sping... Ces mots ne vous disent rien ? Bienvenue dans le monde du spam 2.0 ! Le spam 2.0 est au spam ce que le web 2.0 est au web... c'est à dire pour les uns une évolution, pour les autres... une révolution ;)

Contraction de "spam" et de "blog", les splogs sont des blogs factices, générés de façon automatique (Avec avec ce type de logiciel par ex). Grâce à votre réseau de splogs, vous pouvez engranger les revenus publicitaires de vos Adsense et affiliations, tout en capitalisant du Pagerank, que vous ne manquerez de redistribuer à vos autres sites.

Ironiquement, le plus gros hébergeur de splogs n'est autre que... Google, avec sa plateforme Blogger. A en croire certains tests, de 40% à 60% des blogs sur cette plateforme seraient du spam...

XSS, ou "cross site scripting" est une technologie qui elle vous emmène à la limite du hacking : il ne s'agit rien de moins que d'exploiter les failles de formulaires de recherche sur des sites à fort Pagerank, en y injectant du code HTML, afin de faire apparaitre dans la page de résultat un lien vers le site de son choix.

Dernière technique : le sping (Il me semble que je viens d'inventer le mot). Le sping est simplement le spam des services de ping du type Weblogs.com, dans le but d'attirer des visiteurs, de pénétrer les moteurs de recherche RSS, et d'augmenter son Pagerank. Une variante du sping est d'envoyer de faux trackbacks aux sites gérant ce protocole (des blogs la plupart du temps), pour multiplier ses liens entrants.

On en viendrait presque à regretter les pages satellites...

Se fout-on de notre Goo-gueule ?

Décidemment Jean Veronis fait très fort, en nous expliquant pourquoi Google nous ment sur sa date d'aniversaire... Et ce n'est bien sûr pas par coquetterie ;)

27/09/2005

7 ans... La fin d'une histoire d'amour ?

Cher Google,

7 ans déjà que nous sommes ensemble... Je t'avoue que je n'ai pas vu le temps passer.

Je me souviens quand je t'ai rencontré, tu étais si séduisant ! Tu te démarquais tellement des autres, avec ton air de geek dépouillé, tes grandes aspirations, criant à tue tête "do no evil" ! Avec les années, tu n'a cessé de me surprendre, en faisant toujours plus pour me séduire. Tu n'admettait pas qu'un autre puisse te surpasser...

Mais depuis quelques temps, Google, j'avoue que je ne sais plus où nous en sommes... Tu as changé, et ton coté "chercheur fou" me manque. Tu t'es embourgeoisé, tu t'es empâté, tu mens, tu t'éparpilles dans des choses qui ne te ressemblent pas, bâcle ton travail... où est passé ton idéalisme ?

Je ne sais même plus si tu m'es fidèle.. Ne ment pas, j'ai bien vu que tu cherchais à séduire tout le monde : investisseurs, publicitaires, medias... Mêmes tes fréquentations me font peur... Oh bien sur, tu sais parfois me faire plaisir, mais j'ai désormais en permanence ce sentiment que tu cherches plus à me posseder qu'à me donner ce que je recherche...

22/09/2005

A toi qui me lis dans ton aggregateur...

Il y a 9 mois environ était lancé ce blog... Environ 140 billets et 340 commentaires plus tard, je ne sais toujours pas quelle est son audience véritable. La mesure est d'autant plus ardue que la majorité des consultations se fait par RSS (Environ 2500 hits/jour actuellement).

Je propose donc un petit jeu, en invitant les lecteurs à se présenter en commentaire, en spécifiant leur mode de consultation. Allez, ne soyez pas timides, vous avez même droit à un backlink sans rel="nofollow" ;)

Tant que nous y sommes, n'hésitez pas à proposer des sujets que vous souhaiteriez eventuellement voir abordés sur le blog, ainsi qu'à me faire part de tous vos suggestions et doléances.

Qui commence ?

19/09/2005

Offre d'emploi : Expert en référencement

Petite annonce qui pourrait éventuellement interesser quelques lecteurs... Je précise que je n'ai aucun lien avec la société et ne fais que transmettre l'offre d'emploi.

lire la suite

Google Soutra, ou les 4 verités selon Google

"Ainsi ai-je entendu: Une fois, le Bienheureux Google séjournait au Googleplex, près de Moutain View. Il s'adressa aux webmasters et dit :

O webmasters, il existe deux extrêmes qui doivent être évités par un webmaster. Quels sont ces deux extrêmes? Spammer les moteurs, ce qui est inférieur, vulgaire, mondain, ignoble et engendre de mauvaises conséquences, et négliger son référencement, ce qui est pénible, ignoble et engendre de mauvaises conséquences.

Sans aller à ces deux extrêmes, ô webmasters, le maitre Google a découvert la Voie du Milieu qui prodigue la vision, qui donne la connaissance, qui conduit à la quiétude, à la sagesse, à l'éveil et à l'émancipation.

Et quelle est, ô webmasters, cette Voie du Milieu que le maitre Google a découverte et qui prodigue la vision, qui donne la connaissance, qui conduit à la quiétude, à la sagesse, à l'éveil et à l'émancipation ? Ce n'est que le Noble Sentier quadruple, à savoir: l'écriture juste, la sémantique juste, l'indexabilité juste, la popularité juste.

Cela est, ô webmasters, la Voie du Milieu que le maitre Google a découverte, qui prodigue la vision, qui donne la connaissance, qui conduit à la quiétude, à la sagesse, à l'éveil et à l'émancipation.

Voici ô webmasters, la Vérité Noble dite souffrance : Le référencement est souffrance , suivre son positionnement est souffrance, ne pas être positionné est souffrance, perdre son positionnement est souffrance, le blacklistage est souffrance. En résumé, la course au référencement est souffrance .

Voici, ô webmasters, la Vérité Noble dite la cause du souffrance : C'est cette "soif" de positionnement qui produit tout ce bruit dans les forums, tous ces blacklistages et ces variations de positionnement, qui sont liés à une avidité passionnée et qui trouvent une nouvelle jouissance tantôt ici, tantôt là.

Voici, ô webmasters, la Vérité Noble dite la cessation du souffrance : C'est la cessation complète de cette "soif" de positionnement, la délaisser, y renoncer, s'en libérer, s'en débarrasser.

Voici, ô webmasters, la Vérité Noble dite le sentier conduisant à la cessation de la souffrance : C'est le Noble Sentier Quadruple à savoir: l'écriture juste, la sémantique juste, l'indexabilité juste, la popularité juste.

Ainsi parla le Bienheureux Google. Les webmasters, contents, se réjouirent des paroles du Bienheureux.

Do no evil ! Do no evil ! Do no evil ! "

Disclaimer : Toute ressemblance avec un maître indien né il y a environ 2600 ans ne serait que fortuite ;)

16/09/2005

Menace sur les pages satellites ?

Pratiquées de longue date, les pages satellites avec redirection javascript pourraient désormais être detectées par Google et bannies de l'index.

L'information, d'abord révélée sur Searchengineforums semble avoir été confirmée par Matt Cutts :

"Google mène un programme test pour alerter les propriétaires de sites quand nous supprimons leur site pour violation de nos conseils. Les redirections javascript sont notre 1ère cible, mais nous avons aussi envoyé quelques emails concernant du texte invisible, il me semble. Notre programme ne s'adresse pas aux sites du type il-est-pas-cher-mon-viagra.com, mais plutôt à l'attention des sites ayant un bon contenu, mais n'étant pas au courant des méthodes employées par leur référenceur, ou abusés par les promesses des programmes de génération automatique de pages satellites. Personnellement, je pense que communiquer avec les webmasters pour les prévenir de nos actions est vraiment une bonne chose : un propriétaire de site ne devrait pas avoir à se demander ce qui se passe. Mais je répète, il s'agit d'un programme test."

GoogleGuy avait également évoqué quelques jours plus tôt sur Webmasterworld l'amélioration des capacités de detection des redirections javascript par Google.

Reste à voir cependant l'efficacité réelle du système.

15/09/2005

Table ronde : peut-on vivre sans Google ?

Peut-on-vivre sans Google ? Faut-il avoir peur de ce moteur ? Quel futur pour la recherche d'information ? Ce sont quelques-uns des thême de la journée de reflexion organisée le 11 octobre à l'ENS Lettres et sciences humaines de Lyon, à laquelle Olivier Andrieu m'a fait l'honneur de me convier.

Vous y trouverez votre serviteur en bonne compagnie, puisque Franck Poisson,Jerôme Charron, Jean Veronis, Olivier Ertzscheid, Christophe Asselin, Armelle Thomas seront également présents.

Qui sait peut-être aurais-je l'occasion de rencontrer quelques lecteurs ?

14/09/2005

Du bon sens et de la conception web

Michael Carpentier nous gâte avec 2 billets dignes de lecture à mon avis : "Beau = différent ?" et "Votre organigramme n'interesse que vous !".

Extrait :

"Un livre est-il moins intéressant parce qu’il n’a pas de table des matières, que les numéros de pages sont situés, d’une page à l’autre, à des endroits différents et que les différentes pages du texte sont disposées au hasard, vous laissant deviner quelles constituent le début et quelles la fin ? Non ? Alors pourquoi certains processus de conception de sites web sont-ils encore soumis à d'intéressantes hypothèses du genre : C’est un look différent qui amène le succès d’un site ?"

Google Blog Search : c'est parti !

Google était curieusement absent de ce marché. C'est désormais chose faite, Google dispose désormais d'un module de recherche spécifique aux blogs ! Comme à son habitude le service est proposé en version beta, et son index est pour l'instant bien maigre (Référencement Design et Cie n'y figure même pas, c'est dire ;)

Google Blog Search utilise pour l'instant les sites de ping comme Weblogs.com pour indexer. Mais la FAQ indique qu'un formulaire de soumission devrait être prochainement disponible.

13/09/2005

Pourquoi les clients se fichent de l'accessibilité

A lire, cet article dans Digital Web Magazine : "10 Reasons Clients Don't Care About Accessibility".

Christian Heilmann expose selon lui les 10 raisons principales pour lesquelles l'accessibilité ne prends pas :

  • Personne ne peut garantir un site 100% accessible.
  • Il n'y a pas de bénéfice immédiatement perceptible.
  • L'accessibilité est vendue comme un problème technique.
  • Le handicap n'est pas quelque chose auquel le client aime penser.
  • Il est difficile de revenir sur l'accessibilité de sites déja conçus.
  • L'accessibilité n'est pas prise en compte dans la méthodologie de développement.
  • L'accessibilité n'est pas sexy, elle est un trouble-fête.
  • Personne ne se plaint.
  • L'accessibilité requiert une implication de la part du client.
  • Il n'y a pas de gros sites qui puissent servir de modèle à suivre.

L'auteur donne ensuite quelques pistes de reflexion : "Commencez à developper vos sites dans un éditeur de texte, pas dans Illustrator". Je ne peux qu'être d'accord !

9/09/2005

Olivier Andrieu ouvre son blog

Olivier Andrieu, le Danny Sullivan du référencement français, le 1er searchologue de l'hexagone ouvre enfin son blog. Respect ;)

Envisager autrement la densité des mots-clés

Il est fréquent de rencontrer sur les forums dédiés au webmastering et au référencement des fils dissertant à n'en plus finir sur la densité idéale des mots-clés à respecter pour s'assurer un bon positionnement dans les moteurs de recherche.

Ce questionnement n'est pas infondé : on devine bien intuitivement qu'une page ne contenant aucune occurence d'un mot-clé n'a pas de raison de se positionner dessus, et qu'une page avec un nombre d'occurences trop grand de ce mot-clé à toutes les raisons de paraitre suspecte aux yeux des moteurs.

Seulement voila : il n'existe pas de densité idéale, qu'elle soit globale (sur l'ensemble du contenu) ou locale (à l'intérieur de telle ou telle balise). Si une telle valeur existait, elle serait bien trop facilement exploitable, et perdrait tout son interêt. Comme le souligne cet article du Dr Garcia, les algorithmes des moteurs sont bien plus fins, et prennent en compte de nombreux autres paramètres, comme la lemmatisation, la proximité des mots-clés etc...

Aussi est-il plus productif de raisonner en terme de rationalisation du contenu, en faisant l'analogie entre le web et une bibliothèque, les deux étant finalement une collection de documents.

L'objectif ultime d'un moteur est de proposer la page la plus pertinente pour un mot-clé donné. "Pertinente" veut dire pertinente pour un humain : les moteurs vont donc se baser sur des critères d'évaluations proches des critères humains pour juger de la qualité d'une ressource.

Considérons une page web comme un livre. Si je recherche un livre sur un sujet (mot-clé) donné, je m'attends à ce que ce mot-clé figure en couverture. Pour voir si ce livre est vraiment pertinent par rapport à ma recherche, je m'en vais examiner les mots-clés figurant dans l'index et explore les différents chapitres et sections. Enfin, je "scanne" les chapitres qui m'interessent à la recherche de termes clés pour confirmer mon choix.

Pour les moteurs, la couverture du livre correspond à la balise <title> de la page. L'index correspond aux balises <hn>. Et le feuilletage est l'analyse rapide du contenu des paragraphes <p>. Nul besoin de se soucier d'une densité illusoire. Il suffit simplement que vos termes clés soient présents à ces endroits stratégiques. Votre densité sera suffisante, et vous satisferez ainsi à la fois moteurs et utilisateurs.

Une précision cependant : l'analogie s'arrête là, d'autres critères sont bien sûr pris en compte par les moteurs de recherche. (Quoique le PageRank pourrait être assimilé aux citations par d'autres ouvrages et aux recommandations des bibliothécaires et relations.)

7/09/2005

Yahoo Search : nouveaux services début 2006

C'est ce qu'affirme Olivier Parriche, directeur de la division recherche de Yahoo France dans une interview donnée à VNUnet.

2/09/2005

Menace sur les liens payés ?

Dans un récent billet, Matt Cutts, ingénieur chez Google s'exprime sur la question de l'achat de liens aux seules fins de booster son PageRank.

En effet le Pagerank repose sur le postulat qu'un lien sur une page web constitue une recommandation (ou un vote), et donc un indice de qualité. Hors les liens payés vont à l'encontre de ce postulat : le lien n'est plus établi pour sa pertinence par rapport au sujet traité, mais simplement vendu à des fins de positionnement, ce qui affecte la pertinence des moteurs utilisant ce type d'analyse.

Matt Cutts cite ainsi en exemple le journal des étudiants de l'université de Berkeley, site à fort PR, qui n'affiche pas moins d'une trentaine de liens "sponsorisés" menant entre autres vers des sites de casinos, de poker, ou des hotels en Italie...

Face à ce problème, Google affirme disposer de 2 types de défenses : des filtres algorithmique, tout d'abord, complétés par des pénalités semi-automatiques : s'il n'est pas question de pénaliser le positionnement des sites vendant des liens, Matt Cutts explique qu'ils pourraient cependant perdre leur capacité à transmettre du PR. Un "nofollow" imposé en somme.

Il n'est toutefois pas illégitime d'acheter des liens à des fins de promotion ciblée : Matt Cutts recommande dans ce cas d'utiliser l'attribut rel="nofollow", indiquant que le lien ne constitue pas un vote de la part du site partenaire.

Reste à voir si tout ceci est bien effectif et s'il ne s'agit pas simplement d'effrayer les webmasters obsédés par leur PageRank.

Mais la question qu'il faut se poser n'est elle pas simplement : "Ces lien profitent-t-ils à l'utilisateur ?"

1 2 >