Référencement, Design et Cie

Attention ce blog a déménagé et est en lecture seule. Cliquez ici pour accéder à mon nouveau blog SEO

Aller au contenu | Aller au menu | Aller à la recherche © Sébastien Billard

10/09/2006

36 critères d'accessibilité qui comptent pour le référencement (3ème et dernière partie)

Ce billet poursuit la série sur les rapports entre les recommandations Accessiweb et le référencement :

Critère 9.1 : Est-ce que la structuration de l'information est cohérente par rapport au contexte général du site ?

La structuration de l'information est nécessaire à la bonne compréhension par les utilisateurs de celle-ci. Elle peut également être un atout pour les moteurs. Un contenu bien structuré, utilisant un langage simple et clair, des titres informatifs, faisant bon usage des techniques de "front loading" aura tendance à être naturellement optimisé pour les moteurs.

Critère 9.2 : La page web est-elle structurée de manière cohérente ?

Le code HTML comporte un certain nombre de balises dites "sémantiques" car porteuses de sens : <h1> à <h6> pour les titres, <p> pour les paragraphes, <em> et <strong> pour les emphases, <ul> et <ol> pour les listes, etc. Ces balises sont prises en compte par les navigateurs, ainsi que par les aides à la navigation, mais sont également prises en compte par les moteurs. Les mots-clés présents dans un titre balisé comme tel se verront par exemple reconnaître un poids plus fort que si ce titre avait balisé avec un simple <div>, balise qui n'est pas porteuse de sens.

Critère 9.3 : Y a-t-il un plan du site ?

Le plan du site favorise l'accès à l'information pour les utilisateurs comme pour les moteurs, en fournissant des liens directs vers les pages profondes du site. Le plan améliore donc l'indexabilité du site, et participe à la redistribution du PageRank.

Critère 10.1 : Le contenu de la page est-il séparé de sa présentation ?

La séparation du contenu et de la présentation force à écrire un code HTML propre et des contenus bien structurés au lieu de produire une "soupe de tags" où les balises sont choisies pour leur rendu plutôt que pour leur signification, ce qui est plutôt bon pour les moteurs de recherche. Le code s'en trouve également allégé, ce qui pour certaines pages lourdes permet de voir davantage de contenu indexé.

Critère 10.2 : Avec les feuilles de style désactivées, l'information est-elle toujours présente ?

Tout comme le critère 10.1, la non-dépendance aux feuilles de style force à créer des contenus logiquement et sémantiquement structurés, ce qui reste un avantage du point de vue de l'accessibilité comme du référencement.

Critère 11.2 : Les textes associés aux champs de formulaires donnent-ils leur fonction exacte ?

Des intitulé explicites sont un avantage du point de vue de l'usabilité comme du référencement puisque ceux-ci auront une tendance naturelle à contenir des mots-clés.

Critère 12.3 : Existent-ils des barres de navigation qui facilitent l'accès pour la navigation interne dans le site ?

Les barres de navigation ou "chemins de fers", en plus de permettre un repérage et une navigation faciles au sein d'un site participent également à son référencement, en fournissant des liens aux robots d'indexation, et en comportant des mots-clés explicites, par exemple "Catalogue > Habillement > Homme > Chemises".

Critère 13.2 : "Si une redirection automatique est présente, s'effectue-t-elle sans l'intermédiaire d'un script ?"

Il est parfois nécessaire de rediriger automatiquement un utilisateur. Plusieurs solutions techniques existent, que ce soit au niveau serveur, par une balise meta refresh, ou par javascript. Les redirections à base de javascript posent problème : le navigateur utilisé peut ne pas interpréter javascript, et les moteurs ne l'interprètent de toute façon pas. Les balises meta refresh sont très peu appréciées des moteurs. Les redirection serveurs sont donc préférables à tout point de vue, avec s'il s'agit d'une redirection permanente une redirection de type 301, et s'il s'agit d'une redirection temporaire une redirection de type 302.

Critère 13.4 : "Y a-t-il une alternative équivalente au script qui déclenche l'ouverture de nouvelles fenêtres ? "

Il est parfaitement possible de créer des popups accessibles aux utilisateurs et aux moteurs, en utilisant des liens href "enrichis" d'un évènement onclick. Le contenu de la page en popup sera ainsi référencé.

Critère 13.6 : "Lorsqu'un fichier peut être téléchargé, y a-t-il des formats alternatifs équivalents ?"

Si les moteurs indexent une variété de plus en plus grande de fichiers, tous les formats ne leur sont pas accessibles. Et dans le cas où le format leur est accessible, comme le PDF, il n'est pas forcément souhaitable que l'utilisateur accède directement au document hors du contexte du site. On a donc tout intérêt à proposer ce type de contenus également dans une version HTML quand cela est possible, ce qui augmentera le potentiel de visibilité du site.

Critère 13.8 : "La présentation de la page est-elle réalisée sans détourner certaines balises de leur fonction d'origine ?"

Comme évoqué pour les critère 9.2 et 10.1, les balises HTML ne devraient être utilisée que pour leur signification et non pour leur rendu. Respecter la fonction d'origine des balises assure non seulement une meilleure accessibilité des contenus web, mais également un traitement optimal de ces contenus par les moteurs de recherche.

Voila qui clôt cette série de trois billets consacrée aux points de contact entre critères Accessiweb et référencement. J'espère que cette trilogie aura permis de faire comprendre que si les deux disciplines ne servent pas exactement les même objectifs, celles-ci affichent quand même une similarité dans la méthode, et convergent sur de nombreux points.

8/09/2006

36 critères d'accessibilité qui comptent pour le référencement (2ème partie)

Suite de mon billet d'hier sur les rapports entre les recommandations Accessiweb et le référencement :

Critère 2.3 : Y a t-il une balise NOFRAME ?

Disons-le tout de suite : utiliser des frames (cadres) est une très mauvaise idée tant au niveau de l'ergonomie que du référencement. Si toutefois on persiste à les utiliser, la balise noframe permet de fournir aux moteurs de recherche un contenu alternatif qui sera indexé.

Critère 2.4 : Le contenu de la balise NOFRAME est-il pertinent ?

Un frameset ne comprenant souvent aucun contenu propre, une balise noframe correctement renseignée devrait comprendre un paragraphe décrivant globalement le contenu du site, un texte expliquant que le site utilise normalement les frames, et une liste de liens vers les différentes pages du site.

Critère 4.1 : Est-il possible de récupérer les informations fournies dans les supports multimédias d'une autre manière ?

Les moteurs de recherche web ne savent lire ni les vidéos, ni les fichiers audio. Comme pour les images (critère 1.1), il faut donc fournir un équivalent textuel à ces fichiers. Selon le contexte, il pourra s'agir d'un transcript ou d'une description du contenu multimedia. Ces contenus textes comprendront naturellement des mots-clés pertinents, qui amélioreront la trouvabilité des éléments multimédias et du site en général.

Critère 5.6 : Dans un tableau de mise en forme, le contenu est-il correctement ordonné ?

Le contenu situé haut dans le code a tendance à se voir accorder une importance plus grande par les moteurs. Or certaines mises en page à base de tableaux font que le contenu se situe dans le code après des éléments plus accessoires pour le référencement, comme des éléments de navigation. Il faut donc veiller à une utilisation judicieuse des tableaux de mise en page, et limiter le recours aux tableaux imbriqués, qui ont tendance à destructurer l'information. Mieux encore : passez à une mise en page intégralement gérée par CSS.

Critère 6.1 : L'intitulé des liens fait-il moins de 80 caractères ?

Des intitulé de liens relativement courts favorisent l'accessibilité mais forcent également à rédiger des liens à la fois denses et pertinents, chose appréciée par les moteurs.

Critère 6.2 : Les liens sont-ils explicites ?

Les moteurs tiennent fortement compte des intitulés des liens pointant vers une page pour juger de la pertinence de cette page. Des liens explicites aident donc au positionnement, du fait des mots-clés qu'ils contiennent. Si vous vendez des vêtements en ligne par exemple, préférez "Notre catalogue de vêtements" à "Produits".

Critère 6.5 : Chaque intitulé de lien identique amène t-il vers la même destination ?

Cette recommandation participe aux liens explicites évoqués plus haut, et aide encore davantage à positionner la page liée sur les mots-clés présents dans l'intitulé du lien.

Critère 6.7 : Y a-t-il moins de 40 liens actifs dans la page, hors liens nécessaires à la navigation ?

Un nombre réduit de liens sur une page a tendance à augmenter la quantité de PageRank transférée à chacune des pages liées, ce qui favorise le référencement. Attention cependant, il ne faudrait pas tomber dans le travers qui serait de construire son site autour du PageRank : d'une part le site doit être pensé pour l'utilisateur en priorité (tout en tenant compte de référencement), d'autre part des liens nombreux aident les moteurs à indexer le site en profondeur.

Critère 7.1 : Si un script nécessite une alternative pour être accessible, l'information donnée par cette alternative est-elle équivalente à l'information fournie par le script ?

Javascript n'étant pas interprété par les moteurs, toute information affichée par un script ne sera pas lue par les moteurs de recherche. Une version alternative accessible (en HTML) de cette information garantie que celle-ci sera bien indexée.

Critères 7.2 : Des actions peuvent-elles être accomplies même si le périphérique pour lequel elles sont prévues est désactivé ?

La non-dépendance aux périphériques (souris, clavier, écran...) renforce l'indexabilité de la page par les moteurs : un moteur sait interpréter un lien href, mais ne va pas cliquer, et il ne dispose pas non plus d'écran.

Critère 8.2 : L'attribut LANG est-il présent au début du code source de la page pour identifier clairement la langue utilisée ?

Cet attribut en spécifiant la langue d'une page peut l'aider à se positionner pour les requêtes restreintes à une langue donnée. Il est aussi probable que cet attribut soit utilisé à des fins sémantiques, pour une analyse plus fine des contenus.

Critère 8.3 : Des éléments de description de la page sont-ils présentes en début de code source ?

Les balises meta description et meta keywords apportent des informations utiles aux moteurs puisque porteuses de sens. Le charset permet un affichage correct du titre des pages et de leur description dans les pages de résultats des moteurs de recherche. Ces éléments participent donc à la bonne prise en compte de vos pages par les moteurs.

Critère 8.5 : Le contenu de la balise TITLE est-il explicite ?

La balise <title> est pour les moteurs de recherche un des critères les plus importants pour juger de la pertinence d'une page. La balise <title> doit décrire précisément l'objet de la page dans un langage à la fois clair et riche en expressions-clés.

Critère 8.6 : Le contenu de la balise TITLE est-il différent d'une page à l'autre ?

Le point 8.5 prévoyant un <title> explicite, chaque page du site devrait donc posséder un <title> qui lui est propre. Cette diversité de titres augmentera de façon significative les possibilités de positionnement dans les moteurs de recherche, du fait de la variété des mots-clés y figurant.

Accéder à la troisième partie de l'article

7/09/2006

36 critères d'accessibilité qui comptent pour le référencement (1ère partie)

Comme le laissait pressentir mon dernier billet, je vous propose d'étudier en détail dans une série de billets les 36 critères Accessiweb ayant une relation directe avec le référencement. Il ne s'agit pas de voir l'accessibilité sous le seul angle du référencement : l'accessibilité s'adresse avant tout aux utilisateurs, et c'est là son objectif principal. L'objet de cet étude est davantage de mettre en évidence la convergence dans la méthode entre les deux démarches, les moteurs de recherche pouvant être vus comme des utilisateurs particuliers, avec des handicaps technologiques.

Critère 1.1 : Chaque élément graphique possède-t-il une alternative textuelle ?

Les moteurs sont avant tout des machines à indexer du texte, et sont incapables de lire le contenu d'une image. Les attributs alt permettent de fournir un contenu texte alternatif aux éléments graphiques, pour les utilisateurs comme pour les moteurs.

Critère 1.2 : Pour chacune des images de la page ayant une alternative, les textes dans l'attribut ALT sont-ils appropriés par rapport au contexte dans lequel l'image se trouve ?

Le référencement vise à favoriser l'accessibilité à l'information. On pourrait aussi parler de"trouvabilité". L'information convoyée par l'image peut varier selon le contexte, et l'image peut dans certain cas ne convoyer aucune information : c'est le cas des images purement décoratives. Un attribut Alt non pertinent constituerait autant de bruit supplémentaire pour les moteurs. L'attribut Alt doit donc être adapté afin d'augmenter le rapport signal/bruit des pages.

Critère 1.4 : Pour chacune des images de la page, les textes dans l'attribut ALT font-ils moins de 60 caractères ?

L'objectif de cette recommandation est purement ergonomique. Toutefois, un des bénéfices de sa mise en oeuvre concerne le référencement, puisque elle force à décrire le contenu en un minimum de mots-clés, ce qui favorise la trouvabilité du site (et de l'image) sur ces mot-clés.

Critère 1.5 : Les commentaires associés à chacune des zones réactives d'une image map sont-ils pertinents ?

L'information graphique convoyée par une image map peut être textuelle, elle peut aussi être abstraite ou symbolique. Des attributs alt décrivant précisément chaque zone permettent aux moteurs de se faire une idée du contenu de la page contenant l'image map et des pages liées.

Critère 1.8 : Pour chacune des images texte de la page, le contenu de son alternative est-il au moins équivalent au texte inscrit dans l'image ?

Comme expliqué pour le critère 1.1, les moteurs étant incapables de lire les images, l'attribut alt doit au minimum reprendre le texte de l'image, en le précisant éventuellement. Par exemple pour une image sur un site de vêtements affichant "catalogue", utiliser comme attribut alt "notre catalogue de vêtements" ce qui favorise le référencement et la compréhension du lien vu ou entendu hors de son contexte visuel normal.

Critère 1.9 : Il convient de remplacer un texte sous forme d'image par un texte mis en forme. Cette règle est-elle respectée ?

Si les attributs alt permettent de fournir une alternative textuelle aux images, il est préférable pour les utilisateurs comme pour les moteurs d'utiliser du texte mis en forme via CSS : ce texte sera plus facilement manipulable par les utilisateurs et mieux pris en compte par les moteurs.

Critère 1.10 : Quand une image nécessite une description détaillée, un commentaire texte lui est-il associé ?

L'attribut alt est parfois insuffisant pour décrire une image qui demande une explication plus détaillée. En lui adjoignant un commentaire texte, vous fournissez davantage de contenu riche en mots-clés aux moteurs, ce qui améliore encore la trouvabilité du site. Du point de vue du référencement, le texte dans la page est cependant préférable à l'attribut longdesc.

Critère 1.11 : Si une description détaillée de l'image est présente, son contenu est-il pertinent ?

La description de l'image se doit d'être précise : qu'est-ce qui est représenté ? Quelle est l'idée transmise ? les différents éléments affichés ? En répondant à ces questions, vous écrirez naturellement un texte riche en mots-clés, et donc bénéfique pour votre référencement.

Critère 1.12 : Pour chacune des images liens, le texte contenu dans l'attribut ALT donne-t-il la fonction du lien ?

Les moteurs de recherche prennent en compte les intitulés des liens pointant vers une page pour juger de la pertinence de cette page par rapport à un mot-clé donné. C'est pourquoi il est important que les liens sous forme d'images soient dotés d'un attribut alt décrivant le contenu de la page liée.

Accéder à la seconde partie et à la troisième partie de l'article.

4/09/2006

Le saviez-vous ?

Parmi les 92 points de contrôle du label AccessiWeb, 36 ont une relation directe avec le référencement, soit presque 40 %. L'objet d'un prochain billet sans doute...

31/08/2006

Scepticisme 2.0

A l'aube d'une bulle internet 2.0, Tim Berners Lee remet les pendules à l'heure dans une récente interview :

L'interviewer : "Vous savez, à propos du Web 2.0, une explication fréquemment avancée est que le Web 1.0 consistait à connecter des ordinateurs et à rendre l'information disponible. Le Web 2.0 lui connecte les individus et facilite leur collaboration. Est-ce la façon dont vous voyez le Web 2.0 ?"

Tim Berners Lee : "Pas du tout. La vocation du Web 1.0 était dès le départ de connecter les individus. C'était déjà un espace interactif. Mon opinion est que le Web 2.0 est juste un jargon, que personne ne sait vraiment définir. Si le Web 2.0 se résume pour vous aux blogs et aux wikis, eh bien c'est simplement de l'interaction entre individus. C'est que le Web devait être dès le départ.

En réalité, le Web 2.0 consiste à utiliser les standards qui ont été définis par ceux qui ont construit le Web 1.0 : Le Web 2.0, c'est utiliser DOM, HTML, SVG, HTML, etc, c'est-à-dire construire des applications basées sur les standards, avec un peu de javascript en plus (...) Mais l'idée d'un web consistant en une interaction entre les individus est vraiment ce pour quoi le Web était pensé depuis le début."

Tom Foremski enfonce le clou sur son blog :

"Chaque société du Web 2.0 ne fait finalement que proposer une variante du couteau-suisse-social-collaboratif, chacune offrant à peu près les même choses (...) A mon avis la prudence s'impose (...) je l'ai dit depuis plus d'un an, mais avec tout ces services sortant de phase alpha, je crois qu'il est important de souligner combien nombre de ces sociétés sont dans une impasse.

Par exemple, combien de temps faudrait-il à Google, Yahoo, ou Microsoft pour faire un reverse engineering de ces services ? Une semaine pour la version alpha, et un mois pour la beta, sans compter qu'ils ont déjà la capacité de monétiser ces services en 2 semaines (...)

Ces sociétés ne peuvent réussir que si elle deviennent des standards de fait, en réunissant une communauté suffisamment large. Les communautés ne sont pas crées à coup de communiqués de presse. Elles ne sont pas annoncées : elles sont cultivées. Parmi la quantité de communautés 2.0, certaines deviendront très larges. Mais ce ne sera le cas que pour une toute petite fraction d'entre elles."

Happy Blog day !

Aujourd'hui 31 Août est donc célébré le Blog Day, évènement n'ayant d'autre but que de faire découvrir 5 blogs que l'on apprécie, sans pour autant qu'ils fassent partie de nos thèmes de prédilection.

Voici donc ma sélection pour cette année, forcément incomplète :

(Le tag Technorati)

30/08/2006

Pages similaires Google : amélioration en vue ?

Disponibles à coté de chaque lien de ses page de résultats, les liens "pages similaires" (opérateur related:) de Google étaient jusque ici bien peu efficaces, affichant souvent des sites qui n'avaient un rapport que très vague avec le site concerné.

Il semble cependant que la fonction ait vu son efficacité améliorée sur le datacenter 64.233.187.104 : alors que les pages similaires standards n'affichent que des résultats de mon domaine, la version de ce datacenter affiche elle des sites autres, qui traitent tous du référencement, des moteurs de recherche et du design web, thèmes principaux de ce blog.

La différence est également flagrante pour d'autres sites, Amazon par exemple. Cela dit, il reste encore du progrès à faire, car pour certains sites les résultats ne sont pas encore totalement satisfaisants, comme avec Cdiscount, pour lequel Tfou.fr et le site du journal l'Equipe sont considérés comme similaires.

29/08/2006

Scapture : voir son site sous Linux

Scapture vous permet d'obtenir des captures d'écran de votre site vu dans plusieurs navigateurs sous Linux. Des services équivalent existent déjà pour divers plateformes, certains payants (Browsercam), certains gratuits (Browsershots, Browsrcamp). Scapture se démarque en proposant également des captures en mode texte (Navigateurs Lynx et Links).

Voir des exemples pour Référencement Design et Cie.

25/08/2006

Blogbar, le mini moteur qui rapporte

Le multi-moteur de recherche Blogbar vous permet désormais de gagner de l'argent, grâce au programme de liens sponsorisés Adsense.

La Blogbar s'est également enrichie de nouvelles fonctionnalités depuis la présentation que j'en avais faite en novembre dernier, avec notamment la possibilité de recherche sur les réseaux sociaux (Wikio, Fuzz, Del.icio.us...).

22/08/2006

Le référencement en question

Dans un long mais très pertinent article, Stéphane Marec réfléchit sur la définition du mot "référencement". Après avoir passé en revue -et rejeté- plusieurs définitions restrictives ou incomplètes du référencement, Stéphane propose de définir le référencement comme étant "la capacité à proposer une stratégie personnalisée d’acquisition de visibilité et de trafic utile sur les outils de recherche, répondant précisément aux objectifs de communication du client, et à proposer le plan d’action le plus adéquat afin de mettre en œuvre cette stratégie".

Je ne peux qu'aprouver le propos, qui rejoint sur certains points ma tentative de définition du "référenceur 2.0".

Les interviews de Mots&Co

A lire sur Mots&Co, une interview de votre serviteur sur le référencement des blogs professionnels. Au delà de cette interview, je ne peux que vous encourager à consulter l'ensemble du site, qui regorge de réflexions pertinentes, en insistant notamment sur la nécessité d'un contenu de qualité. J'ai en particulier apprécié les interviews de Sébastien Bailly, Xavier Mazenod, et Bertrand Duperrin.

11/08/2006

Jack Bauer SEO facts

For our (rare) english readers, a translation of my previous post. What every web designer and SEO/SEM should know about Jack Bauer :

Long time ago, the Voila.fr spider lacked respect to Jack Bauer. None has never seen him since.

Once, Jack bauer interrogated Jeeves. This is why the search engine is now just named "Ask".

Many years ago, Northerlight blacklisted Jack's first homepage. Northernlight was Jacklisted.

If Jack Bauer was a search engine, it would be to the users to answer Jack's queries.

If Jack was a search engine, its index would already be clean of any website.

If Jack Bauer was a spider, invisible web would be a myth.

Jack Bauer joined Google. Hence Bigdaddy.

Serious webmasters try to comply with W3C. W3C try to comply with Jack.

Some time ago, W3C's validator said that Jack's website didn't comply with Web Content Accessibility Guidelines. Hence WCAG 2.

There were too many bad jokes about Jack Bauer on the Web. This is why Web 1.0 is now history.

(Freely inspired from the Jack Bauer facts)

10/08/2006

Ce que tout web designer devrait savoir sur Jack Bauer...

Il y a longtemps, le robot d'indexation de Voila a manqué de respect à Jacques Bauer. Personne ne l'a revu depuis.

Une fois, Jack Bauer a interrogé Jeeves. C'est pourquoi le moteur s'appelle désormais seulement Ask.

Northern Light avait blacklisté le premier site perso de Jack. Le moteur s'est vu jacklister.

Si Jack Bauer était un moteur de recherche, ce serait aux utilisateurs de répondre aux questions.

Si Jack était un moteur de recherche, il aurait déjà éliminé tous les sites de son index.

Si Jack était un spider, le web invisible n'existerait pas.

Jack Bauer a rejoint l'équipe Google. Peu après, il y a eu Bigdaddy.

Les webmasters consciencieux s'efforcent de suivre les normes du W3C. Le W3C s'efforce de suivre celles de Jack.

Il n'y a pas longtemps, le W3C a déclaré que le site de Jack ne respectait pas les directive pour l'accessibilité des contenus web. D'où la version 2 des WCAG.

Le Web s'est trop moqué de Jack avec des blagues stupides. Le Web 1.0 est désormais de l'histoire ancienne.

(Librement inspiré des Jack Bauer Facts)

5 Moteurs de recherche personnalisés à découvrir

Suite à la sortie de Yahoo Search Builder, évoqué précédemment, j'ai pensé qu'il serait pertinent de faire un comparatif des services en ligne permettant de créer un moteur de recherche spécialisé. J'ai donc volontairement exclu les moteurs de recherche à héberger soi-même, plus difficiles à mettre en oeuvre.

Google Free Site Search

Il est possible en modifiant le code de Google Free Site Search de se créer une interface de recherche personnalisée, qui permettra une recherche sur les domaines spécifiés, via un bouton radio.

Google Free Search peut être un choix pertinent: Google est le moteur le plus familier pour la majorité des utilisateurs, et dispose du plus gros index mondial avec Yahoo. Le formulaire de recherche est discret et s'intègre à tout type de design. Malheureusement, les fonctionnalités sont pauvres, et la recherche ne porte que sur le seul site sélectionné, non sur l'ensemble des sites.

Yahoo Search Builder

La solution de Yahoo permet de bénéficier d'un index personnalisé, qui est en fait un sous-index de l'index principal : les sites spécifiés dans Yahoo Site Builder devront donc être correctement indexés par Yahoo pour que la recherche fonctionne (comme tous les services de ce type d'ailleurs).

A la différence de Google Free Search, la recherche porte sur l'ensemble des sites spécifiés, ce qui rend cet outil bien plus puissant (Le nombre de site ne semble pas limité). Il est possible d'adjoindre systématiquement certains mots-clés aux recherches, de bannir des mots-clés ou domaines, et d'intégrer la recherche sur Yahoo News. L'interface de recherche est personnalisable (taille, polices, couleurs, logo), et permet d'afficher sous forme de nuage les mot-clés les plus tapés. Autre point fort, Yahoo fournit des statistiques détaillées sur les mots-clés tapés et sites visités.

Gigablast

Relativement peu connu, Gigablast propose pourtant deux solutions de recherche personnalisée performantes, Custom Topic Search, et Site Search.

Custom Topic Search permet de créer un moteur de recherche personnalisé basé sur l'index général de Gigablast, en selectionnant jusqu'à 500 sites. Site Search abaisse cette limite à 200 sites, mais en revanche permet de forcer l'indexation des sites selectionnés (dans le respect du protocole robots.txt).

Dans les deux cas, Gigablast offre la possibilité d'obtenir des résultats au format XML, ce qui autorise un contrôle total sur l'apparence des pages de résultats.

Rollyo

Exploitant l'index Yahoo, Rollyo permet de créer extrêmement facilement de multiples moteurs spécialisés, dénommés "Searchrolls", en spécifiant jusqu'à 25 sites par Searchroll. Rollyo propose un certain nombre d'outils, et s'interface avec votre navigateur pour rechercher à travers vos Searchrolls, vos favoris, ou les sites que vous visitez.

Rollyo hébergeant les Searchrolls, il n'y a pas besoin de disposer d'une page web personnelle pour l'utiliser.

Eurekster

Sous la forme de "Swickis" (Search Wikis), Eurekster propose la création de moteurs personnalisés originaux, puisque permettant aux utilisateurs d'interagir avec les résultats : ceux-ci peuvent promouvoir un site, ou au contraire l'éliminer des pages de résultats, ce qui améliore progressivement la pertinence du Swicki. L'interface de recherche est personnalisable, permettant même l'usage de HTML et CSS.

Basé lui aussi sur l'index Yahoo, Eurekster permet la recherche sur le web, mais également dans les blogs et les images. Tout comme Rollyo, il n'est pas nécessaire de disposer d'un espace web personnel pour utiliser le service.

8/08/2006

Créez votre moteur de recherche personnalisé avec Yahoo

Lorsque l'on mène des recherches approfondies sur un sujet ou que l'on anime une communauté, il peut être pertinent de mettre en place un moteur de recherche spécialisé. Deux solutions s'offrent alors : créer l'outil de toutes pièces, ce qui offre un contrôle total mais est coûteux en temps, en ressources, et nécessite de solides compétences, ou bien passer par un service de recherche "prêt à l'emploi".

Avec Search Builder, Yahoo permet désormais de créer son propre moteur de recherche personnalisé, en sélectionnant les sites qui apparaitront dans les pages de résultats. Il est ainsi possible de disposer d'un index très qualitatif, car défini par vous-même, sous la forme d'une simple liste d'URLs. D'autres options sont disponible, comme la possibilité de filtrer certains mots-clés ou URLs. Des statistiques sur l'utilisation du moteur sont également fournies (mots clés recherchés, sites visités, referers). Une très bonne idée pour mieux cerner les attentes des utilisateurs.

< 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 >