Référencement, Design et Cie

Attention ce blog a déménagé et est en lecture seule. Cliquez ici pour accéder à Référencement Design et Cie 2.0

Aller au contenu | Aller au menu | Aller à la recherche © Sébastien Billard

12/03/2007

A quand AskCity en France ?

La dernière fonctionnalité du service AskCity est assez géniale : il est possible de dessiner un polygone sur une carte, pour ensuite faire des recherches sur ce seul périmètre. Les outils de dessin peuvent également servir à annoter la carte. Il devient alors très aisé de chercher un restaurant français près de Central Park (par exemple), puis de partager les résultats de sa recherche avec ses amis. Dommage que le service ne fonctionne pour l'instant que pour les Etats-Unis...

Ce type de fonctionnalité serait également très intéressante sur un site immobilier : on pourrait ainsi sélectionner des zones où rechercher, et un clic sur les épingles afficherait en pop-up la description du bien.

3/01/2007

Version 3.0 beta pour Goshme

Goshme, que j'avais présenté en octobre 2005, est un moteur de recherche un peu particulier, puisque au lieu d'indexer directement les contenus, ils interroge des bases de données préalablement sélectionnées, permettant ainsi d'accéder au web invisible (sur ce sujet, consulter le livre blanc Goshme, au format PDF).

Goshme se positionne donc d'avantage comme un assistant de recherche qu'un moteur stricto sensu. Actuellement, Goshme est capable d'interroger environ 2590 bases de données, avec des temps de réponses plus courts qu'avant (deux à trois secondes, contre quinze auparavant, et ce délai devrait descendre à terme en dessous de la seconde).

L'interface de cette beta 3.0 a été grandement simplifiée et épurée. Alors qu'il fallait auparavant sélectionner les catégories de sites à interroger, la page d'accueil comprend désormais une simple boite d'interrogation, l'affinage de la recherche se faisant directement dans les pages de résultats grâce à une arborescence sur la gauche (il est cependant toujours possible de sélectionner dès le départ les catégories à interroger via la recherche avancée). Le menu en haut des pages de résultats permet quant à lui de spécifier le type de média recherché : tous types, images, contenus audio, vidéo, actualités etc.

Une prévisualisation des pages de résultats des différentes bases interrogées dans des iframes est offerte. J'aurais cependant apprécié une indication du nombre de résultats pour chaque base interrogée. Espérons que cette fonctionnalité soit implémentée par la suite.

La version précédente de Goshme comprenait trois onglets : moteurs spécialisés, annuaires, et moteur généralistes. Cette distinction a disparu, Goshme affichant d'abord les résultats des moteurs spécialisés, puis ceux des outils généralistes.

Si elles sont moins visibles, des améliorations ont également été menée coté back-office : la maintenance et la catégorisation des bases de données sont désormais automatisées, ce qui permet de gérer plus facilement un très grand nombre de base de données, leur configuration changeant régulièrement. Ce processus était auparavant assuré manuellement.

D'autres améliorations sont enfin prévues, en particulier une attention plus grande portée aux bases de données du web profond, et l'indexation de bases non anglophones, notamment portugaises, françaises et espagnoles.

12/12/2006

Un annuaire pour les professionnels blogueurs

Professionnels blogueurs en quête de visibilité, Blogs Pro vous propose "de découvrir les entreprises à travers leurs blogueurs" à travers son annuaire spécialisé.

Une bonne initiative, car elle bénéficie à tous : le blogueur y gagne en visibilité et en notoriété, de même que l'entreprise qui profite d'un contact plus vrai et plus informel. Et le visiteur y trouve facilement des sites de qualité.

8/11/2006

Recherche cartographique : Virtual Earth passe à la 3D

Virtual Earth, le moteur de recherche cartographique de Microsoft Live, permet désormais d'accéder à ses services en trois dimensions (et en beta), à la manière de Google Earth. A la différence de ce dernier, la navigation ne se fait pas dans un logiciel dédié, mais directement dans le navigateur, après avoir installé le plugin adequat*.

Le service est assez impressionnant. Si concernant les vues aériennes on n'atteint pas pour la France des résolutions aussi élevées que dans Google Earth ou Geoportail (2D pour l'instant), l'outil offre en revanche une excellente résolution en mode carte (données fournies par Navteq, comme pour Ask). En terrain montagneux, cela permet une vue de type GPS très agréable (ici la route du Col des Montets avec le massif du Mont-Blanc en arrière-plan).

Autre point notable : Des bâtiments 3D détaillés et texturés. Les grosses villes américaines sont bien entendues privilégiées (ex : Dallas, New York), mais Paris affiche quand même quelques bâtiments emblématiques comme le Louvre, Notre-Dame, les Invalides... ainsi que le Stade de France et Roland-Garros :)

(*Note pour l'installation : les options régionales de Windows doivent être configurée en anglais américain)

2/11/2006

Google Custom Search a son blog

Le service de moteur de recherche personnalisé Google CSE possède désormais son blog officiel.

Pendant ce temps-là de nouveaux CSE apparaissent : Igor lance un CSE sur les standards du web, Jean Pierre lance un CSE indexant les sites référencés par Webonorme, tandis que SEOplug se spécialise dans l'indexation des sites liés au référencement. Un annuaire spécialisé, Guide to Custom Search Engines, fait également son apparition.

24/10/2006

Créez votre moteur de recherche personnalisé avec Google

Longtemps à la traîne en matière de moteurs de recherche personnalisés, Google rattrape son retard en lançant Google Custom Search Engine (CSE), qui est en fait une nouvelle fonctionnalité de Google Co-op.

Deux modes de recherche sont offerts : soit sur les seuls sites choisis, soit sur l'ensemble du web avec une emphase sur les sites spécifiés. Le nombre de site sur lesquels rechercher ne semble pas limité, ce qui est un très bonne chose. Si le nombre de sites à indexer est important, Google CSE permet l'upload de listes au format OPML, XML et TSV.

Il est possible d'adjoindre des tags aux sites, appelés labels, qui permettent de restreindre les recherches. On peut ainsi tagger les sites par exemple selon leur langue, ou selon leur nature. Un fonctionnement en mode collaboratif est également proposé, permettant aux utilisateurs d'interagir avec l'index.

Au niveau de l'interface, Google CSE permet une personnalisation plus poussée que Google Free Search ou Adsense pour les recherches, en permettant d'intégrer ou non les pages de résultats au site (via une iframe), de personnaliser les couleurs des pages de résultats, d'afficher ou non des Adsenses (et de générer ou non des revenus), et même d'utiliser les APIs Ajax Search.

Google CSE est donc une très bonne surprise pour qui souhaite créer simplement un moteur thématique performant. A titre d'exemple, la mise en place d'un moteur de recherche sur le bouddhisme Theravada ne m'a pris qu'une vingtaine de minutes ;)

12/09/2006

Google facilite l'accès aux fichiers PDF

Cela fait maintenant longtemps que Google indexe les fichiers Adobe Acrobat (PDF).

Ce qui est nouveau (semble-t-il), c'est que Google ajoute désormais systématiquement à l'URL de tout fichier Acrobat le paramètre "#search=", avec comme argument la requête tapée par l'utilisateur ce qui permet via le moteur de recherche intégré d'accéder très rapidement à l'information au sein du PDF (testez par exemple la requête "le handicap en france" en cliquant sur le PDF en cinquième position).

Ce paramètre, qui n'est pas le seul reconnu par Acrobat, fait partie des "Open parameters", permettant par exemple dans une URL de spécifier la page d'ouverture d'un PDF, grâce au paramètre "#page=x".

30/08/2006

Pages similaires Google : amélioration en vue ?

Disponibles à coté de chaque lien de ses page de résultats, les liens "pages similaires" (opérateur related:) de Google étaient jusque ici bien peu efficaces, affichant souvent des sites qui n'avaient un rapport que très vague avec le site concerné.

Il semble cependant que la fonction ait vu son efficacité améliorée sur le datacenter 64.233.187.104 : alors que les pages similaires standards n'affichent que des résultats de mon domaine, la version de ce datacenter affiche elle des sites autres, qui traitent tous du référencement, des moteurs de recherche et du design web, thèmes principaux de ce blog.

La différence est également flagrante pour d'autres sites, Amazon par exemple. Cela dit, il reste encore du progrès à faire, car pour certains sites les résultats ne sont pas encore totalement satisfaisants, comme avec Cdiscount, pour lequel Tfou.fr et le site du journal l'Equipe sont considérés comme similaires.

10/08/2006

5 Moteurs de recherche personnalisés à découvrir

Suite à la sortie de Yahoo Search Builder, évoqué précédemment, j'ai pensé qu'il serait pertinent de faire un comparatif des services en ligne permettant de créer un moteur de recherche spécialisé. J'ai donc volontairement exclu les moteurs de recherche à héberger soi-même, plus difficiles à mettre en oeuvre.

Google Free Site Search

Il est possible en modifiant le code de Google Free Site Search de se créer une interface de recherche personnalisée, qui permettra une recherche sur les domaines spécifiés, via un bouton radio.

Google Free Search peut être un choix pertinent: Google est le moteur le plus familier pour la majorité des utilisateurs, et dispose du plus gros index mondial avec Yahoo. Le formulaire de recherche est discret et s'intègre à tout type de design. Malheureusement, les fonctionnalités sont pauvres, et la recherche ne porte que sur le seul site sélectionné, non sur l'ensemble des sites.

Yahoo Search Builder

La solution de Yahoo permet de bénéficier d'un index personnalisé, qui est en fait un sous-index de l'index principal : les sites spécifiés dans Yahoo Site Builder devront donc être correctement indexés par Yahoo pour que la recherche fonctionne (comme tous les services de ce type d'ailleurs).

A la différence de Google Free Search, la recherche porte sur l'ensemble des sites spécifiés, ce qui rend cet outil bien plus puissant (Le nombre de site ne semble pas limité). Il est possible d'adjoindre systématiquement certains mots-clés aux recherches, de bannir des mots-clés ou domaines, et d'intégrer la recherche sur Yahoo News. L'interface de recherche est personnalisable (taille, polices, couleurs, logo), et permet d'afficher sous forme de nuage les mot-clés les plus tapés. Autre point fort, Yahoo fournit des statistiques détaillées sur les mots-clés tapés et sites visités.

Gigablast

Relativement peu connu, Gigablast propose pourtant deux solutions de recherche personnalisée performantes, Custom Topic Search, et Site Search.

Custom Topic Search permet de créer un moteur de recherche personnalisé basé sur l'index général de Gigablast, en selectionnant jusqu'à 500 sites. Site Search abaisse cette limite à 200 sites, mais en revanche permet de forcer l'indexation des sites selectionnés (dans le respect du protocole robots.txt).

Dans les deux cas, Gigablast offre la possibilité d'obtenir des résultats au format XML, ce qui autorise un contrôle total sur l'apparence des pages de résultats.

Rollyo

Exploitant l'index Yahoo, Rollyo permet de créer extrêmement facilement de multiples moteurs spécialisés, dénommés "Searchrolls", en spécifiant jusqu'à 25 sites par Searchroll. Rollyo propose un certain nombre d'outils, et s'interface avec votre navigateur pour rechercher à travers vos Searchrolls, vos favoris, ou les sites que vous visitez.

Rollyo hébergeant les Searchrolls, il n'y a pas besoin de disposer d'une page web personnelle pour l'utiliser.

Eurekster

Sous la forme de "Swickis" (Search Wikis), Eurekster propose la création de moteurs personnalisés originaux, puisque permettant aux utilisateurs d'interagir avec les résultats : ceux-ci peuvent promouvoir un site, ou au contraire l'éliminer des pages de résultats, ce qui améliore progressivement la pertinence du Swicki. L'interface de recherche est personnalisable, permettant même l'usage de HTML et CSS.

Basé lui aussi sur l'index Yahoo, Eurekster permet la recherche sur le web, mais également dans les blogs et les images. Tout comme Rollyo, il n'est pas nécessaire de disposer d'un espace web personnel pour utiliser le service.

8/08/2006

Créez votre moteur de recherche personnalisé avec Yahoo

Lorsque l'on mène des recherches approfondies sur un sujet ou que l'on anime une communauté, il peut être pertinent de mettre en place un moteur de recherche spécialisé. Deux solutions s'offrent alors : créer l'outil de toutes pièces, ce qui offre un contrôle total mais est coûteux en temps, en ressources, et nécessite de solides compétences, ou bien passer par un service de recherche "prêt à l'emploi".

Avec Search Builder, Yahoo permet désormais de créer son propre moteur de recherche personnalisé, en sélectionnant les sites qui apparaitront dans les pages de résultats. Il est ainsi possible de disposer d'un index très qualitatif, car défini par vous-même, sous la forme d'une simple liste d'URLs. D'autres options sont disponible, comme la possibilité de filtrer certains mots-clés ou URLs. Des statistiques sur l'utilisation du moteur sont également fournies (mots clés recherchés, sites visités, referers). Une très bonne idée pour mieux cerner les attentes des utilisateurs.

25/07/2006

Amnesty International en campagne contre la censure sur le Web

Après Reporter Sans Frontières, c'est au tour d'Amnesty International de s'insurger contre l'autocensure pratiquée par les moteurs de recherche (Quoi ? Internet ne serait pas différent du monde réel ?). J'avais déjà exprimé ma perplexité face à ces propos dans un récent billet.

Là encore, certains propos tenus pas Amnesty International m'apparaissent surprenants : dans un modèle de pétition à Eric Schmidt, CEO de Google, l'ONG argumente ainsi que "l'entreprise contribue à des atteintes à la liberté d’expression et d’information". Je trouve le propos discutable : En filtrant des contenus qui ont toutes les chances de toute façon d'être inaccessibles aux utilisateurs, les moteurs ne font que tenir compte d'un état de fait et de droit (aussi liberticide ce droit soit-il). La liberté d'accès à l'information ne serait pas plus grande pour l'utilisateur si les moteurs renoncaient à fournir leurs services en Chine, ou s'il étaient eux-même blacklistés par le gouvernement chinois car trop libertaires. En fait, c'est même le contraire : les fonctionnalités des moteurs peuvent dans certains cas être détournées pour avoir accès à des contenus illicites, c'est le cas par exemple de l'outil de traduction Google qui peut être transformé en proxy.

Amnesty a également lancé une campagne, Irrepressible.info invitant les webmasters à afficher des fragments d'informations extraits de sites censurés via... javascript ! Ces informations ne seront donc pas indexées par les moteurs, et pas trouvables par les utilisateurs des pays concernés... Qui plus est le javascript affiche aléatoirement des messages dans divers langues ce qui présente encore moins d'interêt pour ces utilisateurs...

Edit : A lire, une réponse de Google à ce sujet sur le blog Il n'est pas trop tard.

27/06/2006

Huckabuck, un meta-moteur innovant

Huckabuck est un meta-moteur de recherche plutôt novateur. L'outil propose très classiquement d'agréger les résultats des grands moteurs, Google, Yahoo, et MSN. Là où l'outil se démarque, c'est qu'il intègre également les moteurs "2.0" que sont Technorati, Digg et Del.icio.us, en permettant de doser l'importance de chacun de ses outils via un système de curseurs (un peu à la manière du Search Builder de MSN Search).

Il devient alors possible de régler très finement la prise en compte des différents sources, selon les objectifs de sa recherche. Un poids fort donné à Del.icio.us et à Google permettra par exemple d'identifier des sites populaires et de qualité, grâce au PageRank de Google et à la sélection des utilisateurs Del.icio.us. A l'inverse, un poids fort donné à MSN et Technorati permettra d'obtenir les résultats les plus frais, MSN étant très rapide à indexer et Technorati se spécialisant dans l'indexation en quasi temps-réel des flux RSS. Les possibilités sont donc nombreuses. Pour les plus pressés, Huckabuck propose plusieurs préselections : "research", "social search", "shopping", "blog search", technology research", "metasearch" etc.

Bien que d'ordinaire assez sceptique en ce qui concerne les meta-moteurs de recherche, j'ai trouvé Huckabuck assez sympathique : les options proposées peuvent être utiles, et l'interface est à la fois esthétique et bien pensée.

21/06/2006

Les moteurs se censurent... et alors ?

Presque chaque semaine paraissent des articles sur l'auto-censure des moteurs de recherche en Chine. l'ONG Reporters sans frontières a d'ailleurs tout récemment publié une analyse sur l'étendue de la censure chez les trois grand moteurs, s'indignant particulièrement de la censure exercée par Yahoo, et appelant à "refuser de censurer certains contenus dits protégés"

J'avoue que je suis toujours perplexe face à de tels propos. Oui, les moteurs censurent leurs résultats. La Chine, bien que libéralisant son économie ne reste qu'une dictature qui muselle l'information, rien de surprenant. Les moteurs sont tenus de respecter les lois des pays dans lesquels ils proposent leurs services. Il ne viendrait pas à l'idée d'une journaliste de se promener en mini-jupe les cheveux au vent en Arabie Saoudite, ou d'un reporter d'arborer un tee-shirt "Free Tibet" lors d'un reportage à Lhassa. Pourquoi en serait-il différemment pour les moteurs ?

Les moteurs sont des entreprises commerciales, pas des ONG ni des organes de propagande.

Que les moteurs outrepassent les législations nationales serait tout aussi choquant : Imaginez qu'un moteur de recherche affiche en France dans ses pages de résultats des liens vers des sites révisionnistes, ou appelant au meurtre d'un journaliste, et refuse de censurer ses résultats au prétexte de protéger la liberté d'expression ?

Oui, cette censure doit être combattue. Mais ne mélangeons pas causes et conséquences.

19/06/2006

Wikio : le meilleur moteur de recherche de News ?

Après une longue période de test, Wikio, moteur de recherche d'actualités à la sauce 2.0 est enfin lancé.

Wikio tient un peu de Google News, de Digg, et de Technorati, sans en avoir les inconvénients. Je dirais même que concernant la recherche de news, Wikio est à mon avis bien supérieur à ces trois services : Wikio indexe beaucoup plus de sources d'information que Google News, présente un rapport signal/bruit supérieur à celui de Technorati, et offre une diversité de sujets sans commune mesure avec Digg, qui se limite à l'actualité hi-tech.

Les fonctionnalités de Wikio sont très bien pensées avec un système automatisé étonnamment efficace de catégorisation et de tagging, un historique des recherches, sans oublier la possibilité désormais indispensable pour tout bon veilleur de de s'abonner à une recherche via RSS.

Un bien bel outil donc, que je vous encourage à tester.

2/06/2006

Un moteur de recherche RSS pour Ask

Ask, déjà propriétaire de Bloglines, vient de sortir un moteur spécialisé dans la recherche au sein des blogs et flux RSS. En fait de moteur, c'est plutôt 3 moteurs en 1, puisque trois modes de recherche sont proposés : recherche dans les contenu des billets, recherche de flux, et recherche dans les actualités.

Parmi les point positifs, on peut saluer la qualité de l'interface : comme tous les services Ask (recherche web, cartographie...) celle-ci est très claire et fonctionnelle. Les jumelles affichent ainsi les derniers entrées du flux RSS, permettant de se faire une idée du contenu du site source, et un menu déroulant permet de restreindre la recherche dans le temps, de 1 heure à 1 mois. L'outil affiche également sur sa droite des flux populaires pertinents par rapport à la requête de l'utilisateur.

Un autre bon point de l'outil est son ouverture vers des service tiers : Il est ainsi possible de souscrire directement à un flux via Bloglines, Google Reader, Newsgator, Netvibes, ou Feedshow et de soumettre une entrée à des services de bookmarking comme Mesfavs, Linkedfeed ou Blogmarks. Le moteur permet également de s'abonner directement aux résultats de la recherche via ces services.

Tout n'est pas cependant parfait, et le service souffre parfois d'un manque de pertinence. Un des problèmes rencontré est notamment l'indexation de flux RSS qui ne devraient pas l'être (AMHA) comme ceux proposé par certains forums et Digg-likes, par Wikipedia, ou par des annuaire de fils RSS (Lamooche par exemple). Espérons qu'un effort soit fait sur ce point. Ces problèmes une fois réglés, je suis persuadé que le service a un très bon potentiel.

< 1 2 3 4 5 6 >