Goshme, que j'avais présenté en octobre 2005, est un moteur de recherche un peu particulier, puisque au lieu d'indexer directement les contenus, ils interroge des bases de données préalablement sélectionnées, permettant ainsi d'accéder au web invisible (sur ce sujet, consulter le livre blanc Goshme, au format PDF).

Goshme se positionne donc d'avantage comme un assistant de recherche qu'un moteur stricto sensu. Actuellement, Goshme est capable d'interroger environ 2590 bases de données, avec des temps de réponses plus courts qu'avant (deux à trois secondes, contre quinze auparavant, et ce délai devrait descendre à terme en dessous de la seconde).

L'interface de cette beta 3.0 a été grandement simplifiée et épurée. Alors qu'il fallait auparavant sélectionner les catégories de sites à interroger, la page d'accueil comprend désormais une simple boite d'interrogation, l'affinage de la recherche se faisant directement dans les pages de résultats grâce à une arborescence sur la gauche (il est cependant toujours possible de sélectionner dès le départ les catégories à interroger via la recherche avancée). Le menu en haut des pages de résultats permet quant à lui de spécifier le type de média recherché : tous types, images, contenus audio, vidéo, actualités etc.

Une prévisualisation des pages de résultats des différentes bases interrogées dans des iframes est offerte. J'aurais cependant apprécié une indication du nombre de résultats pour chaque base interrogée. Espérons que cette fonctionnalité soit implémentée par la suite.

La version précédente de Goshme comprenait trois onglets : moteurs spécialisés, annuaires, et moteur généralistes. Cette distinction a disparu, Goshme affichant d'abord les résultats des moteurs spécialisés, puis ceux des outils généralistes.

Si elles sont moins visibles, des améliorations ont également été menée coté back-office : la maintenance et la catégorisation des bases de données sont désormais automatisées, ce qui permet de gérer plus facilement un très grand nombre de base de données, leur configuration changeant régulièrement. Ce processus était auparavant assuré manuellement.

D'autres améliorations sont enfin prévues, en particulier une attention plus grande portée aux bases de données du web profond, et l'indexation de bases non anglophones, notamment portugaises, françaises et espagnoles.