19/05/2011
Sick Scraper, un logiciel de scraping gratuit
Par Sébastien Billard, 19/05/2011 :: Référencement et moteurs
Signalé par Supergago sur le forum Seosphère, Sick Scraper est un logiciel de scraping totalement gratuit qui propose les mêmes fonctionnalités que le module Harvester du célèbre Scrapebox. Le logiciel est volontairement bien moins complet que Scrapebox, puisque conçu comme un complément à Sick Submitter, le produit phare de l'éditeur. Mais il reste un très bon outil pour aller à la chasse aux URLs.
Comme Scrapebox, la recherche des URLs se fait en spécifiant une empreinte (ou footprint, par exemple "ajouter un site") et optionnellement des mots-clés. Le logiciel va alors interroger les moteurs de recherche spécifiés et extraire les URLs des pages de résultats. Pour du scraping massif il est possible d'utiliser des proxies, que le logiciel peut récuperer de lui-même. Une fois les URLs scrapées, Sick Scraper permet d'appliquer divers traitements pour nettoyer les résultats, comme la suppression des doublons, la suppression des résultats multiples d'un même site, la suppression des URLs correspondants à des fichiers, et la récupération des pageranks des URLs.
Combiné à un logiciel de complétion de formulaires comme Fireform, lui aussi gratuit, Sick Scraper permet ainsi d'accélerer significativement la soumission aux annuaire, la recherche de billets à commenter etc. Ces opérations doivent bien sûr être effectuées de façon légitime et manuelle :)
:: 37 commentaires ::