Retour Accueil

 

Pompanette

Description

Pompanette est une application destinée à récupérer le plus d'objets possible sur un site distant, accessible uniquement en HTTP. Elle importe tous les objets (pages et fichiers) ayant un lien avec la page de départ et les stocke dans une base de données, tout en établissant la cartographie du site. Il est ensuite possible de visualiser le contenu des fichiers (images, code HTML) et de restituer les fichiers d'origine à partir de cette base, quel que soit leur format.

Pompanette a surtout l'avantage d'établir les références croisées du site (qui a un lien avec quoi, qui appelle quoi, etc.) ce qui permet de détecter les liens brisés (mais pas les fichiers orphelins, qui ne sont pas importés puisque n'étant pointés par aucun lien).

Partie d'un besoin ponctuel sur un site spécifique, Pompanette s'est peu à peu enrichie à mesure de son utilisation sur d'autres sites et pour d'autres besoins. Cependant, en raison de la très grande disparité des sites internet, de la grande variété d'objets et de la permissivité des navigateur qui fait que beaucoup de fautes HTML sont acceptées par eux (alors que Pompanette en attend un respect strict), il arrive encore que certaines pages soient mal interprétées.

La version proposée ici est encore une version beta, sans aide en ligne. Si vous souhaitez améliorer son fonctionnement, ou ne comprenez pas certains points de son fonctionnement, n'hésitez pas à nous contacter pour faire progresser Pompanette. L'importation d'un site étant une opération souvent très longue, nous recherchons des beta-testeurs.

Historique

Version 1.0.0 - 12/07/2006

Version initiale non diffusée

Version 1.0.1 - 19/07/2006

Première diffusion réservée au forum Developpez.com pour appel à beta-testeurs

Version 1.0.2 - 21/07/2006

Suppression de la réutilisation des données existantes d'un site, qui ne fonctionnait pas et perturbait l'utilisateur

Ajout des statistiques concernant le site exploré (nombre d'objets, nombre de liens, taille totale des objets importés)

Correction d'un certains nombre de problèmes liés à des liens HTML non conformes à la norme w3c (par exemple <img src="//chemin/image.gif">)

Ajout de l'affichage du temps passé en fin d'exploration d'un site

Téléchargements

Package d'installation : 10 Mo
 
Retour Accueil