HTTrack
The Web Mirror Utility

English version


Présentation (version 1.10, 15/06/98) - VERSION 1.10b est disponible

HTTrack est un aspirateur web. Il vous permet de transférer un site web d'Internet vers votre disque dur, en construisant récursivement toute la structure, récupérant html, images et fichiers du serveur vers votre ordinateur. Les liens sont reconstruits de manière relative, de façon à pouvoir browser librement le site local via votre butineur habituel. Vous pouvez transférer (miroir) plusieurs sites ensembles de façon à pouvoir passer de l'un à l'autre librement. Vous pouvez également mettre à jour (update) un site existant, ou continuer un transfert interrompu. Le robot est entièrement configurable, avec une aide intégrée.

WinHTTrack est la version Windows9x de HTTrack. Elle est disponible dans l'archive ZIP de HTTrack.

SUN SOLARIS ET IBM AIX SEULEMENT:
Sur Sun Solaris et AIX, HTTrack est composé de deux programmes: le shell graphique, et le robot.
Le Shell vous permet de controller facilement le robot, via une interface graphique ; il est disponible à la Page Shell HTTrack
Vous trouverez ici le robot, qui peut être utilisé comme un programme en ligne de commande.

N'hésitez pas à nous faire parvenir vos commentaires.

Description

SourisWare!

Ce programme est GRATUIT, mais si vous l'aimez, encouragez nous: envoyez une souris! (type PC, port type PS2), ou la somme nécessaire pour en acheter une (exemple: FF50, $10, £5 - même 10FF peuvent nous aider!)
C'est un peu inhabituel pour un shareware, mais nous avons vraiment besoin de souris pour travailler... 
Si vous réalisez un miroir en ligne sur le web grâce à HTTrack, envoyez nous également un mail svp.

Envoyez vos souris (ou vos dons) à:

Xavier Roche & Yann Philippot / HTTrack
ISMRA - ENSI of CAEN
6, boulevard du Marechal Juin
14050 CAEN Cedex
FRANCE

Vous serez tenus informés par email (si vous le désirez) des évolutions de HTTrack.

Utilisation

La documentation est maintenant disponible pour WinHTTrack et HTTrack.

Sur SUN/Solaris et IBM/AIX, le plus simple est d'utiliser le shell graphique, mais vous pouvez également passer par une simple ligne de commande.
Tapez httrack <URLs> pour effectuer le miroir d'un ou plusieurs sites (voir exemples) ; les options pas défaut seront utilisées (elles sont fixées de manière à éviter d'en taper)
Tapez httrack (sans aucun paramètres) pour lister la liste des options. Paramètres et adresses ne doivent pas nécessairement être placés dans un ordre quelconque.
Il y a également des commandes spéciales, telles l'option Nx.

Exemple:
httrack www.myweb.abc/mydir/index.hml
httrack www.myweb.abc/mydir/index.hml  www.otherweb.abc/~friend/cool/
httrack www.myweb.abc/mydir/index.html www.otherweb.abc/~friend/cool/ -N1 -P proxy.myweb.abc:1234

httrack www.myweb.abc/mydir/index.html +www.otherweb* +*.def -*.com

Le premier exemple transférera le site partant de 'www.myweb.abc/mydir/index.hml' (et pas tout www.myweb.abc, évidemment, bien que ce soit possible!)
Le second effectuera le miroir de 'www.myweb.abc/mydir/index.hml' et de 'www.otherweb.abc/~friend/cool/" ensembles. (le troisième séparera html et images en 2 répertoires (option N1), et utilisera un proxy (option P))
Le quatrième exemple montre l'utilisation de jokers (*) pour accepter ou refuser des types d'adresses spécifiques. Si aucun '*' n'est utilisé après le '+' ou le '-' (si vous spécifiez donc une adresse complète), l'adresse en question sera acceptée/refusée lorsqu'elle sera rencontrée.

Les options par défaut sont fixées de façon à ce que vous n'ayez que très peu d'options à  indiquer.

Télécharger version 1.10 (15/06/98)

Vous avez pris note que ce programme n'est en aucun cas garanti, et est livré "tel que". Ceci est la version 1.x de HTTrack.
Vous pouvez trouver HTTrack sur beaucoup de ftps à travers le monde (nom: httrkXXX.zip, XXX=numéro de version)
(exemple: miroirs simtel.net)
Enfin, le logiciel est en anglais (mais suffisamment simple pour être compris de tous)

Les éxécutables prêts à l'emploi sont donnés. Sous Unix/Linux, vérifiez qu'ils sont éxécutables (x)

Plateforme

Cliquez sur le fichier correspondant pour télécharger

Version actuelle

Windows95/98

httrack.zip

1.10b <<< WinHTTrack inclus!

SUN Solaris (5.6)

httrack.tar.gz

1.10b

IBM AIX (4.0)

httrack.tar.gz

1.10b

Linux PC

httrack.tar.gz

1.10b

Shell

La version shell est déja incluse dans la version Windows.
Pour Sun Solaris et AIX, voir la page: Page Shell HTTrack

Commentaires

Si vous aimez ce programme n'hésitez pas à nous encourager.
Questions, commentaires et reports de bugs sont les bienvenus, pour le shell et pour le robot.

Updates et corrections

1.10b
+ Corrigé: Meilleure gestion mémoire
+ Nouveau: Option "Taux transfert minimum" ajouté (éviter les sites les plus lents)
+ Nouveau: Les sites "morts" ne gèlent plus HTTrack
+ Corrigé: Encore des problèmes avec les tags code/codebase
+ Nouveau: Détection des ruptures de liens améliorée

1.04
+ Corrigé : Certains liens n'étaient pas correctement lus (pages avec des tags "codebase")
+ Shell: Interface améliorée

1.03 (Pas de changements pour la version en ligne de commande)
+ Shell:Gros bug corrigé (taux de transfert TRES lents)

1.02
+ Corrigé: Certains fichiers java n'étaient pas correctement transférés
+ Nouveau: La vitesse a été améliorée
+ Corrigé: Fichiers log plus précis
+ Shell: L'interface a été améliorée

1.01
+ Fixed: Structure check error in some cases

1.00 - The 1.00, Yeah!
+ Nouveau: base et codebase sont maintenant scannés

0.998 beta-2
+ Corrigé: Bug des fichiers multiples (fichiers ayant le même nom dans un répertoire identique) avec l'option -O corrigé

0.997 beta-2
+ Corrigé: Les noms de fichiers avec des '%' n'étaient pas correctement renommés
+ Corrigé: bug deétecté dans la 0.996: certains fichiers ne sont pas écrits sur disque!!

0.996 beta-2
+ Nouveau: Option -O (chemin pour muroir/fichiers log)
+ Nouveau: L' heure/date des fichiers inchangés reste inchangée durant une update

0.99 beta-2
+ Nouveau: Champ "User-agent"
+ Nouveau: Raccourcis (--spider etc.)
+ Nouveau: Les liens non téléchargés sont reconstruits de manière absolue
+ Nouveau: L'option 'g' (juste get files in current directory) a été ajoutée
+ Nouveau: Analyse des liens primaires a été améliorée
+ Fixed: bug du "304" corrigé

0.25 beta-2
+ Corrigé: Plantages durant certains miroirs corrigé!
+ Nouveau: Plus d'options 'N' (filenames type)

0.24 beta-2
+ Corrigé: Restart/Update avec un cache ne fonctionnait pas (pas du tout..)
+ Corrigé: Les jokers fonctionnent correctement (càd. +www.abc.com* fonctionne)
+ Nouveau: L'option 'n' (get non-html files near a link) a été ajoutée!

0.23 beta-2
+ Corrigé: L'option 'M' (site size) ne fonctionnait pas
+ Corrigé: Les fichiers dépassant 65Ko n'étaient pas correctement écrits

anciennes beta
+ Beaucoup, beauoup de bugs corrigés

Credits

Shell graphique developpé par Yann Philippot

Robot developpé par Xavier Roche

Project digiré par Patrick Ducrot et Daniel Carré

Project développé à l'ENSI Caen - ISMRa

(C)1998 Xavier Roche & Yann Philippot