Ich versuche regelmäßig einige Dateitypen zu archivieren, die auf einer Community-Website gehostet werden, wo unser Administrator seit Jahren MIA ist, falls er stirbt oder einfach nicht mehr für das Hosting zahlt.Was versuche ich, bestimmte Dateitypen mit wget herunterzuladen?
Ich bin in der Lage, alle Dateien, die ich brauche mit wget -r -np -nd -e robots=off -l 0 URL
herunterladen, aber das lässt mich mit etwa 60.000 zusätzlichen Dateien zu verschwenden Zeit sowohl herunterladen und löschen.
Ich suche wirklich nur nach Dateien mit den Erweiterungen "tbt" und "zip". Wenn ich der Eingabe -A tbt,zip
hinzufüge, lädt wget dann nur eine einzige Datei, "index.html.tmp". Diese Datei wird sofort gelöscht, da sie nicht mit dem angegebenen Dateityp übereinstimmt. Anschließend wird der Vorgang vollständig beendet, wobei wget ankündigt, dass der Vorgang abgeschlossen ist. Es wird nicht versucht, eine der anderen Dateien herunterzuladen, die erfasst werden, wenn das Flag -A
nicht enthalten ist.
Was mache ich falsch? Warum werden die Dateitypen so angegeben, dass ich sie nach nur einer Datei abgeschlossen habe?
Ich habe einige Leute gesehen, die [httrack] (https://www.httrack.com/) als Alternative zu "wget" für diese Art von Dingen empfehlen. – larsks