2016-09-02 4 views
0

ich wget betreiben ein warc Archiv zu erstellen, wie folgt:wget --warc-Datei --recursive, verhindert das Schreiben einzelner Dateien

$ wget --warc-file=/tmp/epfl --recursive --level=1 http://www.epfl.ch/ 

$ l -h /tmp/epfl.warc.gz 
-rw-r--r-- 1 david wheel 657K Sep 2 15:18 /tmp/epfl.warc.gz 

$ find . 
./www.epfl.ch/index.html 
./www.epfl.ch/public/hp2013/css/homepage.70a623197f74.css 
[...] 

Ich brauche nur die epfl.warc.gz Datei. Wie verhindere ich, dass wget alle einzelnen Dateien erstellt werden?

Ich habe versucht, wie folgt:

$ wget --warc-file=/tmp/epfl --recursive --level=1 --output-document=/dev/null http://www.epfl.ch/ 
ERROR: -k or -r can be used together with -O only if outputting to a regular file. 

Antwort

0

Für einzelne Dateien (ohne --recursive) die Option -O /dev/null wget machen keine Datei für die Ausgabe zu erstellen. Für rekursive Aufrufe wird /dev/null nicht akzeptiert (weiß nicht warum). Aber warum schreiben Sie nicht einfach alle Ausgaben in eine einzige Datei über -O tmpfile und löschen Sie diese Datei danach?

+0

sicher. Ich habe nur gefragt, ob es eine Möglichkeit gibt, die Daten nicht zu duplizieren. –