2016-07-05 2 views
0

Ich versuche, einige spezifische Dateien von dieser Website (http://nomads.ncep.noaa.gov/pub/data/nccf/com/hourly/prod/) herunterladen, halten sie 10 Tage Daten. Ich möchte alle Dateien, die mit "ST4" beginnen, von allen Verzeichnissen herunterladen, die mit "nam_pcpn_anal" beginnen. Ich konnte alle Dateien mit „ST4“ von einem Ordner wie starrend herunterladen:wie rekursiv einige Daten mit Muster mit wget

wget -r -nd -N --no-parent -nH --cut-dirs=100 -P ~/test/ -A ST4* 'http://nomads.ncep.noaa.gov/pub/data/nccf/com/hourly/prod/nam_pcpn_anal.20160625/' 

aber ich weiß nicht, wie ST4 rekursiv zu durchsuchen. Ich dachte, das Folgende sollte funktionieren, aber nein!

wget -r -nd -N --no-parent -nH --cut-dirs=100 -P ~/test/ -A ST4* --accept nam_pcpn_anal*/ST4* 'http://nomads.ncep.noaa.gov/pub/data/nccf/com/hourly/prod/' 

Irgendeine Idee!

+0

Siehe auch [httrack] (https://www.httrack.com/), hat es [Filter] (https://www.httrack.com/html/filters.html). – gavv

Antwort

0

Die wget manual zeigt:

-I list 
    --include-directories=list 
     Specify a comma-separated list of directories you wish to follow 
     when downloading. Elements of list may contain wildcards. 

So, könnten Sie versuchen:

wget -r -nd -N --no-parent -nH --cut-dirs=100 -P ~/test/ \ 
    -A 'ST4*' -I '*/nam_pcpn_anal.*' \ 
    'http://nomads.ncep.noaa.gov/pub/data/nccf/com/hourly/prod/' 
+0

Danke, es sollte funktionieren. Aber ich fürchte, das tut es nicht. – newbie

+0

Was passiert, wenn Sie stattdessen '-I' nam_pcpn_anal. * ''Verwenden? – jxh

+0

Das gleiche, ich denke, etwas ist mit meinem wget nicht richtig, sonst macht die Lösung, die du postest, Sinn und sollte funktionieren. – newbie