Ich habe versucht, alle ZIP-Dateien auf dieser Website auf einen EC2-Server herunterzuladen. Es erkennt jedoch die Links nicht und lädt nichts herunter. Ich denke, es liegt daran, dass die shtml-Datei erfordert, dass SSI aktiviert ist, und das verursacht irgendwie ein Problem mit wget. Aber ich verstehe das Zeug nicht wirklich.Mit wget alle zip-Dateien auf einer shtml-Seite herunterladen
Dies ist der Code, den ich erfolglos verwendet habe.
wget -r -l1 -H -t1 -nd -N -np -A.zip -erobots=off http://www.fec.gov/finance/disclosure/ftpdet.shtml#a2015_2016
Danke für jede Hilfe, die Sie zur Verfügung stellen können!
Die Zip-Links sind nicht im Quellcode enthalten, sie werden über Javascript generiert. Die Dateiliste befindet sich in http://www.fec.gov//finance/disclosure/tables/foia_files_summary.xml unter dem Knoten ' ' –
@StanO: Werfen Sie einen Blick auf: ftp: //ftp.fec.gov/FEC/2016/ ftp://ftp.fec.gov/FEC/2014/ ftp://ftp.fec.gov/FEC/2012/ ftp://ftp.fec.gov/ FEC/2010/... oder ftp://ftp.fec.gov/FEC/ – Cyrus