2010-12-11 3 views
4

Ich habe ein kleines Problem. Ich möchte rekursiv herunterladen that web page, aber es basiert auf "Frames". Standardmethoden können mir nicht helfen. Ich versuche verschiedene Varianten, aber nichts. Maximum Ich kann eine Rekursion herunterladen, ich fand Beispiel there. Wie kann ich diese Website vollständig abrufen und offline verwenden? Danke.'wget' vollständige Website basierend auf Frames

+0

Vielleicht Sie suchen Anwendungen Spiegelung? Für Windows kenne ich WinHTTrack und Teleport Pro; Ich bin mir sicher, dass es für andere Betriebssysteme einige Alternativen gibt. – Kos

+0

Ich denke, ich werde sie nach dem Scheitern damit versuchen. Ich möchte es von Linux und Befehl 'wget' tun. –

Antwort

0

Was verwenden Sie für die Befehle? Sind Sie auf MSWindows? Z.B. "Wget --mirror -w 2 -p --html-Erweiterung --convert-Links -P c: \ wget_files \ example1 http://base.safework.ru/iloenc"

+0

Ich benutze Linux und seinen nativen Befehl wget. Ich versuche, auf diese Weise zu tun, aber es rekursiv selbst analysieren (Frame, als Frame in Frame und Frame in Frame .... und Unendlichkeit. Alle Frames sind von der ersten Seite, nicht von anderen Seiten). –

1

Wenn Sie eine lokale Kopie einer Website verwenden wollen --mirror:

wget --mirror http://www.example.com/ 

Einige der anderen Optionen sind auch nützlich:

--convert-Links wandelt absolute Links zu lokalen Links, so dass Sie die Site lokal durchsuchen können.

--html-Erweiterung fügt .html auf alle Ressourcen, die keine Endung haben (dies ist nützlich für das Surfen ansonsten sehr dynamische Websites lokal über Apache)

-p erhält Bilder, CSS und alle für die Seite benötigten Ressourcen

So laden:

wget --mirror --convert-links --HTML-extension -p http://www.example.com/ 

Schließlich, wenn es nicht Ihre Website ist, dann höflich sein und fügen sie eine -w (wartet zwischen den Anfragen in Sekunden)

+0

Danke, aber ich weiß, wie man diesen Befehl benutzt. Versuchen Sie, http://base.safework.ru/iloenc zu analysieren. Diese Seite basiert auf Frames, und ich kann es nicht mit Standardmethoden machen (((So bekomme ich nur den ersten Seitenrahmen und bekomme ihn unendlich, aber keine anderen Seiten und Frames. –

1

testen:

wget -E -H -k -K -p "http://yoursite.com/path" 

Werke für meinen Anwendungsfall (zum referenzierten Rahmen HTMLs Downloads)

+1

könntest du diese Kommandozeile erklären) Optionen, oder zumindest auf eine Referenz verlinken? – deltree