2010-08-12 12 views
8

Ich habe das nicht in 3 oder 4 Jahren getan, aber ein Client möchte seine dynamische Website in statisches HTML herunterstufen.Scrape und konvertieren Sie Website in HTML?

Gibt es irgendwelche kostenlosen Tools, um eine Domain zu crawlen und funktionierende HTML-Dateien zu generieren, um dies schnell und schmerzlos zu machen?

Edit: es ist eine Coldfusion-Website, wenn das zählt.

+3

'wget' und Rekursion? – relet

+0

Problem ist, dass sie nicht bezahlen, um dies getan zu haben, also, was auch immer der schnellste Weg ist, ohne Code/ssh'ing irgendetwas zu schreiben, so kann ich dies getan haben, während ich an bezahlter Arbeit arbeite. – Kevin

Antwort

8

Getleft ist ein netter Windows-Client, der dies tun kann. Es ist sehr konfigurierbar und zuverlässig.

Wget kann auch mit der --mirror Option.

2

Es ist eine lange Zeit seit ich es benutzt habe, aber webzip war ziemlich gut.

Es ist nicht kostenlos, aber für $ 35,00, ich denke, Ihr Kunde wird nicht pleite gehen.

Eine schnelle Google für die Offline-Browser kam mit this und this, die gut aussehen ..

6

Versuchen Sie es mit httrack (oder webhttrack/winhttrack, wenn Sie eine GUI wollen) auf der Website zur Spinne. Es ist kostenlos, schnell und zuverlässig. Es ist auch viel mächtiger als primitive Downloader wie wget; httrack ist für die Spiegelung von Websites konzipiert.

Beachten Sie, dass Sie beim Konvertieren einer dynamischen Seite in statische Funktionen viel Funktionalität verlieren. Es ist auch nicht immer möglich - eine dynamische Website kann eine unendliche Anzahl von verschiedenen statischen Seiten darstellen.

+0

Ich würde nicht "wget" primitiv nennen. – strager

+1

@strager: Ok, dann "relativ primitiv". Es hat ein viel eingeschränkteres Feature-Set, wenn es darum geht, Websites zu spiegeln. – Borealid

+0

Ich bin mir nicht sicher, ob es alles kann, was httrack tut, aber unterschätze nicht "wget ​​--spiegel"! Es kann eine Menge Dinge tun. –