2012-12-30 16 views
6

Ich benutze Python Webkit.WebView und GTK zum Crawlen einer Webseite. Die Webseite wird jedoch von JavaScript dynamisch geladen.Woher weiß ich, dass eine Seite wirklich vollständig geladen ist?

Das "load-finished" -Ereignis von WebView ist nicht ausreichend, um damit umzugehen. Gibt es einen Indikator/ein Ereignis, um mich wissen zu lassen, dass die Seite wirklich voll ist, sogar der Inhalt, der von Javascript produziert wird?

Danke,

Antwort

4

Es gibt keine wirkliche Möglichkeit, zu bestimmen, ob die Seite vollständig geladen ist.

Eine Methode ist es, die Zeit seit der letzten Anfrage zu bestimmen. Einige Seiten werden jedoch ständig wiederholt Anfragen stellen. Dies ist bei Tracking-Scripts und einigen Anzeigenscripts üblich.

Was ich tun würde, ist eine bestimmte Menge an Zeit, nachdem die Web-Ansicht hat gesagt, dass das Laden beendet ... 5 Sekunden oder so. Es ist nicht perfekt, aber es ist das Beste, was Sie haben, da es keine Möglichkeit gibt zu bestimmen, was "voll geladen" für eine beliebige Seite ist.

Verwandte Themen