2017-09-20 2 views
-1

Ich verwende derzeit Selen mit PhantomJS, um Javascript-generierten Inhalt von einer Webseite zu scrappen. Während dies mir die Ergebnisse bringt, die ich suche, ist es ein langsamer Ansatz, da ich darauf warten muss, dass die Seite vor dem Scrappen geladen wird. Gibt es eine Möglichkeit, das Javascript direkt auszuführen, das den gesuchten Inhalt generiert? Wenn dies der Fall ist, wird es ein schnellerer Ansatz sein, als ich derzeit verwende?Wie bekomme ich JavaScript-Inhalte direkt von der Webseite?

Danke!

+1

'Ich muss warten, bis die Seite vor dem Scrappen geladen wird 'Könnte Semantik sein, aber gibt es überhaupt eine Möglichkeit, eine Seite zu scraphen * bevor * sie (d. H. Laden)? – Vaviloff

+0

Wird der Inhalt tatsächlich * durch * Javascript * oder (* wahrscheinlich *) durch das Javascript von einer externen Quelle * generiert? – Peteris

+0

Oder meinst du, dass die Seite in der Regel langsam lädt? Wenn ja, dann schauen Sie sich diese Frage an und antworten Sie: https://stackoverflow.com/a/42710420/2715393 – Vaviloff

Antwort

0

Leider gibt es nicht. Ich bin mehrmals auf dieses Problem gestoßen und die einzige Lösung, die ich mir ausgedacht habe, ist, das Problem so anzugehen, wie Sie es bereits tun. Da der Inhalt js-generated ist, ist die einzige Möglichkeit, sie zu holen, sie von einem Browser zu bekommen, daher Selen mit dem von Ihnen bevorzugten Treiber zu verwenden.

Verwandte Themen