Ich verwende derzeit Selen mit PhantomJS, um Javascript-generierten Inhalt von einer Webseite zu scrappen. Während dies mir die Ergebnisse bringt, die ich suche, ist es ein langsamer Ansatz, da ich darauf warten muss, dass die Seite vor dem Scrappen geladen wird. Gibt es eine Möglichkeit, das Javascript direkt auszuführen, das den gesuchten Inhalt generiert? Wenn dies der Fall ist, wird es ein schnellerer Ansatz sein, als ich derzeit verwende?Wie bekomme ich JavaScript-Inhalte direkt von der Webseite?
Danke!
'Ich muss warten, bis die Seite vor dem Scrappen geladen wird 'Könnte Semantik sein, aber gibt es überhaupt eine Möglichkeit, eine Seite zu scraphen * bevor * sie (d. H. Laden)? – Vaviloff
Wird der Inhalt tatsächlich * durch * Javascript * oder (* wahrscheinlich *) durch das Javascript von einer externen Quelle * generiert? – Peteris
Oder meinst du, dass die Seite in der Regel langsam lädt? Wenn ja, dann schauen Sie sich diese Frage an und antworten Sie: https://stackoverflow.com/a/42710420/2715393 – Vaviloff