Ich erstelle eine Anwendung, die eine Website crawlt, in einem Konto anmeldet und greift auf die Reiseinformationen des Benutzers.PHP Web Scraping - zurück Inhalt nach dem Laden von JavaScript
Sobald ich mich anmelde und auf die Seite mit der Liste der Reisekarten gehe, muss ich auf den Link klicken.
Also hier ist das Problem: der Link erscheint nur auf der Seite, sobald ein Javascript-Skript geladen (ich bin nicht sicher, welche). Wenn ich mein Crawlerscript ausführe und diese Seite drucke, kann ich den Link anzeigen (weil er das Javascript im Browser lädt). Wenn ich jedoch versuche, diese Seite zu crawlen, um diesen Link zu finden, findet er ihn nicht. Meine Annahme ist, dass diese PHP-Bibliothek keine Möglichkeit hat, Javascript (eine browserseitige Sprache) auf dem Backend auszuführen.
Wie kann ich die Seite html NACH dem alle JavaScript-Skripte geladen und verarbeitet haben?
Ich verwende Goutte zum Crawlen. Diese Bibliothek verwendet Symfony BrowserKit, die das Verhalten eines Webbrowsers simulieren soll, es wäre gut zu wissen, ob es eine Möglichkeit hat, JavaScript zu verarbeiten, bevor das HTML zurückgegeben wird.
Ich bin offen für jede Art von Lösung, was bedeutet, die Verwendung von verschiedenen Bibliotheken oder sogar eine andere Programmiersprache.
Vielen Dank im Voraus.