Ich brauche ein wenig Daten von einem HTML-Tag, das nur erscheint, wenn Sie in einer Site angemeldet sind. Ich muss es in Python oder Javascript tun. Javascript hat die Cross-Origin-Browser-Policy (CORS) als Hindernis.Kratzen Sie die aktuell geöffnete Webseite oder erhalten Sie Live-HTML mit einer anderen Methode?
Ich kann serverseitigen Code nicht verwenden. Ich kann keine iframes verwenden.
Die Daten sind leicht verfügbar, wenn Sie die Seiten-URL in Chrome oder FireFox öffnen, da Sie sich wie Facebook anmelden, also werden wir es als Beispiel verwenden. Wir werden sagen, dass ich die Daten aus dem ersten Element meines Facebook News Feeds erhalten möchte.
Ich habe versucht, die Webseite zu scrappen und den Benutzer-Agent-Wert mit Pythons Urllib-Modul übergeben. Ich habe versucht, Yahoos YQL-Tool mit Javascript zu verwenden. Beide haben den gewünschten HTML-Code ohne die benötigten Werte zurückgegeben. Dies liegt daran, dass es nicht meine Browser verwendet, um die erforderlichen Werte zu speichern.
Gibt es eine Möglichkeit, eine bereits geöffnete Webseite zu scrappen? Angenommen, ich habe Facebook geöffnet und Code ausgeführt, der meine News Feed-Daten vom Browser erhalten hat.
Gibt es eine andere Methode, die ich nicht erwähnt habe, um dies zu erreichen?
Hintergrund: Ich erstelle eine Autobumpper für ein Forum (innerhalb der Site-Regeln) und brauche einige generierte Werte aus der Website HTML, aber wird keine Zusammenarbeit in diesem Sinne vom Eigentümer erhalten.
Es ist durchaus möglich, serverseitigen Code um Cookies und damit mehrseitige Sessions inklusive Login-Flow zu unterstützen. – ceejayoz
@ceejayoz Wenn ich es absolut nicht kann, wie ich beschrieben habe, könnte ich auf etwas so zurückgreifen. Wie könnte das geschehen? – user3055938