2010-12-25 10 views
1

Ich habe eine Seite, die eine andere Seite in einem iframe lädt. Die Seite, die aufgerufen wird, führt einige Dinge dynamisch aus, wie sie von meiner Site aufgerufen werden. Daher kann ich sie nicht direkt aufrufen, und selbst wenn es möglich wäre, würde ich dieselbe Seite aufrufen und denselben dynamischen Code zweimal ausführen.Kratzen Sie Ihre eigene Webseite, wenn sie fertig geladen ist? (Mit PHP)

Also, was ich tun möchte, ist, sobald meine Seite geladen ist, kratzen sich selbst, Parsing für einige bestimmte einzigartige Dinge, und dann die geparsten Ergebnisse zu behandeln. Ich weiß, wie man die Ergebnisse des Parsens analysiert und verarbeitet, aber ich weiß nicht genau, wie man das Scraping selbst durchführt.

Wer hat irgendwelche Vorschläge?

TiA

Antwort

1

Verwendung AJAX die Seite Ausgabe an ein Skript zu senden, dann analysiert es, wie Sie wollen. Ich weiß nicht wirklich, was Sie mit "scraping" meinen, und Sie müssen wirklich weitere Tags hinzufügen.

+0

Gerade jetzt zurück zu diesem Thema, danke für die Idee, ich werde es versuchen. =) –

1

Ich muss sagen, die ganze Idee von scraping Ihre Ausgabe ist ineffizient (speziell im Vergleich mit dem Parsen der gerenderten Seite) klingt nicht wirklich richtig zu mir.

ob_start(); 
render_your_page(); 
$rendered_page = ob_get_contents(); 
ob_end_flush(); // Sends page, turns off output buffering 
scrape($rendered_page); 

Edit::

Dennoch, wenn Ihr Problem Ihr Ausgang wird immer, wenn die Seite gerendert wird, können Sie die output buffering control functions verwende ich hoffe, dass ich Ihre Frage richtig verstanden. Es ist 5:20 Uhr am Weihnachtstag, und ich bin bereit für das Bett :)

+0

Um zu verdeutlichen, der Grund, dass ich eine seltsame Art und Weise machen muss, meinen eigenen Inhalt zu scrappen, ist zum Beispiel: Ich lade meine eigene Webseite mit einem iframe darin, im iframe wird eine andere Webseite sein aufgerufen, wo einige JS ausgeführt wird und gibt ihre Ergebnisse in diesem iFrame zurück. Was ich tun muss, ist, die zurückgegebenen Informationen von diesem iFrame zu scrappen und Teile davon zu speichern, daher das Scrapen, da ich ansonsten keinen direkten Zugriff habe. –

Verwandte Themen