2010-12-13 6 views
0

Guten Tag alle,Erhalten Sie aktualisierte Informationen von anderen Seiten und Posten auf Ihrer Website in PHP

Ich habe eine bestehende Website gebaut. Ich frage mich, wie kann meine Website automatisch aktualisiert werden, wenn eine andere Website aktualisiert wird? Dies bedeutet im Wesentlichen, dass meine existierende Seite Informationen wie Kosten, Beschreibung, Bilder von der anderen Seite nach der Aktualisierung erhält.

Ich habe über Web-Dienste nachgedacht, aber die andere Seite hat es nicht.

Bitte beraten!

Danke!

+0

Ich vermute, Sie können nichts auf * der anderen * Seite ändern, nur bei Ihnen? – deceze

+0

hat die andere Seite eine API jeglicher Art? –

+0

@deceze - Yup kann nichts ändern – aHaH

Antwort

2

Wenn die andere Site keine API hat, ist Ihre einzige Option das Scraping von Seiten, d. H. Das Herunterladen des HTML und das Parsen, um die gewünschten Informationen zu extrahieren.

Wenn sie eine Seitenstruktur haben, die sich nicht oft ändert, ist dies im Allgemeinen zuverlässig.

Sie möchten wahrscheinlich die DomDocument von PHP verwenden, um die Informationen zu extrahieren.

Im Allgemeinen mögen Leute es nicht, weil schlecht entworfene Werkzeuge ihre Systemressourcen besteuern können, da das Generieren einer ganzen HTML-Seite ressourcenintensiver ist als das Generieren einer API-Antwort.

Seite Scraping ist ziemlich weit verbreitet, obwohl einige Leute entmutigen. Es kann durch die TOU einer Site verboten werden, möglicherweise mit rechtlichen Implikationen. Oder Ihre Ziel-Website hat möglicherweise kein Problem damit. Es gibt natürlich große Unternehmen, die auf Seiten-Scraping aufbauen (siehe "Google").

+0

Heh Mark, vielen Dank! Werde es ausprobieren! – aHaH

+0

Hrm ... Ich denke, Google * wäre * ein Seitenräumer. So habe ich noch nie darüber nachgedacht. Ich denke, ich würde mich mehr darum kümmern, dass Leute meinen Inhalt stehlen, als meinen Server zu besteuern. – mpen

Verwandte Themen