2009-05-11 9 views
0

Ich versuche, einen Weg zu finden, alle Tweets eines bestimmten Suchbegriffs über PHP und die Twitter-Such-API zu ziehen.Mehrere Seiten von Suchbegriffen aus Twitter ziehen

So würde Funktionalität gehören 1. Fügen Sie einen Suchbegriff 2. Ziehen Sie Begriffe von jeder Seite. 3. Nur neue Begriffe aus der letzten Suche ziehen 4. Export in eine db oder eine flache Datei.

Ich bin mir ziemlich klar auf alle diese Ausnahme über mehrere Seiten durchqueren

Antwort

5

Die Mail API nimmt einen Seitennummer-Parameter. In den Atom-Ergebnissen gibt es Link-Elemente mit rel-Attributen für next und previous. Dies ist Ihr bester Indikator dafür, ob Sie nach einer zweiten Seite und so weiter suchen sollten. Das href-Attribut dieses Tags teilt Ihnen sogar die URL mit, die Sie anfordern sollten.

Die Abfrage, die Sie erstellen, verwendet auch einen since_id-Parameter. Sie sollten die größte ID-Nummer, die Sie in Ihren Antworten sehen, speichern und in nachfolgenden Anfragen verwenden, damit Sie keine Duplikate filtern müssen.

Was die Datenspeicherung anbelangt, ist Ihre Auswahl wahrscheinlich am besten von dem, was Sie mit den Ergebnissen machen wollen, abhängig ... Wenn Sie irgendwelche Abfragen durchführen, sollten Sie sie wahrscheinlich in einer Datenbank ablegen, zB MySQL . Wenn Sie nur protokollieren, sollte Flat File Ihnen gut tun.

+0

Nur sicher sein, den veralteten since_time-Parameter nicht irgendwo zu verwenden, es wird einige wirklich unerwünschte Daten zurückgeben :) –

0

Die twitter search api nimmt einen Seitenparameter:

# page. Optional kann die Seitennummer (beginnend bei 1) bis zu einem max von rund 1500 Ergebnissen zurückzukehren, (basierend auf RPP * Seite. Hinweis: Es gibt Seitenumbruchgrenzen.

* Example: http://search.twitter.com/search.atom?q=devo&rpp=15&page=2 
Verwandte Themen