2008-10-03 6 views
6

Ich arbeite an einem Projekt, das einen zuverlässigen Zugriff auf historische Feedeinträge erfordert, die nicht unbedingt im aktuellen Feed der Website verfügbar sind. Ich habe mehrere Möglichkeiten gefunden, auf solche Daten zuzugreifen, aber keine von ihnen gibt mir alle Eigenschaften, die ich brauche.Zugriff auf alte, nicht mehr verfügbare Feedeinträge

Betrachten Sie dies als ein Brainstorming. Ich werde Ihnen sagen, wie viel ich gefunden habe und Sie können beitragen, wenn Sie andere Ideen haben.

  1. Google AJAX Feed API - Sie werden zu 250 Titel begrenzen

  2. Unofficial Google Reader API - (? Und vielleicht quasi-illegal) Perfect aber nicht offiziell und daher unzuverlässig. Auch die Authentifizierung scheint schwierig zu sein.

  3. Spinn3r - Kosten viel Geld

  4. die internet archive an der Stelle des Futters Spidering - Viele Komplexität, fleckige Abdeckung, nur nützlich als letztes

  5. Yahoo! Feed API oder Yahoo! Search BOSS - Die sieht zunächst eher nach einem Aggregator aus, was bedeutet, dass ich für jeden Feed eine andere Registrierung benötige, und der zweite sollte mehr Zugriff auf die Daten von Yahoo geben, aber ich kann keine Feeds finden.

  6. (Danke an Lou Franco) Bloglines Sync API - Neben dem Problem, einen Account zu benötigen und mehr als Aggregator zu entwickeln, gibt es keine Möglichkeit, dem Account Feeds hinzuzufügen. Also kein Abruf von beliebigen Feeds. Sie müssen sie manuell zuerst über den Reader hinzufügen.

  7. Andere Suchmaschinen/Blogsuche/was auch immer?

Dies ist ein wirklich irritierend Problem ist, wie wir über semantische Informationen sprechen, die einmal dort waren, noch ist (in der Regel) gültig ist, ist noch schwer zuverlässig zugreifen zu können, frei und ohne Grenzen. Kennt jemand alternative Quellen für die Futteraufnahme?

Antwort

1

Die beste Antwort, die ich bisher gefunden habe, ist: Die inoffizielle API von Google Reader hat einen öffentlichen Zugangspunkt für ihre Feeds, was bedeutet, dass keine Authentifizierung erforderlich ist. Die Verwendung ist wie folgt:.

http://www.google.com/reader/public/atom/feed/ {Ihr Feed uri hier} n = 1000

den Text in den squigglies ersetzen (einschließlich der squigglies selbst) mit dem Futter URI Sie Interesse an mehr Informationen über das

http://blog.martindoms.com/2009/10/16/using-the-google-reader-api-part-2/

aber nicht vergessen, verwenden, um den/public/url, wenn Sie mit der Authentifizierung

zu verwirren wollen nicht: Konkrete Argumente finden Sie hier
1

Bloglines hat eine API zu synchronisieren Konten

http://www.bloglines.com/services/api/sync

Sie müssen ein Konto machen, abonnieren Sie den Feed herunterladen möchten, aber dann können Sie auf Datum Download basiert, die Art und Weise sein kann in der Vergangenheit. Nicht sicher über die Bedingungen.

Verwandte Themen