2008-10-18 13 views
28

Ich bin auf der Suche nach etwas, mit dem ich Atom und RSS in Ruby and Rails analysieren kann. Ich habe mir die Standard-RSS-Bibliothek angesehen, aber gibt es eine Bibliothek, die automatisch erkennt, welche Art von Feed es ist, und sie für mich parse?Parsing Atom & RSS in Ruby/Rails?

+0

https://www.ruby-toolbox.com/categories/feed_parsing – Chloe

Antwort

30

Feedzirra eine der besseren Optionen ist: http://www.pauldix.net/2009/02/feedzirra-a-ruby-feed-library-built-for-speed.html

Natürlich, ich bin voreingenommen, da ich es schrieb. :)

+0

Ich stimme zu. Feedzirra ist das Beste. Wirklich schnell. Danke Paul Dix für diese erstaunliche Bibliothek. –

+4

Unglücklicherweise ist die aktive Supportabhängigkeit in der neuesten Version (auf Rails 2.3.8, nicht 3) unterbrochen. Da ich jruby nicht benutze und diese lib native Erweiterungen verwendet, kein osgi für mich. Schade, Feedzirra sah vielversprechend aus. –

+0

Ich mag es auch! –

10

Googleage zeigt einige Dinge. Waren sie nicht akzeptabel?

Simple RSS
Ruby-Feedparser

require 'simple-rss' 
require 'open-uri' 
rss = SimpleRSS.parse open('http://slashdot.org/index.rdf') 
rss.channel.title # => "Slashdot" 
+2

Simple-RSS sah gut aus, aber es wurde in 2 Jahren nicht mehr aktualisiert. Feedparser sah auch ziemlich gut aus, aber es scheint, es gibt kein Juwel und es ist ein 0,6. Ich hatte gehofft, dass es etwas reiferes geben würde, was im Allgemeinen der Standard ist. – aronchick

+0

Ich weiß, wie Sie sich fühlen, aktive Projekte zu verwenden, aber wenn die RSS- und RDF-Spezifikationen in letzter Zeit nicht viel geändert haben, würden diese vielleicht den Trick machen. :) – Pistos

+0

Ich werde es mit Simple RSS versuchen - aber es überrascht mich wirklich, dass es keine bessere Lösung da draußen gibt - angesichts der Tatsache, wie Ruby/Rails und RSS 2.0 sind, würden Sie denken, dass es ein nettes wäre Paket kombiniert sie. – aronchick

10

Wenn Sie crappy Feeds treffen, möchten Sie vielleicht HPricot verwenden, um das Futter zu analysieren.

+0

Hpricot = gute Zeiten. Vielen Dank! – aronchick

+0

Hast du dich bei Hpricot eingelebt, habe ich das versucht und konnte nicht alle Informationen aus einem Feed bekommen. Es war fairer als Nokogiri, die nicht mit falschem Futter umgehen konnten. – Kris

+0

Nun, ein oder zwei Mal konnte Hpricot nicht mit einem sehr kaputten Futter umgehen, aber abgesehen davon funktioniert es immer gut für mich. Ich verwende es für http://www.learnivore.com zum Beispiel. –

2

-Feed Normalizer sieht aus wie es eine gute Option sein kann

http://rubyforge.org/projects/feed-normalizer/

+0

es wie Feed-normalizer sieht hüllt Einfache RSS, von der Installation. Ich habe es gerade benutzt, um durch eine OPML-Datei mit gemischten Rss/Atom-Feeds zu graben - es schien sehr gut agnostisch zu sein, ich wusste es nicht und kümmerte mich nicht darum, was es aussah, was mir passt! –

1

Ich habe Feedzirra und SimpleRSS versucht und ich fand, dass beide gut funktionieren. Feedzirra war zwar schneller, aber wenn es um deine Leistung geht, bist du mit Feedzirra besser dran.

2

Sieht aus wie im Jahr 2009 die standart Ruby RSS library haben nur noch nicht existieren?

+0

P. S.: Es hat mir nicht funktioniert, weil einige Feeds nicht nach RFCs aussehen. – Nakilon