2010-08-09 3 views
7

Ich habe derzeit einen Algorithmus in Ruby basierend auf dem Arc90-Lesbarkeitscode geschrieben, um einen Artikel von einer Webseite zu extrahieren.Gibt es etwas besseres als Ruby Alchemy zum Extrahieren von Keywords?

Nun, da ich den Artikel haben, möchte ich Keywords und spezifische Informationen daraus extrahieren (Namen, Autor, etc.)

Ich hörte Alchemy ein großer Rubin Juwel war, dies zu tun, obwohl es viele Ressourcen verbraucht . Gibt es irgendwelche besseren Edelsteine, die ich dafür benutzen kann?

+0

Ich denke, das Alchemie-Schlüsselwort bezieht sich auf das Alchimie-Projekt von Adobe, nicht auf Ruby Gem. Siehe die FAQ: http://stackoverflow.com/tags/alchemy/info – paleozogt

Antwort

2

Es gibt eine OpenCalais gem, die ähnliche Fähigkeiten bietet. Zusätzlich zur Entity-Extraktion können auch Ereignisse und Beziehungen zwischen Entitäten erkannt werden. Es ist nicht leicht, obwohl ich nicht sagen konnte, ob es besser oder schlechter als Alchemie ist, da ich das Juwel von Alchemy nicht benutzt habe. Hoffe das hilft.

+0

Ich bin gegangen und habe mein eigenes Juwel für OpenCalais geschrieben: https://github.com/RedFred7/dover_to_calais – RedFred

9

schnelle, leichtgewichtige und leicht zu bedienendes Juwel für Stichworte von mehr Inhalt zu extrahieren:

https://rubygems.org/gems/highscore

ich es in der Produktion verwenden, wirkt wie ein Zauber.

Die Frage ist ein bisschen älter, aber ich werde dies hier für andere verlassen, die von Google kommen werden, um diese Frage zu sehen.

Verwandte Themen