2013-07-30 11 views
5

Ich würde gerne den Stemmer hier zum Zusammenführen von Wortanzahl verwenden.
http://snowball.tartarus.org/download.html
Die Seite hat einen Download-Link, aber ich bin nicht sicher, wie die Dateien in mein Eclipse Projekt
Seiner Integration nicht nur ein Glas in meinen lib Ordner zu löschen, dessen Dateisystem. Kennt jemand eine Dokumentation, die dies erklärt, da ich keine auf der Website gesehen habe.
(Wie in, was importiere ich, wie nenne ich es etc ..)Schneeball Stemmer Usage

+0

[Der Schneeball Handbuch] (http://snowball.tartarus.org/compiler/snowman.html) und [Der Schneeball, wie man run it] (http://snowball.tartarus.org/runtime/use.html) – orangegoat

+0

Ich habe beide gelesen, aber die zweite sagt, wie man es eigenständig mit Java ausführt, nicht wie man es in ein Projekt importiert und der erste berührt nicht das reale Setup – Lemonio

Antwort

13

Erstellen Sie die JAR-Datei und fügen Sie sie Ihrem Build Path hinzu.

Details:

  • Laden Sie die tgz mit dem Code von hier http://snowball.tartarus.org/download.php
  • dekomprimieren.
  • Wechseln Sie in das Verzeichnis libstemmer_java und lesen Sie README.
  • Befolgen Sie die Anweisungen zum Kompilieren (mit javac).
  • Möglicherweise müssen Sie java/org/tartarus/snowball/ext/frenchStemmer.java korrigieren oder entfernen, weil es einen Fehler hat und nicht kompiliert.
  • erstellen jar-Datei: Zum libstemmer_java/java dann jar cvf libstemmer.jar *
  • hinzufügen libstemmer.jar zu Ihrem Build Path (in Eclipse: Projekt-Eigenschaften-Java Build Path-Libreries Tab).

Dann können Sie die Abbeermaschinen nutzen so etwas wie tun:

import org.tartarus.snowball.ext.spanishStemmer; 
... 
spanishStemmer stemmer = new spanishStemmer(); 
stemmer.setCurrent("torero"); 
if (stemmer.stem()){ 
    System.out.println(stemmer.getCurrent()); 
} 
+0

Ich lief in einen Kompilierungsfehler, so nahm ich alle außer den englischen Sprachpaketen heraus und das Kompilieren ging perfekt. Danke, dass Sie diese Frage beantwortet haben und niemandem RTFM gesagt haben. :) – Twitch

+0

Ich habe ein ungewöhnliches Problem. Ich habe meine Zeichenfolge in einer Variablen namens "Wort" wie Word = "Torero"; und wenn ich diese Variable an den Stemmer übergebe, wird es nicht funktionieren. zB stemmer.setCurrent (Wort); stemmer.stem(); System.out.println (stemmer.getCurrent()); Es wird nicht aufgehalten. Sag mir, was ich hier falsch mache. –