Ich würde gerne den Stemmer hier zum Zusammenführen von Wortanzahl verwenden.
http://snowball.tartarus.org/download.html
Die Seite hat einen Download-Link, aber ich bin nicht sicher, wie die Dateien in mein Eclipse Projekt
Seiner Integration nicht nur ein Glas in meinen lib Ordner zu löschen, dessen Dateisystem. Kennt jemand eine Dokumentation, die dies erklärt, da ich keine auf der Website gesehen habe.
(Wie in, was importiere ich, wie nenne ich es etc ..)Schneeball Stemmer Usage
Antwort
Erstellen Sie die JAR-Datei und fügen Sie sie Ihrem Build Path hinzu.
Details:
- Laden Sie die tgz mit dem Code von hier http://snowball.tartarus.org/download.php
- dekomprimieren.
- Wechseln Sie in das Verzeichnis libstemmer_java und lesen Sie README.
- Befolgen Sie die Anweisungen zum Kompilieren (mit javac).
- Möglicherweise müssen Sie java/org/tartarus/snowball/ext/frenchStemmer.java korrigieren oder entfernen, weil es einen Fehler hat und nicht kompiliert.
- erstellen jar-Datei: Zum libstemmer_java/java dann jar cvf libstemmer.jar *
- hinzufügen libstemmer.jar zu Ihrem Build Path (in Eclipse: Projekt-Eigenschaften-Java Build Path-Libreries Tab).
Dann können Sie die Abbeermaschinen nutzen so etwas wie tun:
import org.tartarus.snowball.ext.spanishStemmer;
...
spanishStemmer stemmer = new spanishStemmer();
stemmer.setCurrent("torero");
if (stemmer.stem()){
System.out.println(stemmer.getCurrent());
}
Ich lief in einen Kompilierungsfehler, so nahm ich alle außer den englischen Sprachpaketen heraus und das Kompilieren ging perfekt. Danke, dass Sie diese Frage beantwortet haben und niemandem RTFM gesagt haben. :) – Twitch
Ich habe ein ungewöhnliches Problem. Ich habe meine Zeichenfolge in einer Variablen namens "Wort" wie Word = "Torero"; und wenn ich diese Variable an den Stemmer übergebe, wird es nicht funktionieren. zB stemmer.setCurrent (Wort); stemmer.stem(); System.out.println (stemmer.getCurrent()); Es wird nicht aufgehalten. Sag mir, was ich hier falsch mache. –
- 1. Weka Schneeball Stemmer geben Fehler
- 2. Porter Stemmer, Schritt 1b
- 3. Fast-Stemmer Installationsprobleme
- 4. Gibt es eine Java-Implementierung von Porter2 stemmer
- 5. Linux CPU Usage Tools
- 6. Powershell Memory Usage
- 7. Ignite Heap Memory Usage
- 8. Java Heap Usage Monitor
- 9. SQL CASE Usage & Pivot
- 10. Data Usage Checker Tools
- 11. TypeScript typed array usage
- 12. C - strncpy usage - segfault
- 13. Usage Access Settings, Berechtigungen
- 14. Grep Usage help
- 15. Captive Network Usage
- 16. Logging iphone feature usage
- 17. nanosleep high cpu usage?
- 18. ropemacs USAGE Tutorial
- 19. Silverlight Memory Usage
- 20. winforms application memory usage
- 21. Verwendung von possessive_english stemmer in Elasticsearch
- 22. Bash Script "Usage" Ausgabe Formatierung
- 23. Nexus Artifact Usage Plugin nicht
- 24. Visual Studio CPU High Usage
- 25. Get Memory Usage in Android
- 26. Google Cloud Storage Javascript Usage
- 27. "position: absolute" usage in CSS
- 28. PowerShell Memory Usage für Tomcat
- 29. Python - Prozessnamen, CPU, Mem Usage und Peak Mem Usage in Windows holen
- 30. Erstellen Sie eine rumänische Lucene Stemmer in Java Netbeans
[Der Schneeball Handbuch] (http://snowball.tartarus.org/compiler/snowman.html) und [Der Schneeball, wie man run it] (http://snowball.tartarus.org/runtime/use.html) – orangegoat
Ich habe beide gelesen, aber die zweite sagt, wie man es eigenständig mit Java ausführt, nicht wie man es in ein Projekt importiert und der erste berührt nicht das reale Setup – Lemonio