Hier ist ein Beispielcode für einen deutschen Satz Parsing:
import edu.stanford.nlp.io.IOUtils;
import edu.stanford.nlp.ling.CoreAnnotations;
import edu.stanford.nlp.pipeline.*;
import edu.stanford.nlp.simple.*;
import edu.stanford.nlp.trees.*;
import edu.stanford.nlp.util.CoreMap;
import edu.stanford.nlp.util.PropertiesUtils;
import edu.stanford.nlp.util.StringUtils;
import java.util.*;
public class SimpleGermanExample {
public static void main(String[] args) {
String sampleGermanText = "...";
Annotation germanAnnotation = new Annotation(sampleGermanText);
Properties germanProperties = StringUtils.argsToProperties(
new String[]{"-props", "StanfordCoreNLP-german.properties"});
StanfordCoreNLP pipeline = new StanfordCoreNLP(germanProperties);
pipeline.annotate(germanAnnotation);
for (CoreMap sentence : germanAnnotation.get(CoreAnnotations.SentencesAnnotation.class)) {
Tree sentenceTree = sentence.get(TreeCoreAnnotations.TreeAnnotation.class);
System.out.println(sentenceTree);
}
}
}
diesen Beispielcode zu verwenden Stellen Sie sicher, das volle Toolkit herunterladen.
http://stanfordnlp.github.io/CoreNLP/
Auch stellen Sie sicher, dass es jar deutsche Modelle in Ihrem CLASSPATH. Der obige Code weiß, dass Sie alle Objekte in Ihrem CLASSPATH betrachten müssen, und erkennt, dass sich diese Datei im deutschen Jar befindet.
Ich würde davon ausgehen, dass das Jar die Daten enthält, und Sie würden das Glas zum Build-Pfad Ihres Projekts hinzufügen, um darauf zuzugreifen, nein? –
Sie haben Recht. Natürlich habe ich die deutsche .jar-Datei bereits zu meinem Build-Pfad in Eclipse hinzugefügt. Aber es muss eine Option geben, wo ich diese deutsche Datei einstellen muss. Wenn nicht, wie kann das Programm wissen, welche Sprache es verwenden soll? – Tobi123
Edit: Natürlich kann ich auch einen deutschen Satz für die Eingabe verwenden, aber die Ergebnis-Tags sind falsch/ergeben keinen Sinn. – Tobi123