6
Wie kann ich eine Zeichenfolge in Java-Klasse mit Hilfe von Stanford Parser in Tokensize?stanford nlp Tokenizer
Ich bin nur in der Lage, Beispiele für DocumentProcessor und PTBTokenizer zu finden, die Text aus einer externen Datei nehmen.
DocumentPreprocessor dp = new DocumentPreprocessor("hello.txt");
for (List sentence : dp) {
System.out.println(sentence);
}
// option #2: By token
PTBTokenizer ptbt = new PTBTokenizer(new FileReader("hello.txt"),
new CoreLabelTokenFactory(), "");
for (CoreLabel label; ptbt.hasNext();) {
label = (CoreLabel) ptbt.next();
System.out.println(label);
}
Danke.
Können Sie den Code für Konstruktor schreiben zu analysieren und wie kann ich verwenden Leser mit diesem. Danke – Naveen
macht mir nichts, das gibt mir Token: Liste rowWords = tokenizerFactory.getTokenizer (new StringReader (sentence)). Tokenize(); System.out.println (rawWords.get (0) .value()); –
Naveen
Ich habe etwas Zeit gebraucht, um NetBeans zu öffnen, ein neues Projekt zu erstellen, etc ... dann Blackout ... verdammt ... – CapelliC