2012-10-11 13 views
6

Wie kann ich eine Zeichenfolge in Java-Klasse mit Hilfe von Stanford Parser in Tokensize?stanford nlp Tokenizer

Ich bin nur in der Lage, Beispiele für DocumentProcessor und PTBTokenizer zu finden, die Text aus einer externen Datei nehmen.

DocumentPreprocessor dp = new DocumentPreprocessor("hello.txt"); 
    for (List sentence : dp) { 
    System.out.println(sentence); 
    } 
    // option #2: By token 

    PTBTokenizer ptbt = new PTBTokenizer(new FileReader("hello.txt"), 
      new CoreLabelTokenFactory(), ""); 
    for (CoreLabel label; ptbt.hasNext();) { 
    label = (CoreLabel) ptbt.next(); 
    System.out.println(label); 
    } 

Danke.

Antwort

6

PTBTokenizer Konstruktor nimmt einen java.io.Reader, dann können Sie einen String verwenden Ihren Text

+0

Können Sie den Code für Konstruktor schreiben zu analysieren und wie kann ich verwenden Leser mit diesem. Danke – Naveen

+4

macht mir nichts, das gibt mir Token: Liste rowWords = tokenizerFactory.getTokenizer (new StringReader (sentence)). Tokenize(); System.out.println (rawWords.get (0) .value()); – Naveen

+1

Ich habe etwas Zeit gebraucht, um NetBeans zu öffnen, ein neues Projekt zu erstellen, etc ... dann Blackout ... verdammt ... – CapelliC

Verwandte Themen