2016-04-29 4 views
1

Wenn ich Stanford Parser verwende, um Sätze zu parsen wie: "Jirí Hubacs Skript ist ein Juwel." "Absorbierende Charakterstudie von André Turpin."Wie Parsen Satz, der mehrsprachig ist?

Sie erhöhen internen Fehler.

Wie mit einer solchen Situation umgehen, dass der Satz mehrsprachig ist?

Antwort

1

Mit dem vollen Stanford CoreNLP Toolkit finden Sie hier:

http://stanfordnlp.github.io/CoreNLP/

ich diesen Befehl lautete:

java -Xmx6g -cp "stanford-corenlp-full-2015-12-09/*" edu.stanford.nlp.pipeline.StanfordCoreNLP -annotators tokenize,ssplit,pos,lemma,ner,parse -file example.txt -outputFormat text 

Es hatte kein Problem, Ihr Beispielsatz und die Ausgabe Parsen kann in die gefunden werden file: example.txt.out

Können Sie bitte den Befehl, den Sie ausgegeben haben, und den Fehler, den Sie beim Ausführen erhalten haben, angeben zu diesem Satz?

+0

@StanfodNLPHelp Ich benutze die Python-Schnittstelle in der [link] (https://github.com/dasmith/stanford-corenlp-python) mit nur dem bereitgestellten Befehl 'code server.parse (' ein Satz ')' Inline 'Code in Backticks' – Matthew

+0

Ich würde diesen Python-Wrapper nicht verwenden. Sie können versuchen, den Stanford CoreNLP-Server zu verwenden: http://stanfordnlp.github.io/CoreNLP/corenlp-server.html und diesen Python-Wrapper verwenden: https://github.com/smilli/py-corenlp ... obwohl ich Wenn Sie nur eine Menge von Sätzen verarbeiten möchten, können Sie einfach den obigen Befehl in einem os.system() - Aufruf verwenden und dann die Ausgabe verarbeiten ... wenn Sie "-outputFormat json" anstelle von Text in unserem Toolkit verwenden wird json der verarbeiteten Sätze ausgeben – StanfordNLPHelp

+0

@StanfodNLPHelp Das ist eine große Hilfe für mich. Wie kann ich den binarisierten Parsing-Baum von Stanford Parser erhalten? Gibt es irgendwelche Parameter dafür? Vielen Dank! – Matthew