Ich habe ein Korpus von Sätzen, die Stanford CoreNLP-Systeme vorverarbeitet wurden. Eine der Sachen, die es zur Verfügung stellt, ist der Parse-Baum des Satzes (konstituentenbasiert). Während ich ein Parse-Baum verstehen kann, wenn es (wie ein Baum) gezogen ist, ich bin nicht sicher, wie es in diesem Format zu lesen:Wie lesen Sie Wahlkreis basierten Parse-Baum
ZB:
(ROOT
(FRAG
(NP (NN sent28))
(: :)
(S
(NP (NNP Rome))
(VP (VBZ is)
(PP (IN in)
(NP
(NP (NNP Lazio) (NN province))
(CC and)
(NP
(NP (NNP Naples))
(PP (IN in)
(NP (NNP Campania))))))))
(. .)))
Der ursprüngliche Satz ist:
sent28: Rome is in Lazio province and Naples in Campania .
Wie soll ich diesen Baum lesen, oder gibt es alternativ einen Code (in Python), der es richtig macht? Danke.
Thank you! und ich fügte 'from nltk.draw.tree import draw_trees >>> draw_trees (tree)' hinzu, um es als echten Baum zu visualisieren :-) [Oh, und ich kann 'sent28' nicht ausziehen, es ist Teil einer Aufgabe. ..] – Cheshie
Vergessen zu sagen: 'Tree.pprint' ist auch sehr praktisch – mbatchkarov