Auf den NLTK docs, das ist, wie das Drucken eines Baumes (in diesem Fall ‚Einheiten‘) wird gezeigt, auf:NLTK Baum-Format ist nicht so docs es zeigen
import nltk
sentence = """At eight o'clock on Thursday morning
Arthur didn't feel very good."""
tokens = nltk.word_tokenize(sentence)
tagged = nltk.pos_tag(tokens)
entities = nltk.chunk.ne_chunk(tagged)
entities
Tree('S', [('At', 'IN'), ('eight', 'CD'), ("o'clock", 'JJ'),
('on', 'IN'), ('Thursday', 'NNP'), ('morning', 'NN'),
Tree('PERSON', [('Arthur', 'NNP')]),
('did', 'VBD'), ("n't", 'RB'), ('feel', 'VB'),
('very', 'RB'), ('good', 'JJ'), ('.', '.')])
Aber wenn ich versuche zu tun genau das gleiche mit dem exakt gleichen Code, das ist, was passiert:
entities
(S
At/IN
eight/CD
o'clock/NN
on/IN
Thursday/NNP
morning/NN
(PERSON Arthur/NNP)
did/VBD
n't/RB
feel/VB
very/RB
good/JJ
./.)
Falls Sie auf nicht gefangen haben, ich die Ausgabe von meinem Code möchte (was genau die gleiche Code ist) formatiert werden wie die Ausgabe des Codes aus den Dokumenten.
Ich habe dies auf Python 2.7 und Python 3.5 versucht, mit den gleichen Ergebnissen. Gibt es eine Lösung? Vielleicht fehlt mir gerade ein nltk-Addon? Wenn es eine Lösung gibt, würde ich Python 2.7 bevorzugen.
Vielen Dank! Ich kann nicht glauben, dass ich das verpasst habe, und ja, du hattest Recht - ich tippte "print (entities)", um meine Ausgabe zu erhalten. –