0
import nltk
import nltk.data
nltk.corpus.brown
y= nltk.corpus.brown.raw()
print(y)
Wenn ich print(y)
tun zeigt es mir all die Rohdaten in diesem Korpus, aber ich will nur 10,000
Worte aus diesem rohen Korpus erhalten. Wie kann ich das erreichen?Wie erhält man bestimmte Distanzwörter vom Rohkorpus?
ich nicht 10000 Wörter aus Worten müssen. Ich brauche Worte aus dem Rohkorpus. Sie schrieben words = nltk.corpus.brown.words() anstelle von words = nltk.corpus.brown.raw() –
In 'words()' haben Sie alle Wörter in 'raw()' in der gleichen Reihenfolge . Sie können dies überprüfen, indem Sie: 'nltk.corpus.brown.raw() [0: 100]' und 'nltk.corpus.brown.words() [0:10]' – Till
Danke, es funktioniert gut. nltk.corpus.brown.words() [0:10] dieses Ding, das ich eigentlich wollte. –