2016-03-26 28 views

Antwort

2

Sie könnten tun:

import random 
words = nltk.corpus.brown.words() 
random_words = random.sample(words, 10000) 
+0

ich nicht 10000 Wörter aus Worten müssen. Ich brauche Worte aus dem Rohkorpus. Sie schrieben words = nltk.corpus.brown.words() anstelle von words = nltk.corpus.brown.raw() –

+0

In 'words()' haben Sie alle Wörter in 'raw()' in der gleichen Reihenfolge . Sie können dies überprüfen, indem Sie: 'nltk.corpus.brown.raw() [0: 100]' und 'nltk.corpus.brown.words() [0:10]' – Till

+0

Danke, es funktioniert gut. nltk.corpus.brown.words() [0:10] dieses Ding, das ich eigentlich wollte. –

Verwandte Themen