Ich möchte nltk
mit dem Korpus tweeter_sample
trainieren, aber ich bekomme einen Fehler, wenn ich versuche, die Probe nach Kategorie zu laden.nltk Korpus Hochtöner_Probe nach Kategorie
Zuerst versuchte ich wie folgt aus:
from nltk.corpus import twitter_samples
documents = [(list(twitter_samples.strings(fileid)), category)
for category in twitter_samples.categories()
for fileid in twitter_samples.fileids(category)]
aber es gab mir diesen Fehler:
Traceback (most recent call last):
File "C:/Users/neptun/PycharmProjects/Thesis/First_sentimental.py", line 6, in <module>
for category in twitter_samples.categories()
File "C:\Users\neptun\AppData\Local\Programs\Python\Python36-32\lib\site-packages\nltk\corpus\util.py", line 119, in __getattr__
return getattr(self, attr)
AttributeError: 'TwitterCorpusReader' object has no attribute 'categories'
Ich weiß nicht, wie sie die verfügbaren Attribute geben, um meine Liste zu haben, mit positive und negative Stimmung.
Vielen Dank für Ihre Antwort @alexis, aber ich machte einen Fehler in meiner Frage Ich möchte, dass jedes Wort getrennt ist. So kann ich 'nltk.FreqDist (Dokumente)' verwenden – Cavalier