2010-12-27 4 views
3

Gibt es eine Möglichkeit, ein Korpus zu erstellen, ohne Elemente in Dateien haben zu müssen. Ich möchte zum Beispiel Tweets oder Absätze manipulieren, die ich aus dem Internet geholt habe. Kann ich etwas tun, wieKann ich ein Korpus aus einer Sammlung von Strings in NLTK erstellen?

myCorpus = MyCorpus([ 
    ('id', 'item', 'category'), 
    ('id', 'item', 'category'), 
    ('id', 'item', 'category'), 
    ... ]) 

Oder

myCorpus.add('id', 'item', 'category') 

Der Zweck ist es, den Korpus mit bestehenden NLTK Fähigkeiten zu manipulieren. Ich habe TextCollection überprüft, aber es scheint, dass es keine Kategorien behandelt.

Antwort

-1

Warum nicht einfach die Strings in eine Datei oder Dateien schreiben und dann als Corpus verarbeiten?

+0

Es kann schneller sein, Dinge im Speicher zu behalten. Zum Beispiel, wenn Sie Inhalte aus dem Internet scrappen. –

Verwandte Themen