2012-03-28 15 views
1

Ich habe eine Reihe von Textdatei. Ich möchte NLTK zum Vorverarbeiten und Ausdrucken des Vokabulars in einem Textformat im Textformat verwenden, damit ich diese Datei für die Benutzer verteilen kann. Ich habe folgenden it.I begann zu tun mit einzelner Datei unter:Erstellen von Vokabeln in Python

file1 = open("path/to/text/file","rU") 
raw = file1.read() 
tokens = nltk.wordpunct_tokenize(raw) 
words = [w.lower for w in tokens] 
vocab = sorted(set(tokens)) 

Jetzt würde ich die Elemente in vocab zur Liste wie in einen Klartext .txt menschliche lesbare Datei. Wie würde ich es tun?

+0

Ein Fehler, der es in Ihrer Frage ist, dass die Worte nach dem unteren Untertitelung, verwenden Sie sie nicht Ihre vocab zu bauen. – chandresh

Antwort

4

schreiben sie manuell aus:

with open("output.txt", "w") as f: 
    for item in vocab: 
     f.write(item + "\n") 
+3

Oder nur 'f.writelines (vocab)' :) –

+0

danke you.it funktionierte :) – thetna

+0

@NiklasB. Just so: D – brice

Verwandte Themen