Könnten Sie mir bitte helfen, die Häufigkeitsverteilung von "Wortgruppe" zu berechnen?NLTK Häufigkeitsverteilung für eine Gruppe von Wörtern
Mit anderen Worten, ich habe eine Textdatei. Hier ist ein Überblick:
Hier mein Code ist die 50 häufigsten Wörter in der Textdatei zu finden:
f=open('myfile.txt','rU')
text=f.read()
text1=text.split()
keywords=nltk.Text(text1)
fdist1=FreqDist(keywords)
fdist1.most_common(50)
In den Ergebnissen, wie Sie in den Link sehen können, jeweils Wort wird berechnet. Hier ist ein Screenshot der Ergebnisse:
Es funktioniert gut, aber ich versuche, die Häufigkeitsverteilung von jeder Zeile in der Textdatei zu finden. Zum Beispiel gibt es in der ersten Zeile einen Begriff "konzeptionelle Veränderung". Das Programm berechnet "konzeptionell" und "ändern" als unterschiedliche Keywords. Ich muss jedoch die Häufigkeitsverteilung des Begriffs "konzeptionelle Veränderung" finden.
Welcome to-Überlauf zu stapeln. Sie können Ihre Frage etwas verbessern, indem Sie einige Informationen darüber geben, was Sie versucht haben und wo Sie stecken geblieben sind. – Willem
Auch: Wie sieht die Eingabedatei eigentlich aus? Zeigen Sie ein paar Zeilen. – alexis
Ich habe meine Frage nach Ihren Vorschlägen bearbeitet –