Ich bin der "Programmierer" eines Schülerteams, der die Zufriedenheit und allgemeine Probleme meines Gymnasiums untersuchen will. Wir haben einen Fragebogen, der auf einer Skala von 1-6 aufgebaut ist und interpretieren diese Antworten mit einer Diagrammsoftware, die ich in Python geschrieben habe.Wie kann ich Textanalyse verwenden, um Antworten auf Fragebögen zu untersuchen?
Jetzt gibt es eine <textarea>
am Ende unseres Fragebogens, die man verwenden kann, wie er will. Ich denke derzeit darüber nach, wie man diese Daten nutzbar machen kann (wir wollen nicht mehr als 800 Antworten lesen).
Wie kann ich Textanalyse in Python verwenden, um zu untersuchen, was Schüler schreiben? Ich war eine Art und Weise zu denken jeder Satzes „Tag“, die unten geschrieben wird, wie:
I don't like being in school. [wellbeing][negative]
I have way too much homework. [homework][much]
I think there should be more interesting projects. [projects][more]
Gibt es brauchbare Ansätze, die zu erhalten? Ist es sinnvoll, einen vorhandenen Tokenizer zu verwenden?
Danke für Ihre Hilfe!
800 Antworten wird Ihnen nicht genug geben, um NLP mit zu tun. Sie sind besser dran, die Antworten manuell zu lesen. Sie können einen naiven Bayes-Klassifikator mit 600 trainieren und auf 200 überprüfen, aber das wird Ihnen nur 2 Dimensionen bringen - und während dies für mehr Tags möglich ist, werden Sie viel mehr Einträge benötigen. – kreativitea
Es hilft, wenn Sie uns sagen, sind die Boxkommentare völlig frei, oder gibt es eine Reihe von bekannten Themen, auf denen sie sein werden? (oder verwenden Sie Clustering, um das zu beantworten, oder einfach nur einfach alt Grep, oder nur Augapfel es selbst) – smci