Ich habe Tweets von einem bestimmten Konto, möchte ich durch jeden tweet gehen und in die Klasse Labels wie Unternehmen zu kategorisieren, Musik, Sport usw.Multi-Klasse Einstufung in R
Mein Ansatz Trainingsdaten für die Erstellung ist zuweisen paar Stichworte zu jeder Klasse Etikett, zum Beispiel
- Schlüsselwörter für „Business“ könnte sein - Unternehmer, job, GDP ...
- Schlüsselwörter für „Musik“ könnte - Songs, Genre, Album ...
CSV-Datei für Trainingsdaten hat 2 Spalten 1. Keywords 2. Klasse
Ist dies der richtige Weg zu gehen?
Vielen Dank im Voraus!
Ich habe es ausprobiert, das war genau das, was ich gesucht habe. Ich danke dir sehr! –
Kein Problem. Freue mich zu helfen. Quanteda ist definitiv ein großartiges Textanalysewerkzeug. Auch gut, weil es Twitter versteht! – lmkirvan
Es ist eine dumme Frage zu stellen, aber ich kann keine Lösung finden. Ich habe "Sport" gespeichert, "trage" in meinem Wörterbuch, aber wenn ich auf Wörter stoße, die mit ihnen in Beziehung stehen, wie "Sport", "trägt", ist es nicht in der Lage, sie zu identifizieren. Irgendwelche Vorschläge, wie man das macht? –