Für ein Schulprojekt müssen wir herausfinden, ob ein Tweet mit Fitness/körperlicher Aktivität in Verbindung steht oder nicht. Der gesamte Datensatz enthält 50 Millionen unmarkierte Tweets.Klassifizieren von Tweets wenn Fitness bezogen oder nicht
Was sind mögliche Klassifizierungen für dieses Unternehmen?
Dies scheint eine viel zu breite Frage zu sein; Welche Techniken sollten Sie verwenden - einfache Textanpassung, semantische Analyse, Deep Learning oder andere? –
ist es egal, welche Technik wir verwenden! es muss nur etwas fortgeschrittener sein, als nur ein Wörterbuch zu schreiben und zu prüfen, ob die Wörter des Wörterbuchs im Tweet erscheinen oder nicht. –