Ich versuche ein LSTM-Modell für die Aufgabe der Stimmungseinteilung in kurzen Texten wie Produktbewertungen und Tweets zu trainieren.Was ist die minimale Größe des Trainingssatzes, die für die Aufgabe der Stimmungseinteilung in kurzen Texten benötigt wird?
Ich suche nach einem Trainingssatz, der positiv/negativ/neutral kennzeichnet, gibt es so etwas (frei für die Forschung) da draußen, das wirklich auf menschlichen Tags basiert und nicht auf Starts oder Emoticons? Ich fand nur kleine Trainingssätze, die mich zu schlechten Ergebnissen führten. Ich habe versucht, die Größe meines Netzwerks und gestapelte Ebenen zu erhöhen, aber keine Verbesserung.
Was ist die Mindestgröße für ein solches Training, um vernünftige Ergebnisse zu erhalten (F1> 0.8).