2016-08-21 4 views
4

Ich habe Mühe, die Tasche der Wörter/Vokabeln-Methode für die Darstellung meiner Eingabedaten als eine heiße Vektoren für mein neuronales Netzmodell in Keras nähern.Verwenden von Keras für die Textklassifizierung

Ich möchte ein einfaches 3-Schicht-Netzwerk bauen, aber ich brauche Hilfe beim Verständnis und der Entwicklung eines Ansatzes, um meine etikettierten Daten in Form von Text zu transformieren, der 7 Etiketten hat, im Bereich von 0 - 1 Zoll Schritte von 0,2.

Ich habe versucht, Scikit-Vektorisierer zu verwenden, aber sie sind zu starr, d. H. Sie token Wörter oder Zeichen, während ich einen Satz zum Vokabular benötige, der Wörter, Zeichen, Interpunktion und Emojis enthält. Wenn ich tfid für einen Testsatz verwende, zählt es nur die Wörter und ignoriert alles andere. Ich brauche auch Anleitung, um diesen einen heißen Ansatz zu nehmen und wie er in Keras implementiert wird.

schätzen wirklich jede mögliche Hilfe,

Prost

Antwort

6

Here ein Keras Beispiel ist, wo sie acht Leistungsklassen haben und eine Tasche der Worte.

+1

gute Antwort - aber besser, eine kurze Beschreibung in die Antwort selbst hinzuzufügen –

Verwandte Themen