2017-04-04 2 views
0

Ich gebe vor, Tensorflow (von Python) zu verwenden, um ein kleines System zu implementieren, das die Sprache aus einem gegebenen Text (1-20 Wörter) zurückgeben muss.Wie viele Eingänge sollten ein Multilayer-Perzeptron haben, um die Sprache aus dem gegebenen Text herauszufinden?

Ich weiß Multilayer Perzeptron ist gut für Klassifizierung Problem, und ich denke, das ist eine gute Netzwerktopologie für meinen Zweck.

Ich muss entscheiden, wie viele Schichten und wie viele Knoten in jeder Schicht sind, aber ich weiß nicht, wie Mähne Eingänge mein Netzwerk haben sollte.

Kann mir jemand mit den Netzwerkeingängen für diese Art von Problem helfen?

+1

Ich habe hier einige Tensorflow-Code für die Spracherkennung geschrieben. https://github.com/ajja/twitter_langid – Aaron

Antwort

1

Es ist nicht klar, was Sie mit Eingaben meinen.

Aber in diesem Problem sind Eingaben der Text, den Sie klassifizieren möchten. So etwas Text gegeben, „ich dies als Englisch klassifizieren wollen“ könnte man kodieren diese mit char n-Gramm, zB

if n = 2, ==> 'I ', ' w', 'wa', 'an' etc. 

Sie würden dann diese n-Gramm-Indizes abbilden müssen durch ein Wörterbuch der n- mit Gramm. die den Text für beispiels

{1 : 'I ', 2: 'En', ... } 

vektorisiert würde können Sie eine Bibliothek sklearn von spacy verwenden, um dieses Wörterbuch zu erstellen oder Sie können den Code selbst, natürlich schreiben.

„Ich möchte dies als Englisch klassifizieren“ auf einen Vektor von Indizes

[1, 17, 45, 7, 9, 10, 5, 4, ...] 

könnte zuordnen, die dann eine Eingabe in eine Einbettungsschicht sein könnten, die dann zu einem MLP zugeführt werden können.

+0

Sorry, ich war nicht klar genug. Ich wollte genau das sagen. Ich benutze immer ein neuronales Netzwerk mit dem Vektor der Zahl. Vielen Dank. –

Verwandte Themen