Ich arbeite an einem Forschungsprojekt über Textdaten (es geht um Suchmaschinen-Abfragen überwachte Klassifizierung). Ich habe bereits verschiedene Methoden implementiert, und ich habe auch verschiedene Modelle für den Text verwendet (z. B. Binärvektoren der Dimension meines Vokabulars - 1 wenn das i-te Wort im Text erscheint, 0 sonst - oder Wörter, die mit dem Modell word2vec eingebettet sind)).Einbettungen mit rekurrenten neuronalen Netzen
Mein Berater sagte mir, dass wir vielleicht eine andere Darstellung der Abfragen finden könnten, die das Recurrent Neural Network verwenden. Diese Darstellung sollte die Reihenfolge der Wörter im Text dank der Wiederholungsbeziehung berücksichtigen. Ich habe einige Dokumentationen über RNN gelesen, aber ich habe nichts Nützliches für dieses Ziel gefunden. Ich habe viele Dinge über Sprachmodellierung gelesen (die die Wahrscheinlichkeiten der Wörter vorhersagen), aber ich verstehe nicht, wie ich dieses Modell anpassen könnte, um etwas wie einen eingebetteten Vektor zu erhalten.
Vielen Dank!