Ich bin ziemlich verwirrt über Sequenz-Sequenz-RNN auf NLP-Aufgaben. Zuvor habe ich einige neuronale Modelle von Klassifikationsaufgaben implementiert. In diesen Aufgaben nehmen die Modelle Worteinbettungen als Eingabe und verwenden eine Softmax-Schicht am Ende der Netzwerke, um eine Klassifizierung vorzunehmen. Aber wie machen neuronale Modelle seq2seq Aufgaben? Wenn die Eingabe Worteinbettung ist, was ist dann die Ausgabe des neuronalen Modells? Beispiele für diese Aufgaben sind Fragen beantworten, Dialogsysteme und maschinelle Übersetzung.Wie man RNN auf Sequenz-zu-Sequenz-NLP-Aufgabe anwenden?
1
A
Antwort
0
Sie können einen Encoder-Decoder Architektur verwenden. Der Codierteil codiert Ihre Eingabe in einen Vektor mit fester Länge, und dann decodiert der Decodierer diesen Vektor in Ihre Ausgabesequenz, was immer dies auch sein mag. Kodierungs- und Dekodierschichten können gemeinsam gegen Ihre Zielfunktion gelernt werden (was immer noch ein Soft-Max beinhalten kann). Check out this paper, die zeigt, wie dieses Modell in der neuralen maschinellen Übersetzung verwendet werden kann. Der Decoder sendet hier Wörter nacheinander aus, um eine korrekte Übersetzung zu erzeugen.
Verwandte Themen
- 1. Basic RNN Kostenfunktion konvergiert nicht auf Null
- 2. Tensorflow RNN Schicht Fehler
- 3. Wie man jQuery Element Auswahl auf eine String-Variable anwenden
- 4. Wie man Hovering auf HTML-Bereich-Tag anwenden?
- 5. Wie man Auto-Vervollständigen auf das Dropdown in MVC4 anwenden?
- 6. Wie man Physik auf Collada Objekt Knoten in Scenekit anwenden
- 7. OpenCV: Wie man Rainbow Gradient Map auf ein Bild anwenden?
- 8. Pandas Wie man mehrere Funktionen auf Datenrahmen anwenden
- 9. Wie man einen Effekt auf Sprite in ActionScript 3 anwenden
- 10. Coq: Wie man eine Hypothese auf eine andere anwenden
- 11. Wie man Jackson-Databind Deserializer auf Kartenschlüssel anwenden?
- 12. Wie man eine JavaScript-Funktion auf mehrere Div Klassen anwenden?
- 13. Wie Klasse auf GridMVC anwenden
- 14. Decorator auf Kontextprozessor anwenden
- 15. OpenCV v3.1.0 mit CRF-RNN
- 16. Wie man eine Regel in .htaccess anwenden
- 17. Wie man benutzerdefinierte Bundle-Reihenfolge anwenden?
- 18. Beobachten tensorflow rnn Modell Gewichte
- 19. Wie man Klangverzerrung in ActionScript-3 anwenden?
- 20. Wie man Responsive Design in Bootstrap anwenden?
- 21. RNN-Zellenbenennung Problem in TensorFlow
- 22. Transformationsmatrix auf Meshgrid anwenden
- 23. Wie man Filter auf eine Gridview anwendet (wie das Anwenden von Filtern auf Excel)
- 24. Anwenden auf einen SqlDataReader
- 25. Bild auf Etikett anwenden
- 26. Wie Design auf PyGTK Anwendung anwenden
- 27. Wie Funktion auf mehrere Pandas Dataframe anwenden
- 28. Wie min und max auf Textarea anwenden?
- 29. wie css auf textbox für ie9 anwenden
- 30. Wie Css Margen auf ein Label anwenden