Ich bin neu in RNN, und ich versuche, die Besonderheiten der LSTM Zellen, um herauszufinden, und sie sind gegenüber TensorFlow: Colah GitHub Hat die GitHub Beispiel der Website verwendet die gleiche LSTM-Zelle im Vergleich zu TensorFlow? Die einzige Sache, die ich auf der TensorFlow-Site bekam, war, dass grundlegende LSTM-Zellen die folgende Architektur verwenden: Paper Wenn es die gleiche Architektur ist, kann ich die Zahlen für eine LSTM-Zelle manuell berechnen und sehen, ob es übereinstimmt.Recurrent Neural Network (RNN) - Ebene vergessen, und TensorFlow
Auch wenn wir eine grundlegende LSTM Zelle in tensorflow gesetzt, dauert es in einem num_units
nach: TensorFlow documentation
tf.nn.rnn_cell.GRUCell.__init__(num_units, input_size=None, activation=tanh)
Ist diese Anzahl von verstecktem Zustand (h_t)) und Zellzustand (C_T)?
Laut der GitHub-Website wird die Anzahl der Zellenzustände und versteckten Zustände nicht erwähnt. Ich nehme an, sie müssen die gleiche Nummer sein?
Es tut mir leid, aber tiefes Lernen ist nicht etwas, dem du ein Tutorial folgen kannst und du wirst ein Guru. Das ist meine Erfahrung gerade jetzt, Monate zu studieren wirklich schwer zu verstehen, weil sie komplex sind. Also, wenn Sie wirklich neu sind und verstehen wollen, wie sie funktionieren, empfehle ich Ihnen Udemy Kurse von Instruktoren: Lazy Programmer und SuperDataScience. Wenn Sie nur an einfachem Code interessiert sind, können Sie es mit Keras versuchen, es ist ein High-Level-Framework, das auf Tensorflow oder Theano arbeitet. –
Ist Ihre Frage zu GRU oder LSTM? Eine GRU-Zelle hat einen einzelnen Zustand, der die gleiche Größe der Ausgabe hat, während eine LSTM-Zelle einen zweiteiligen Zustand mit Komponenten gleicher Größe hat. – jasekp