Ich frage mich, was der Unterschied zwischen Aktivierungsebene und Dichteebene in Keras war.Unterschied zwischen Dichte- und Aktivierungsschicht in Keras
Da Activation Layer eine vollständig verbundene Ebene zu sein scheint und Dense über einen Parameter verfügt, um eine Aktivierungsfunktion zu übergeben, was ist die beste Vorgehensweise?
Lasst uns ein fictionnal Netzwerk wie folgt vorstellen: Eingang -> Dense -> Dropout -> sollte letzte Schicht letzte Schicht sein: Dichte (Aktivierung = softmax) oder Aktivierung (softmax)? Was ist das sauberste und warum?
Danke allen!
Vielen Dank, das ist sehr klar! –
Können Sie irgendwelche Vorteile der Verwendung der ersten erkennen? – lejlot
Modelldefinition ist kürzer und kompakter. –