Tiefe neuronale Netze: Wie gut müssen die Boltzmann-Maschinen sein?

-1

Wenn Boltzmann-Maschinen gestapelt werden, um ein tiefes neuronales Netz generativ vorzutrainieren, wie genau müssen die Rekonstruktionen sein? Wenn sie zu genau sind, kann Überanpassung ein Problem sein? Oder ist eine zu hohe Genauigkeit nur eine rote Fahne bei diskriminierender Feinabstimmung?Tiefe neuronale Netze: Wie gut müssen die Boltzmann-Maschinen sein?

Quelle

2017-04-23 Isaac K

Was ist ein Problem ist es nicht in den Markov-Ketten genug zu verbrennen, um hoch energetische Bereiche im Trainingssatz zu unterdrücken, die weit von den anfänglichen Werten entfernt sind. Dies ist typisch unter Verwendung von CD (1) oder irgendeiner kontrastiven Divergenz niedriger Ordnung. Das heißt, diese Methoden initialisieren typischerweise immer Gewichte weit von lokalen Optima, in denen nicht vortrainierte Netze stecken bleiben. RBMs werden auch mit simuliertem Annealing trainiert, so dass sie eher mehr Parameterraum erkunden.

Ich empfehle Ihnen auch, das Papier zu lesen Verständnis von tiefem Lernen erfordert Umdenken Generalisierung von Zhang et al. Es zeigt im Grunde, wie diese Netzwerke die Wahrscheinlichkeitsverteilungen praktisch vollständig speichern und trotzdem verallgemeinern können.

Quelle

2017-04-23 20:25:19 convolutionBoy

Tiefe neuronale Netze: Wie gut müssen die Boltzmann-Maschinen sein?

Antwort

Verwandte Themen