2016-04-24 6 views
-1

Ich studiere vor kurzem über eingeschränkte Boltzmann-Maschine (RBM).Wie erklärt man den Trainingsprozess in einer eingeschränkten Boltzmann-Maschine?

Ich habe das Papier von G. Hinton sucht: https://www.cs.toronto.edu/~hinton/absps/guideTR.pdf

Um das Bild zu trainieren in der RBM ist auf den Daten des Netzes „um die Wahrscheinlichkeit zu erhöhen,“ aber ich kann nicht erklären, warum das so machen Sinn: Wie wir das Netzwerk mit einem gegebenen Bild trainieren ist es, die Wahrscheinlichkeit des Netzwerks zu erhöhen

Kann jemand das erklären? Vielen Dank.

Antwort

2

Denken Sie an RBM als eine Black Box, die in der Lage ist, Dinge zu generieren. Lasst uns auf die Bilddomäne fokussieren - es ist jetzt eine Blackbox, die in der Lage ist, jede Art von Bild zu erzeugen - offensichtlich repräsentieren die meisten Bilder nichts, sie sind einfach nur Rauschen. Während des Trainings passen Sie die internen Parameter von RBM (die definieren, wie es Dinge erzeugt) so an, dass eine bestimmte Menge von Trainingsbildern mit hoher Wahrscheinlichkeit generiert wird. Mit anderen Worten - Sie ändern RBM-Parameter so, dass RBM beginnt, Bilder Ihrer Wahl zu erzeugen. Wie kann es in der Praxis gemacht werden? Durch Optimierungsverfahren. RBM wird als Satz von Gewichten (also konstante Anzahl von Schwimmern, die in einer bestimmten Art und Weise interagieren) definiert, so können Sie Optimierungsproblem

maximize_theta PRODUCT_x P(x | theta) 

über Ihre Trainingsproben x darstellen, wobei Theta Ihrer RBM Gewichte gesetzt . Es gibt viele Möglichkeiten, Optimierungsprobleme zu lösen, einige verwenden Gradienten-Ansätze, einige andere, spezialisiertere Techniken. Sie alle teilen das Ziel - das anfängliche Theta (das normalerweise zufällig ist) so zu verändern, dass es sich "ein bisschen mehr auf eine Weise verhält, wie Sie es wünschen". Gradientenbasierte Ansätze versuchen also, die zu ändernden Gewichte zu analysieren, um das Optimierungskriterium (hier - Wahrscheinlichkeit) etwas höher zu setzen. Es "löst" das Problem nicht - es kommt iterativ immer näher an die tatsächliche Lösung heran.

Verwandte Themen