Ich habe mit dieser Online-Demo von einem In-Browser https://cs.stanford.edu/people/karpathy/convnetjs/demo/image_regression.html gespielt und ich habe versucht, das Bild mit Text (der mit "Was sagt der Fuchs sagen ..." Überschrift) um klarer (mit lesbarem Text), ohne Erfolg.Was ist der beste Weg, um ein neuronales Netzwerk zu überfrachten?
Dieses neuronale Netzwerk empfängt zwei Eingänge - X- und Y-Positionen eines Pixels und drei Ausgänge - RGB-Kanäle für das Pixel. Das Netzwerk wird durch ein ausgewähltes Bild trainiert und versucht dann, es "zu zeichnen".
Ich möchte dieses Netzwerk so trainieren, dass jedes Pixel so nah wie möglich an das Originalbild angepasst wird, d. H. Es zu überfrachten. Wie kann dies erreicht werden? Welche Kombination oder Parameter sollten verwendet werden? Vielleicht muss die Struktur der Netzwerke anders sein (mehr Schichten, mehr Neuronen in Schichten, verschiedene Arten von Schichten, etc.)?
Ich habe versucht, mit dem Lernrate zu spielen, ohne die Struktur vom Original zu verändern, sondern auch nach 400k Iterationen der meisten des Textes ist nicht zu unterscheiden:
Ist es nur eine Frage der Zeit und Vielleicht wird nach einigen Millionen Iterationen das gewünschte Ergebnis erreicht? Kann es irgendwie beschleunigt werden (ohne die Rechenleistung und andere offensichtliche Dinge zu erhöhen)?
Es scheint, dass es eine wirklich einfache Aufgabe sein sollte, den gleichen Wert für die gleichen Eingaben jedes Mal wiederzugeben - das Netzwerk wird exakt hunderttausende Male auf die gleichen Daten trainiert, also warum gibt es immer noch so viele zurück graue Pixel?
Ich bin neu in neuronalen Netzen, also vielleicht ist es eine dumme Frage und neuronale Netze können dafür überhaupt nicht verwendet werden.
Haben Sie eine semantische Segmentierung versucht? –
Nein. Können Sie mir bitte zeigen, wie es mit dieser spezifischen JS-Bibliothek gemacht werden kann? –
Ich weiß nicht, über diese JS-Bibliothek, aber ich habe semantische Segmentierung für Bilder in Caffe verwendet. –