2017-01-24 3 views
1

Ich versuche, Keras Implementierung von Resnet für eine Übertragung Leananing Aufgabe mit einem ganz anderen Satz von Bildern zu verwenden (B & W 16 Bit). Was erwartet Keras als Input? Bild mit 3 Kanälen und -127-128 Bereich (das ist, was ich Null-zentriertes 8-Bit-Bild nehme)? 0-255? Was würde passieren, wenn ich etwas außerhalb dieses Bereichs verlasse?Was Keras Resnet als Eingabe erwartet?

Danke.

Antwort

2

Gemäß der paper in Keras Dokumentation zur Verfügung gestellt werden, sollten Sie eine 224 x 224 RGB [0 - 225] Bild bereitstellen. Die tatsächliche Reihenfolge der Dimensionen hängt vom Backend ab, das Sie in Ihrer Keras-Installation verwenden.

Die Datenvorbereitung wurde wie in AlexNet durchgeführt, so dass die mittlere Aktivierung von jedem Farbkanal abgezogen wurde. Der mittlere Vektor für RGB ist 103.939, 116.779, 123.68.

Wenn Ihre Farbwerte -255, 255 reichen würde - es könnte Ihr Training wegen der Größe der Daten für das Netzwerk unbekannt schädigen. Aber dennoch - das Netzwerk könnte sich an diese Veränderungen anpassen, aber es macht normalerweise mehr Zeit und macht das Training chaotischer.

Im Fall von monochromatischen Bildern - eine häufig verwendete Technik besteht darin, den gleichen Kanal dreimal zu wiederholen, um Dimensionen für die Netzwerkarchitektur plausibel zu machen.

+0

Danke, Marcin –

Verwandte Themen