Gemäß der paper in Keras Dokumentation zur Verfügung gestellt werden, sollten Sie eine 224 x 224 RGB [0 - 225]
Bild bereitstellen. Die tatsächliche Reihenfolge der Dimensionen hängt vom Backend ab, das Sie in Ihrer Keras-Installation verwenden.
Die Datenvorbereitung wurde wie in AlexNet durchgeführt, so dass die mittlere Aktivierung von jedem Farbkanal abgezogen wurde. Der mittlere Vektor für RGB ist 103.939, 116.779, 123.68
.
Wenn Ihre Farbwerte -255, 255
reichen würde - es könnte Ihr Training wegen der Größe der Daten für das Netzwerk unbekannt schädigen. Aber dennoch - das Netzwerk könnte sich an diese Veränderungen anpassen, aber es macht normalerweise mehr Zeit und macht das Training chaotischer.
Im Fall von monochromatischen Bildern - eine häufig verwendete Technik besteht darin, den gleichen Kanal dreimal zu wiederholen, um Dimensionen für die Netzwerkarchitektur plausibel zu machen.
Danke, Marcin –