Ziel ist es, Objekte aus Bildern zu lokalisieren. Ich entschied mich, ein bestehendes Modell zu modifizieren und zu trainieren. Ich kann jedoch nicht entscheiden, ob ich das Modell mit Masken oder nur mit ROIs trainieren soll.Auswählen von Zugbildern für das konvolutionelle neuronale Netzwerk
Zum Beispiel: Für Daten der Klasse 1 wird nur das Objekt der Klasse 1 auf dem Bild angezeigt, alle anderen Regionen werden mit Nullen gefüllt und für die 2. Klasse mache ich dasselbe und verlasse nur 2. Objekt der Klasse in der Maske usw. für die 3. und 4. Klasse.
Die zweite Möglichkeit, die ROIs zu verwenden: Ich werde jede Klasse aus dem Bild ohne Maske zuschneiden, nur die Region auf Interesse.
Dann Ich hoffe, das ähnliche Sache weiterhin tun: https://github.com/jazzsaxmafia/Weakly_detector
Soll ich die den ersten Weg oder zweite wählen? Alle Kommentare wie "Ihr Plan wird nicht funktionieren, versuchen Sie es" wird ebenfalls geschätzt.
--Edit-- klar,
Originalbild sein: http://s31.postimg.org/btyn660bf/image.jpg
1'st Ansatz unter Verwendung von Masken:
- 1'st Klasse: http://s31.postimg.org/4s0pjywpn/class11.png
- 2. Klasse: http://s31.postimg.org/3zy1krsij/class21.png
- 3'rd Klasse: http://s31.postimg.org/itcp5j09n/class31.png
- 4'rd Klasse: http://s31.postimg.org/yowxv31gb/class41.png
1'st Ansatz ROIs:
- 1'st Klasse: http://s31.postimg.org/4x4gtn40r/class1.png
- 2'nd Klasse: http://s31.postimg.org/8s7uw7n6j/class2.png
- 3. Klasse: http://s31.postimg.org/mxdny0w7v/class3.png
- 4'rd Klasse: http://s31.postimg.org/qfpnuex3v/class4.png
P. S: Die Standorte der Objekte für die neuen Beispiele in sehr ähnlich sein, so vielleicht die Maske Ansatz kann ein bisschen mehr nützlich sein. Für den ROI-Ansatz muss ich jedes Objekt mit sehr unterschiedlichen Größen normalisieren. Die Normalisierung der gesamten Bildmaske kann jedoch die Varianz zwischen der ursprünglichen Bildmaske viel weniger verringern.