Bildvorverarbeitung für Bildklassifizierung und semantische Segmentierung

In Bezug auf das Training Deep-Learning-Modelle für verschiedene Arten von bildbezogenen Arbeiten, wie Bildklassifizierung, semantische Segmentierung, welche Art von Pre-Processing-Arbeiten durchgeführt werden müssen?Bildvorverarbeitung für Bildklassifizierung und semantische Segmentierung

Wenn ich zum Beispiel ein Netzwerk für die semantische Segmentierung trainieren möchte, muss ich den Bildwert (normalerweise als nd-Array dargestellt) auf den Bereich [0,1] skalieren oder ihn als [0,255] Bereich halten? Vielen Dank.

Quelle

2016-11-28 user288609

Normalerweise skalieren Leute das Bild. – malreddysid

Danke für die Kommentare. Meinst du das Skalieren des Bildes auf einen vordefinierten Bereich, z. B. [0,1]? Möchten Sie mehr ausarbeiten? – user288609

Ja. Skaliere es auf [0,1]. – malreddysid

Es gibt wenige Dinge, die getan werden, aber wirklich gibt es keine festgelegte oder fixe Vorverarbeitung, die immer gemacht wird.

Hier sind einige Beispiele:

das mittlere Bild subtrahieren,
Teile durch die Varianz (weniger häufig)
die Werte normalisieren
wenn mit „echten“ Bildern arbeiten (wie ein Bild von Menschen) dann horizontale Flips
zufällige Ernten
Übersetzungen

Quelle

2016-11-28 23:30:20 Steven

Hallo Steven, in Bezug auf die Normalisierung der Werte, ist das ähnlich, was wir in der Regel tun, normalisieren die Pixelwerte auf [0, 1]? – user288609

yeah von normalize ich meine genau das. Die Werte zwischen [0,1], während Subtrahieren Mittelwert und Division durch Varianz würde Sie in den Bereich [-1,1] – Steven

Bildvorverarbeitung für Bildklassifizierung und semantische Segmentierung

Antwort

Verwandte Themen