2016-11-28 9 views
0

In Bezug auf das Training Deep-Learning-Modelle für verschiedene Arten von bildbezogenen Arbeiten, wie Bildklassifizierung, semantische Segmentierung, welche Art von Pre-Processing-Arbeiten durchgeführt werden müssen?Bildvorverarbeitung für Bildklassifizierung und semantische Segmentierung

Wenn ich zum Beispiel ein Netzwerk für die semantische Segmentierung trainieren möchte, muss ich den Bildwert (normalerweise als nd-Array dargestellt) auf den Bereich [0,1] skalieren oder ihn als [0,255] Bereich halten? Vielen Dank.

+0

Normalerweise skalieren Leute das Bild. – malreddysid

+0

Danke für die Kommentare. Meinst du das Skalieren des Bildes auf einen vordefinierten Bereich, z. B. [0,1]? Möchten Sie mehr ausarbeiten? – user288609

+0

Ja. Skaliere es auf [0,1]. – malreddysid

Antwort

0

Es gibt wenige Dinge, die getan werden, aber wirklich gibt es keine festgelegte oder fixe Vorverarbeitung, die immer gemacht wird.

Hier sind einige Beispiele:

  • das mittlere Bild subtrahieren,
  • Teile durch die Varianz (weniger häufig)
  • die Werte normalisieren
  • wenn mit „echten“ Bildern arbeiten (wie ein Bild von Menschen) dann horizontale Flips
  • zufällige Ernten
  • Übersetzungen
+0

Hallo Steven, in Bezug auf die Normalisierung der Werte, ist das ähnlich, was wir in der Regel tun, normalisieren die Pixelwerte auf [0, 1]? – user288609

+0

yeah von normalize ich meine genau das. Die Werte zwischen [0,1], während Subtrahieren Mittelwert und Division durch Varianz würde Sie in den Bereich [-1,1] – Steven