2017-05-17 2 views
0

Ich baue ein Convolutional Neural Network (CNN) Modell für die Gesichtserkennung.Grau oder RGB für die Gesichtserkennung mit Machine Learning?

Als erster Schritt des Trainings Datensammlung, was wäre das bevorzugte Bildformat für Training, Grau oder RGB?

Ich bin durch einige Artikel gegangen, die sagen, dass Graustufenbilder für die Gesichtserkennung am besten sind, aber die befriedigenden Informationen für warum so nicht erhalten haben?

Für diesen Ansatz, was sind die Vorteile & Nachteile der Verwendung von Grau über RGB?

Für das Gesichtserkennungsmodell ist es notwendig, Farbinformationen zu haben oder verliere ich die nützlichen Informationen aus dem Bild bei der Graukonvertierung?

Wie variiert die Vorhersagegenauigkeit?

                Thanks in Advance. 

Antwort

0

Anstatt Gesichtserkennung als ein spezifisches Problem bedenkt, können wir auch das allgemeine Gebiet der Bildanalyse notwendig ist, insbesondere bei der Verwendung von CNNs.

Im Allgemeinen vereinfachen wir Probleme beim maschinellen Lernen, um das Rauschen und die Menge der zu verarbeitenden Daten zu reduzieren.

Einfachheit - Viele Bildverarbeitungsoperationen arbeiten auf einer Ebene von Bild Daten (z. B. ein einzelner Farbkanal) zu einer Zeit. Also, wenn Sie ein RGBA Bild haben, müssen Sie möglicherweise den Vorgang auf jedem der vier Bild Ebenen anwenden und dann die Ergebnisse kombinieren. Graustufenbilder enthalten nur eine Bildebene (die die Graustufenintensitätswerte enthält).

Datenreduktion - Angenommen, Sie haben ein RGBA-Bild (Rot-Grün-Blau-Alpha). Wenn Sie dieses Bild in Graustufen umgewandelt haben, müssten Sie nur 1/4 der Daten im Vergleich zum Farbbild verarbeiten. Für viele Bildverarbeitungs- Anwendungen, insbesondere Videoverarbeitung (z. B. Echtzeitobjekt Tracking) ermöglicht diese Datenreduktion, dass der Algorithmus in einer angemessenen Zeit läuft.

Is conversion to gray scale a necessary step in Image preprocessing?