4

Ich versuche, ein vereinheitlichtes Modell zu beenden, das das Objekt in einem Bild erkennt (lokalisiert). Das Objekt selbst kann von vielen Arten sein, wie "Text in der Wildnis", aber die umgebenden Merkmale des Objekts sollten bestimmen, wo sich die interessierende Region befindet.Wie funktioniert die Objekterkennung mithilfe der CNN-Funktionen im Tensorflow?

Wie ein menschliches Gesicht erkennen, ohne die Merkmale des Gesichts selbst zu berücksichtigen. d. h. es ist ein gewisser Wutabstand um den Hals.

Ich erwarte die Ausgabe als Koordinaten des Objekts, oder wie das Bild-Nettoformat, um Begrenzungsrahmen zu erzeugen: [xmin, ymin, xmax, ymax] Ich habe einen Datensatz von 500 Bildern. Gibt es Beispiele für Objekterkennung im Tensorflow basierend auf umgebenden Features? d. h. das Merkmal bildet von conv1 oder conv2 ab. ?

Antwort

4

Es ist Tensorflow basiertes Framework für die Objekterkennung/Lokalisierung, die Sie überprüfen können: https://github.com/Russell91/TensorBox

Obwohl, ich bin nicht sicher, dass 500 Bilder ausreichen würde, erfolgreich bereitgestellt Modell umschulen (n).

Verwandte Themen