0

Ich versuche, meinen eigenen Trainingsdatensatz für die Bilderkennung zu sammeln (Erkennung, noch). Im Moment habe ich 4 Klassen und 750 Bilder für jeden. Jedes Bild ist nur ein normales Bild der einzelnen Klassen. Einige Bilder sind jedoch unscharf oder enthalten äußere Objekte wie einen anderen Hintergrund oder andere Faktoren (aber keine unterscheidbaren Dinge). Mit diesem Trainingsdatensatz ist die Bilderkennung wirklich schlecht.TensorFlow: Ich sammle meinen eigenen Trainingsdatensatz. Mit diesem Trainingsdatensatz finde ich den Standort des Objekts.

Meine Frage ist, 1. Muss das Trainingsbildset das Objekt in verschiedenen Hintergrund/Einstellungen/Umgebung enthalten (ich glaube nicht ...)? 2. Lassen Sie uns einfach sagen, dass das Training ziemlich genau funktioniert hat und ich möchte den Standort des Objekts auf dem Bild wissen. Ich denke, es gibt keine Möglichkeit, den Ort zu finden, nur mit der Bilderkennung, also, wenn ich die Bounding Box, wie/wo im Code kann ich die Position der Bounding Box sehen?

Vielen Dank im Voraus!

Antwort

0

Es ist schwer vorher zu wissen, welche Funktionen Ihr Programm für jede Klasse lernen wird. Wenn Ihre ungesehenen Bilder jedoch im selben Hintergrund sind, spielt der Hintergrund keine Rolle. Ich würde Datenerweiterung im Training vorschlagen; zufällige Farbverzerrung, zufälliges Spiegeln, zufälliges Zuschneiden.

Sie können nicht in dem Code sehen, wo die Bounding Box ist. Sie müssen sie zuerst selbst in Ihren gesammelten Daten mit einem Werkzeug wie zB LabelMe beschriften/annotieren. Dann lernen Sie den Objektdetektor.

Verwandte Themen