Ich habe einen Datensatz von 10 JPEG qualitativ hochwertige Luftbilder mit TXT-Dateien mit Informationen über die Begrenzungsbox jedes Fahrzeugs (Breite, Höhe, Winkel, x & y-Achse, ...). Dies ist ein Beispiel:Wie erstellt man einen Trainingsdatensatz für die Bildverarbeitung
@CATEGORY:GENERAL
@IMAGE:2012-04-26-Muenchen-Tunnel_4K0G0010.JPG
#format: id type center.x center.y size.width size.height angle
0 30 1319 2338 35 11 56.451578
1 30 1337 2350 42 14 57.817368
2 30 224 3556 61 20 136.967797
Wie soll ich eine Datenbank von Fahrzeugen schaffen in einem neuronalen Netzwerk zu trainieren, mit Caffe? Sollte ich photoshop verwenden, um jedes Fahrzeug zu beschneiden und sie eins nach dem anderen zu speichern? oder kann die txt-Dateien verwenden, um verschiedene Klassen von Fahrzeugen zu erstellen im Netzwerk mit etw wie Matlab trainieren?
Wenn Sie nur 10 Bilder haben, werden Sie schneller sein, indem Sie dieses Handbuch in Photoshop, aber wenn Sie möchten, können Sie eine Bildbibliothek verwenden, um diese Dateien zu erhalten – Maaaaa
danke für die Antwort. Es gibt 10 Bilder, aber mit vielen Fahrzeugen. Ich spreche tausende .. Muss ich jedes Fahrzeug durch seine genauen Grenzen trennen oder nur eine Bounding-Box um es wäre genug? –