Ich versuche MXNet/Gluon zu verwenden, um ein Objekterkennungsmodell (speziell mehrere Instanzen eines Objekttyps in einem Bild) zu trainieren, und das im2rec-Tool scheint keine Begrenzungsrahmeninformationen zur .rec-Datei hinzuzufügen.Kann man Rahmenboxen und Labels mit Bildern in RecordIO packen?
mxnet.recordio.pack_img()
scheint die Arbeit des Packens des Bildes und des Etiketts zusammen zu tun, aber ich kann nicht finden, wo/wie man Bounding-Box-Informationen im Pixelraum einbezieht. Aus der Dokumentation:
label = 4 # label can also be a 1-D array, for example: label = [1,2,3]
id = 2574
header = mx.recordio.IRHeader(0, label, id, 0)
img = cv2.imread('test.jpg')
packed_s = mx.recordio.pack_img(header, img)
Der Header hat keinen Platz für Box info begrenzen. Irgendeine Idee, wie man das macht?