Ich löse ein Erkennungsproblem mit ConvNet. In meinem Fall sind die Etiketten jedoch eine Matrix der Dimension [3 x 5]
für jedes Bild. Ich benutze Caffe für diese Arbeit. Ich lese die Bilder mit der Datalayer
, während ich die Etiketten mit HDF5Layer
lesen.Caffe Multi-Label Matrix Eingang
Der HDF5Layer liest die [3x5]
Etikettenmatrix als [1x15]
Dimensionsvektor. Also habe ich Reshape Layer
mit dem Vektor in Matrix vor der Berechnung der L2-Verlust umformen. Ich erkannte jedoch, dass die Umformschicht die Daten in H x W
formatiert, während meine Etikettenmatrix [W x H]
ist, d. H. [W = 3, h = 5] , daher ist die Umformung inkorrekt. Ich frage mich, ist es eine Möglichkeit, die [1x15]
Etikett Vektor in der richtigen Reihenfolge, dh [3x5]
und nicht[5x3]
Eine andere Möglichkeit, ich kann ich um gedacht neu zu gestalten Arbeit wird durch die Ausgabeform Faltungsschicht in [1 x 15] abflachen und Berechne dann den Verlust mit meinem [1 x 15] -Label.
Ich zeige das Problem mit Figuren zum besseren Verständnis wegen meines schlechten Englisch.
Eample meiner Eingangsmatrix Etikett (Anmerkung werden die Bilder nur zur Veranschaulichung vergrößert)
Ergebnis Caffe Reshape Schicht
Jeder Vorschlag, wenn ich es richtig mache?
Dank @Prune tatsächlich Ich habe bemerkt, was Sie beim Debuggen erwähnt. –