Ich versuche, Ziffern (0-9) zu klassifizieren, mit LeNet.caffe.io.Transformer für LeNet-Klassifizierung verwenden
Ich lese Bilder der Dimension 28x28, transponiere sie und schicke einen Farbkanal ins Netz.
bild = mpimg.imread('pathToImg')
bild = np.transpose(bild,(2,0,1))
Und erhalten Sie Prognosen, die überhaupt keinen Sinn machen. Ich sehe, dass PyCaffe einen Transformator hat, der diese Arbeit erledigt, aber ich weiß nicht, wie ich es für LeNet verwenden würde.
ich verwende das Netz von caffe/examples/mnist (hoffentlich, dass die Antworten welche Art von Daten die Netto erwartet).
Das einzige, was anders ist, ist, dass der Eingang ist jetzt:
input_shape {
dim: 1
dim: 1
dim: 28
dim: 28
}
Welchen Input erwartet Ihr Netz? 'float32' im Bereich [0..255], Bereich [0..1]? Zieht Ihr Netz den Mittelwert des Bildes ab? warum konvertierst du nicht in grau? Wie wurden die Eingaben während des Trainings des Netzes verarbeitet? – Shai
Aktualisiert die Frage –