Ich bin neu in Deep Learning und ich habe mit einigen Datenformat auf Keras. Mein CNN basiert auf der Stacked Hourglass Networks for Human Pose Estimation von A. Newell et al.Wie formatiert Training Eingabe-und Ausgabedaten auf Keras
In diesem Netzwerk ist der Eingang ein 256x256 RGB Bild und der Ausgang sollte eine 64x64 Heatmap sein, die Körpergelenke hervorhebt (Schulter, Knie, ...). Ich schaffe es, das Netzwerk aufzubauen, und ich habe alle Daten (Bilder) mit ihren Anmerkungen (Pixel-Etiketten für Körper Gelenke). Ich habe mich gefragt, wie ich die Eingabe- und Ausgabedaten des Trainingssatzes formatieren soll, um mein Modell zu trainieren. Zur Zeit verwende ich ein numpliges Array (256,256,3) für ein Bild und ich weiß nicht, wie ich meine Ausgabe formatiere. Soll ich eine Tabelle erstellen [n, 64,64,7]? (n ist die Größe des Trainingssatzes und 7 ist die Anzahl der Filter, die ich verwende, um eine Heatmap für 7 Gelenke zu erhalten)
Vielen Dank für Ihre Zeit.