ich Pandas Datenrahmen haben, enthält folgende Felder:Expanding Bildfeld in einem Pandas Datenrahmen
ID TYPE_01 TYPE_02 SPRITE
1 12 8 [Image]
2 11 9 [Image]
3 9 nan [Image]
4 3 12 [Image]
5 8 nan [Image]
TYPE_01 und TYPE_02 sind Einstufungen auf das Bild, dass ich Maschine Lernmethoden zu klassifizieren werde versuchen, (I benutze sklearn). SPRITE enthält 64x64 HSV-Bilder, die ich der Trainingsmethode zuführen werde.
Ich versuche, die Bilder in einer großen 2D-Matrix von Dimensionen (# Records, 64 * 64 * 3) für die Verwendung in einer PCA-Dekomposition zu glätten, aber ich habe einige Probleme. Ich habe es geschafft, For-Schleifen für jeden Datensatz zu verwenden, aber ich denke, das ist ein wenig ineffizient (ich habe ein neues Array zugewiesen und einen Datensatz zugewiesen, um das abgeflachte Bild aufzuzeichnen).
Gibt es einen besseren Weg, dies mit Pandas/Numpy zu tun? Wenn ich die Form des Datenrahmens mit df.values.shape
bekomme, bekomme ich eine (#Records,4)
, also half mir eine einfache Abflachung, Ravel oder Umformung über den ganzen Datenrahmen nicht.
Ich sah einige ähnliche Fragen Linie this one, aber sie nicht für diesen Fall gelten.
Sind die Sprites 3d numpy Arrays? – James
Ja. Sie sind (64 x 64 x 3) und haben die gleiche Dimension über alle Datensätze. – hemagso