Ich habe Daten, die ich als Datenframe aus einer CSV mit Pandas (in Python) einlesen. Die CSV sieht im Grunde wie folgt aus:Pivot Gruppen von Zeilendaten in Spalten mit Pandas
image img1.jpg
date Thursday, May 5
link bit.ly/asdf
subject 'Unique subject line 1'
image img2.jpg
date Tuesday, May 17
link bit.ly/zxcv
subject 'Unique subject line 2'
image img3.jpg
date Monday, May 9
link bit.ly/sdfg
subject 'Unique subject line 3'
Ich mag es in einen Datenrahmen erhalten, wobei jede eindeutige Gruppierung in einer einzigen Reihe ist, mit den Attributen, die derzeit als Zeilendaten in Spalte 1 als Spalte aufgeführt sind Namen. So etwas wie folgen aus:
image date link subject
img1.jpg Thursday, May 5 bit.ly/asdf 'Unique subject line 1'
img2.jpg Tuesday, May 17 bit.ly/zxcv 'Unique subject line 2'
img3.jpg Monday, May 9 bit.ly/sdfg 'Unique subject line 3'
Ich habe versucht pandas.pivot_table
mit und auch nur einen leeren Datenrahmen mit den Säulen zu schaffen ich will, aber mit beiden Methoden, ich bin entweder mit Indizierung oder Aggregieren Probleme habe. Ich denke, das liegt daran, dass ich nicht nach einem Attribut gruppiere, und ich versuche nicht, irgendwelche numerischen Daten zu aggregieren.
Es scheint, als sollte es einfach genug sein, um die Daten auf diese Weise umzuformen, aber ich bin mir nicht sicher, wie ich die gewünschten Gruppierungen definieren soll. Gibt es eine Möglichkeit, dies mit pivot_table
zu tun, oder wäre es am besten, es auf eine andere Weise zu tun?
ausgezeichnet, danke! Für alle anderen mit ähnlich strukturierten Daten musste ich df.pivot verwenden (Spalten = 0, Werte = 1, Index = 'Bildgruppe') ODER Namen zu den Spalten hinzufügen, die zum Pivot für die Argumente columns und values übergeben wurden. – nicolekanderson