ich ein df wie dieses:Pandas df Manipulation: neue Spalte mit Werteliste, wenn andere Spalte Zeilen wiederholt
ID Cluster Product
1 4 'b'
1 4 'f'
1 4 'w'
2 7 'u'
2 7 'b'
3 5 'h'
3 5 'f'
3 5 'm'
3 5 'd'
4 7 's'
4 7 'b'
4 7 'g'
Wo Identifikation der primäre und eindeutige Schlüssel eines anderen df ist, dass die Quelle für diese df . Cluster ist kein Schlüssel, verschiedene IDs haben oft denselben Clusterwert; Jedenfalls ist es eine Information, die ich weiterführen muss.
Was will ich erreichen, ist dieser Datenrahmen:
ID Cluster Product_List_by_ID
1 4 ['b','f','w']
2 7 ['u','b']
3 5 ['h','f','m','d']
4 7 ['s','b','g']
Wenn dies nicht möglich ist, auch ein Wörterbuch wie dies könnte in Ordnung sein:
d = {ID:[1,2,3,4], Cluster:[4,7,5,7],
Product_List_by_ID:[['b','f','w'],['u','b'],['h','f','m','d'],['s','b','g']]}
ich viele Möglichkeiten erfolglos versucht habe .. es scheint, dass es nicht möglich ist, Listen als Pandas Datenrahmen Werte einzufügen. Wie auch immer ich denke, es sollte nicht so schwierig sein, das Ziel auf eine knifflige Art und Weise zu erreichen .. Tut mir leid, wenn ich verrückt werde, aber ich bin neu Codierung
Irgendwelche Vorschläge ?!
Dank
Was alle Operationen können wir nach groupby tun. Irgendeine gute Ressource dafür? – MYGz
['groupby' docs] (http://pandas.pydata.org/pandas-docs/stable/groupby.html) – piRSquared
@MohammadYusufGhazi thx ... kommentieren ist schwierig für mich :-) – piRSquared