2017-09-29 1 views
0

Ich bin neu in Python und habe gelernt, Daten durch Pandas zu manipulieren. Im Moment habe ich Daten aus einer JSON-Datei eingelesen und eine der Spalten sieht so aus.Pandas: Pivot DataFrame

Ich habe versucht, Pandas, JSON & ijson Module zu verwenden, um es zu öffnen - aber ich kann es nicht funktionieren lassen. Hat jemand irgendwelche Vorschläge, wie man dies in einen Datenrahmen mit 'ID' und 'variantColor' als Spaltenüberschriften konvertieren kann?

0 
0 {'ID': '615454762062', 'variantColor': 'JJ0BVE... 
1 {'ID': '615454762222', 'variantColor': 'JJ0BVE... 
2 {'ID': '615454762307', 'variantColor': 'JJ0BVE... 
3 {'ID': '615454772788', 'variantColor': 'JJ0FHA... 
4 {'ID': '615454773525', 'variantColor': 'JJ1ANC... 
5 {'ID': '615454762109', 'variantColor': 'JJ0BVE... 
6 {'ID': '615454762185', 'variantColor': 'JJ0BVE... 
7 {'ID': '615454772863', 'variantColor': 'JJ0FHA... 
8 {'ID': '615454773402', 'variantColor': 'JJ1ANC... 
9 {'ID': '615454773600', 'variantColor': 'JJ1ANC... 
10 {'ID': '615454762024', 'variantColor': 'JJ0BVE... 
11 {'ID': '615454762260', 'variantColor': 'JJ0BVE... 
12 {'ID': '615454772665', 'variantColor': 'JJ0FHA... 
13 {'ID': '615454773327', 'variantColor': 'JJ1ANC... 
14 {'ID': '615454773440', 'variantColor': 'JJ1ANC... 
15 {'ID': '615454762147', 'variantColor': 'JJ0BVE... 
16 {'ID': '615454772740', 'variantColor': 'JJ0FHA... 
17 {'ID': '615454772825', 'variantColor': 'JJ0FHA... 
18 {'ID': '615454772900', 'variantColor': 'JJ0FHA... 
19 {'ID': '615454772948', 'variantColor': 'JJ0FHA... 
20 {'ID': '615454773280', 'variantColor': 'JJ1ANC... 
21 {'ID': '615454773365', 'variantColor': 'JJ1ANC... 
22 {'ID': '615454762345', 'variantColor': 'JJ0BVE... 
23 {'ID': '615454772627', 'variantColor': 'JJ0FHA... 
24 {'ID': '615454772702', 'variantColor': 'JJ0FHA... 
25 {'ID': '615454773488', 'variantColor': 'JJ1ANC... 
26 {'ID': '615454773563', 'variantColor': 'JJ1ANC...` 
+0

Ihre erwartete Ausgabe sind? Und können Sie sagen, das Ergebnis von 'type (df [0] [0])' – Dark

+0

'type (df [0] [0])' gibt ein "dict" -Ergebnis. – Abhay

Antwort

0

Verwenden Sie einfach pd.Series anwenden, indem Sie die Spalte auswählen, wenn sie in dict Format d.h

ndf = df[0].apply(pd.Series) 
+1

Alter, du bist großartig! Das hat funktioniert :) Kannst du erklären, was falsch war, so dass ich weiß, was ich tun muss, wenn ich das nächste Mal auf dieses Problem stoße – Abhay

+0

@Abhay Es könnte sein, weil es eine verschachtelte JSON-Datei war. Also müssen Sie pd.Series auf eine weitere Ebene anwenden. – Dark