Angenommen, ich habe eine verschachtelte Wörterbuch 'user_dict' mit Struktur:Baukonstruktion Pandas Datenrahmen von Artikel im verschachtelten Wörterbuch
Stufe 1: UserId (Long Integer)
Stufe 2: Kategorie (String)
Stufe 3: Verschiedene Attribute (Schwimmer, ints, etc ..)
Zum Beispiel, ein Eintrag des Wörterbuchs wäre:
user_dict[12] = {
"Category 1": {"att_1": 1,
"att_2": "whatever"},
"Category 2": {"att_1": 23,
"att_2": "another"}}
jedes Element in „user_dict“ hat die gleiche Struktur und „user_dict“ enthält eine große Anzahl von Gegenständen, die ich zu einem Pandas Datenrahmen füttern wollen, den Aufbau der Serie von der Attribute. In diesem Fall wäre ein hierarchischer Index für diesen Zweck nützlich.
Speziell meine Frage ist, ob es eine Möglichkeit gibt, dem DataFrame-Konstruktor zu verstehen, dass die Serie aus den Werten der "Ebene 3" im Wörterbuch erstellt werden sollte?
Wenn ich versuche, so etwas wie:
df = pandas.DataFrame(users_summary)
Gegenstände in „Ebene 1“ (die Benutzer-ID) als Spalt genommen, das ist das Gegenteil von dem, was ich erreichen will (User-ID als Index).
Ich weiß, ich könnte die Serie nach dem Iterieren über die Wörterbucheinträge erstellen, aber wenn es einen direkteren Weg gibt, wäre dies sehr nützlich. Eine ähnliche Frage wäre die Frage, ob es möglich ist, einen Pandas DataFrame aus json-Objekten zu erstellen, die in einer Datei aufgelistet sind.
Gibt es eine vernünftige Möglichkeit, dies zu verallgemeinern, um mit willkürlichen Tiefen-Listen zu arbeiten? z.B. listet in einer beliebigen Tiefe auf, in der einige Zweige kürzer als andere sein können, und eine None oder Nan wird verwendet, wenn kürzere Zweige nicht das Ende erreichen? – naught101
Haben Sie Pandas JSON Unterstützung (io Tools) und Normalisierung angeschaut? http://pandas.pydata.org/pandas-docs/dev/io.html#normalization –
Rette mein Leben !!!!!!!!!! Lerne viel !! Danke – Wen