Ich bin neu in Pandas und das ist meine erste Frage zu Stackoverflow, ich versuche, einige Analysen mit Pandas zu tun.Erstellen Sie einen Pandas DataFrame aus mehreren Dicts
Ich habe einige Textdateien mit Datensätzen, die ich verarbeiten möchte. Jede Zeile der Datei stimmt mit einem Datensatz überein, wobei die Felder an einem festen Ort sind und eine Länge einer festen Anzahl von Zeichen aufweisen. Es gibt verschiedene Arten von Datensätzen in derselben Datei. Alle Datensätze teilen sich das erste Feld, das je nach Datensatztyp zwei Zeichen umfasst. Als Beispiel:
Some file:
01Jhon Smith 555-1234
03Cow Bos primigenius taurus 00401
01Jannette Jhonson 00100000000
...
field start length
type 1 2 *common to all records, example: 01 = person, 03 = animal
name 3 10
surname 13 10
phone 23 8
credit 31 11
fill of spaces
Ich schreibe einige Code einen Datensatz in ein Wörterbuch zu konvertieren:
person1 = {'type': 01, 'name': = 'Jhon', 'surname': = 'Smith', 'phone': '555-1234'}
person2 = {'type': 01, 'name': 'Jannette', 'surname': 'Jhonson', 'credit': 1000000.00}
animal1 = {'type': 03, 'cname': 'cow', 'sciname': 'Bos....', 'legs': 4, 'tails': 1 }
Wenn ein Feld im Wörterbuch leer (gefüllt mit Leerzeichen) ist da sein nicht) .
Mit allen Datensätzen einer Art möchte ich ein Pandas DataFrame mit den Dicts Keys als Spaltennamen erstellen, ich habe es mit Pandas.DataFrame.from_dict() ohne Erfolg versucht.
Und hier kommt meine Frage: Gibt es eine Möglichkeit, dies mit Pandas zu tun, so dass dict Schlüssel Spaltennamen werden? Gibt es eine andere Standardmethode, um mit dieser Art von Dateien umzugehen?
Danke, die _list of_ dicts ist der Schlüssel. Die Dateien sind Hunderte von Mbs gzip komprimiert und mehrere Gbs nicht komprimiert, also wird Zeile für Zeile gelesen und an den entsprechenden DataFrame angehängt. – tinproject