Ich verstehe, dass einer der Gründe, warum Pandas relativ langsam importieren csv-Dateien ist, dass es den gesamten Inhalt einer Spalte vor dem Erraten des Typs (siehe die Diskussionen um die meist fragen müssen) veraltet low_memory
Option für pandas.read_csv
). Ist mein Verständnis richtig?So beschleunigen Sie den Import von Datenrahmen in Pandas
Wenn es ist, was wäre ein gutes Format, in dem ein Datenrahmen zu speichern, und die explizit Datentypen angibt, so Pandas muss nicht raten (SQL ist keine Option für jetzt)?
Jede Option insbesondere von those listed here?
Meine Datenrahmen haben Gleitkommazahlen, Ganzzahlen, Datumsangaben, Zeichenfolgen und Y/N, so dass Formate, die nur numerische Werte unterstützen, nicht ausreichen.
Danke!
auch für nicht-numerische Spalten (Strings, Daten, Y/N)? –
Ich habe nur mit numerischen Daten gearbeitet (float64), also kann ich nicht sicher sein, aber ich erwarte trotzdem, dass es den direkten Import in Pandas übertrifft. – Shayn