Haben Sie einen df wie folgt aus:Pandas to_datetime() Funktion Performance-Probleme
Dat
10/01/2016
11/01/2014
12/02/2013
Die Spalte 'Dat' Objekttyp hat, damit ich versuchen, es zu Datetime wechseln to_datetime() verwendet Pandas Funktion, die Art und Weise:
to_datetime_rand = partial(pd.to_datetime, format='%m/%d/%Y')
df['DAT'] = df['DAT'].apply(to_datetime_rand)
Alles funktioniert gut, aber ich habe Leistungsprobleme, wenn mein df höher als 2 Milliarden Zeilen ist. In diesem Fall bleibt diese Methode hängen und funktioniert nicht gut.
Funktioniert die pandas to_datetime() - Funktion mit der Möglichkeit, die Konvertierung durch Chuncks oder iterativ durch Schleifen durchzuführen.
Danke.
Sind die Daten eindeutig? Wenn nicht, könnten Sie ein dict verwenden, um die neuen datetime-Werte und Strings zu speichern, so dass es nicht konvertiert werden muss, wenn es das Datum vorher gesehen hat, zusätzlich einen Grund, warum Sie nicht einfach 'df ['DAT'] = pd.to_datetime tun können (df ['DAT'], Format = '% m /% d /% Y') '? – EdChum
Definitiv nicht verwenden '.apply' –