Ich lese eine große CSV-Datei in Python mit der Methode read_csv von Pandas. Ich habe eine Spalte mit Datum und Uhrzeit (beide in derselben Spalte) des Formats: YYYY-MM-DD HH:MM:SS
. Ich bin die 0. Spalte der Daten. Derzeit, was ich tue, ist:Lesen von CSV-Datei Python 3.6 mit Pandas
format = "%Y-%m-%d %H:%M:%S"
parser = lambda x: pd.datetime.strptime(x, format)
data = pd.read_csv("path/to/file", sep=',', encoding='ISO-8859-1', parse_dates=[0], date_parser=parser)
Aber es sagt mir dtype Option beim Import angeben zu verwenden. Ich habe versucht, ein Argument zum Anruf hinzuzufügen: dtype = {[0]:pandas.datetime}
, aber es hat nicht funktioniert. Haben Sie eine bessere Abhilfe? Oder kann jemand erklären, wie man das Argument dtype richtig verwendet? Ich habe versucht, die Dokumentation zu lesen, half aber nicht viel.
Können Sie die tatsächlichen Fehler posten, die Sie bekommen? –
Versuchen Sie ohne den 'date_parser' arg. Pandas hat einen guten Standard dafür. – josh