Suchen, um die Daten in einer CSV-Datei mit Python und Pandas zu überprüfen. Alles funktioniert gut, wenn saubere Daten eingegeben werden. Wenn es jedoch ein Problem mit den Daten gibt, sind die Probleme schwer zu finden. Jede Art von Fehler zu erheben wäre großartig. Hier einig Pseudo-Code:Wie validiere ich csv Daten gelesen von pandas.read_csv?
dtypes = {'Date': 'str', 'yesno': 'str', 'int_val': 'int', 'decimal_value': 'str'}
df = pd.read_csv(filename, dtype=dtypes)
# Ensure exceptions are thrown for invalid data.
# valid date format in date. ValueError raised for invalid data.
pd.to_datetime(df['Date'])
# 'yes' or 'no' for the yesno field. (has to be in a list of values)
# valid integer for int_val.
# a valid integer or decimal number for decimal_value
Ich bin nicht einmal sicher, dass der pd.to_datetime der beste Weg ist, ein Datum zu bestätigen. Was ist ein guter Weg, dies zu tun?
Was möchten Sie tun, wenn Sie ungültige Daten finden? –
Fehler beheben ist in Ordnung. Die Anweisung pd.to_datetime (df ['Date']) löst einen ValueError aus, wenn irgendwo ein ungültiges Datumsformat vorhanden ist. –
Dann haben Sie Ihre Antwort. –