ich den folgenden Code mithilfe einer CSV-Datei in Blöcken lesen Pandas mit read_csv
Pandas: Griff Spalte fehlt
headers = ["1","2","3","4","5"]
fields = ["1", "5"]
for chunk in pandas.read_csv(fileName, names=headers, header=0, usecols=fields, chunksize=chunkSize):
Manchmal wird meine CSV nicht Spalte „5“ haben und ich möchte in der Lage sein Behandle diesen Fall und gib einige Standardwerte an. Gibt es eine Möglichkeit, nur die Header meiner CSV-Datei zu lesen, ohne die gesamte Datei zu lesen, damit ich das manuell behandeln kann? Oder kann eine andere clevere Möglichkeit sein, den Wert für die fehlende Spalte zu übernehmen?
Möglicherweise Set 'error_bad_lines = false'. –
@ cᴏʟᴅsᴘᴇᴇᴅ die Sache ist, ich brauche den Wert für die Spalte "5" für jede Zeile, aber manchmal wird die ganze Spalte "5" fehlen, so dass ich auf Standardwerte zurückgreifen muss. error_bad_lines = False ignoriert nur die Zeile, nein? –
Ja, du hast Recht. Ich bin mir nicht sicher. Ich habe immer geglaubt, Pandas würden NaNs standardmäßig füllen. –