Ich habe einen DataFrame, in dem eine Spalte drei Arten von Werten haben kann, Integer (12331), ganze Zahlen als Strings ('345') oder eine andere Zeichenfolge ('Text').Ignorieren nicht-numerischen String-Werte in Pandas Datenframe
Gibt es eine Möglichkeit, alle Zeilen mit der letzten Art von Zeichenfolge aus dem Datenframe zu löschen und die erste Art von Zeichenfolge in Ganzzahlen zu konvertieren? Oder zumindest eine Möglichkeit, die Zeilen, die Typfehler verursachen, zu ignorieren, wenn ich die Spalte summiere.
Dieser Datenrahmen stammt aus dem Lesen einer ziemlich großen CSV-Datei (25 GB), also hätte ich gerne eine Lösung, die beim Einlesen von Stücken funktioniert.
Da das NaN nach dem Lesen erstellt wird, würden diese Werte fallen, wenn ich na_values = 'NaN' setze und drop_na ausführe? – devil0150
@ devil0150 Yeah, '' dropna() 'zu tun, sobald du konvertiert hast, ist nicht zu schwierig, siehe meine Bearbeitung – Marius
Arbeitet nicht für '$ 1,00' Währung. :( – xtian