ich CSV-Dateien, die ich in Pandas lesen mit:Lesen Sie alle aber letzte Zeile der CSV-Datei in Pandas
#!/usr/bin/env python
import pandas as pd
import sys
filename = sys.argv[1]
df = pd.read_csv(filename)
Leider ist die letzte Zeile dieser Dateien oft korrupt ist (hat die falsche Anzahl von Kommas). Zur Zeit öffne ich jede Datei in einem Texteditor und entferne die letzte Zeile.
Ist es möglich, die letzte Zeile im selben Python/Pandas-Skript zu entfernen, das die CSV lädt, um zu sparen, dass Sie diesen zusätzlichen, nicht automatisierten Schritt ausführen müssen?
Sie löschten eine Frage über das Extrahieren von Zahlen, trotzdem würde ich vorschlagen, 'str.extract' zu verwenden:' für col in df.spalten [2:]: df [col] = df [col] .str.extract (r '(\ d +)'). astyp (int) ' – EdChum
@EdChum Danke! – eleanora
@EdChum Überschreitet Ihr Code die Dezimalstellen? – eleanora