2016-07-21 3 views
2

Ich habe versucht, meine Datenmenge mit read.csv in Python-Notebook zu importieren. Beim Importieren meiner Datenmenge sehe ich jedoch, dass der Datentyp jeder Spalte als Objekt verwendet wird. Probleme in Datentyp während Csv-Datei als Panda-Datenframe

Gibt es eine Möglichkeit, dass ich die Datentypen der Spalten wie die der CSV-Datei beibehalten kann?

Ich versuchte mit mehreren anderen Möglichkeiten, aber es hat nicht funktioniert. Es würde helfen, wenn uns jemand auf eine richtige Funktion hinweist. Wenn es eine Möglichkeit gibt, den Datentyp jeder Spalte während des Imports zu steuern, wäre das großartig.

+0

Können Sie den Code teilen, mit dem Sie die CSV-Dateien gelesen haben? – pyne

Antwort

1

Dies tritt auf, wenn Sie inkonsistente Datentypen haben, z. Ganzzahlen und Zeichen wie Leerzeichen. Es ist schwer zu sagen, ohne eine Probe Ihrer tatsächlichen Daten anzusehen, aber ich vermute, dass dies das Problem ist. Zum Beispiel

>>> pd.DataFrame([1, 2, '']).info() 
<class 'pandas.core.frame.DataFrame'> 
Int64Index: 3 entries, 0 to 2 
Data columns (total 1 columns): 
0 3 non-null object 
dtypes: object(1) 
memory usage: 48.0+ bytes 

Um dieses Problem zu umgehen, müssen Sie diese Werte wie „“ mit einem empfindungsfähigen Wert wie -1 (der tatsächliche Wert auf Ihrem Anwendungsfall abhängen würde) ersetzen.

+0

Danke Alexander. Es war der Fall, wie du es erwähnt hast. Es gab eine ganze Reihe von Kopfzeilen in den Daten, die davon betroffen waren. –

Verwandte Themen