2016-08-30 8 views
0

Ich habe 1000 Dateien, in denen die Daten in Kommatrennung gespeichert ist. Die Beschreibung einer Datei ist unten angegeben:lesen CSV-Datei von Panda und Plotten

Die Werte durch Komma getrennt sind, sollten -9999 Werte ignoriert und wenn sie gelesen werden kann, werden alle Werte von Zeile und Spalte sollte in Zahlen gespeichert werden, da es beim Plotten verwendet werden. Die Form der Datei ist [104 Zeilen x 15 Spalten].

Die wenigen Zeilen der Dateien sind wie folgt:

0, 9.8597e+00, 129.944, 1.071, 6.7433e-06, 1.0911e-05,  -9999,  -9999, 3.7134e-07, 3.5245e-05,  -9999,  -9999, 26.295, -86.822, -123.017 



0, 8.7012e+00, 130.908, 0.966, 1.9842e-06, 1.0799e-05,  -9999,  -9999, 3.5888e-07, 7.8133e-05,  -9999,  -9999, 27.140, -86.818, -122.322 

Nachdem in numerische Werte zu lesen, ich brauche es auch in subplot plotten. Wie COl1 vs Col2, Col3 vs col5 und so weiter ....

Irgendeine Idee, wie man es erreicht?

import numpy as np 
import pandas as pd 
import matplotlib.pyplot as plt 

df1=pd.read_csv("small_file_106.txt",header=1) 
print(df1) 

Antwort

1

ich nie Handlung verwendet, aber folgende würde für die erste Frage Eingabe der Werteliste na_values ​​und diejenigen, werden berücksichtigt, wie NA von Pandas

pd.read_csv(File, sep=',',na_values=['-9999'],keep_default_na=False) 

Auch pd.to_numeric ist verfügbar nützlich sein konvertieren Daten in numerische

df.apply(lambda x: pd.to_numeric(x, errors='ignore')) 
0

Nachdem Sie die Daten in gelesen haben (Shijo Methode sieht gut aus) der Seaborn library's pairplot sh würde das gewünschte Diagramm erstellen.

+0

Danke Dies funktioniert die meiste Zeit jetzt! – MPJ

Verwandte Themen