2017-07-17 2 views
0

Ok, also habe ich einen TXT mit einem pd.groupby Dataframe geschrieben. Jetzt muss ich es öffnen.Lies Txt von Panda groupby zu mehreren Spalten

Was ich so weit gekommen ist:

f = open('C:/MDH.txt', 'r') 
reg = f.read() 
rege = np.asarray(reg) 

aber das gibt mir nur eine lange Schlange mit \ n, wo die Zeile in der ursprünglichen Anordnung beendet, aber ohne Begrenzung für die 422.472 Elemente. Als Beispiel ein Teil:

array('4.498000000000000000e+03 5.866666666666667140e+00 1.989999999999999858e+01 6.763333333333333997e+01 3.600000000000000000e+01 0.000000000000000000e+00 -7.165617522142724738e+00 2.800000000000000000e+01 4.000000000000000000e+00 3.000000000000000000e+00 0.000000000000000000e+00 0.000000000000000000e+00\n4.495000000000000000e+03 5.799999999999999822e+00 

Was ich brauche, ist dies von 35,206 Zeilen in ein Array von 12 Spalten zu erholen, für die 422.472 Elemente im txt.

Auch ich muss wissen, wie in Python von 1.989999999999999858e + 01 bis 19.89 konvertieren.

Ich brauche nicht den Index der ursprünglichen groupby, nur die Spalten nach Zeilen.

+0

Wie di Sie den Datenrahmen speichern? Als CSV? Hast du eine bestimmte Spalte gespeichert? Kannst du bitte ein [MCVE] zur Verfügung stellen? –

+0

Ich hatte einen Datenrahmen MDH. Ich habe groupby verwendet: > MDH = MDH.groupby (['mes', 'dia', 'hora']). Mean(). Dann habe ich den TXT erstellt mit:> np.savetxt ('MDH.txt', MDH) –

+0

Oh, okay. Dann wird 'np.loadtxt' es tun. –

Antwort

0

Sie können np.loadtxt verwenden, die Ihre Datei automatisch liest und ihren Inhalt analysiert.

Zunächst erstelle ich einige Dummy-Daten und speichern Sie es:

In [627]: x = np.random.randn(35206, 12) 

In [629]: np.savetxt('MDH.txt', x) 

Als nächstes ich es np.loadtxt mit laden kann:

In [630]: y = np.loadtxt('C:/MDH.txt') 

In [631]: y.shape 
Out[631]: (35206, 12) 

In [632]: y.dtype 
Out[632]: dtype('float64') 
+0

Gelöst, danke. –

+0

@ AdolfoDonoso Überlegen Sie, diese Antwort zu akzeptieren, wenn es Ihnen geholfen hat. Vielen Dank :) –