Ich habe Pandas df mit Spalte, T max
& T min
. Ich möchte in der nächsten Spalte T mean
berechnen. Ich habe mit dieser df['T mean']= df[['T max','T min']].mean(axis=1)
aber nicht funktioniert. Ich habe T max
als T mean
. Könnte mir jemand helfen?Wie berechnet man Reihen-Durchschnitt in Panda-Datenrahmen?
-2
A
Antwort
1
Ich denke, es gibt ein Problem mit Spalte T min
- type
von Werten ist string
, nicht numerisch. So müssen Sie es von astype
Stimmen:
Probe:
df=pd.DataFrame({'T max':[1,2,3],'T min':['5','6','7']})
print (df)
T max T min
0 1 5
1 2 6
2 3 7
print (type(df.ix[0,'T min']))
<class 'str'>
df['T mean']= df[['T max','T min']].mean(axis=1)
print (df)
T max T min T mean
0 1 5 1.0
1 2 6 2.0
2 3 7 3.0
#cast column to int
df['T min'] = df['T min'].astype(int)
print (type(df.ix[0,'T min']))
<class 'numpy.int32'>
df['T mean new']= df[['T max','T min']].mean(axis=1)
print (df)
T max T min T mean T mean new
0 1 5 1.0 3.0
1 2 6 2.0 4.0
2 3 7 3.0 5.0
Wenn astype
Return-Fehler:
ValueError: invalid literal for int() with base 10: 'aaa'
es in Spalte bedeutet T min
mindestens ein ungültiger Wert.
Probe:
df=pd.DataFrame({'T max':[1,2,3],'T min':['5','6','aaa']})
print (df)
T max T min
0 1 5
1 2 6
2 3 aaa
df['T mean']= df[['T max','T min']].mean(axis=1)
print (df)
T max T min T mean
0 1 5 1.0
1 2 6 2.0
2 3 aaa 3.0
#check invalid rows where is bad value in T min
print (df[ pd.to_numeric(df['T min'], errors='coerce').isnull()])
T max T min T mean
2 3 aaa 3.0
#replace invlid value to NaN
df['T min'] = pd.to_numeric(df['T min'], errors='coerce')
df['T mean new']= df[['T max','T min']].mean(axis=1)
print (df)
T max T min T mean T mean new
0 1 5.0 1.0 3.0
1 2 6.0 2.0 4.0
2 3 NaN 3.0 3.0
+0
Ich warf Spalte zu int und es hat funktioniert. Vielen Dank ! –
Verwandte Themen
- 1. Wie berechnet man "Ansichten"?
- 2. Wie berechnet man Partituren?
- 3. Wie berechnet man Laufzeit
- 4. Wie berechnet man den Ausdruck
- 5. wie man deskriptive Statistiken berechnet
- 6. Wie berechnet man den Netzwerkdurchmesser
- 7. Wie berechnet man mit String?
- 8. Wie berechnet man die Zeit?
- 9. speichern pandaDatenRahmen aber NA Erhaltung der Werte
- 10. Wie berechnet man den Durchschnitt?
- 11. Pyephem: Wie berechnet man Transite?
- 12. Wie berechnet man freien Speicherplatz?
- 13. Wie berechnet man die Schriftbreite?
- 14. Wie berechnet man Rekursionsbeziehungen in Mathematica effizient?
- 15. Wie berechnet man CVaR in SAS?
- 16. Wie berechnet man Durchschnitt in Python gleichzeitig?
- 17. JavaFX Wie berechnet man Zeilen in TableView
- 18. Wie man gl_FragCoord in glsl berechnet
- 19. Wie berechnet man Comedian (c) in Matlab?
- 20. Wie berechnet man in Laravel 5.1
- 21. Wie berechnet man etwas in C++?
- 22. Wie berechnet man diese Tensorkontraktion in numpiger?
- 23. Wie berechnet man Mauskoordinaten in Prozent Javascript?
- 24. Wie berechnet man die Häufigkeitsverteilung in R?
- 25. Wie berechnet man den Datumsunterschied in pyspark?
- 26. Wie berechnet man fmod in C#?
- 27. Wie berechnet man die Lösungszeit in MySQL?
- 28. Wie berechnet man 5^262144 in Erlang
- 29. Wie berechnet man Zentroide in PCA?
- 30. Wie berechnet man Test/Validierungsverlust in Pycaffe?
Bitte um eine Probe Datenrahmen bereitstellt, mit zu arbeiten. –
Post Rohdaten, Ihren Code, gewünschte Ausgabe und Ihre fehlerhafte Ausgabe – EdChum