ich folgende sparkdataframe haben:berechnen Quantil auf gruppierten Daten in Funkendataframe
agent_id|payment_amount|
+--------+--------------+
| a| 1000|
| b| 1100|
| a| 1100|
| a| 1200|
| b| 1200|
| b| 1250|
| a| 10000|
| b| 9000|
+--------+--------------+
mein Wunsch Ausgabe etwas wie
agen_id 95_quantile
a whatever is 95 quantile for agent a payments
b whatever is 95 quantile for agent b payments
für jede Gruppe von agent_id ich brauche wäre, die 0,95 Quantil berechnen , nehme ich den folgenden Ansatz:
test_df.groupby('agent_id').approxQuantile('payment_amount',0.95)
aber ich nehme den folgenden Fehler:
'GroupedData' object has no attribute 'approxQuantile'
ich brauche so später .95 Quantil (Perzentil) in einer neuen Spalte haben kann für Filterzwecke
@ zero323 ich würde mich über Ihre Hilfe freuen. – sanaz
welche Version von Spark verwenden Sie? – eliasah
@eliasah + 2.0.0 – sanaz