Ich habe einen Datenrahmen:Scala - erste Quartil, dritte Quartil und IQR von Funken SqlContext Datenrahmen ohne Hive
data.show()
+--------+------+------------------+
| Count| mean| stdev|
+--------+------+------------------+
| 5| 6337| 1684.569470220803|
| 3| 7224| 567.8250904401182|
| 330| 20280|23954.260831863092|
| 42| 26586| 32957.9072313323|
...
| 49| 23422|21244.094701798418|
| 4| 36949| 8616.596311769514|
| 35| 20915|14971.559603562522|
| 33| 20874|16657.756963894684|
| 14| 22698|15416.614921307082|
| 25| 19100| 12342.11627585264|
| 27| 21879|21363.736895687238|
+--------+------+------------------+
Ohne Hive verwendet, möchte ich das erste Quartil bekommen, im zweiten Quartil und die IQR (Interquartil Bereich) für die Spalte "Mittelwert".
Andere Lösungen scheinen Hive zu verwenden, auf die alle möglicherweise keinen Zugriff haben.