Unten ist die Probe Spark sql ich schrieb, um die Anzahl der männlichen und weiblichen in einer Agentur eingeschrieben zu bekommen.Ich verwendete sql, um die Ausgabe zu generieren, gibt es eine Möglichkeit, ähnliche Dinge zu tun mit Datenframe nur nicht sql.Verwenden von Datareframe anstelle von Spark sql für Datenanalyse
val districtWiseGenderCountDF = hiveContext.sql("""
| SELECT District,
| count(CASE WHEN Gender='M' THEN 1 END) as male_count,
| count(CASE WHEN Gender='F' THEN 1 END) as FEMALE_count
| FROM agency_enrollment
| GROUP BY District
| ORDER BY male_count DESC, FEMALE_count DESC
| LIMIT 10""".stripMargin)
, welche Version von Funken verwenden Sie? –
Ich benutze Funken 2 in Hortonworks Sandbox –