Env: Spark-1.6, ScalaDatenrahmen Datensätze Abfrage Ausgabe
Hallo
Ich habe Aufzeichnungen in Datenrahmen wie unten
reportTime serverNAme channel viewer
2017-01-12 19:16:58.76 MTRL28DSERV722 Channel1 1192
2017-01-12 19:16:59.213 MTRL28DSERV722 Channel1 668
2017-01-12 19:17:05.193 BBBN23DSERV000 Channel1 795
2017-01-12 19:17:01.15 BBBN23DSERV000 Channel1 700
2017-01-12 19:16:58.76 MTRL28DSERV722 Channel3 100
2017-01-12 19:16:59.213 MTRL28DSERV722 Channel3 110
2017-01-12 19:17:05.193 BBBN23DSERV000 Channel3 200
2017-01-12 19:17:01.15 BBBN23DSERV000 Channel3 50
Ich brauche Ausgabe: neueste Zuschauer von jedem Server von Channel-, so dass
2017-01-12 19:16:59.213 MTRL28DSERV722 Channel1 668
2017-01-12 19:17:05.193 BBBN23DSERV000 Channel1 795
2017-01-12 19:16:59.213 MTRL28DSERV722 Channel3 100
2017-01-12 19:17:05.193 BBBN23DSERV000 Channel3 200
Wie kann ich ein Ergebnis erhalten? Ich möchte DF nicht als verführbar registrieren und SQL dafür verwenden, da SQL in Spark 1.6 nicht optimiert ist.
Dank
Hossain
Schätzen Sie Ihre Hilfe @Psidom. Es funktioniert für mich – Jhon