Ich habe einen Datensatz Daten wie die folgenden enthalten:GroupByKey mit Datensätzen in Spark-2.0 unter Verwendung von Java
|c1| c2|
---------
| 1 | a |
| 1 | b |
| 1 | c |
| 2 | a |
| 2 | b |
...
Jetzt möchte ich die Daten wie folgt (col1 gruppiert bekommen : String Key, col2: Liste):
| c1| c2 |
-----------
| 1 |a,b,c|
| 2 | a, b|
...
ich dachte, dass goupByKey mit einer ausreichenden Lösung sein würde, aber ich kann kein Beispiel nicht finden, wie es zu benutzen.
Kann mir jemand helfen, eine Lösung mit groupByKey zu finden oder eine andere Kombination von Transformationen und Aktionen zu verwenden, um diese Ausgabe mit Hilfe von Datasets, nicht RDD?
Glad to DataSet konnte ich helfen. – abaghel
Danke, es funktioniert! –