2017-06-16 5 views
0

Ich habe eine Dataset[(A,B)]. Ich suche nach etwas wie unzip(Set[A,B]) => (Set[A], Set[B]). Was sind meine Möglichkeiten? Ich finde nichts in der Dataset-API. Muss ich auf RDDs zurückgreifen und es wieder hochbringen?Funke Dataset Entpacken Funktion

Dies wird durch einen Join verursacht, sind Joins 'billig' genug, um den Join zweimal zu tun, nur umgekehrt? Scheint übertrieben, da die beiden Sets schon da sind.

Antwort

0

Eine Lösung, die offensichtlich gewesen sein sollte ich denke, nur zwei Schritte von tut val a = ds.map(_._1) val b = ds.map(_._2)