2017-11-28 1 views

Antwort

0

Wenn Sie RDD haben als

scala> mapd.foreach(println) 
(a,(b,c,d)) 
(a,(e,f,g)) 
(b,(b,c,d)) 

Dann

tun
val redcd = mapd.groupBy(_._1).mapValues(x => x.map(_._2).toList) 

würde Ihnen

scala> redcd.foreach(println) 
(b,List((b,c,d))) 
(a,List((b,c,d), (e,f,g))) 

Nun, wenn Sie es wollen, in das Format in Frage erklärt können Sie

tun
val redcd = mapd.groupBy(_._1).mapValues(x => x.map(_._2).toList.mkString(", ")) 

die

scala> redcd.foreach(println) 
(a,(b,c,d), (e,f,g)) 
(b,(b,c,d)) 

erzeugen würde ich hoffe, die Antwort hilfreich