Transformation von Daten in Funken scala Spalt

Eingang Datensatz Zeile:Transformation von Daten in Funken scala Spalt

CustomerID CustomerName Sun Mon Tue 
    1   ABC  0 12 10 
    2   DEF  10 0 0

Erforderlich Ausgabe-Datensatz:

CustomerID CustomerName Day Value 
    1   ABC  Sun 0 
    1   ABC  Mon 12 
    1   ABC  Tue 10 
    2   DEF  Sun 10 
    2   DEF  Mon 0 
    2   DEF  Tue 0

Bitte beachten Sie, dass die Zahl der "So Mo Di" Spalten 82 in meinem Dataset ist !

Quelle

2017-07-28 Sourajyoti MDeadart Datta

prüfen geben sollten diese https://stackoverflow.com/questions/37864222/transpose-column-to-row-with-spark – dumitru

Unter der Annahme, dass Ihre Eingabe dataset erzeugt wird unter Verwendung eines case class als

case class infos(CustomerID: Int, CustomerName: String, Sun: Int, Mon: Int, Tue: Int)

Für Testzwecke Ich erstelle ein dataset als

import sqlContext.implicits._ 
val ds = Seq(
    infos(1, "ABC", 0, 12, 10), 
    infos(2, "DEF", 10, 0, 0) 
).toDS

, die Ihre Eingabe dataset

+----------+------------+---+---+---+ 
|CustomerID|CustomerName|Sun|Mon|Tue| 
+----------+------------+---+---+---+ 
|1   |ABC   |0 |12 |10 | 
|2   |DEF   |10 |0 |0 | 
+----------+------------+---+---+---+

geben sollte

Wie Sie Ihre endgültige dataset erforderlich erfordert, dass Sie eine andere case class als

case class finalInfos(CustomerID: Int, CustomerName: String, Day: String, Value: Int)

Finale dataset, indem Sie folgende

erreicht, die zum Erstellen werden kann

val names = ds.schema.fieldNames 

ds.flatMap(row => Array(finalInfos(row.CustomerID, row.CustomerName, names(2), row.Sun), 
    finalInfos(row.CustomerID, row.CustomerName, names(3), row.Mon), 
    finalInfos(row.CustomerID, row.CustomerName, names(4), row.Tue)))

, die Sie dataset als

+----------+------------+---+-----+ 
|CustomerID|CustomerName|Day|Value| 
+----------+------------+---+-----+ 
|1   |ABC   |Sun|0 | 
|1   |ABC   |Mon|12 | 
|1   |ABC   |Tue|10 | 
|2   |DEF   |Sun|10 | 
|2   |DEF   |Mon|0 | 
|2   |DEF   |Tue|0 | 
+----------+------------+---+-----+

Quelle

2017-07-28 11:48:34

Transformation von Daten in Funken scala Spalt

Antwort

Verwandte Themen