Map umwandeln habe ich die Struktur folgende Daten, welche Film-IDs (erste Spalte) und Ratings für verschiedene Benutzer für diesen Film in den Rest der Spalten - so ähnlich:Scala Funken: beliebig N Spalten in
+-------+----+----+----+----+----+----+----+----+----+----+----+----+----+----+----+
|movieId| 1| 2| 3| 4| 5| 6| 7| 8| 9| 10| 11| 12| 13| 14| 15|
+-------+----+----+----+----+----+----+----+----+----+----+----+----+----+----+----+
| 1580|null|null| 3.5| 5.0|null|null|null|null|null|null|null|null|null|null|null|
| 3175|null|null|null|null|null|null|null|null|null|null|null|null|null| 5.0|null|
| 3794|null|null|null|null|null|null|null|null|null|null|null| 3.0|null|null|null|
| 2659|null|null|null| 3.0|null|null|null|null|null|null|null|null|null|null|null|
ich möchte diese Datenrahmen zu einem Datensatz von
final case class MovieRatings(movie_id: Long, ratings: Map[Long, Double])
So konvertieren, dass es so etwas wie
wäre[1580, [1 -> null, 2 -> null, 3 -> 3.5, 4 -> 5.0, 5 -> null, 6 -> null, 7 -> null,...]]
Etc.
Wie dies geschehen kann?
Die Sache hier ist, dass die Anzahl der Benutzer ist beliebig. Und ich möchte diese in eine einzelne Spalte zippen und die erste Spalte unberührt lassen.
Mögliches Duplikat [Spark-2.0 - Konvertieren Datenrahmen zu DataSet] (https://stackoverflow.com/questions/40700213/spark-2 -0-convert-dataframe-to-dataset) – Pavel
Ich glaube nicht, dass dies ein Duplikat ist, weil diese Frage ist Wie mache ich das, und diese Frage ist, ich versuche dies zu tun und es funktioniert nicht, Oh warte Ich muss Spark aktualisieren. Diese Frage erfordert ein Tutorial und ist daher nicht Thema. – jmarkmurphy