Gibt es eine bessere Möglichkeit, alle oder mehrere Spalten zur gleichen Zeit einer bestimmten SparkSQL DataFrame
voranzustellen oder umzubenennen als mehrere Male dataFrame.withColumnRenamed()
aufrufen?Spark DataFrame und Umbenennen mehrerer Spalten (Java)
Ein Beispiel wäre, wenn ich Änderungen (mit voller Outer Join) erkennen möchte. Dann bin ich mit zwei DataFrame
s mit der gleichen Struktur verlassen.
Es ist mehr über Java API und Spark. Als Beispiel erwartet 'select' entweder einen String-Parameter und dann varargs oder ein Array von' Column's, was nicht konsistent und manchmal auch ein wenig nervig ist. Ich musste einige Hilfsmethoden erstellen, um mit diesem Problem umzugehen, aber es wäre besser, diese Methoden direkt in 'DataFrame' verfügbar zu haben. – JiriS
Es gibt ein anderes Beispiel [hier] (http://stackoverflow.com/questions/32535273/how-to-match-dataframe-column-names-to-scala-case-class-attributes) –
Haben Sie Ihren Code mit versucht Funken 2.0? Ich habe es mit 7000 Spalten zu tun, siehe https://github.com/ramhiser/datamicroarray/wiki/Golub-(1999). Es dauert ewig (= nie beendet, bevor meine Geduld zu Ende war). – Boern