Ich handle mit einem Dataset<Row>
in Apache Spark mit Java und muss ein paar mathematische Transformationen über alle Spalten in diesem Datensatz durchführen. Eine der Transformationen besteht im Wesentlichen darin, das Protokoll aller Werte zu erhalten, die in diesem Datensatz gespeichert sind und immer noch Dataset<Row>
zurückgeben. Ich sehe klar, wie man das in einer map
Funktion in einer RDD macht, aber wie kann ich das in einem Dataset<Row>
tun?Anwenden von Transformationen auf Dataset Apache Spark
Kontext: Dataset<Row> old
enthält 2 Spalten a
und b
. Ich möchte ein neues Dataset<Row> new
mit beiden Spalten a = log(a)
und b = log(b)
Bitte in weiteren Details erklären, was Sie zu tun versuchen, was Sie getan haben, so weit usw. Dataset hat viele Funktionen, die verwendet werden können. –