Von R haben wir die Funktion factors()
. Ich möchte diese Funktion parallel mit Spark R verwenden.Spark R - Was ist äquivalent zu `factors()` in Spark R?
Meine Version von Spark ist 1.6.2, und ich finde kein Äquivalent in der documentation. Ich dachte, ich könnte es mit einer Karte machen, aber ich bin mir nicht sicher, ob ich this answer verstehe, und es sollte einen einfacheren Weg geben.
Also um es einfach auszudrücken: Was ist das Äquivalent von factors()
in Spark R?
Ist [diese Antwort] (http://stackoverflow.com/questions/25038294/how-do-i-run-the-spark-decision -tree-mit-einem-kategorischen-Feature-Set-using-scala) hilfreich? –
Oder mit Spark [Ein-Hot-Encoder] (http://stackoverflow.com/questions/32277576/spark-ml-categorical-features) Dummy-Variablen zu erstellen –
Ich verstehe aus der 2. Antwort, dass es auf eine Karte zeigt- wie Lösung, aber mir ist nicht klar, wie dies in SparkR zu erreichen ist. Ich bin mir nicht sicher, wie ich die map Funktion in SparkR 3 Spalten zurückgeben würde. –