2017-06-19 1 views
1

Ich benutze Zeppelin 0.7.1 und Spark 2.1.0.kann nicht einen anderen Absatz in Zeppelin nach VectorAssembler.trans von

+-------+-------+-------+-------+ 
| index |var 1 |var 2 |var 3 | 
+-------+-------+-------+-------+ 
| 0  | 0  | 1  | 0  | 
+-------+-------+-------+-------+ 
| 1  | 0  | 1  | 0  | 
+-------+-------+-------+-------+ 
| 2  | 1  | 0  | 1  | 
+-------+-------+-------+-------+ 

und ich möchte, um eine lineare Regression zu machen, jede Spalte in einer Vektor-Spalte zu setzen:

Ich habe einige Daten in dem Datenrahmen 'Dataset' bekomme

from pyspark.ml.linalg import Vectors 
from pyspark.ml.feature import VectorAssembler 


assembler = VectorAssembler(inputCols=['var 1', 'var 2', 'var 3'], outputCol='features') 
output = assembler.transform(dataset) 

Nun, nachdem ich das im Zeppelin ausgeführt habe, kann ich keinen anderen Absatz mehr ausführen. Ich muss meinen Dolmetscher neu starten ... Wenn jemand eine Idee hat, woher das Problem kommen könnte.

Danke!

Antwort

1

Version 0.7.2 von Zeppelin sollte Ihr Problem lösen. Wir hatten das gleiche Problem, wir haben es gerade mit der gleichen Version und diesem Upgrade getestet und es war in Ordnung.

grüße

Verwandte Themen