2017-12-21 2 views
0
rf = RandomForestClassifier().setFeaturesCol("features").setLabelCol("label") 
pipeline = Pipeline(stages=[tokenizer, hashingTF, idf, rf]) 
model = pipeline.fit(training) 
model.save(sc, '<path_to_save>') 

Ich versuche, unter Verwendung der oben code.But die Modelldatei speichern einen unerwarteten Fehler bekommen -Fehler beim Speichern Random Forest Classifier Modell in Pyspark

TypeError: save() takes exactly 2 arguments (3 given) 

ich diesen Fehler nicht verstehen. Ich übergebe nur 2 Argumente, aber immer noch diesen Fehler. Hat jemand eine Idee? Was mache ich hier falsch?

Antwort

0

Ich weiß nicht, wie das funktioniert. Aber das Entfernen des 1. Feldes "sc" funktioniert für mich.

model.save('<path_to_save>') 

Ich kann die Modelldatei mit diesem Befehl speichern.

+0

Warum verwirrt? Dies ist der richtige Weg, nach der [Docs] (http://spark.apache.org/docs/2.2.0/api/python/pyspark.ml.html#pyspark.ml.classification.RandomForestClassificationModel.save). Außerdem beziehen Sie sich offensichtlich auf Spark ML und nicht auf MLlib (Tag bearbeitet). – desertnaut

Verwandte Themen