Ich schreibe eine Spark-Anwendung und möchte Algorithmen in MLlib verwenden. Im API-Dokument habe ich zwei verschiedene Klassen für denselben Algorithmus gefunden.Unterschied zwischen org.apache.spark.ml.classification und org.apache.spark.mllib.classification
Zum Beispiel gibt es eine Logistische Regression in org.apache.spark.ml.classification auch ein LogisticRegressionwithSGD in org.apache.spark.mllib.classification.
Der einzige Unterschied, den ich finden kann, ist, dass der in org.apache.spark.ml von Estimator übernommen wird und in der Kreuzvalidierung verwendet werden konnte. Ich war ziemlich verwirrt, dass sie in verschiedenen Paketen untergebracht sind. Kennt jemand den Grund dafür? Vielen Dank!
Hallo Yijie, vielen Dank! Wie ich es verstehe, kann ich, wenn ich eine Kreuzvalidierung für Algorithmen durchführen möchte, die sich in o.a.s.mllib befinden, nur manuell Parameter setzen und mehrere Male ausführen, anstatt die Cross-Validator-Methode zu verwenden. Hast du einen besseren Weg es zu tun? – ailzhang
@ailzhang, könntest du das als eine andere Frage posten und sehen, ob jemand anderes helfen kann :) Ich weiß wenig über Mllib –
ok ~ danke für deine Hilfe! – ailzhang