Wie bekomme ich das Mapping aus einem trainierten Spark MLlib StringIndexerModel?Abrufen von Spark Mllib StringIndexer Spaltenzuordnung
val stringIndexer = new StringIndexer()
.setInputCol("myCol")
.setOutputCol("myColIdx")
val stringIndexerModel = stringIndexer.fit(data)
val res = stringIndexerModel.transform(data)
Der obige Code wird ein myColIdx
meine Dataframe-Mapping-Werte in myCol
auf einen Index Frequenz auf der Grundlage der Werte hinzufügen. d. h. der häufigste Wert -> 0, der zweithäufigste -> 1 usw.
Wie kann ich diese Zuordnung vom Modell abrufen? Wenn ich das Modell serialisiere/deserialisiere, wird das Mapping stabil sein (d. H. Werde ich nach der Transformation für dasselbe Ergebnis garantiert)?