Ich erhalte die folgende Fehlermeldung versucht, einen ML zu bauen Pipeline
:Wie konvertiert man ArrayType in DenseVector in PySpark DataFrame?
pyspark.sql.utils.IllegalArgumentException: 'requirement failed: Column features must be of type [email protected] but was actually ArrayType(DoubleType,true).'
Meine features
Spalte enthält ein Array von Gleitkommazahlen. Es klingt, als müsste ich diese in eine Art Vektor umwandeln (es ist nicht spärlich, also ein DenseVector?). Gibt es eine Möglichkeit, dies direkt auf dem DataFrame zu tun, oder muss ich in eine RDD konvertieren?