Acyally bin am Funken 2.0.2 Ich würde gerne wissen, zum Beispiel auf logistische Regression basierend auf Spark ML zu arbeiten. Ich möchte jede Zeile des Datenrahmens in einen Vektor, der wird für die logistische Regression eingegeben werden, können Sie helfen, Zeile in den Datenrahmen zu bekommen, um jede Zeile in einen dichten Vektor zu bekommen. Danke. Hier, was ich getan habe, um den Datenrahmen zu bekommen.Datenrahmen in dichten Vektor Funke
import org.apache.spark.ml.classification.LogisticRegression
import org.apache.spark.ml.linalg.{Vector, Vectors}
import org.apache.spark.ml.param.ParamMap
import org.apache.spark.sql.SparkSession
import org.apache.spark.sql.Row
import org.apache.hadoop.fs.shell.Display
object Example extends App {
val sparkSession = SparkSession.builder.master("local").appName("my-spark-app").getOrCreate()
val data=sparkSession.read.option("header", "true").csv("C://sample_lda_data.csv").toDF()
val data2=data.select("col2","col3","col4","col5","col6","col7","col8","col9")
am Ende ich so etwas wie dies als Input für die logistische Regression in der ersten Position bekommen wird es die erste Spalte des Datenrahmen jede Hilfe sein bitte
val data=sparkSession.read.option("header", "true").csv("C://sample_lda_data.csv").toDF()
val data2=data.select("col2","col3","col4","col5","col6","col7","col8","col9")
val assembler = new VectorAssembler().setInputCols(Array("col2", "col3", "col4")).setOutputCol("features")
val output = assembler.transform(data2)
main" java.lang.IllegalArgumentException: Data type StringType is not supported.
werde ich sein so gratefull.Thank euch
können Sie [VectorAssembler] (https://spark.apache.org/docs/2.0.2/ml-features.html#vektorasembler) verwenden. – mtoto
@mtoto ich benutzte, was Sie sagten, ich editierte den Code ich habe diesen Fehler main "java.lang.IllegalArgumentException: Datentyp StringType wird nicht unterstützt.Alle Hilfe –
alle Ihre cols sollte numerisch sein – mtoto