2017-01-06 1 views

Antwort

0

Ja, es ist notwendig. Sie müssen nicht nur in Zahlen konvertieren, sondern auch kodieren, um sie für lineare Modelle nützlich zu machen. Beide Schritte werden in pyspark.ml umgesetzt (nicht mllib) mit:

  • pyspark.ml.feature.StringIndexer - Indizierung.
  • pyspark.ml.feature.OneHotEncoder - Codierung.
Verwandte Themen