2016-10-11 3 views
1

Mit diesen Daten:Was ist der Regressionsalgo für diesen Fall?

clientId zipCode codeHeatingType countingType consumptionProfile householdCount squareFootage 

01  75015 ELEC   P012   A400   6    25    

02  75002 GAZ    P011   A600   3    30    

und die AvgConsumtion

clientId  AvgConsumption 
    01   300.5  (KWH) 
    02   400  (KWH) 

Was für maschinelles Lernen zu verwenden, die Avgconsumption in Abhängigkeit von den Client-Eigenschaften zu schätzen? LogisticRegression?, Multilabel classification? ...

ist es möglich, ein Beispiel mit String-Spalten zu haben?

Antwort

0

Sie benötigen einen Regressionsalgorithmus, der eine kontinuierliche Variable vorhersagt. Sie finden die Liste der in spark.mlhere implementierten Regressionsalgorithmen mit Beispielen.

Kategorische Prädiktoren können auf verschiedene Arten mit nichtparametrischen (nicht optimierten) Transformer (siehe http://spark.apache.org/docs/latest/ml-features.html) transformiert werden. Zum Beispiel wird OneHotEncoder eine kategorische Prädiktoren in einer Reihe von binären Prädiktoren konvertieren. Beispiele finden Sie in der documentation.

Hinweis: Informieren Sie sich über einige Grundlagen des maschinellen Lernens, bevor Sie zu viel ausprobieren. Es gibt eine Reihe von Fallstricken, die rein statistischer Art sind. Für spezifische Fragen, fragen here

+0

ist die lineare Regression oder generalisierte lineare Regression eine kontinuierliche Variable vorhersagen? Wie kann man wissen, ob es funktioniert? –

+0

Alle Methoden im Abschnitt verknüpft sind Regressionsverfahren (siehe Inhaltsverzeichnis: http://spark.apache.org/docs/latest/ml-classification-regression.html). Aber nicht alle Modelle der Regression werden in Ihrem Kontext Sinn ergeben. Dies ist jedoch kein Syntaxproblem, daher ist es nicht im Umfang von StackOverflow (siehe http://StackOverflow.com/Help/on-Topic) – Wilmerton

+0

Ich möchte wissen, die kontinuierliche Variable vorhersagen können? und welche meinen Bedürfnissen besser entsprechen –

Verwandte Themen