Mit diesen Daten:Was ist der Regressionsalgo für diesen Fall?
clientId zipCode codeHeatingType countingType consumptionProfile householdCount squareFootage
01 75015 ELEC P012 A400 6 25
02 75002 GAZ P011 A600 3 30
und die AvgConsumtion
clientId AvgConsumption
01 300.5 (KWH)
02 400 (KWH)
Was für maschinelles Lernen zu verwenden, die Avgconsumption in Abhängigkeit von den Client-Eigenschaften zu schätzen? LogisticRegression?, Multilabel classification? ...
ist es möglich, ein Beispiel mit String-Spalten zu haben?
ist die lineare Regression oder generalisierte lineare Regression eine kontinuierliche Variable vorhersagen? Wie kann man wissen, ob es funktioniert? –
Alle Methoden im Abschnitt verknüpft sind Regressionsverfahren (siehe Inhaltsverzeichnis: http://spark.apache.org/docs/latest/ml-classification-regression.html). Aber nicht alle Modelle der Regression werden in Ihrem Kontext Sinn ergeben. Dies ist jedoch kein Syntaxproblem, daher ist es nicht im Umfang von StackOverflow (siehe http://StackOverflow.com/Help/on-Topic) – Wilmerton
Ich möchte wissen, die kontinuierliche Variable vorhersagen können? und welche meinen Bedürfnissen besser entsprechen –