2014-06-05 8 views
5

Ich versuche, mit Logistische Regression zu laufen Gridsearch und bekommenGridSearchCV und Logistische Regression Valueerror erhöhen: Kann nicht damit umgehen Mischung aus kontinuierlichen und binären

ValueError: Can't handle mix of continuous and binary 

ich diesen Fehler zu metrics.accuracy_score verfolgt haben. Offensichtlich geht die Vorhersage nicht so gut, und während y_true kontinuierlich ist (wie auch der Rest der Daten), ist y_pred nur Nullen und wird daher als binär klassifiziert.

  • Gibt es eine Möglichkeit, diesen Fehler zu vermeiden?
  • Bedeutet die Natur von y_pred, dass ich überhaupt keine logistische Regression verwende, oder könnte dies eine Folge der verwendeten Parameter sein?

Dank

Antwort

3

Etwas verwirrend logistische Regression ist eigentlich ein Klassifikationsalgorithmus (siehe http://scikit-learn.org/stable/modules/linear_model.html#logistic-regression). Daher sollten die Zieldaten ("y_true"), die Sie füttern, binär sein. Wenn Sie tatsächlich versuchen, ein Regressionsproblem zu lösen, sollten Sie einen anderen Algorithmus wählen, z. LinearRegression, SVR, RandomForestRegressor, etc.

+0

LogisticRegression kann verwendet werden, wenn es feste Anzahl von Etiketten gibt –

+0

Trotz des obigen Kommentars ist dies natürlich die richtige Antwort. Sich dumm fühlen, danke. – Korem

+0

@AbishekThakur, ja, das ist ein guter Punkt, aber beachte, dass scikit-learn für den Mehrklassen-LR einen Ein-gegen-Alles-Wrapper um den binären LR-Algorithmus verwendet. – DavidS

Verwandte Themen