Im Ausführen einer GridSearchCV (Gitter-Suche Kreuz Validierung) von der Sklearn-Bibliothek auf einem SGDClassifier (Stochastic Gradient Descent Classifier). Ich verwende einen DataFrame von Pandas für Funktionen und Ziel. Hier ist der Code:Sklearn GridSearchCV mit Pandas DataFrame Spalte
from sklearn.grid_search import GridSearchCV
parameters = {'loss': [ 'hinge', 'log', 'modified_huber', 'squared_hinge', 'perceptron'], 'alpha': [0.1, 0.01, 0.001, 0.0001, 0.00001, 0.000001, 0.0000001], 'n_iter': list(np.arange(1,1001))}
clf = GridSearchCV(estimator = SGDClassifier(), param_grid = parameters, scoring = 'f1')
print(clf)
clf.fit(X_train, y_train)
Wo ist X_train ist eine 300 Zeilen x 31 Spalten Pandas Datenrahmen mit jeder Spalte mit dem Namen durch:
['school', 'sex', 'age', 'address', 'famsize', 'Pstatus', 'Medu', 'Fedu', 'Mjob', 'Fjob', 'reason', 'guardian', 'traveltime', 'studytime', 'failures', 'schoolsup', 'famsup', 'paid', 'activities', 'nursery', 'higher', 'internet', 'romantic', 'famrel', 'freetime', 'goout', 'Dalc', 'Walc', 'health', 'absences']
Und y_train ist eine 300 Zeilen x 1 Spalte Pandas Serie namens durch die folgenden:
['passed']
Wenn ich den GridSearchCV Algorithmus versuchen, ich die folgende Fehler Anweisung bekommen:
012.351.IndexError: too many indices for array