Ich versuche, Kreuzvalidierung zu tun, und ich renne in einen Fehler, der sagt: 'Gefundene Eingangsvariablen mit inkonsistenten Zahlen von Proben: [18, 1]'Kreuzvalidierung für Sklearn 0.20+?
Ich benutze verschiedene Spalten in einem Pandas-Datenrahmen (df) als Features, mit der letzten Spalte als Label. Diese stammt aus dem Machine Learning Repository für UC Irvine. Beim Importieren des Kreuzvalidierungspakets, das ich in der Vergangenheit verwendet habe, erhalte ich einen Fehler, der möglicherweise abgewertet wurde. Ich werde einen Entscheidungsbaum, SVM und K-NN laufen lassen.
Mein Code ist als solche:
feature = [df['age'], df['job'], df['marital'], df['education'], df['default'], df['housing'], df['loan'], df['contact'],
df['month'], df['day_of_week'], df['campaign'], df['pdays'], df['previous'], df['emp.var.rate'], df['cons.price.idx'],
df['cons.conf.idx'], df['euribor3m'], df['nr.employed']]
label = [df['y']]
from sklearn.cross_validation import train_test_split
from sklearn.model_selection import cross_val_score
# Model Training
x = feature[:]
y = label
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.5)
Jede Hilfe wäre toll!
Was ist unklar über den Fehler? Druckart und Form von x. Es sieht aus wie eine Liste von PD-Serien, die möglicherweise nicht das sind, was Sie wollen. – sascha