Meine Anzahl der Etiketten stimmt nicht mit der Anzahl der Proben überein, daher denke ich, eine Lösung wäre zu entfernen einige der Beispieldaten, aber ich denke, das ist insgesamt keine gute Praxis.Python Fehler mit sklearn.model_selection.train_test_split: ValueError: Gefundene Eingabevariablen mit inkonsistenten Zahlen von Proben: [416858, 398427]
Hier ist mein Code:
X = np.loadtxt('/Users/myname/PycharmProjects/my_project/X.txt')
y = np.loadtxt('/Users/myname/PycharmProjects/my_project/y.txt')
print np.shape(X)
print np.shape(y)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=.3)
ich den Fehler:
ValueError: Found input variables with inconsistent numbers of samples: [416858, 398427]
Kann mir jemand erklären, was ich tun müssen, um es zu beheben?
Diese Funktion ist ein util für ** überwachtes Lernen **. Ein 1: 1-Mapping von X und Y (zumindest in der ersten Dimension) ist nicht sinnvoll. Hier ist keine wertvolle Antwort möglich. – sascha
Ich stimme nicht zu. Ich denke, Brams Antwort war wertvoll. – dirtysocks45
Nein. Es ist nicht. Aber Sie werden zu dem Punkt kommen, wo Sie diese Tatsache erkennen werden (oder schlechte Ergebnisse bekommen, ohne es zu verstehen). Wenn Sie echte Antworten wünschen, sollten Sie wahrscheinlich weitere Informationen hinzufügen, wie: Sie haben das Mapping für dieses unausgeglichene X/Y-Set (Sie wissen genau, welche zwei Paare gepaart sind)? Klassifizierung (wie viele Klassen)? Regression? – sascha