2017-12-12 4 views
-4

Meine Anzahl der Etiketten stimmt nicht mit der Anzahl der Proben überein, daher denke ich, eine Lösung wäre zu entfernen einige der Beispieldaten, aber ich denke, das ist insgesamt keine gute Praxis.Python Fehler mit sklearn.model_selection.train_test_split: ValueError: Gefundene Eingabevariablen mit inkonsistenten Zahlen von Proben: [416858, 398427]

Hier ist mein Code:

X = np.loadtxt('/Users/myname/PycharmProjects/my_project/X.txt') 
y = np.loadtxt('/Users/myname/PycharmProjects/my_project/y.txt') 

print np.shape(X) 
print np.shape(y) 
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=.3) 

ich den Fehler:

ValueError: Found input variables with inconsistent numbers of samples: [416858, 398427] 

Kann mir jemand erklären, was ich tun müssen, um es zu beheben?

+0

Diese Funktion ist ein util für ** überwachtes Lernen **. Ein 1: 1-Mapping von X und Y (zumindest in der ersten Dimension) ist nicht sinnvoll. Hier ist keine wertvolle Antwort möglich. – sascha

+1

Ich stimme nicht zu. Ich denke, Brams Antwort war wertvoll. – dirtysocks45

+1

Nein. Es ist nicht. Aber Sie werden zu dem Punkt kommen, wo Sie diese Tatsache erkennen werden (oder schlechte Ergebnisse bekommen, ohne es zu verstehen). Wenn Sie echte Antworten wünschen, sollten Sie wahrscheinlich weitere Informationen hinzufügen, wie: Sie haben das Mapping für dieses unausgeglichene X/Y-Set (Sie wissen genau, welche zwei Paare gepaart sind)? Klassifizierung (wie viele Klassen)? Regression? – sascha

Antwort

-2

Was sind die Ergebnisse für np.shape (x) und np.shape (y)? Vielleicht kann dir das helfen. Wenn Sie keinen Zielwert für alle Ihre Eingaben haben, müssen Sie das beheben. Einfaches Löschen kann problematisch sein, denn wenn die fehlenden Werte nicht zufällig sind, beeinflussen Sie das Ergebnis Ihres Modells. Ihre beste Option wäre die Imputation. Weitere Informationen finden Sie unter Wikipedia page.

+0

Das habe ich mir gedacht. Ich wusste nicht, dass es so heißt, aber danke. – dirtysocks45

Verwandte Themen