Python Fehler mit sklearn.model_selection.train_test_split: ValueError: Gefundene Eingabevariablen mit inkonsistenten Zahlen von Proben: [416858, 398427]

-4

Meine Anzahl der Etiketten stimmt nicht mit der Anzahl der Proben überein, daher denke ich, eine Lösung wäre zu entfernen einige der Beispieldaten, aber ich denke, das ist insgesamt keine gute Praxis.Python Fehler mit sklearn.model_selection.train_test_split: ValueError: Gefundene Eingabevariablen mit inkonsistenten Zahlen von Proben: [416858, 398427]

Hier ist mein Code:

X = np.loadtxt('/Users/myname/PycharmProjects/my_project/X.txt') 
y = np.loadtxt('/Users/myname/PycharmProjects/my_project/y.txt') 

print np.shape(X) 
print np.shape(y) 
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=.3)

ich den Fehler:

ValueError: Found input variables with inconsistent numbers of samples: [416858, 398427]

Kann mir jemand erklären, was ich tun müssen, um es zu beheben?

Quelle

2017-12-12 dirtysocks45

Diese Funktion ist ein util für ** überwachtes Lernen **. Ein 1: 1-Mapping von X und Y (zumindest in der ersten Dimension) ist nicht sinnvoll. Hier ist keine wertvolle Antwort möglich. – sascha

Ich stimme nicht zu. Ich denke, Brams Antwort war wertvoll. – dirtysocks45

Nein. Es ist nicht. Aber Sie werden zu dem Punkt kommen, wo Sie diese Tatsache erkennen werden (oder schlechte Ergebnisse bekommen, ohne es zu verstehen). Wenn Sie echte Antworten wünschen, sollten Sie wahrscheinlich weitere Informationen hinzufügen, wie: Sie haben das Mapping für dieses unausgeglichene X/Y-Set (Sie wissen genau, welche zwei Paare gepaart sind)? Klassifizierung (wie viele Klassen)? Regression? – sascha

-2

Was sind die Ergebnisse für np.shape (x) und np.shape (y)? Vielleicht kann dir das helfen. Wenn Sie keinen Zielwert für alle Ihre Eingaben haben, müssen Sie das beheben. Einfaches Löschen kann problematisch sein, denn wenn die fehlenden Werte nicht zufällig sind, beeinflussen Sie das Ergebnis Ihres Modells. Ihre beste Option wäre die Imputation. Weitere Informationen finden Sie unter Wikipedia page.

Quelle

2017-12-12 22:07:29

Das habe ich mir gedacht. Ich wusste nicht, dass es so heißt, aber danke. – dirtysocks45

Python Fehler mit sklearn.model_selection.train_test_split: ValueError: Gefundene Eingabevariablen mit inkonsistenten Zahlen von Proben: [416858, 398427]

Antwort

Verwandte Themen