Ich arbeite an einem Projekt, bei dem mit vorverarbeiteten Daten in der folgenden Form gearbeitet werden muss."Ein Array-Element mit einer Sequenz setzen" numpy Fehler
Daten Erklärung wurde oben zu gegeben. Das Ziel besteht darin, vorherzusagen, ob eine geschriebene Ziffer mit dem Audio der Ziffer übereinstimmt oder nicht. Zuerst habe ich die gesprochenen Arrays von Form (N, 13) an das Mittel über die Zeitachse als solche Transformation:
Dies schafft eine einheitliche Länge von (1,13) für jedes Array innerhalb gesprochen. Um dies in einem einfachen Vanille-Algorithmus zu testen, zip die beiden Arrays zusammen, so dass wir ein Array der Form (45000, 2) erstellen, wenn ich dies in die Fit-Funktion der LogisticRegression-Klasse einfügen, wirft es mir den folgenden Fehler:
Was mache ich falsch?
Code:
import numpy as np
from sklearn.linear_model import LogisticRegression
match = np.load("/srv/digits/match_train.npy")
spoken = np.load("/srv/digits/spoken_train.npy")
written = np.load("/srv/digits/written_train.npy")
print(match.shape, spoken.shape, written.shape)
print(spoken[0].shape, spoken[1].shape)
def features(signal, function):
new = np.copy(signal)
for i in range(len(signal)):
new[i] = function(new[i], axis=0)
return new
spokenMean = features(spoken, np.mean)
print(spokenMean.shape, spokenMean[0])
result = np.array(list(zip(spokenMean,written)))
print(result.shape)
X_train, X_val, y_train, y_val = train_test_split(result, match, test_size =
0.33, random_state = 123)
model = LogisticRegression()
print(X_train.shape, y_train.shape)
model.fit(X_train, y_train)
yh_val = model.predict(X_val)
Wie ist die Form von gesprochenemMean und ytrain? – Siddharth
@Siddharth spokenMean sollte nicht in der Fit-Funktion sein, das sollte natürlich X_train sein. X_train hat eine Form von (30150,2); y_train hat eine Form von (30150,). –
Gibt es immer noch Fehler mit X_train? – Siddharth