Ich versuche, maschinelle Lernalgorithmen auf Rohaudio anzuwenden. Mein Training wäre auf dem Fourier-Koeffizienten des Audiosignals. Ich habe versucht, diese und gelten ifft zu bekommen meine Audio zurück zu bekommen, aber es mit meiner Implementierung nicht funktioniert, das ist:Probleme mit scipy.io fft und ift
fs, data = wavfile.read('dataset piano/wav/music (1).wav')
Te = 0.25
T = 40
a = data.T[0] #retrieve first channel
#put the information in a matrix, one row will contain the fourier coefficients of 0.25s of music.
#The whole matrix, which has 40 rows will contain information of 10s of the wav file.
X = np.array([fft(a[int(i*fs*Te):int((i+1)*fs*Te)]) for i in range(T)])
Z = ifft(X.flatten())
Z = Z.astype(data.dtype)
wavfile.write('test3.wav',fs,Z)
Normalerweise sollte es die ersten 10 Sekunden der WAV-Datei spielen, aber es doesn‘ t und ich verstehe wirklich nicht warum. Alles, was ich bekomme, ist ein hoher Ton. Ich benutze das fft und ift von scipy.
Vielen Dank! Es funktioniert jetzt perfekt! Danke auch für deine Erklärung! – Tiffany