Ich bin neu in der Audio-Welt, und mir wurde eine Aufgabe zugewiesen, ich bin mir nicht sicher, wie ich damit umgehen soll. Ich muss ein Diagramm anzeigen, das die Tonhöhe einer WAV-Datei darstellt. Die WAV-Datei kann polyphon sein, und dann muss ich das Tonhöhen-Diagramm des dominanten (also mit der stärksten Lautstärke) Instruments (oder menschlichen Gesang) anzeigen. Ich bin ziemlich vertraut mit .NET und weiß fast nichts in C, C++, Java.Display WAV-Datei Tonhöhe
Ich begann eine Recherche im Internet, und von dem, was ich verstand, ist die Tonhöhenerkennung von polyphonen WAV-Dateien ein ungelöstes Problem, aber ich brauche nicht die genaue Tonhöhe, nur um zu wissen, ob es höher ist. und was ist seine Länge.
Meine Fragen sind:
Wo sollte ich für das Erlernen der Theorie hinter dieser Aufgabe beginnen? Gibt es dafür empfohlene Bücher?
Gibt es ein API/Tool, das das kann?
Danke,
ML
Ich bin besorgt über die polyphone Natur der WAV-Datei. Kann FFT mir helfen, das dominanteste Instrument/die Stimme zu isolieren? –
Nun FFT wird Ihnen die dominante Frequenz in einem Wellenfragment geben - also wenn Sie drei Instrumente haben, die alle C erzeugen (ob als Grundfrequenz oder Obertöne), wird FFT Ihnen nicht sagen, welches Instrument am lautesten ist, aber es wird Ihnen sagen dieses mittlere C ist die lauteste Frequenz in der Probe. –
Ich nehme an, Sie haben einen 'Spektrumanalysator' gesehen - FFT wird Ihnen das geben. –