2009-10-28 13 views
5

Ich möchte den Mel-Frequenz Cepstrum-Algorithmus machen, aber es gibt einige Dinge, die ich nicht verstehe.Wie man MFCC-Algorithmus macht?

Nach FTT geschehen ist, müssen wir „die Befugnisse des Spektrums oben auf die mel-Skala erhalten Karte, dreieckige überlappende Fenster verwendet wird.“

Ich weiß, wie man die Dreiecke berechnet und ich weiß auch, wie man zur Mel-Skala übergeht. Ich weiß einfach nicht, was ich mit ihnen machen soll.

Wenn die Dreiecke definiert sind, wie kann ich die Stärke des oben erhaltenen Spektrums auf die Mel-Skala übertragen?

Ist es so: Summe der Frequenzen innerhalb des Dreiecks und dann übergeben sie an Mel Skala? oder Summe der Frequenzen innerhalb des Dreiecks nach einem Gewichtswert (definiert durch die Höhe des Dreiecks an diesem Punkt) und dann an die Mel-Skala übergeben? oder Übergeben Sie alle Frequenzen innerhalb des Dreiecks, um die Skala entsprechend dem Weith-Wert zu skalieren? Eine andere Sache?

Kann jemand klärt mir diese

+1

Mein Vorschlag ist es, ein aufrichtiges und gnädiges Mitglied der Gemeinschaft zu sein. Stoppen Sie die Veröffentlichung unter verschiedenen Benutzernamen (Andre, Andre Ferreira und aF); danke den Leuten für ihre Hilfe bei deinen vorherigen drei ähnlichen Fragen, und stimme und akzeptiere ihre Antworten, wenn es angemessen ist (diese aktuelle Frage folgt eindeutig meinen vorherigen Antworten, aber keiner Bestätigung oder Upvotes); und sei ehrlich (antworte nicht auf deine eigenen Fragen, als wärst du jemand anderes). Für Fragen wie diese ist es eine sehr kleine Gemeinschaft. Ansonsten, zahlen Sie jemanden, der Ihnen hilft ... möchten Sie meine Preise wissen? – tom10

+0

Ich wurde nicht registriert und konnte nach dem Logout keinen Zugriff bekommen. Ich verstehe diesen Teil wirklich nicht sehr gut und ich bin dankbar für das, was Sie bisher gesagt haben. Also bitte, können Sie mir helfen, es überhaupt zu verstehen? Ich lese schon viele Dinge, aber diesen Teil verstehe ich wirklich nicht. –

+0

Sicher. 1) Das Markieren von Fragen ist sehr wichtig. Ich denke, um mehr Leute zu bekommen, um Ihre Frage zu sehen, es auch mit "FFT" und "Signalverarbeitung".2) Menschen auf SO sind motiviert, Menschen zu helfen und Punkte zu bekommen, also verbessern Sie Dinge, die Ihnen gefallen, indem Sie auf den Pfeil bei der Frage oder Antwort klicken und die Antwort auf Ihre eigene Frage akzeptieren, die für Sie funktioniert (klicken Sie auf den Haken, I denken). 3) folgen Sie Ihren eigenen Fragen, auch nachdem sie beantwortet wurden, damit sich die Leute bestätigt fühlen. – tom10

Antwort

5

Ich denke, dieser Schritt des Prozesses ein wenig seltsam ist und machen keinen vollständigen Sinn (für mich jedenfalls). Die Mitte der Filterbänder ist gleichmäßig entlang der Mel-Skala beabstandet, aber sind Dreiecke auf der linearen Skala, d.h. genau wie die Figur here.

Dann berechnen Sie die gewichtete Summe mit diesem Dreieck entlang der linearen x-Achse. (In diesem vorherigen Schritt, denke ich, dass einige Ansätze durch die Filter-Dreiecks Bereich normalisieren, und manche nicht, und ich bin ehrlich gesagt nicht sicher über die letzten Konsequenzen hier, obwohl ich vermute, es nicht viel bedeuten kann, außer das zu ändern ohnehin endgültige Interpretation der alle relativen Vergleiche sind. hält eine Gesamtenergie und die andere geben gleich gewichtete Beiträge pro Band.), dann das Protokoll hierfür nehmen (die den Gesamtvolumenfaktor konvertiert in ein Offset).

Edit: mehr klar zu sein, die Filter auf die Anwendung ... Jedes Dreieck stellt einen separaten Filter, eine separate gewichtete Summe zu erzeugen. Wenn in Ihrer Filterbank zwanzig Filter vorhanden sind, werden zwanzig Dreiecke und zwanzig gewichtete Summen berechnet. Um jeden Filter anzuwenden, multiplizieren Sie für jeden X-Achsen-Wert den Filterwert an dieser X-Stelle mit dem Funktionswert an dieser X-Stelle und addieren diesen Wert zu der Summe für diesen speziellen Filter. Die meisten X-Achsen-Werte mit zwei Filtern, die dort vorhanden sind, tragen also an jeder X-Stelle zu zwei Filtern bei.

+0

Ich habe meine Antwort bearbeitet, um Ihre Frage zu beantworten, hoffe ich. Wenn nicht, bitte wiederholen Sie Ihre Frage sehr sorgfältig, damit ich verstehe, was unklar ist. – tom10

+0

Auch können Sie meine Antwort wahrscheinlich noch akzeptieren, auch ohne 15 Punkte. Es ist nicht so, als würde ich sterben, um die Punkte hier zu bekommen, es ist ehrlich gesagt mehr, um dich zu verleiten, aber sieh dir das an ... http://meta.stackexchange.com/questions/8396/how-do-i-accept-an -answer-where-do-i-click Aber akzeptiere das nicht für ungefähr einen Tag, damit mehr Leute die Frage sehen und vielleicht hat jemand etwas aufschlussreiches zu sagen. – tom10

+0

Danke nochmal! Natürlich akzeptiere ich deine Antwort. Sie waren großartig zu mir. Der letzte Zweifel betrifft die Umwandlung von der Frequenz in die Mel-Skala. Dies wird durch Anwenden der Filter und der Summe der Gewichte gemacht? oder Ich muss so etwas tun: http://en.wikipedia.org/wiki/Mel_scale überall? –