Ich bin dabei, eine Software-Plattform zu entwickeln, die Linguisten und Anthropologen bei der Untersuchung bisher unbekannter Sprachen unterstützt. Statistiken zeigen, dass es rund 1.000 Sprachen gibt, die nie von einer Person außerhalb ihrer jeweiligen Sprechergruppen untersucht wurden.IPA (International Phonetic Alphabet) Transkription mit Tensorflow
Mein Ziel ist es, mit TensorFlow eine Plattform zu schaffen, die es Linguisten ermöglicht, diese Sprachen effizienter zu studieren und zu dokumentieren und schriftliche Systeme für diejenigen zu erstellen, die noch kein geschriebenes System haben. Eine ihrer derzeitigen Methoden, um eine solche Aufgabe zu erfüllen, ist dreifacher Art: 1) Aufzeichnung eines Muttersprachlers, der sich in der Sprache unterhält, 2) Anhören dieser Aufzeichnung und Versuch, sie in die IPA zu übertragen, 3) Aus der Phonetik, Analysieren der Phonemik und phonotactics der Sprache, um schließlich ein geschriebenes System für den Sprecher zu schaffen.
Meine vorgeschlagene Plattform würde diese Forschungszeit von einem Minimum von einem Jahr auf ein Maximum von sechs Monaten reduzieren. Bevor ich anfange, habe ich einige Fragen ...
Was wäre erforderlich, um TensorFlow zu trainieren, um Live-Audio in die IPA zu transkribieren? Ist das schon gemacht worden? und wenn ja, wie würde ich eine vorherige Lösung für dieses Projekt nutzen? Ist ein solches Projekt mit TensorFlow überhaupt möglich? Wenn nicht, was würden Sie stattdessen empfehlen?
Ich entschuldige mich für die Größenordnung dieser Frage. Ich habe nicht viel Erfahrung im Bereich des maschinellen Lernens, da ich gerade den Forschungsprozess für dieses Projekt beginne. Jede Hilfe wird geschätzt!
Haben Sie mit einem Linguisten darüber gesprochen? Phonemerkennung kann viel schwieriger als das Erkennen von Wörtern https://cmusphinx.github.io/wiki/phoneme recognition/ – Aaron
@Aaron technisch, es ist * Telefone * hier, nicht Phoneme, aber nicht sicher, ob es es besser macht ... – lenz