Ich bin daran interessiert, eine Audiodatei als Aufzeichnung von Ereignissen zu verwenden, die rechtzeitig stattfinden. Das heißt, ich werde mehrere Datenströme haben, die rechtzeitig ausgerichtet werden müssen, und ich möchte die Audiodatei als Referenz verwenden. Also, ich frage mich, ob es möglich ist, die tatsächliche Zeitbasis für einen Audiostream zu erhalten, der relativ zu einer Echtzeituhr referenziert wird?
Ich schätze, dass man die Dauer eines Audio-Clips aus der Sample-Anzahl und der Sampling-Frequenz (zB 16KHz) bestimmen kann. Für kurze Clips ist dies wahrscheinlich eine gute Schätzung, aber für lange (mehrstündige Aufzeichnungen) wie genau wird diese Schätzung sein? Ich möchte die Genauigkeit in weniger als einer Sekunde über mehrere Stunden beibehalten.So erhalten Sie eine genaue Audio-Zeitbasis
Anders gesagt, speichert die Audiodatei die tatsächliche Start- und Stoppzeit der Audioaufnahme, die auf die RTC (Echtzeituhr) bezogen ist. Dies würde es ermöglichen, eine Zeitbasis für jedes Sample in der Audiodatei zu erzeugen. Wenn ja, kann ich diese Daten von einer Python-Audiobibliothek abrufen?
Ich verwende MP4/AAC für die Codierung auf einer Android-Plattform und pydub
für die Nachbearbeitung.
Danke.
Ich glaube nicht, dass Audioaufnahmen eine Genauigkeit in der Zeit unter der Sekunde haben. [viele Leute] (https://www.google.com/search?client=safari&rls=en&q=audio+recording+drift&ie=UTF-8&oe=UTF-8) haben in ihren Audioaufnahmen "Drift" entdeckt und sich ausgedacht verschiedene Strategien, um mehrere (unabhängige) Aufnahmen desselben Ereignisses korrekt auszurichten. Insbesondere Podcaster, bei denen jeder Host sich lokal registriert und die Aufnahmen anschließend zusammenfasst – Jiaaro