2009-09-04 10 views
8

Ich habe diese Frage in letzter Zeit nachgedacht. Ich habe diese kleine App, die ich gebaut habe, in der ich eine WAV-Datei visualisiere und ihr eine Wellenform gebe (ähnlich wie bei der Kühnheit).Bedeutung von negativen Werten in Audio-Wellenformen

Ich habe festgestellt, dass aus irgendeinem Grund gibt es negative und positive Werte. Nun, ich kann die Bedeutung von negativen Werten in sinusförmigen Wellen verstehen, wobei die Richtung die Richtung des elektrischen Stroms darstellt. Was aber stellt negativer Wert in der Musik dar?

+3

Ich sehe keinen Grund zu stimmen, um zu schließen. Wenn Fragen zur Spielphysik koscher sind, stellt sich auch die Frage nach der physikalischen Bedeutung eines digitalisierten Wertes. Natürlich ist dies wahrscheinlich nahe am Rande dessen, was "programmierungsbezogen" ist. – RBerteig

+0

Ich stimme zu. Diese Frage mag technisch besser für die Elektrotechnik-Überlaufgemeinschaft geeignet sein, aber es ist auch eine fundamentale Frage, die viele Software-Leute haben, da ihre Hintergründe möglicherweise nicht so in EE involviert sind. Persönlich habe ich mich selbst schon eine ganze Weile gefragt, obwohl ich ziemlich anspruchsvolle DSP-Literatur gelesen habe. Bei dieser Frage geht es um die Interpretation digitalisierter Daten, die für die Programmierung extrem relevant ist. –

Antwort

8

Sound ist im Grunde eine Druckwelle, bestehend aus "Peaks", die Bereiche mit höherem Druck sind und "Täler", die Bereiche mit niedrigerem Druck sind. Ein Mikrofon spricht auf die einfallende Druckwelle an, indem es einige physikalische Materialeigenschaften ausnutzt, um diesen Druck über die Zeit zu messen. Eine Aufzeichnung ist der Prozess, bei dem diese Messungen abgetastet und auf einige Medien übertragen werden.

Eine vernünftige Darstellung zu wählen ist, den Umgebungsdruck Null zu nennen, mit höheren und niedrigeren Drücken positiv und negativ. Eine andere sinnvolle Darstellung besteht darin, den Umgebungsdruck als Halbskala anzunehmen, wobei niedrigere Drücke unter und höhere Drücke über der Hälfte liegen. Andere Darstellungen sind möglich, und es ist nicht einmal erforderlich, dass die Beziehung zwischen dem einfallenden Druck und dem gemessenen Wert linear ist.

Ob eine signierte oder vorzeichenlose Darstellung verwendet wird, ist nur eine Frage der Geschichte und Konvention. 16-Bit-Audio wird normalerweise als vorzeichenbehaftet dargestellt, aber 8-Bit-Audio ist in der Regel nicht zum Beispiel.

In der Vergangenheit hat das Telefonsystem vorzeichenlose 8-Bit-Messungen nach einer nichtlinearen Funktion namens a-law oder µ-law verwendet. Die nichtlineare Darstellung unterstützt einen größeren dynamischen Bereich innerhalb der gleichen Bitrate als eine lineare Darstellung.

+0

also mal sehen, ob ich es richtig gemacht habe. 0 repräsentiert überhaupt keinen Ton. Was bedeutet es also für einen negativen Wert? Es repräsentiert die Richtung der Schallmenge? Ein positiver Wert bedeutet ein verstärkendes Geräusch (sprich eine Explosion) und ein negativer Wert eine Abnahme der Lautstärke. Wenn das der Fall ist, dann zeichne einfach keine Linie zwischen der Menge an Sound in jedem Moment, Werte sind immer positiv, solange es Sound gibt. Was nützt es dann für negative Werte? – vondip

+2

Das hast du nicht richtig verstanden. 0 ist ein einzelnes Beispiel. Es kann nicht gesagt werden, dass ein einzelnes Sample irgendeinen Ton oder keinen Ton darstellt. Nur in der Schwingungsfrequenz des Signals kann Schall existieren. Offensichtlich kann eine einzelne Probe keine Schwingung darstellen. – recursive

+2

Der aktuelle Wert - entweder positiv, Null oder negativ - stellt überhaupt keinen Ton dar. Es ist die Variation des Wertes über die Zeit, die den Klang repräsentiert. Schau dir einen Lautsprecher an. Der Wert in einer Wellenform repräsentiert die Position der Membran zu verschiedenen Zeitpunkten. Positiv bedeutet, dass sich die Membran in eine Richtung bewegt (aus dem Gleichgewicht, wenn die Musik ausgeschaltet ist), und negativ bedeutet die andere Richtung. Absolut kleinere Werte repräsentieren kleine Verschiebungen, absolut größere Werte repräsentieren große Verschiebungen. –

1

Genau das gleiche ... eine Wave-Datei repräsentiert nur eine gesampelte Schallwelle. Und Schallwellen (wie die meisten Wellen jeder Art) liegen manchmal unter und manchmal über dem Gleichgewicht (im Falle einer Schallwelle ist der lokale Luftdruck niedriger oder höher als der Umgebungsluftdruck) und daher sind die Proben manchmal negativ und manchmal positiv.

Am Ende ist es nur eine Frage des Gleichgewichts. Eine 16-Bit-Audiodatei hat Sample-Werte von -32.768 bis +32.767. Sie könnten nur 32,768 zu allen Abtastwerten hinzufügen und Abtastwerte im Bereich von 0 bis 65.535 erhalten und das Gleichgewicht (totale Stille (in Abwesenheit eines DC-Offsets)) von 0 auf 32.768 verschoben.

2

Die Wellenform ist flach (Y = 0), wenn kein Ton vorhanden ist.

Die Y-Achse bezieht sich auf die Druckdifferenz zum Umgebungsdruck. Positive Y-Werte zeigen eine Kompression an und negative Y-Werte zeigen eine Verdünnung an.

-2

Vom WAV format:

8-Bit-Samples als unsigned Bytes gespeichert sind, im Bereich von 0 bis 255 16-Bit-Proben als 2'S-Komplement signierte ganzen Zahlen gespeichert sind, im Bereich von -32768 bis 32767.

Negative Werte kommt unterzeichnet Zahlen.

3

Schall ist mechanische Energie in Form von Druckschwankungen in einem elastischen Medium.Diese Druckvariationen breiten sich als Wellen von einer vibrierenden Quelle aus. Änderungen des Luftdrucks (Luft ist ein sich ausbreitendes Medium) können durch eine WAVEFORM dargestellt werden, die eine grafische Darstellung eines Schalls darstellt. In Wirklichkeit breiten sich Schallwellen in langen Wellen (und nicht in transversalen Wellen) durch die Luft aus.

Das Konzept der Kompression und Verdünnung kommt ins Bild, wo in einer Kompression ist eine Periode von höherem Druck als der Umgebungsdruck (oder wenn der Ausgang 0 ist) und Verdünnung ist ein Zeitraum, in dem der Druck niedriger als der Umgebungsdruck ist. Wenn also die Longitudinalwelle auf die Membran des Mikrophons/Wandlers auftrifft. Die Kompression erzeugt einen positiven Wert der Amplitude und die Verdünnung erzeugt einen negativen Wert der Amplitude.

0

Die Sample-Werte in einer Sounddatei können als die Bewegung der Mikrofonmembran zur Aufzeichnung dieses Sounds angesehen werden: Die Mikrofonmembrane vibrierte oben (positiv) und unterhalb (negativ) ihre Ruheposition (Null).

In ähnlicher Weise bewegt sich die Lautsprechermembran zur Wiedergabe dieses Tons aus ihrer Ruhelage (Null) nach vorn (positiv) und zurück (negativ). Diese Vibration um eine zentrale Position erzeugt einen Klang.

Verwandte Themen