2017-04-04 3 views
1

Ich arbeite an Speech Sentiment Analyse auf Kundenbetreuung Daten. Ich habe eine Audiodatei, in der der Kundendienstbeamte die Frage gestellt hat und der Kunde seine Bewertung abgegeben hat.So teilen Sie die Audiodatei in Python

Ich muss dieses Audio teilen, und bekomme nur die Überprüfungsteil vom Kunden, Sentiment Analyse zu tun, ob der Kunde glücklich, traurig oder neutral ist.

Bitte lassen Sie mich wissen, wie Sie Audiodatei teilen, um nur das Audio des Kunden zu erhalten. Der Ton ist im Format „.aac“

Bisher ist es das, was ich getan habe:

from os import path 
AUDIO_FILE = path.join(path.dirname(path.realpath('C:\\Users\\anagha\\Documents\\Python Scripts')),"Python Scripts\\audioa.aac") 

halfway_point = len(AUDIO_FILE)/2 
+0

Wenn Sie nur basierend auf Größe oder Stille teilen möchten Sie können http://stackoverflow.com/questions/37725416/pydub-combine-split-on-silence-with-minimum-length-file-size Aber ich glaube, Sie müssen zuerst entscheiden, wie Sie werden Unterscheiden Sie zwischen Kunden- und Kundenaudio. Vielleicht helfen Spracherkennungstools. –

+0

Danke, irgendeinen Vorschlag, wie man zwischen Kunde und Klientenaudio unterscheidet? – Anagha

Antwort

2

, da Sie die pydub-Tag verwendet, ist hier, wie es mit pydub zu tun

from pydub import AudioSegment 
sound = AudioSegment.from_file(AUDIO_FILE) 

halfway_point = len(sound) // 2 
first_half = sound[:halfway_point] 

# create a new file "first_half.mp3": 
first_half.export("/path/to/first_half.mp3", format="mp3") 
+0

Danke. Aber wie bekommt man die Ausgabe und sieht, ob sie geschnitten wurde? oder wie exportiere ich die Ausgabe? – Anagha

+0

@Anagha aktualisierte Antwort mit Exportlinie – Jiaaro

0

Ich denke, es ist zu spät, um die ursprüngliche Frage zu beantworten, aber jemand stolpernd auf diese Frage könnte das Verfahren nützlich finden

-> Verwenden Sie ein Tool zum Diarisieren der Daten. > Interpretieren die Ausgabe auf diesem wunderschön einfache SO Post (Parsing LIUM Speaker Diarization Output)

und dann schließlich verwenden die Timings von oben erhalten anhand der Audiodatei spleißen - Ich habe Lium (http://www-lium.univ-lemans.fr/diarization/doku.php)

verwendet! Das Konvertieren der Sprache in Text ist jedoch eine völlig andere Herausforderung und erfordert entweder einen tiefen Ansatz (mit großen Datenmengen) oder die Abhängigkeit von einem API-Provider (wie Google)