Die Transkriptionen des Kosinus Sprachkorpus wie folgt aussehen:Wie lese ich die Variablen der TextGrid-Datei in Python?
File type = "ooTextFile"
Object class = "TextGrid"
xmin = 0
xmax = 3931.56874994773
tiers? <exists>
size = 8
item []:
item [1]:
class = "IntervalTier"
name = "Phrases"
xmin = 0
xmax = 3931.56874994773
intervals: size = 1938
intervals [1]:
xmin = 0
xmax = 3.59246613841739
text = "Good morning"
intervals [2]:
xmin = 3.59246613841739
xmax = 3.77632771424237
text = "the dog likes me"
intervals [3]:
xmin = 3.77632771424237
xmax = 8.15464058223137
text = "fish swim"
intervals [4]:
xmin = 8.15464058223137
xmax = 8.53678424963039
text = "Sure."
intervals [5]:
xmin = 8.53678424963039
xmax = 9.54622035219737
text = "Just keep swimming"
Die Dateien in .TextGrid-Format sind. Wie könnte man die Variablen xmin
, xmax
und text
für jedes der Intervalle extrahieren?
EDIT:
Der Dateityp kann als normale Textdatei und lesen Sie Zeile für Zeile behandelt werden. Welches war meine Lösung für das Problem. Es wäre dennoch interessant zu wissen, ob es eine spezielle Möglichkeit gibt, Informationen aus diesen Dateitypen zu extrahieren. Danke für die Antworten.
Was haben Sie versucht? – MYGz
Hinweis: http://stackoverflow.com/questions/2081836/reading-specific-lines-only-python Oder Sie können Regex verwenden. Probieren Sie es aus und aktualisieren Sie die Frage mit Ihrem Versuch. – MYGz