2017-08-04 10 views
-3

Gibt es eine Möglichkeit, durch die Reihe von Videos aufgelistet gehen können:Bestimmte gesprochene Wörter in einem Video suchen?

http://archive.org/details/trumparchive&tab=collection

und passende bestimmte Wörter mit der Zeit finden, an dem sie gesprochen wurden?

Kontext:
Ich versuche, eine Kompilation Art von Bot zu machen, so dass meine ursprüngliche Idee für eine Reihe von Transkripten (vorzugsweise eine Datenbank, die enthält die Transkripte der Reden mit den ungefähren Zeiten zu sehen war welche Wörter gesprochen wurden und später ein Programm verwenden, um die Videos zu finden, die Clips mit den gesprochenen Wörtern auszuschneiden und dann alle Clips in ein Video zu kompilieren.

+0

Willkommen bei StackOverflow. Um Downvotes zu vermeiden, erinnern Sie sich ... Diese Seite behandelt ** Programmierung ** Fragen. Sie müssen etwas gestartet haben und Probleme mit Ihrem Code haben, um Rat zu bekommen (ein _overflow_ führt zu einem Computerabsturz). Kennzeichnen Sie die verwendete Programmiersprache, zeigen Sie Code an, der nicht wie erwartet funktioniert, und so weiter ... –

Antwort

0

“... Gibt es eine Möglichkeit, durch die Reihe von Videos aufgelistet gehen können:

http://archive.org/details/trumparchive&tab=collection

und bestimmte Wörter finden, mit der Zeit, passend zu dem sie waren gesprochen?"

Wenn das Video mit ihrem Untertitel-Datei hat (zB: eine SRT oder WebVTT-Datei), es könnte möglich sein.

Hinweis:
Die unten folgende manuell durchgeführt wird, aber nach dem Üben, können Sie einfach ein Programm schreiben, um es automatisch zu tun ...

zu den aufgeführten Punkten der Suche: http://archive.org/details/trumparchive&tab=collection

können wir ein Pick: The O'Reilly Factor : FOXNEWSW : February

und überprüfen Sie die (hTML) Quellcode zu sehen, ob irgendwelche .srt oder .vtt Dateien aufgelistet sind:

href="/download/FOXNEWSW_20170207_040300_The_OReilly_Factor/FOXNEWSW_20170207_040300_The_OReilly_Factor.align.srt" 

So werden die gefundenen Untertitel befinden sich in:
https://archive.org/download/FOXNEWSW_20170207_040300_The_OReilly_Factor/FOXNEWSW_20170207_040300_The_OReilly_Factor.align.srt

Nachfolgend finden Sie eine Auswahl von Text. Jetzt kennst du die Wörter und die spezifischen Zeiten im Video, in denen sie gesprochen werden.

1 
00:00:00,0 --> 00:00:04,570 
A "WASHINGTON TIMES" REPORTER. 
TONIGHT, WE HAVE A NUMBER OF 

2 
00:00:04,572 --> 00:00:03,482 
SUBJECTS THAT WE PRESENTED TO PRESIDENT 
TRUMP. 

3 
00:00:03,484 --> 00:00:09,479 
HERE THEY ARE. LET'S TALK ABOUT 
IRAN, YOUR 

4 
00:00:09,481 --> 00:00:14,261 
ASSESSMENT, DO YOU THINK WE ARE 
ON A COLLISION COURSE WITH THE 

5 
00:00:14,263 --> 00:00:16,463 
-- WITH THATED COUNTRY? PRESIDENT 
TRUMP: I THINK IT 

6 
00:00:16,465 --> 00:00:18,221 
WAS THE WORST DEAL I EVER SEE NEGOTIATED. 

7 
00:00:18,223 --> 00:00:19,841 
IT WAS IT DEAL THAT NEVER SHOULD 
HAVE BEEN NEGOTIATED. 
+0

Vielen Dank! Dies half eine Tonne. –

Verwandte Themen