sed: Verbindungslinien abhängig von der vierten

Ich habe eine Datei, die gelegentlich Split-Linien hat.sed: Verbindungslinien abhängig von der vierten

Die Teilung wird durch die Tatsache signalisiert, dass zwei aufeinanderfolgende Zeilen mit alphabetischen Zeichen.

 

5 

00:00:00,000 --> 00:00:00,000 

Alphabetic characters 
Alphabetic characters 

6 

00:00:00,000 --> 00:00:00,000 

Alphabetic characters 

7 

00:00:00,000 --> 00:00:00,000 

Alphabetic characters 
Alphabetic characters 

8 

00:00:00,000 --> 00:00:00,000 

Alphabetic characters 

.....

Ich möchte die Trennlinie kommen zurück:

 

5 

00:00:00,000 --> 00:00:00,000 

Alphabetic characters Alphabetic characters 

6 

00:00:00,000 --> 00:00:00,000 

Alphabetic characters 

7 

00:00:00,000 --> 00:00:00,000 

Alphabetic characters Alphabetic characters 

8 

> 00:00:00,000 --> 00:00:00,000 

Alphabetic characters Alphabetic characters 
.....

sed verwenden. Mir ist nicht klar, wie ich mich einer Linie mit der vorhergehenden anschließen soll. Irgendwelche Vorschläge?

Quelle

2016-11-18 Marcelo

Wenn es sich um eine SRT-Datei handelt, gibt es im Gegensatz zu Ihrem Beispiel eine leere Zeile nach der letzten Textzeile (vor dem Untertitelindex). –

können Sie Ihre Frage bearbeiten, weil sie nicht das tatsächliche Format einer gültigen .SRT-Datei widerspiegelt. Daher werden Lösungen, die auf Ihrem Beispiel basieren, nicht zufriedenstellend sein. –

Präfixzeilen mit vier Leerzeichen. Bitte werfen Sie einen Blick auf [editing-help] (http://stackoverflow.com/editing-help). – Cyrus

sed ist für einfache Subsitutionen auf einzelnen Zeilen, das ist alles. Für alles andere sollten Sie awk werden:

$ awk '/[[:alpha:]]/{ if (buf=="") {buf=$0; next} else {$0=buf OFS $0; buf=""} } 1' file 

5 

00:00:00,000 --> 00:00:00,000 

Alphabetic characters Alphabetic characters 

6 

00:00:00,000 --> 00:00:00,000 


7 

00:00:00,000 --> 00:00:00,000 

Alphabetic characters Alphabetic characters 

8 

00:00:00,000 --> 00:00:00,000 

Alphabetic characters Alphabetic characters 

.....

Die oben wird kräftig arbeiten, portabel und effizient auf allen UNIX-Systemen mit allen POSIX-kompatiblen awks.

Quelle

2016-11-19 00:51:03

Danke, funktioniert gut für mich. Es ist möglich, Negation Operator? gefällt das -> "nicht gleich [: digit:]" – Marcelo

je nachdem was du meinst, das; s '!/[[: Digit:]] /' or '/ [^ [: digit:]] /' . –

sed '$!{N;/^[a-zA-Z ][^\n]\+\n[a-zA-Z ]/{s/\n/ /}}'

Spiel zwei Linien back-to-back, die die Bedingung, dass die erste Zeile beginnt mit einem alphabetischen Zeichen oder Zwischenraum und die zweiten beginnt mit dem gleichen erfüllen. Begleite sie mit einem Leerzeichen. nächste Zeile zu dem Musterraum gefunden wird, fügen Sie mit dem Befehl N

sed '/^[[:alpha:]]/{N;/\n[[:alpha:]]/s/\n/ /}' file

Wenn eine Zeile mit Buchstaben beginnen:

Quelle

2016-11-18 20:31:47 eddiem

Danke, funktioniert gut für mich. – Marcelo

Einen anderen Ansatz mit sed. Ersetzen Sie dann Newline, gefolgt von alphabetischen Zeichen mit einem Leerzeichen.

Quelle

2016-11-18 21:21:36 SLePort

Fantastisch - vielen Dank. funktioniert wirklich gut für mich. – Marcelo

sed: Verbindungslinien abhängig von der vierten

Antwort

Verwandte Themen