Rein akademisch, aber es frustriert mich.Entfernen Sie doppelte Wörter in einer Zeile mit sed
Ich möchte diesen Text korrigieren:
there there are are multiple lexical errors in this line line
mit sed. Ich habe so weit:
sed 's/\([a-z][a-z]*[ ,\n][ ,\n]*\)\1/\1/g' < file.text
Es korrigiert alles außer den endgültigen verdoppelten Worten!
there are multiple lexical errors in this line line
Kann ein Sed Guru bitte erklären, warum das oben genannte nicht mit den Worten am Ende beschäftigt?
N. B. RE - '[, \ n]' sed verwendet das '\ n' als Zeilenbegrenzer. Wenn Sie also '\ n''s nicht in den Musterbereich einfügen, werden Sie ihnen nach dem Einlesen einer Zeile in den Musterbereich nie begegnen. – potong