Ich habe eine Zeichenfolge in einem Protokoll, das ich gerne Tokenize. Die Felder werden manchmal durch das '|' Zeichen und manchmal durch Leerzeichen.Tokenize regulären Ausdruck
es sieht immer so aus: timestamp | log_level | kategorie | message_body
oder
Zeitstempel log_level message_body
Beispiel:
2016/04/11 07:05:33 | INFO | xxc | message_message_abcde
Oder
2016-04-11 07:01:24,895 INFO message message abcde
Ich möchte alle duplizierten Nachrichten entfernen (Zeitstempel ignorieren). Da ich zuerst durch log_level
= grep werde kann ich auch log_level
ignorieren.
danke!