Ich habe eine große Textdatei, die wie folgt aussieht:Buchstaben zum zweiten/dritten/vierten Vorkommen einer Zeichenkette hinzufügen?
1 1:49298 0 49298 T C
1 1:54676 0 54676 T C
1 1:54676 0 54676 A G
1 1:86028 0 86028 C T
1 1:86028 0 86028 T G
1 1:86028 0 86028 A G
1 1:91536 0 91536 T G
Die zweite Spalte enthält einige Multiples - es gibt definitiv Duplikate und es ist möglich, dass es Triplikaten etc, aber ich habe das nicht vollständig erforscht.
Ich möchte den Buchstaben "b" am Ende des zweiten Vorkommens in Spalte 2 hinzufügen, und "c" zum dritten Vorkommen, "d" zum vierten Vorkommen und so weiter. So sollte die Ausgabedatei wie folgt aussehen:
1 1:49298 0 49298 T C
1 1:54676 0 54676 T C
1 1:54676b 0 54676 A G
1 1:86028 0 86028 C T
1 1:86028b 0 86028 T G
1 1:86028c 0 86028 A G
1 1:91536 0 91536 T G
Ich dachte, das getan werden könnte, awk, aber ich habe noch keine praktikable Möglichkeiten herausgefunden.
Was haben Sie versucht, und wie ist es gescheitert? Ist Perl eine Option? (Es hat eine praktische Funktion, so dass '$ x =" a "; ++ $ x" ergibt $ x "mit der Zeichenfolge" b ".) – tripleee
Was sollte zum 27. Vorkommen hinzugefügt werden? Wie wäre es mit dem 53.? –