I Datei mit mehrfachen Linien haben, wie nachfolgend beschrieben mit Kopf für jede Spezies mit ‚>‘ StartPosition ändert Wort
>gi|398852808|ref|NZ_AKJD01000108.1| Pseudomonas sp. GM80 PMI37_contig126.126, whole genome shotgun sequence
CCGCAGGCTGCGATCTTTTGATGTTGTTTTTTTAAGATCAAGATCAAAAGATCGCAGCCTTCGGCAGCTCCTACAGGTGG
TCGTGGGTTTAAGCCGCTCAATCCAGTAAACTGCGGCACGTTTTTCTCTAAGTAGTGTTTTCCCCATGCAAATTGCTCTG
GCGCCCATGGAGGGGTTGGTCGACGACATCCTCCGCGACGTGCTGACCCGCGTTGGCGGCATCGATTGGTGCGTGACTGA
ATTCATTCGGGTCAACGATCAGTTGCTCACCCCGGCTTACTTCCACAAGTTCGGCCCCGAGCTGCTCAACGGTGCCCGCA
CGGCGTCCGGCGTGCCATTGCGTGTGCAATTGCTCGGTTCCGACCCGGTGTGCCTGGCGGAAAACGCTGCACTGGCCTGC
Ich mag den Header finden und es
>NZ_AKJD01000108.1|kraken:taxid|398852808 Pseudomonas sp. A3(2016), complete genome
CGCGATGGTCGTTAACGAAAACGCATGCTTACTGGCTAAACGCGGCGCTCTTGACTCCAT
CGCGAGCAAGCTCGCTCCTACAGAAGAAAGCGGCGCTCTAGTGCGCCTCATCCCAGTTAT
TGCCTACCCCCACCTCGACCAGCAGCGGCACATCCAGTTGCGCGGCCCCGCTCATGTGCA
zu
ändern
Ohne die Struktur der Datei zu ändern.
Ich versuchte dies awk-v repl = "> kraken: taxid | $ ID |" '{gsub (/ ^> /, repl, $ 0); Drucken $ 0} '$ FILE
Ich bin in der Lage, Wörter zu verschieben, aber nicht in der Lage zu entfernen oder das gewünschte Ergebnis zu erhalten.
Dank
[bearbeiten] Sie Ihre Frage, um die Umwandlung zu erklären, die Sie machen möchten. Momentan sehen Ihre Eingabe und Ausgabe wie 2 teilweise überlappende, aber nicht verwandte Textblöcke aus. Woher kam zum Beispiel 'A3 (2016)'? Warum ist Ihre Ausgabe um 2 Zeilen geschrumpft? Warum wurde 'CCG ...' 'CGC ...'? etc... –