Ich möchte einige Genom FASTA-Dateien mit einigen Informationen der ersten Zeile umbenennen, aber ich kann es nicht herausfinden. HierUmbenennen von FASTA-Dateien mit einem Teil ihrer ersten Zeile
ist ein Beispiel, zwei Dateien:
GCA_000007365.1_ASM736v1_genomic.fna
:
>AE013218.1 Buchnera aphidicola str. Sg (Schizaphis graminum), complete genome
ATGTCAAAGTCGTATTTAAAAAATTTTGATGTTATTGTTATTGGTGGAGGGCATGCTGGCACTGAAGCTGCAGCAGCCTC
TGCAAGAGTAGGTTGTAAAACATTATTATTAACTCAAAAAATAACTGATATAGGTGTATTATCTTGCAATCCTGCTATCG
GCA_000012065.2_ASM1206v2_genomic.fna
:
>CP000048.1 Borrelia hermsii DAH, complete genome
TACCACTACACTTATTAATAATACATACTCACGCCTGGGGGGAAAAATTCAATAATGGAAACCTTACAAATATAAAACCA
CTACAAATAGGTATTATTCAGCATAATTATATAAATTTAACTCCTTATAATCAACATTATAAATATTACGCTTTCATTGG
Ich möchte tausend *.fna
Dateien mit Informationen von der ersten Zeile umbenennen in der FASTA-Datei geben:
Buchnera_aphidicola_AE013218.1.fna
Borrelia_hermsii_CP000048.1.fna
Der FASTA-Header bleibt unverändert. Nur der Dateiname.
Was _exactly_ geht in den Dateinamen? Die ersten drei Wörter in der Reihenfolge 2, 3, 1 ohne das '>', verbunden mit Unterstrichen? Etwas anderes? –
Genau @ BenjaminW. Wörter 2, 3, 1 getrennt mit "_" (2_3_1) ohne das ">" und sonst nichts. – Tetraodienne