Ich frage mich, was der beste Weg ist, einige Zeilen aus einer Fasta-Datei in bash zu entfernen.Bash: Zeilen aus Fasta-Datei entfernen
In dem obigen Beispiel, sagen wir, ich möchte die Zeile entfernen, wo es "GUITH" geschrieben ist, wie entfernen Sie diese Zeile und über Zeilen, bis Sie ein anderes '>'
Zeichen finden?
fasta
Datei:
>B4KSI7_DROMO
RGLKRKPMALIKKLRKAKKEAPPNEKPEIVKTHLRNMIIVPEMTGSIIGVYNGKDFGQVE
VKPEMIGHYLGEFALTYKPVKH
>O46898_GUITH
RSLSKGPYIAAHLLKKLNNVDIQKPDVVIKTWSRSSTILPNMVGATIAVYNGKQHVPVYI
SDQMVGHKLGEFSPTRTFRSH
>Q7RT13_PLAYO
RGIDKKAKSLLKKLRKAKKECEVGEKPKPIPTHLRNMTIIPEMVGSIVAVHNGKQYTNVE
IKPEMIGYYLGEFSITYKHTRH
fasta
Datei, nachdem sie mit bash Filterung:
>B4KSI7_DROMO
RGLKRKPMALIKKLRKAKKEAPPNEKPEIVKTHLRNMIIVPEMTGSIIGVYNGKDFGQVE
VKPEMIGHYLGEFALTYKPVKH
>Q7RT13_PLAYO
RGIDKKAKSLLKKLRKAKKECEVGEKPKPIPTHLRNMTIIPEMVGSIVAVHNGKQYTNVE
IKPEMIGYYLGEFSITYKHTRH
Es gibt eine andere Version der Frage, aber härter Manipulation. Angenommen, Sie haben eine Datei mit Artnamen haben:
species.txt
:
DROMO;
PLAYO;
Und Sie wollen Linien in der fasta Datei löschen, in denen Arten im species.txt Dokument nicht vorhanden sind. So erhalten Sie die gleiche Ausgabe wie oben, aber Sie erhalten die Zeilen zu löschen, dank einer anderen Datei (nicht 'GUITH'
direkt eingeben). Was wäre der beste Weg, das zu tun?
Haben Sie versucht, etwas? – 123
Ich habe versucht mit Python, das funktioniert, aber es ist nicht optimiert. Und mit bash habe ich etwas mit "sed" probiert, konnte aber nichts finden, was funktionieren würde. – Natha