Kann diese Frage zu verallgemeinert sein, aber ich bin völlig bei diesem fest. Jede Art von Hilfe geschätzt:Von der verketteten Fasta-Datei, wie man einzelnen Bereich der Positionen in jeder Proteinsequenz findet
Ich habe ein Protein FASTA-Datei (protein.txt) wie:
>a
mnspq
>b
rstuvw
>c
mnqa
zu beachten, dass die Länge von A, B und C-Proteine sind 5,6 bzw. 4 (Gesamtlänge = 15)
jetzt habe ich einige zufällige Bereiche (Berechnung extrahiert wird auf Gesamtlänge basiert) und (file1.txt) als sparen:
2-3
4-10
11-14
die Länge jedes Protein (in der gesamten Länge) wie in Protein-Datei zu sehen ist in einer anderen Datei (file2.txt) gespeichert als:
a 1-5
b 6-11
c 12-15
nun von file1 Werten mag ich die file2 Werte ändern und versuchen, für jede Proteinsequenz einzelnen Bereich zu berechnen, Für die oben Eingang, wird der Ausgang sein:
a 2-3,4-5
b 1-5, 6
c 2-5
mit anderen Worten, wenn ich meint alle Sequenzen erste verketten und einige Bereiche von der verketteten Datei derermine, wie kann ich einzelnen Bereich von Positionen in jeder Proteinsequenz finden
Danke
Sollte es nicht 'c 1-3' stattdessen sein? – choroba
upps .. meine Schuld .. Sie haben absolut Recht, Sir .. –