Mein erstes Mal mit biopython. Verzeih mir, wenn das eine grundlegende Frage ist.ungapped Index für Biopython Alignments
Ich möchte Sequenzen eingeben, sie dann ausrichten und in der Lage sein, auf die Indexposition der ursprünglichen Sequenz (ungapped) und die ausgerichtete Sequenz (lückenhaft) zu verweisen.
Meine reale Welt Beispiel ist enolase (Uniprot P37869 und P0A6P9). Das Substrat, das Lysin bindet, ist der Index 392 in E. coli und 389 in B. subtilis. Wenn man eine Muskelausrichtung der beiden durchführt, ist der Index dieses Lysins in der Ausrichtung 394. Ich möchte in der Lage sein, leicht zwischen Lücken und ungapped Indices zu konvertieren.
Beispiel 1: Was ist der ausgerichtete Index von E. coli Rückstand # 392? (Antwort 394 in der ausgerichteten Sequenz).
Beispiel 2 Ich fand einen konservierten Rest in der Ausrichtung bei 394. Wo ist das in der ursprünglichen (ungeteilten) Sequenz? (Antwort 392 in E. coli und 389 in B. subtilis).
>>>cline = MuscleCommandline(input="enolase.txt", out="enolase.aln")
>>>cline()
>>> alignment = AlignIO.read("enolase.aln","fasta")
>>> print(alignment[:,390:])
SingleLetterAlphabet() alignment with 2 rows and 45 columns
AGQIKTGAPSRTDRVAKYNQLLRIEDQLAETAQYHGINSFYNLNK sp|P37869|ENO_BACSU
AGQIKTGSMSRSDRVAKYNQLIRIEEALGEKAPYNGRKEIKGQA- sp|P0A6P9|ENO_ECOLI
>>> print(alignment[:,394])
KK