Ich bin ein Python-Neuling, aber habe eine Weile in anderen Sprachen programmiert. Ich habe eine lange Reihe von DNA (Kleinbuchstaben) und AA-Sequenzen (Großbuchstaben). Weiter am Anfang der Datei habe ich einen Proteinnamen in Großbuchstaben. Also sieht meine Datei so aus.So finden Sie den ersten Großbuchstaben in der Zeichenfolge mit Python
PROTEINNAMEatcgatcg ... JFENVKDFDFLK
Ich brauche die ersten nicht-Großbuchstaben in der Zeichenfolge zu finden, damit ich ausgeschnitten dann das Protein Namen. So, was ich von der oben wünschen würde, ist:
atcgatcg ... JFENVKDFDFLK
Ich kann dies mit einer Schleife tun, aber das scheint übertrieben und ineffizient. Gibt es einen einfachen Python-Weg, um es zu tun?
Ich kann alle Großbuchstaben mit re.findall ("[A-Z]", mystring), aber dann würde ich einen Vergleich durchführen müssen, um zu sehen, wo das Ergebnis von der ursprünglichen Zeichenfolge abweicht.
Danke!
lstrip war genau das, was ich brauchte. Arbeitete wie ein Zauber mit meinem anderen Code! – user1357015