Falls Sie sich fragen, über die Leistung der verschiedenen Ansätze, hier sind einige Timings:
In [1]: words = [str(i) for i in range(10000)]
In [2]: %timeit replaced = [w.replace('1', '<1>') for w in words]
100 loops, best of 3: 2.98 ms per loop
In [3]: %timeit replaced = map(lambda x: str.replace(x, '1', '<1>'), words)
100 loops, best of 3: 5.09 ms per loop
In [4]: %timeit replaced = map(lambda x: x.replace('1', '<1>'), words)
100 loops, best of 3: 4.39 ms per loop
In [5]: import re
In [6]: r = re.compile('1')
In [7]: %timeit replaced = [r.sub('<1>', w) for w in words]
100 loops, best of 3: 6.15 ms per loop
Wie Sie für solche einfachen Muster sehen können, ist das akzeptierte Listenverständnis das schnellste, aber betrachten Sie t er folgende:
In [8]: %timeit replaced = [w.replace('1', '<1>').replace('324', '<324>').replace('567', '<567>') for w in words]
100 loops, best of 3: 8.25 ms per loop
In [9]: r = re.compile('(1|324|567)')
In [10]: %timeit replaced = [r.sub('<\1>', w) for w in words]
100 loops, best of 3: 7.87 ms per loop
Dies zeigt, dass für kompliziertere Substitutionen ein vorkompilierte reg-exp (wie in 9-10
) sein kann (viel) schneller. Es hängt wirklich von deinem Problem und dem kürzesten Teil des reg-exp ab.
Durch einen Vergleich zwischen dieser Listenverstehensmethode und der Kartenmethode (veröffentlicht von @Anthony Kong) war diese Listenmethode ungefähr 2x schneller. Es ist auch möglich, mehrere Ersetzungen in denselben Anruf einzufügen, z. 'resname = [name.replace ('DA', 'ADE'). ersetzen ('DC', 'CYT'). ersetzen ('DG', 'GUA'). ersetzen ('DT', 'THY') für Name in ncp.resname()] ' –