2017-05-20 2 views
1

Ich habe 2m Zeilen von Uk Postleitzahl Daten, aber einige muppet hat doppelte Leerzeichen in einigen Fällen und einzelne Leerzeichen in anderen verwendet. Ich muss Daten basierend auf der Postleitzahl zusammenführen, so dass es konsistent sein muss.Entfernen Sie doppelte Leerzeichen und ersetzen Sie sie mit einem einzigen in Pandas

Ich kann keinen einfachen Weg finden, dies in Pandas zu tun, aber es fühlt sich an wie es sein sollte. Irgendein Rat?

Vielen Dank

Antwort

5

Sie für pd.Series.str.replace suchen können:

df.postcode = df.postcode.str.replace(' ', ' ') 
+2

Wenn OP will eine beliebige Anzahl von aufeinanderfolgenden Räumen mit einem einzigen ersetzen: 'df.postcode = df.postcode.str.replace ('\ s {2,}', '') ' – MaxU

+0

@MaxU Das ist ein guter Punkt, danke. –

Verwandte Themen