Ich habe eine große Datendatei und ich muss Zeilen löschen, die in bestimmten Buchstaben enden. HierPython: Wie lösche Zeilen mit bestimmten Zeichen?
ist ein Beispiel für die Datei Ich verwende:
User Name DN
MB212DA CN=MB212DA,CN=Users,DC=prod,DC=trovp,DC=net
MB423DA CN=MB423DA,OU=Generic Mailbox,DC=prod,DC=trovp,DC=net
MB424PL CN=MB424PL,CN=Users,DC=prod,DC=trovp,DC=net
MBDA423 CN=MBDA423,OU=DNA,DC=prod,DC=trovp,DC=net
MB2ADA4 CN=MB2ADA4,OU=DNA,DC=prod,DC=trovp,DC=netenter code here
-Code Ich bin mit:
from pandas import DataFrame, read_csv
import pandas as pd
f = pd.read_csv('test1.csv', sep=',',encoding='latin1')
df = f.loc[~(~pd.isnull(f['User Name']) & f['UserName'].str.contains("DA|PL",))]
Wie kann ich Syntax für reguläre Ausdrücke verwenden, um die Worte zu löschen, die "enden in DA "und" PL "aber stellen Sie sicher, dass ich die anderen Zeilen nicht lösche, weil sie" DA "oder" PL "in ihnen enthalten?
Es sollte die Zeilen löschen und ich mit einer Datei am Ende wie folgt:
User Name DN
MBDA423 CN=MBDA423,OU=DNA,DC=prod,DC=trovp,DC=net
MB2ADA4 CN=MB2ADA4,OU=DNA,DC=prod,DC=trovp,DC=net
Die ersten 3 Zeilen werden gestrichen, weil sie in DA und PL beendet.
Hat eine Regex nicht endswith zu akzeptieren? Ich vermute, es benutzt einen unter der Haube. –
Ich dachte auch, sogar die Docs behaupten, dass das erste Argument ein Muster ist, aber ich konnte es nicht dazu bringen, eine Regex zu erkennen. –
@AndyHayden anscheinend braucht es ein Tupel. –