Ich versuche Split
Worte vor :
Zeichen mit Regex.Python Split-Worte vor ':' Zeichen, aber nicht Zeitstruktur
Allerdings möchte ich nicht split
Zeitstruktur, wie 15:46:00 Uhr.
Alle Informationen, die ich habe, ist in einer for
Schleife, und kommt aus dem Schaben einer PDF-Datei.
so, mit diesem Code:
for item in result:
for key in keyHeaders:
if key in item.encode('utf-8'):
item = item.replace(key, '')
if ':' in item:
item = item.replace(':', ':\n')
Ausgang:
15:
46:
00
State:
NY
Phone:
x-xxx-xxx
Mit regex oder ohne reguläre Ausdrücke wie kann ich split
speziell Worte, aber nicht Zahlen von :
Charakter verbunden.
Ich habe das versucht, aber nichts passiert. Tatsächlich teilt es nichts auf.
for item in result:
for key in keyHeaders:
if key in item.encode('utf-8'):
item = item.replace(key, '')
lines = re.compile(r'(?<!\\d\\d):(?!\\d\\d)') # expect split words before ':'
if item == re.findall(lines, item):
item = item.replace(':', ':\n')
Ausgang:
15:46:00
State:NY
Phone:x-xxx-xxx
Vielen Dank für Ihre Unterstützung!
Wie sieht Ihre ursprüngliche Eingabe aus? Ist es nur '" 15:46:00 Staat: NY Telefon: x-xxx-xxx "'? – wnnmaw
Nicht, es gibt mehrere Elemente, wie 100. Und sie ändern sich je nach Inhalt von PDF. Jedoch sind fast 100% der Wörter vor einem ':' Zeichen. – estebanpdl
Das ist, was mich denken lässt "Regex" könnte eine gute Option sein, sie zu "teilen" – estebanpdl