ich Pandas Serie (benannt df) in folgendem Format haben:Pandas Serie extractall Fehler
col1
a GEOS 13100
b MATH 13100-MATH 13200
c MATH 19100-19200
d SPAN 10300 or 20300
e EGPT 10101-10102-10103
f MOGK 10100/30100
g PHSC 12600 must be taken before PHSC 12620
ich alle Kurse extrahieren möchten ("[AZ] {4} \ s * \ d {5} "oder" \ d {5} ") aus Spalte1. Die gewünschte Datensatz wird in folgendem Format sein:
col1 col2 col3 col4 col5
a GEOS 13100
b MATH 13100 - MATH 13200
c MATH 19100 - 19200
d SPAN 10300 or 20300
e EGPT 10101 - 10102 - 10103
f MOGK 10100 / 30100
g PHSC 12600 PHSC 12620
ich versuchte
df.col1.str.extract('(([A-Z]{4}\s*\d{5}?)|(\d{5}?)).*?(and|\-|or|\, or|\:|\/|\.|\;|\(|\s?)')
und bekam die erste abgestimmte Muster.
versuchte ich
df.col1.str.extractall('(([A-Z]{4}\s*\d{5}?)|(\d{5}?)).*?(and|\-|or|\, or|\:|\/|\.|\;|\(|\s?)')
bekam aber den folgenden Fehler:
Length of names must match number of levels in MultiIndex.
Wer hat eine Ahnung, was ich tun soll?
können Sie Ihre gewünschte Datensatz aufgeben? – MaxU
Ich habe es gerade gepostet. Vielen Dank! @MaxU – Claudia