ich eine Pandas df eine Säule, bestehend aus Text wie enthalten:Parse Pandas df Spalte mit regex Extrahieren Teil
String1::some_text::some_text;String2::some_text::;String3::some_text::some_text;String4::some_text::some_text
kann ich sehen:
- Der Anfang des Textes enthält immer die erste Zeichenfolge, die ich extrahieren möchte
- Der Rest der Zeichenfolgen sind zwischen "::" und ";"
Ich möchte eine neue Spalte erstellen enthält:
String1, String2, String3, String4
Alle separed durch ein Komma, aber immer noch in der gleichen Spalte.
Wie wird das Problem behandelt?
Danke für Ihre Hilfe
Ich habe tatsächlich die dtype der Säule und es ist „Objekt“. Ich kann es nicht verschlüsseln, weil es sagt .. "UnicodeEncodeError: 'ascii' Codec kann das Zeichen u '\ xae' nicht an Position 1679 codieren: Ordnungszahl nicht im Bereich (128)" wenn ich versuche: df.column. astyp (str). – xxxvinxxx