ich einen Datenrahmen df erstellt, wo ich eine Spalte mit den folgenden Werten haben:Python Pandas Teilstring Spiel
category
20150115_Holiday_HK_Misc
20150115_Holiday_SG_Misc
20140116_DE_ProductFocus
20140116_UK_ProductFocus
I 3 neue Spalten erstellen möchten
category | A | B | C
20150115_Holiday_HK_Misc 20150115_Holiday_Misc HK Holiday_Misc
20150115_Holiday_SG_Misc 20150115_Holiday_Misc SG Holiday_Misc
20140116_DE_ProductFocus 20140116_ProductFocus DE ProductFocus
20140116_UK_ProductFocus 20140116_ProductFocus UK ProductFocus
in Spalte A, ich will herausnehmen "_HK" - Ich denke, ich muss das manuell codieren, aber das ist in Ordnung, ich habe die Liste aller Ländercodes
In Spalte B ist es genau dieser Ländercode
Spalte C, ist Spalte A ohne das Datum am Anfang
Ich versuche so etwas, aber nicht weit.
df['B'] = np.where([df['category'].str.contains("HK")==True], 'HK', 'Not Specified')
Danke
Ich bin wie '.split über einige String-Methoden zu denken()' zum Beispiel – AsheKetchum
Außer Saiten sind nicht alle die gleiche Art und Weise strukturiert, so dass es nicht Sie genau funktioniert, wo Sie will sein. – AsheKetchum