Ich habe ein Dataframe wo in einigen Spalten gibt es mehrere Werte, immer durch ,
getrennt.Pandas: Split Colum in n neue Spalten auf Trennzeichen
df = pd.DataFrame([['', 'mariachi', 'mexico, united states'],
['', 'jazz, rap', 'united states'],
['', '', 'spain'],
['jimi hendrix, john lennon', 'rock', ''],
['spirit', '', 'united states'],
['', 'latin', 'united states'],
['', '', ''],
['speak', '', 'mexico, united states']],
columns=['Musician', 'Genre', 'Country'])
Musician Genre Country
1 NaN mariachi mexico, united states
2 NaN jazz, rap united states
3 NaN NaN spain
4 jimi hendrix, john lennon rock NaN
5 spirit NaN united states
6 NaN latin united states
7 NaN NaN NaN
8 speak NaN mexico, united states
Wie kann ich teilen Sie die Spalten n
Spalten mit jeweils nur eine Variable enthält?
zB:
Musician Musician2 Genre Genre2 Country Country2
1 NaN NaN mariachi NaN mexico united states
2 NaN NaN jazz rap united states NaN
3 NaN NaN NaN NaN spain NaN
4 jimi hendrix john lennon rock NaN NaN NaN
5 spirit NaN NaN NaN united states NaN
6 NaN NaN latin NaN united states NaN
7 NaN NaN NaN NaN NaN NaN
8 speak NaN NaN NaN mexico united states
Dank! Dieser Code funktioniert gut. Ich habe jedoch vergessen zu erwähnen, dass es andere Spalten gibt, die nicht getrennt werden sollen. Wie würde man die Spalten spezifizieren, die in diesem Fall verarbeitet werden? – kbecker87
überprüfen Sie bitte die bearbeitete Antwort. – jezrael
Die Beschränkung auf Spalten funktioniert auf diese Weise nicht. Wenn ich nur die Spalten spalte, die ich teilen muss, werden alle anderen Spalten durcheinander gebracht. Die Verwendung des gleichen Df mit einer weiteren Spalte für Testzwecke funktioniert nicht ... – kbecker87