Ich mache ein bisschen Webscraping und möchte Teile einer Zeichenkette entfernen.Pandas String Replace Error Python
PlayerDataHeadings = soup.select(".auflistung th")
PlayerDataItems = soup.select(".auflistung td")
PlayerData = pd.DataFrame(
{'PlayerDataHeadings': PlayerDataHeadings,
'PlayerDataItems': PlayerDataItems
})
Der obige Code erstellt einen Datenrahmen und funktioniert wie erwartet. In der 'PlayerDataHeadings' Spalte gibt es eine unerwünschte <th>
am Anfang und </th>
am Ende jedes Wertes, den ich entfernen möchte.
Der Code Ich verwende ist:
PlayerData['PlayerDataHeadings'].replace(
to_replace['<th>', ':</th>'],
value='',
inplace=True
)
Diese Rückkehr: als Fehler "Nameerror name 'to_replace' ist nicht definiert".
Irgendwelche Gedanken darüber, wie diese zu beheben oder eine bessere Alternative wäre toll
Dank jezrael, wenn ich dein Beispiel der Code funktioniert laufen, aber wenn ich in meinem Skript ausführen darin die Zeichen ersetzt nicht, sondern auch einen Fehler nicht zurück. Irgendwelche Gedanken oder Ideen, warum? – DenJJ
Schweres Problem ohne Daten finden. Aber es scheint, dass Sie einen Unterschied nicht ersetzen können. Wenn Daten nicht vertrauenswürdig sind, ist es möglich, [pickle] (http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.to_pickle.html) -Datei - 'PlayerData.to_pickle ('file.pkl ') 'und sende es an meine E-Mail in meinem Profil? – jezrael