Ich habe eine Aufgabe, um rohen Text von HTML-Seite zu bekommen. Nach dem HTML-Parsing erhalte ich eine Zeichenfolge mit vielen '\ n' Symbolen. Wenn ich versuche, es durch leer zu ersetzen, funktioniert die Ersetzungsfunktion nicht. Hier ist mein Code:Warum ersetzen() in python3 funktioniert nicht für lange Zeichenfolge
from bs4 import BeautifulSoup
import urllib
with urllib.request.urlopen('http://shakespeare.mit.edu/lear/full.html') as response:
lear_bytes = response.read()
lear_html = str(lear_bytes)
soup = BeautifulSoup(lear_html, 'html.parser')
lear_txt_dirty = soup.get_text()
lear_txt_clean = str.replace(lear_txt_dirty, '\n', '')
print(lear_txt_clean)
können Sie a [MCVE] erstellen? –
@ Jean-FrançoisFabre nach der Behebung eines Fehlers, dieser Code läuft und zeigt das Problem ... oder nicht ... es ist nicht wirklich ein Problem! – tdelaney
@tdelaney so Python ersetzen Funktion funktioniert? Puh, ich bin so erleichtert. –