ersetzen oder entfernen Ich verarbeite HTML mit Python und die BeautifulSoup 4-Bibliothek, und ich kann keinen offensichtlichen Weg finden,
durch ein Leerzeichen zu ersetzen. Stattdessen scheint es in ein nicht-brechendes Unicode-Leerzeichen konvertiert zu werden.Wie kann ich HTML-Entitäten wie " " mit BeautifulSoup 4
Fehle ich etwas offensichtlich? Was ist der beste Weg, um & nbsp zu ersetzen? mit einem normalen Raum mit BeautifulSoup?
Bearbeiten, um hinzuzufügen, dass ich die neueste Version BeautifulSoup 4 verwende, so dass die Option convertEntities=BeautifulSoup.HTML_ENTITIES
in Beautiful Soup 3 nicht verfügbar ist.
Aber es * ist * ein nicht-brechender Raum ... –
Ja ich realisiere ist ein nicht brechender Raum. Sie sagen also, das Richtige ist, das gewünschte HTML-Snippet zu erhalten und dann eine Unicode-Suche zu starten und zu ersetzen? Ich denke, das macht, was ich will, ich dachte nur, es gäbe ein Äquivalent zur alten Option convertEntities. –