2012-07-10 2 views
6

Mögliche Duplizieren:
Decode HTML entities in Python string?Wie kann ich Python verwenden, um HTML-Escape-Zeichen zu ersetzen?

Ich habe einen String mit HTML-Escape-Zeichen wie ", ” und —.

Gibt es in Python-Bibliotheken zuverlässige Möglichkeiten, all diese Escape-Zeichen durch ihre jeweiligen tatsächlichen Zeichen zu ersetzen?

Zum Beispiel möchte ich alle " s mit „s ersetzt

+0

[string.replace] (http://docs.python.org/library/string.html#string.replace) –

+0

Verwendung Schöne Suppe: http: // lxml .de/elementsoup.html – sateesh

Antwort

14

Sie wollen, dass diese verwenden.

from HTMLParser import HTMLParser 
parser = HTMLParser() 
html_decoded_string = parser.unescape(html_encoded_string) 

Ich bin auch eine Menge Liebe für BeautifulSoup sehen

from BeautifulSoup import BeautifulSoup 
html_decoded_string = BeautifulSoup(html_encoded_string, convertEntities=BeautifulSoup.HTML_ENTITIES) 

Auch duplizieren Sie diese vorhandenen Fragen:

Decode HTML entities in Python string?

Decoding HTML entities with Python

Decoding HTML Entities With Python

+1

Wenn Sie wissen, dass es ein Duplikat ist, warum nicht markieren, anstatt zu antworten (anders als rep)? – kapa

+1

Es ist nervig, wenn sich die Leute nicht die Zeit nehmen, nach vorhandenen Antworten auf ihre Fragen zu suchen, besonders in diesem Fall - wenn es so viele exakte Repliken gibt. Allerdings spüre ich manchmal Gemeinsamkeiten. Was wäre, wenn wir die Frage falsch verstanden hätten und es sich wirklich nicht um ein Duplikat handelte? Was ist, wenn ich die Frage beantworte, die eine sinnvolle Konversation/einen Thread ausgelöst hat, der die Frage und die Antwort in eine andere Richtung bringt? Es geht auch nicht wirklich um den Ruf, wenn eine Frage einmal geschlossen oder gelöscht wird, kann die damit verbundene Reputation negiert werden ... –

+1

Ich habe nur versucht, Sie über die allgemein akzeptierten Verhaltensnormen hier auf StackOverflow zu warnen. Wenn Sie sich etwas zu interessieren schienen, würde ich die Meta-Frage nachschlagen, aber ich denke, Sie können es selbst finden, wenn Sie interessiert sind. Ich möchte nicht darüber streiten, ich war nur der Bote, mach es so, wie du es willst :). – kapa

Verwandte Themen