2017-09-02 1 views
1

ich zu entschlüsseln und ascii bin versucht, die mit String kombiniert wirdWie ascii mit String in Python kombiniert dekodieren

Beispiel

g&#108bo&#115w&#111&#114t&#104 

aber ich bin nicht genau Ausgabe

bekommen
'g&#108bo&#115w&#111&#114t&#104'.decode("ascii") 

Ausgabe

u'g&#108bo&#115w&#111&#114t&#104' 

wenn u Dieses Zeichen & # entfernen und versuchen, nur mit ganzen Zahlen bekomme ich diese

>>> chr(108) 
'l' 
>>> chr(115) 
's' 
>>> chr(111) 
'o' 
>>> chr(114) 
'r' 
>>> chr(104) 
'h' 

erwartete Ausgabe

glbosworth 

Wie kann ich entschlüsseln diese ein „g & # 108bo & # 115W & # 111 & # 114t & # 104 "zum erwarteten Ausgang

+2

wie ein String Art Looks mit seltsamen HTML-Entitäten 'html.unescape zufällig entkommen ('g & # 108bo & # 115W & # 111 & # 114t & # 104 ') 'return'' glbosworth'' –

Antwort

0
  • auf python3 beantworten. 6.x können Sie html.unescape verwenden:

    import html 
    print(html.unescape('g&#108bo&#115w&#111&#114t&#104')) 
    
  • auf Python 2.x können Sie verwenden HTMLParser:

    from HTMLParser import HTMLParser 
    h = HTMLParser() 
    print(h.unescape('g&#108bo&#115w&#111&#114t&#104')) 
    
+0

versuchen Python 2.x funktioniert nicht ich bekomme dieses Ergebnis g & # 108bo & # 115w & # 111 & # 114t & # 104 – Mounarajan

0

Sie versuchen, html escaped string zu decodieren. Sie können die html.unescape(s) Funktion verwenden, dies zu tun (auf python3):

import html 
print(html.unescape('g&#108bo&#115w&#111&#114t&#104')) 

Ausgänge:

'glbosworth' 

bei this einen Blick so für weitere Informationen

+0

alle Optionen für Python 2.7 – Mounarajan

+0

Ich habe dies aus HTMLParser versucht HTMLParser importieren h = HTMLParser() Drucken (h.unescape ('g & # 108bo & # 115w & # 111 & # 114t & # 104 ')), aber bekommen unterschiedliche Ergebnisse "g & # 108bo & # 115w & # 111 & # 114t & # 104 " – Mounarajan

+0

können Sie bs4 – ShmulikA

Verwandte Themen