Ich versuche, den genauen Text von der HTML-Seite zu erhalten, aber Ausgabetext unterscheidet sich von erwartetem Text. Kein exakter Text von BeautifulSoup
Text auf HTML-Seite
Салнас 14
Text Show von BeautifulSoup
ĐĄĐ°ĐťĐ˝Đ°Ń 14
Mein Code ist
page = BeautifulSoup(url.read(),'html.parser')
page.find(id='tdo_11').text
Html inspizieren Code für das div
<td class="ads_opt" id="tdo_11" nowrap=""><b>Салнас 14</b></td>
ich verstehen mich nicht, was dies verursacht? Sollte ich den verschiedenen Parser verwenden?
Haben Sie versucht, die Textkodierung zu ändern? – Krishh
Sie müssen herausfinden, welche Zeichencodierung die Seite verwendet, z. UTF8. –
Es sieht aus wie ein Codierungsproblem für mich. Haben Sie versucht, den Text mit der Zeichencodierung zu codieren, die die Seite verwendet? – SRC