2017-11-09 3 views
-1
<div class=" col-md-8"> 
    <strong>3.</strong>&nbsp;&nbsp;&nbsp;&nbsp;For 
    <i>ax</i> 
    <sup>2</sup> + <i>bx</i> + <i>c</i> = 0, 
    which of the following statement is wrong? 
</div> 
<div class="row"> 
    <div class=" col-md-6"> 
    (a) three zeros 
    </div> 
    <div class=" col-md-6"> 
    (b) one zero 
    </div> 
    <div class=" col-md-6"> 
    (c) two zeros 
    </div> 
    <div class=" col-md-6"> 
    (d) none of these 
    </div> 
</div> 

Der obige Code wird für jede Frage und Antwort wiederholt. Ich benutze BeautifulSoup, um Daten abzurufen, ist aber nicht erfolgreich.Wie bekomme ich Text in HTML Tags?

Kann mir jemand helfen, Daten (nur Text und keine HTML-Tags) mit BeautifulSoup abzurufen?

+1

Mögliches Duplikat von https://stackoverflow.com/questions/16206380/python-beautifulsoup-how-to-remove-all-tags-from-an-element? – Polymer

+0

Nein, der von Ihnen angegebene Link ist nicht die richtige Lösung für mein Problem – john

+0

Können Sie bitte eine Beispiellösung bereitstellen? – Polymer

Antwort

1

** Anmerkung, ich das Markup bearbeitet zu schließen, was Sie angegeben **

ich nur einige Code kompiliert und ich kann bestätigen, dass dies die richtige Zeichenfolge ausgibt. Sehen Sie den Code unten:

from bs4 import BeautifulSoup 

string = """<div class=" col-md-8"> 
<strong></strong>Every quadratic polynomial can have at most 
</div> 
<div class="row"> 
<div class=" col-md-6"> 
(a) three zeros 
</div> 
<div class=" col-md-6"> 
(b) one zero 
</div> 
<div class=" col-md-6"> 
(c) two zeros 
</div> 
<div class=" col-md-6"> 
(d) none of these 
</div> 
</div>""" 

soup = BeautifulSoup(string, "html.parser") 
text = soup.get_text().replace("\n", "") 

print(text) 

Dies wird Ausgang

Every quadratic polynomial can have at most (a) three zeros(b) one zero(c) two zeros(d) none of these

Ich bin nicht sicher, ob der genaue Format Sie wollen, so zwicken selbst wird getan werden müssen.

Verwandte Themen