2016-03-21 4 views
1

Hier ist die HTML-Datei, die ich behandeln werde:Python: Extrahieren von Text nach</span> vor <br/>

<span class="pl">Countries:</span> USA <br/> 
<span class="pl">Language:</span> English <br/> 

Und hier ist mein Python-Code:

from bs4 import BeautifulSoup 

record=[] 
soup=BeautifulSoup(html) 
spans=soup.find_all('span') 
for span in spans: 
    record.append(span.text) 

Was ich endlich ist:

Countries: Language: 

Das Ergebnis fehlt einige wichtige Informationen: "USA" und "Englisch" Wie kann ich den Text bekommen?

Antwort

2

Verwenden Sie die .next_sibling Notation:

soup.find("span", text="Countries:").next_sibling 
soup.find("span", text="Language:").next_sibling 
+0

Awesome !!! Vielen Dank!! – KengoTokukawa