Ich versuche, die Beschreibung des chinesischen Zeichens von dieser Website zu extrahieren: http://www.hsk.academy/en/hsk_1Extrahieren von Text aus find_next_sibling(), BeautifulSoup
Beispiel html:
<tr>
<td>
<span class="hanzi"><a href="/en/characters/%E7%88%B1">爱</a></span>
<br/>ài</td>
<td>to love; affection; to be fond of; to like</td>
</tr>
Ich möchte den letzten Text des td-Tag für jede Beschreibung des Charakters in eine Liste eingetragen werden. Derzeit wird mir jedoch das gesamte Tag einschließlich der Tags selbst gegeben. Ich kann den Text nicht finden. Find_next_sibling(): AttributeError: Das Objekt 'NoneType' hat kein Attribut 'text'.
Dies ist mein Code:
for item in soup.find_all("td"):
EnglishItem = item.find_next_sibling()
if EnglishItem:
if not any(EnglishItem in s for s in EnglishDescriptionList):
EnglishDescriptionList.insert(count, EnglishItem)
count += 1
print EnglishDescriptionList
können Sie klarer sein, wie die gewünschte Ausgabe ist. Ich habe die Anweisung nicht verstanden "Ich kann den Text nicht find_next_sibling(): AttributeError: ...." – Sandeep