Wo ist der Fehler? Ich möchte meinen Text ohne Tags analysieren.AttributeError: 'ResultSet' Objekt hat kein Attribut 'find_all'
from bs4 import BeautifulSoup
import re
import urllib.request
f = urllib.request.urlopen("http://www.championat.com/football/news-2442480-orlov-zenit-obespokoen---pole-na-novom-stadione-mozhet-byt-nekachestvennym.html")
soup = BeautifulSoup(f, 'html.parser')
soup=soup.find_all('div', class_="text-decor article__contain")
invalid_tags = ['b', 'i', 'u', 'br', 'a']
for tag in invalid_tags:
for match in soup.find_all(tag):
match.replaceWithChildren()
soup = ''.join(map(str, soup.contents))
print (soup)
Fehler:
Traceback (most recent call last):
File "1.py", line 9, in <module>
for match in soup.find_all(tag):
AttributeError: 'ResultSet' object has no attribute 'find_all'
Sie ersetzt ' Suppe "mit einem Resultset:' suppe = supp.find_all ('div', Klasse _ = "text-decor article__contain") '. Ein Resulset ist einfach eine Liste mit einem zusätzlichen Verweis auf das ursprüngliche Suppenobjekt. Es ist mir nicht klar, warum Sie das 'BeautifulSoup'-Objekt durch ein Resultset ersetzen. Wenn Sie eine geschachtelte Suche durchführen möchten, verwenden Sie einen [CSS-Selektor] (https://www.crummy.com/software/BeautifulSoup/bs4/). doc/# css-selectors). –
Sie möchten auch [Ausgabeformatierung] (https://www.crummy.com/software/BeautifulSoup/bs4/doc/#output) betrachten, die Objekte nicht auf Zeichenketten abbilden. –