Ich versuche, eine Website zu analysieren und einige Informationen mit BeautifulSoup.findAll zu bekommen, aber es hat sie alle nicht finden .. Ich verwende python3Schöne Suppe findAll findet sie nicht alle
der Code diese
#!/usr/bin/python3
from bs4 import BeautifulSoup
from urllib.request import urlopen
page = urlopen ("http://mangafox.me/directory/")
# print (page.read())
soup = BeautifulSoup (page.read())
manga_img = soup.findAll ('a', {'class' : 'manga_img'}, limit=None)
for manga in manga_img:
print (manga['href'])
druckt er nur die Hälfte von ihnen ...
danke! das hat funktioniert! :) – Clepto
Wow. Das hat mich davor bewahrt, meinen Kopf mehr auf den Tisch zu schlagen. Woher wussten Sie, dass der LXML-Parser Probleme hatte (außer dem offensichtlichen, dass er nur 18 Zeilen zurückgab). Wie hätte ich wissen sollen, dass dies ein Problem war, abgesehen davon, dass es still die falsche Anzahl an Zeilen hatte? – FuriousGeorge
Erfahrung; hauptsächlich dadurch, dass man den Menschen hier auf SO hilft. –