Ich verwende das Modul BeautifulSoup
, um eine HTML-Datei zu analysieren, von der ich bestimmte Informationen extrahieren möchte. Insbesondere Spielstände und Teamnamen.findAll wird leer für html zurückgegeben
Wenn ich jedoch die findAll
-Funktion verwenden, gibt es kontinuierlich leer für eine Zeichenfolge, die sicherlich innerhalb des HTML ist. Wenn jemand erklären kann, was ich falsch mache, wird es sehr geschätzt. Siehe Code unten.
import urllib
import bs4
import re
from urllib.request import urlopen as uReq
from bs4 import BeautifulSoup as soup
my_url = 'http://www.foxsports.com/mlb/scores?season=2017&date=2017-05-09'
uClient = uReq(my_url)
page_html = uClient.read()
uClient.close()
# html parser
page_soup = soup(page_html, "html.parser")
container = page_soup.findAll("div",{"class":"wisbb_teams"})
print(len(container))
Diese wörtliche, 'wisbb_teams', scheint nicht für' my_url' überhaupt in der HTML zu erscheinen. –
Irgendwas Glück beim Schaben? – Nevermore