Ich habe Probleme mit Scraping profootball-reference.com. Ich versuche auf die "Team Offensive" -Tabelle zuzugreifen, kann aber nicht auf die Div/Tabelle zielen. Das Beste, was ich tun kann, ist:BeautifulSoup webscraper issue: kann bestimmte Divs/Tabellen nicht finden
soup.find('div', {'id':'all_team_stats})
, die die Tabelle nicht zurück, noch ist es sofort div-Wrapper. Die folgenden Versuche zurückgeben „None“:
soup.find('div', {'id':'div_team_stats'})
soup.find('table', {'id':'team_stats'})
ich schon abgeschabt verschiedene Seiten einfach durch:
soup.find('table', {'id':'table_id})
aber ich kann nicht herausfinden, warum es nicht auf dieser Seite arbeiten. Unten ist der Code, mit dem ich gearbeitet habe. Jede Hilfe wird sehr geschätzt!
from bs4 import BeautifulSoup
import urllib2
def make_soup(url):
page = urllib2.urlopen(url)
soupdata = BeautifulSoup(page, 'lxml')
return soupdata
def get_player_totals():
soup = make_soup("http://www.pro-football-reference.com/years/2015/")
tableStats = soup.find('table', {'id':'team_stats'})
return tableStats
print get_player_totals()
EDIT:
Vielen Dank für all die Hilfe jeder. Beide der unten aufgeführten Lösungen waren erfolgreich. Sehr geschätzt!
Die Tabelle ist auskommentiert. – Jan
Direkt unter dem auskommentierten Abschnitt befinden sich einige Divs in div.table_outer_container.mobile_table mit den Klassen div_team_stats_clone und div_team_stats, die die Tabelle haben, die ich brauche. Sind diese divs versteckt oder so? –
Als ich in der Seitenquelle nachgesehen habe, habe ich nur ein div namens all_team_stats gefunden, das extrahiert werden kann. –