Ich versuche, von dieser Webseite (http://www.basketball-reference.com/teams/CHO/2017.html) alle Elemente zu extrahieren, die der Tabelle (Team Misc) entsprechen.Python crawl Tabellenelemente
Ich möchte von „Team“ alle Zahlen extrahieren - (diese Zeile: 17 13 2,17 -0,51 1,66 106,9 104,7 96,5 .300 .319 .493 10,9 20,5 .228 .501 11,6 79,6 .148 Spectrum Center 269 , 47)
import urllib2
from bs4 import BeautifulSoup
htmla = urllib2.urlopen('http://www.basketball-reference.com/teams/CHO/2017.html')
bsObja=BeautifulSoup(htmla,"html.parser")
tables = bsObja.find_all("table")
Ich habe den obigen Code versucht, in der Hoffnung, dass ich eine Liste aller Tabellen erhalten und dann die richtige wählen werde. Aber egal wie ich es versuche, ich bekomme nur 1 Tisch von dieser Seite.
Irgendwelche Ideen zu einem anderen Ansatz?
Bitte fügen Sie dieses Bild direkt in Ihre Frage ein, anstatt eines Links, der jederzeit unterbrochen werden könnte. – ettanany
Diese Seite enthält alle Daten im HTML-Format, wird jedoch als Kommentare ausgeblendet und verwendet JavaScript, um sie anzuzeigen. Aber Sie können 'BeautifuSoup' verwenden, um diese Kommentare zu finden, entfernen Sie' 'und verwenden Sie das Ergebnis mit' BeautifuSoup', um Daten zu erhalten. Ich denke, dass dieses Problem in einer Frage vorher gelöst wurde. – furas