schrieb ich die folgende Codezeile
Python Daten Scrapper
#!/usr/bin/python
#weather.scrapper
from bs4 import BeautifulSoup
import urllib
def main():
"""weather scrapper"""
r = urllib.urlopen("https://www.wunderground.com/history/airport/KPHL/2016/1/1/MonthlyHistory.html?&reqdb.zip=&reqdb.magic=&reqdb.wmo=&MR=1").read()
soup = BeautifulSoup(r, "html.parser")
table = soup.find_all("table", class_="responsive airport-history-summary-table")
tr = soup.find_all("tr")
td = soup.find_all("td")
print table
if __name__ == "__main__":
main()
Wenn ich die Tabelle drucke ich die alle html erhalten (td, tr, spanne, etc.) als auch. Wie kann ich den Inhalt der Tabelle (tr, td) ohne HTML drucken?
DANKE!
der Tat sind Sie schreiben über Technisch Delegierten festgehalten in der Tabelle. aber wenn ich versuche 'tr = table.find ('tr')' Ich bekomme den folgenden Fehler: 'AttributeError: 'ResultSet' Objekt hat kein Attribut 'find'' – malina
Weil es eine Liste ist. Wenn Sie nur eine Tabelle in HTML haben, müssen Sie supp.find ('table' .... anstelle von soup.find_all ('table .... –
) Aber im gesamten HTML gibt es mehr Tabellen, die ich festlege meine Suche nach einer Klasse Ich bin nicht ganz sicher, was du meinst ... – malina