Ich versuche, Daten von einer Website mit schönen Suppe zu extrahieren, um die HTML zu analysieren. Ich versuche zur Zeit die Tabellendaten aus der folgenden Webseite zu erhalten:Schöne Suppe fehlt einige HTML-Tags Tabelle
ich die Daten aus der Tabelle erhalten möchten. Zuerst habe ich die Seite als HTML-Datei auf meinem Computer speichern (dieser Teil funktioniert gut, ich überprüft, dass ich alle Informationen habe), aber wenn ich versuche, mit dem folgenden Code zu analysieren:
soup = BeautifulSoup(fh, 'html.parser')
table = soup.find_all('table')
cols = table[0].find_all('tr')
cells = cols[1].find_all('td')`
ich nicht bekommen irgendwelche Ergebnisse (speziell stürzt es ab und sagt, dass es kein Element bei Index 1 gibt). Irgendeine Idee von wo es herkommen könnte?
Dank
Funktioniert für mich wie sind Sie sicher, dass Sie die richtige HTML-Datei analysieren? – alecxe
Ich sehe ein Leerzeichen zwischen 'table' und' [0] 'in der 3. Zeile. Auf der anderen Seite hatte ich ein ähnliches Problem früher und ich fand heraus, dass, wenn das HTML viel aufgebohrt ist, Beautiful Soup nicht damit umgehen kann. Ich habe verschiedene 'HTML-Parser' ausprobiert, konnte aber keine Lösung finden. – Leustad
Ich bin mir ziemlich sicher, dass ich die korrekte HTML-Datei analysiere, zumindest wenn ich sie im Editor öffne, sieht es korrekt aus. Über den Platz war es ein Tippfehler, aber nicht in meinem Code vorhanden. – aeboq