Ich entwickle ein Python-Skript, um Daten von einer bestimmten Site zu scrappen. Ich benutze Beautiful Soap als Python-Modul. Die interessanten Daten in HTML-Seite sind in dieser Struktur:Python scrape spezifisches Tag ohne Klassennamen
<tbody aria-live="polite" aria-relevant="all">
<tr style="">
<td>
<a href="www.server.com/art/crag">Name<a>
</td>
<td class="nowrap"></td>
<td class="hidden-xs"></td>
</tr>
</tbody>
in Tag tbody gibt es mehr tr-Tag und ich möchte jedem nur erste Tag nehmen eine von Tag td
ich in dieser versucht haben, weg:
page = requests.get(url)
soup = BeautifulSoup(page.content, 'html.parser')
a = soup.find(id='tabella_falist')
b = a.find("tbody")
link = [p.attrs['href'] for p in b.select("a")]
aber auf diese Weise das Skript nehmen alle href in alle td-Tag. Wie kann nur zuerst gehen?
Dank
Welche Leistung erwarten? Ich bin mir nicht sicher über das, was Sie versuchen, zu extrahieren – Arount
Jeder Tag hat einen Tag mit href, aber ich würde nur den href-Wert der ersten Tag nehmen, die keinen Klassennamen haben – APPGIS