Parsing für Text in Tabelle funktioniert nicht

Ich versuche, den folgenden Text in den Tags zu erhalten.Parsing für Text in Tabelle funktioniert nicht

<td align="center" valign="top">I AM TRYING TO GET THIS</td>

diese in einer Tabelle ist, und dieser bestimmte Text ist eine bestimmte Zeile und Spalte, ich versuche, dies mit dem Rest der Säule miteinander auszukommen.

Ich habe die für Schleifen versucht, und ich versuchte, dies auch:

r = driver.get("url") 

htmltext = htmlfile.read() 

regex = '<td align="center" valign="top">(.+?)</td>' 

pattern = re.compile(regex) 

grade = re.findall(pattern,htmltext) 

print(grade)

Ich würde es vorziehen BS4 Weg, es zu tun.

Quelle

2016-11-20 KingPey

'requests' ist nicht für HTML-Analyse, sondern für das Senden von Daten arbeiten. – furas

BeautifulSoup: 'für x in supp.find_all ('td'): drucken (x.text.strip())' – furas

htmltext = htmlfile.read()? Woher kam diese Datei? vielleicht ist es r.read() –

ich es nicht kontrollieren kann, aber es sollte

import requests 
from bs4 import BeautifulSoup 

url = 'http://www.w3schools.com/html/html_tables.asp' 

r = requests.get(url) 

soup = BeautifulSoup(r.text, 'html.parser') 

for x in soup.find_all('td'): 
    print(x.text.strip())

Quelle

2016-11-20 14:52:50 furas

Ich bekomme diesen Fehler: AttributeError: 'NoneType' -Objekt hat kein Attribut 'text' – KingPey

Es bedeutet, dass Sie kein Element auf der Seite finden, aber Sie 'text' verwenden - also versuchen Sie' None' .text' – furas

Aber das Element ist da? Können Sie Ihre Antwort bearbeiten, um das Problem zu beheben? weißt du wie? – KingPey

Parsing für Text in Tabelle funktioniert nicht

Antwort

Verwandte Themen