In Python mit der LXML-Bibliothek Wie lese ich eine HTML-Tabellen Td-Werte? Ich habe versucht, die Xpath-Tabelle zu lesen, aber ich kann nicht den richtigen Parameter finden, um die td-Werte zurückzugeben. Danke allen, ich weiß es zu schätzen.Python - Tabelle lesen
import sys
from glob import *
from lxml import etree, html
import requests
#Scan directory (current) and scrape the html files
dirScan = glob('html/*.*')
fileCount = 0
while(fileCount < len(dirScan)):
fileName = dirScan[fileCount]
page = open(fileName)
tree = html.fromstring(page.read())
tables = tree.xpath('//table')
print("Tables:",tables)
seite.html
<table style="width:100%">
<tr align="right"><td>1</td><td>John</td><td>Smith</td>
<tr align="right"><td>2</td><td>Tody</td><td>Miller</td>
</table>
Wissen Sie, wie ein XPath zu benutzen? –
Nicht wirklich, und ich kann keine gute Dokumentation darüber finden. Ich möchte alle td-Werte nach dem tr align = "right" holen, aber ich kann die Syntax nicht richtig machen. – John
http://www.w3schools.com/xml/xpath_intro.asp 'xpath (" // table/tr [@ align = 'rechts']/td ")' –