Ich habe keine Dokumentation noch Tutorial dafür gefunden. Gibt es so etwas?Wie benutze ich XPath in Nokogiri?
doc.xpath('//table/tbody[@id="threadbits_forum_251"]/tr')
Der obige Code erhalten mir jede table
, überall, das ein tbody
Kind mit dem Attribut id
gleich "threadbits_forum_251" hat. Aber warum beginnt es mit Doppel //
? Warum gibt es /tr
am Ende? Weitere Informationen finden Sie unter "Ruby Nokogiri Parsing HTML table II".
Kann mir jemand sagen, wie href
, extrahieren id
, alt
, src
usw. Nokogiri mit?
td[3]/div[1]/a/text()' <--- extracts text
Wie kann ich andere Dinge extrahieren?
@Rubens danke. Und du hast recht, ich muss das XPath Tutorial lesen. Ich dachte, es wäre nokorigi doc, das ich lesen müsste ... würdest du wissen, ob es ein Werkzeug gibt, das mir vollen Xpath geben würde, wenn ich auf die html Seite klicke? – Radek
Ich weiß es nicht, aber XPath ist nicht so schwer; Betrachten Sie Ihr Dateisystem und nehmen wir an, dass jeder Ordner ein XML-Element ist; Wenn Sie also Ihren 'system32'-Ordner auswählen, erhalten Sie' \ windows \ system32' path; Ersetzen Sie einfach das '\\' 'durch'/', betrachten Sie Attribute, die mit' @ 'beginnen und Bedingungen durch' [] 'und Sie sind gut zu gehen –
Ich weiß, dies ist eine ältere Antwort, aber der Link zum Xpath-Tutorial ist jetzt gebrochen. Ich denke es sollte jetzt http://www.w3schools.com/xsl/xpath_intro.asp sein – Axiombadger