2009-07-26 2 views
0

Ich habe ein Dokument mit ahref-Links, die ich extrahieren möchte. Der Link, den ich möchte, kann durch einen Teil der URL identifiziert werden, zu der er verlinkt ist. Es gibt andere Links, die ähnlich sind, die ich verwerfen möchte.Verwenden von Ruby und Nokogiri zum Auswählen von ahrefs basierend auf einem Teil der URL

Die URLs der Links Ich möchte haben das Format

http://www.xxxxxxxxxxxxxxxxxxx.com/index.php?showtopic=44&hl=

I = für Links enthalten, die h1 suchen möchten. Ist das möglich?

Antwort

2

Sie können einfach eine normale find auf dem Satz von A-Tags des Dokuments tun.

document.search('a').find {|link| link['href'].include? 'h1='} 
Verwandte Themen