Ich versuche ein Array aller Links zu erstellen, die unter der folgenden URL zu finden sind. Wenn Sie page.scan(URI.regexp)
oder URI.extract(page)
verwenden, werden mehr als nur URLs zurückgegeben.eine Webseite nach URLs mit Ruby und Regex scannen
Wie bekomme ich nur die URLs?
require 'net/http'
require 'uri'
uri = URI("https://gist.github.com/JsWatt/59f4b8ce6bbf0c7e4dc7")
page = Net::HTTP.get(uri)
p page.scan(URI.regexp)
p URI.extract(page)