So habe ich eine Nokogiri Web kratzen läuft perfekt auf meinem lokalen Rechner.mit einem Proxy mit einer Schiene URL-Link
Wenn ich jedoch versuche, das Web-Scrape in meiner Produktionsumgebung auszuführen, wird ein 403-Fehlercode angezeigt.
Ich glaube, dies ist bis auf die Webseite meine IP meines Servers blockiert (wahrscheinlich, weil frühere Menschen, dass die IP verwenden, haben es blockiert)
Ist es möglich, die nokogiri Anfrage von meinem Web-Server über einen Proxy-Server zu routen ? Wenn ja, wie würde ich darüber gehen?
Dies ist der Code, den ich im Moment habe.
doc = Nokogiri::HTML(open(URL HERE, 'User-Agent' => 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_7_0) AppleWebKit/535.2 (KHTML, like Gecko) Chrome/15.0.854.0 Safari/535.2'))
Woher bekommen Sie den 403? Von den Websites versuchen Sie zu kratzen? – thesecretmaster
In der Tat bin ich, habe ich den Eindruck, dass sie die Server-IP-Adresse blockiert haben, Deshalb habe ich an einen Proxy gedacht –
Können Sie Mechanise und Proxy dafür verwenden? Schauen Sie [hier] (http://stackoverflow.com/questions/18348673/how-do-i-configure-a-ruby-mechanize-agent-to-work-through-the-charles-web-proxy) oder [hier ] (https://gist.github.com/emergent/3983870) –