Derzeit crawlen mehrere Website mit mehreren Threads (URL-Verbindung Ansatz) mit nur einer einzigen IP-Adresse und bekam Block von einigen Websites.Java verwenden mehrere IP für Web-Crawl mit Threads
Und wir wollen irgendwie dieses Problem verhindern. Was mich dazu bringt, an unsere virtuelle Maschine mit mehreren IP-Adressen zu denken.
Ich möchte fragen, gibt es eine Möglichkeit in Java, diese lokalen IPs in verschiedenen URL-Verbindungen zu verwenden, die unter verschiedenen Java-Threads laufen?
Ich habe versucht, mit Proxy, aber es scheint nicht funktioniert, weil ich glaube, dass die lokalen IPs nicht Proxy sein sollte. Hier
ist, was ich versucht: Proxy Proxy = new Proxy (Proxy.Type.HTTP, neue InetSocketAddress (InetAddress.getByAddress (ip), 8080));
Eine andere Lösung von Define source ip address using Apache HttpClient funktioniert nicht, da die Funktionen abgeschrieben werden.
Vielen schätzen Sie Ihr Wissen, wenn jemand das gleiche Szenario begegnet.