Ich verwende Goutte (die Guzzle verwendet) Inhalt und mein Skript zu extrahieren endet mit einem Fehler, obwohl ich in try/catch renne:Kann nicht Ausnahme mit try/catch behandeln
Error: Client error: `GET http://example.com/C42C9CA3` resulted in a `403 Forbidden` response:
<?xml version="1.0" encoding="iso-8859-1"?>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN"
"htt (truncated...)
Diese ist was ich habe:
use Goutte\Client;
$HTTPconfig = [ "curl" => [
CURLOPT_TIMEOUT => 60,
CURLOPT_CONNECTTIMEOUT => 60,
CURLOPT_SSL_VERIFYPEER => false,
],
['http_errors' => false]
];
$HTTPclient = new \Goutte\Client;
$HTTPclient->setClient(new \GuzzleHttp\Client($HTTPconfig));
$HTTPclient->setHeader('user-agent', 'Mozilla/5.0 (Windows NT 6.2; rv:20.0) Gecko/20121202 Firefox/20.0');
try {
$crawler = $HTTPclient->request('GET', $url);
$doc = $crawler->html();
} catch (Exception $e) {
write($e->getMessage());
continue;
}
So dass die Ausgabe nicht von 'write ($ e-> getMessage());'? –
@JonStirling Nein, ich habe später versuchen/fangen und es endet immer noch mit diesem Fehler. – 3zzy
Und es ist definitiv dieser Code, der es verursacht? Ich sehe keinen Grund dafür, dass dies scheitern würde, und höre einfach die Hinrichtung auf. –