Wenn Sie PHP cURL oder file_get_contents verwenden, scheint diese bestimmte Website zu blockieren, die eine Fehlermeldung gibt. Wenn Sie den Benutzer-Agent festlegen, scheint es OK. Auch würde ich es bei Fehlern im HTML durch php-ordentlich laufen lassen.
<?php
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, 'http://www.jamnews.ir/detail/News/742550');
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch,CURLOPT_USERAGENT,'Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.8.1.13) Gecko/20080311 Firefox/2.0.0.13');
$source = curl_exec($ch);
$config = array(
'indent' => true,
'output-xhtml' => true,
'force-output' => true,
'wrap' => 200);
$tidy = new tidy;
$tidy->parseString($source, $config, 'utf8');
$tidy->cleanRepair();
$doc = new DOMDocument();
$doc->loadHTML($tidy);
$finder = new DomXPath($doc);
$title = $finder->query('/html/head/title')->item(0)->textContent;
die($title);
gibt:
جام نیوز :: JamNews - اجازه عربستان به اسرائیل برای حمله به ایران
Wie genau soll es funktionieren? –
@RuslanOsmanov Es gibt nur einen Text zurück (der Titel des Seitentiteltags). – mehdirahimi