Ich möchte eine Webseite laden und einige Elemente daraus extrahieren. Ich benutze PHP. Dies ist mein Codefile_get_contents ändert HTML-Tag in PHP
<?php
$html = file_get_contents('www.website.com');
$pokemon_doc = new DOMDocument();
libxml_use_internal_errors(TRUE); //disable libxml errors
if(!empty($html)){ //if any html is actually returned
echo $html;
}
?>
Wenn ich Quellcode www.website.com und HTML vergleichen, die ich loded ich sehe, dass einige Tags geändert. zum Beispiel gibt es
<span class="str">
in www.website.com sorce Code, der
<h5 class="item-subtitle">
in meinem loded html zu
ändert. Was ist der Grund und wie kann ich es korrigieren?
Ich bezweifle, dass sich die Dinge ändern. Was wahrscheinlich passiert, ist die reale Seite hat Javascript, das an der Seite fummelt, die nicht auf Ihrer Seite läuft. Oder die Seite, die erstellt wird, wenn Sie sie richtig verwenden, anstatt sie zu kratzen, basiert auf etwas Servercode und Aktion, die Ihr Schaber – RiggsFolly