2016-11-19 3 views
0

im Sport Resul Spiele von dieser WebsitePhantomJS immer wieder zurückkehren Seite nicht auf einer bestimmten Website

http://www.oddsportal.com

zu erhalten versuchen, gefunden, aber jede gewünschte Adresse von dieser Website, die ich versuche ich mit Seite am Ende nicht

gefunden

während es in meinem eigenen Browser öffnet

hier ist ein Beispielcode

var webPage = require('webpage'); 
var page = webPage.create(); 

page.onConsoleMessage = function(msg) { 
    console.log(msg); 
} 

page.open('http://oddsportal.com', function(status) { 

    page.evaluate(function() { 
    console.log(document.getElementsByTagName('body')[0].innerHTML); 
    }); 
    phantom.exit(); 

}); 

ich weiß nicht, wie sie Phantom js blockieren, und ich habe keine Ahnung, wo zu beginnen .....

gibt es etwas in Phantom js-Header, die sie warnen würde?

i jeden Vorschlag zu schätzen wissen oder Ratschläge, wie kann ich lösen dieses

hier ist, dass Website-Ausgabe

        <a href="http://www.oddsportal.com"> 
             <img src="logo.jpg" /> 
</p> 

            <div id="main" class="home"> 
             <div id="breadcrumb"> 
              <strong>The page you requested is not available.</strong> 
             </div> 
            <hr class="hidden"> 
             <div id="col-content"> 
              <h1>Page not found</h1> 
              <p>This page not exist on OddsPortal.com!</p> 
         </div> 
             <div class="break"></div> 
             <hr class="hidden"> 
            </div> 
            <div id="footer"> 
             <p class="l">Copyright © 2008-12 OddsPortal.com (v)</p> 
             <div class="break"></div> 
         </div> 
+0

Welche Ausgabe oder Fehler sehen Sie nach dem Ausführen Dieses Skript? –

+0

Es ist kein phantomjs Problem, es ist ein Redirect-Problem, wie durch die 301 hier angezeigt: '$ curl --head http://oddsportal.com HTTP/1.1 301 http: // www.oddsportal.com /' Wenn Sie können make phantom folgt dieser Umleitung, es wird den gewünschten Inhalt laden. – meatspace

+0

@StevenSchobert im Grunde eine 404-Seite nicht gefunden errro (ich habe die Ausgabe zu meiner Frage hinzugefügt), gibt es keinen Fehler, ich werde mit dieser Website in Ordnung, es schicken Sie mir einfach zu Seite nicht auf jeder Adresse gefunden – max

Antwort

2

Versuchen Sie, die User-Agent zu ändern page.settings.userAgent mit:

var webPage = require('webpage'); 
var page = webPage.create(); 

page.settings.userAgent = 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/37.0.2062.120 Safari/537.36'; 

//... 

Quelle : PhantomJS Docs

+1

Oder so: 'var page = webPage.create ({Einstellungen: {userAgent: 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, wie Gecko) Chrome/37.0.2062.120 Safari/537.36'}}) ; ' –

Verwandte Themen