2017-01-20 3 views
-1

Ich habe Probleme mit dem richtigen Quellcode der Webseite, zum Beispiel. Auf diesem Link, zum Beispiel http://www.ebay.com/sch/Kitchen-Tools-Gadgets/20635/i.html?_from=R40&LH_ItemCondition=3&LH_BIN=1&LH_FS=1&LH_RPA=1&_mPrRngCbx=1&_udlo=&_udhi=50%22&_nkw=slicer&LH_PrefLoc=3&_pgn=2&_skc=200&rt=nc sehe ich anderen Code im Browser und wenn Python es Quellcode bekommen. Ich habe bereits versucht, urllib2Python kann die richtige Seite Quellcode nicht bekommen

usock = urllib2.urlopen(url).read() 
page = BeautifulSoup(usock, "html.parser") 

auch, habe ich versucht PhantomJS und Code wie diese

driver = webdriver.PhantomJS() 
driver.get(url) 
content = driver.page_source 

und mein Programm Schuh mir diesen Code

<li _sp="p2045573.m1686.l13" class="sresult lvresult clearfix li shic" id="item41a7f34546" listingid="281990612294" r="1"> 
<div class="lvpic pic img left" iid="281990612294"> 
<div class="lvpicinner full-width picW"> 
<div class="triangle"></div> 
<div class="urgency"></div> 
<a class="img imgWr2" href="http://www.ebay.com/itm/Philips-Viva-Collection-HR2505-90-Black-OnionChef-2-way-Slicer-GENUINE-NEW-/281990612294?hash=item41a7f34546:g:YJ4AAOSwgApXANo~"> 
<img alt="Philips Viva Collection HR2505/90 Black OnionChef 2-way Slicer GENUINE NEW" class="img" src="http://thumbs.ebaystatic.com/images/g/YJ4AAOSwgApXANo~/s-l225.jpg"/> 
</a> 

und wenn ich auf der Website drücken " Quellcode der Seite anzeigen "

<li id="item3ab2772306" _sp="p2045573.m1686.l74" listingId="252102255366" class="sresult lvresult clearfix li shic" 
    r="1" > 

    <div class="lvpic pic img left" iid="252102255366" > 
      <div class="lvpicinner full-width picW"> 

    <a href="http://www.ebay.com/itm/12-PC-Super-Slicer-Plus-Vegetable-Fruit-Peeler-Dicer-Cutter-Chopper-Nicer-Grater-/252102255366?hash=item3ab2772306:g:B7kAAOSw9r1WA89h" class="img imgWr2"> 
        <img 
         src="http://thumbs.ebaystatic.com/images/g/B7kAAOSw9r1WA89h/s-l225.jpg" class="img" alt='12 PC Super Slicer Plus Vegetable Fruit Peeler Dicer Cutter Chopper Nicer Grater' /> 
       </a> 
      </div></div> 
    <h3 class="lvtitle"><a href="http://www.ebay.com/itm/12-PC-Super-Slicer-Plus-Vegetable-Fruit-Peeler-Dicer-Cutter-Chopper-Nicer-Grater-/252102255366?hash=item3ab2772306:g:B7kAAOSw9r1WA89h" class="vip visited" title="Click this link to access 12 PC Super Slicer Plus Vegetable Fruit Peeler Dicer Cutter Chopper Nicer Grater">12 PC Super Slicer Plus Vegetable Fruit Peeler Dicer Cutter Chopper Nicer Grater</a> 

natürlich könnte es auf ein Suchergebnis abhängen, aber während meines Tests bekomme ich nie das richtige Ergebnis

Antwort

2

Das Problem liegt aufgrund des dynamisch geladenen Codes mit JavaScript. Der von Ihnen erstellte Scraper gibt kein JavaScript aus. Verwenden Sie PhantomJS zusammen mit Selen zur Reparatur.

Verwandte Themen