2013-08-28 12 views
5

Ich suche die in voller Größe Produktbilder von hereBeautifulSoup - Wie Bilder zu öffnen und laden Sie sie

Mein Denken zu greifen war:

  • Folgen Sie der Bildlink
  • das Bild herunterladen
  • Zurück
  • Wiederholen für n + 1 Bilder

Ich weiß, wie man die Bildminiaturen öffnet, aber nicht, wie man die Bilder in voller Größe bekommt. Irgendwelche Ideen, wie das gemacht werden könnte?

Antwort

13

Diese erhalten Sie alle URL der Bilder erhalten:

import urllib2 
from bs4 import BeautifulSoup 

url = "http://icecat.biz/p/toshiba/pscbxe-01t00een/satellite-pro-notebooks-4051528049077-Satellite+Pro+C8501GR-17732197.html" 
html = urllib2.urlopen(url) 
soup = BeautifulSoup(html) 

imgs = soup.findAll("div", {"class":"thumb-pic"}) 
for img in imgs: 
     print img.a['href'].split("imgurl=")[1] 

Ausgang:

http://www.toshiba.fr/contents/fr_FR/SERIES_DESCRIPTION/images/g1_satellite-pro-c850.jpg 
http://www.toshiba.fr/contents/fr_FR/SERIES_DESCRIPTION/images/g4_satellite-pro-c850.jpg 
http://www.toshiba.fr/contents/fr_FR/SERIES_DESCRIPTION/images/g2_satellite-pro-c850.jpg 
http://www.toshiba.fr/contents/fr_FR/SERIES_DESCRIPTION/images/g5_satellite-pro-c850.jpg 
http://www.toshiba.fr/contents/fr_FR/SERIES_DESCRIPTION/images/g3_satellite-pro-c850.jpg 

Und dieser Code ist für das Herunterladen und Speichern dieser Bilder:

import os 
import urllib 
import urllib2 
from bs4 import BeautifulSoup 

url = "http://icecat.biz/p/toshiba/pscbxe-01t00een/satellite-pro-notebooks-4051528049077-Satellite+Pro+C8501GR-17732197.html" 
html = urllib2.urlopen(url) 
soup = BeautifulSoup(html) 

imgs = soup.findAll("div", {"class":"thumb-pic"}) 
for img in imgs: 
     imgUrl = img.a['href'].split("imgurl=")[1] 
     urllib.urlretrieve(imgUrl, os.path.basename(imgUrl)) 
+0

anderer Some Elemente auf dieser Site haben keine Bilder mit voller Auflösung (die Bilder wurden verschoben oder gelöscht). Also nur Option dafür ist, Thumbnails herunterladen – ton1c

+0

Hallo ton1c hast du eine Karriere Profilseite? – Ninja2k

Verwandte Themen