Ich versuche, einen Crawler zu machen, der zur Webseite geht und alle Bilder herunterlädt, die auf dieser Seite verfügbar sind. Mein Code sieht wie folgt ausWie bekomme ich die vollständige Verknüpfung eines Bildes mit Python?
import random
import urllib.request
import requests
from bs4 import BeautifulSoup
def get_images(url):
code = requests.get(url)
text = code.text
soup = BeautifulSoup(text)
for img in soup.findAll('img'):
src = img.get('src')
download_image(src)
def download_image(url):
name = random.randrange(1, 100)
image_name = str(name) + ".jpg"
urllib.request.urlretrieve(url, image_name)
get_images("http://www.any_url.com/")
Jetzt werden viele Bilder in der Regel nicht ihre volle URL enthalten in ihrem src
-Tag. Nun, meine Frage ist, wie kann ich die volle URL der Bilder bekommen, damit ich sie herunterladen kann?