Ich verwende Python 3.5 und versuchen, eine Liste von URLs zu kratzen (von der gleichen Website), Code wie folgt:Scraping eine Liste von URLs
import urllib.request
from bs4 import BeautifulSoup
url_list = ['URL1',
'URL2','URL3]
def soup():
for url in url_list:
sauce = urllib.request.urlopen(url)
for things in sauce:
soup_maker = BeautifulSoup(things, 'html.parser')
return soup_maker
# Scraping
def getPropNames():
for propName in soup.findAll('div', class_="property-cta"):
for h1 in propName.findAll('h1'):
print(h1.text)
def getPrice():
for price in soup.findAll('p', class_="room-price"):
print(price.text)
def getRoom():
for theRoom in soup.findAll('div', class_="featured-item-inner"):
for h5 in theRoom.findAll('h5'):
print(h5.text)
for soups in soup():
getPropNames()
getPrice()
getRoom()
Bisher wenn ich Suppe drucken, erhalten propNames, getPrice oder getRoom scheinen sie zu arbeiten. Aber ich kann es anscheinend nicht durch jede der URLs gehen lassen und getPropNames, getPrice und getRoom ausdrucken.
Erst seit ein paar Monaten Python lernen, also würde ich bitte einige Hilfe mit diesem bitte sehr schätzen!
Danke für diesen Sebastian Opałczyński, ich werde das an Bord nehmen, versuchen, meinen Kopf drumherum zu bekommen, und Sie das Ergebnis wissen lassen! – Maverick