Ich versuche, eine Web-Seite mit dem folgenden Code zu kratzen: -Schleife für mehrere URLs
import requests
from bs4 import BeautifulSoup
page = requests.get("http://www.realcommercial.com.au/sold/property-offices-retail-showrooms+bulky+goods-land+development-hotel+leisure-medical+consulting-other-in-vic/list-1?includePropertiesWithin=includesurrounding&activeSort=list-date&autoSuggest=true")
soup = BeautifulSoup(page.content, 'html.parser')
links = soup.find_all('a', attrs ={'class' :'details-panel'})
hrefs = [link['href'] for link in links]
for urls in hrefs:
pages = requests.get(urls)
soup_2 =BeautifulSoup(pages.content, 'html.parser')
Date = soup_2.find_all('li', attrs ={'class' :'sold-date'})
Sold_Date = [Sold_Date.text.strip() for Sold_Date in Date]
Address_1 = soup_2.find_all('p', attrs={'class' :'full-address'})
Address = [Address.text.strip() for Address in Address_1]
der obige Code wird in dem hrefs nur die Details von der ersten URL zurück.
['Mon 05-Jun-17'] ['261 Keilor Road, Essendon, Vic 3040']
muss ich die Schleife durch jede URL in hrefs laufen & von jeder URL in hrefs ähnliche Details zurück. Bitte schlagen Sie vor, was ich im obigen Code hinzufügen/bearbeiten sollte. Jede Hilfe würde sehr geschätzt werden.
Dank
Vielen Dank Anubhav, jetzt ist es für mich arbeiten ,, –
können Sie mir bitte auch anleiten, wie kann ich den gleichen Code ausführen für sagen wir 10 oder 20 Seiten auf der gleichen Seite, ohne jedes Mal die Verbindung von jeder neuen Seite zu schaffen, ? –
Wenn es funktioniert dann bitte genehmigen Sie die Antwort, um die Frage zu schließen. –