Ich versuche, den Titel aus einem Bild zu extrahieren. Ich habe es geschafft, die url
zu extrahieren, aber nicht sicher, wie die Extraktion des Titels des Bildes zu kodieren ist.Python BeautifulSoup Extrahieren von Titile Web Crawler
import requests
from bs4 import BeautifulSoup
def trade_spider(max_pages):
page = 1
while page <= max_pages:
url = 'http://www.gurstree.com.au/s—cars—vans—utes/melbourne/page—' + str(page) + '/c1832013001317'
source_code = requests.get(url)
plain_text = source_code.text
soup = BeautifulSoup(plain_text)
for link in soup.findAll('a', {'class': 'ad—listing_title—link'}):
href = 'http://www.gumtree.com.au/' + link.get('href')
print(href)
page += 1
trade_spider(1)
<a itemprop="url" class="ad-listing__thumb-link" name="1124692138" href="/s-ad/derrimut/cars-vans-utes/2015-toyota-86-coupe-12-month-warranty-/1124692138" data-ref="searchTopAd">
<span id="r-image-TOP_AD-1124692138" title="2015 Toyota 86 Coupe **12 MONTH WARRANTY** Derrimut Brimbank Area Preview" class="j-responsive-image ad-listing__thumb" data-index="1">...</span>
</a>
Die erste Zeile ist die href
aber ich möchte, markiert die title
gemäß dem span
Block von HTML zu bekommen.
Danke!
Code schreiben, anstatt Bild –
kann u url hier hinzufügen? schwer zu bekommen von code image –