Ich bin nicht vertraut mit HTML und Web Scraping mit schönen Suppe. Ich versuche, Titel, Gehälter, Standort und Firmennamen aus verschiedenen Stellenanzeigen zu erhalten. Dies ist mein Code so weit:In der Tat mit schönen Suppe Scrapping
URL = "http://www.indeed.com/jobs?q=data+scientist+%2420%2C000&l=New+York&start=10"
import urllib2
import bs4
from bs4 import BeautifulSoup
soup = BeautifulSoup(urllib2.urlopen(URL).read())
resultcol = soup.find_all(id = 'resultsCol')
company = soup.findAll('span', attrs={"class":"company"})
jobs = (soup.find_all({'class': " row result"}))
obwohl ich die Befehle haben Jobs und Unternehmen zu finden, kann ich nicht den Inhalt bekommen. Ich bin mir bewusst, dass es einen Inhalt Befehl gibt, aber keine meiner Variablen haben dieses Attribut bisher. Vielen Dank!
Dank! Irgendeine Idee, wie man Gehälter schabt? Hier ist, wie es ist verschachtelte: '
'x.find ('nobr')' – furas
versucht, hat nicht funktioniert. – squidvision
Verwandte Themen