Ich versuche, die folgende Website-URL-Suchmaschine zu kratzen. Ich bekomme jedoch nur einen Bruchteil des Inhalts zurück.Scraping Website-Suchmaschine mit BeautifulSoup
from urllib.request import urlopen as uReq
from bs4 import BeautifulSoup
my_url = 'https://www.kvk.nl/zoeken/#!zoeken&q=ING&index=4&site=kvk2014&start=0'
uClient = uReq(my_url)
page_html = uClient.read()
uClient.close()
# Data pull
page_soup = BeautifulSoup(page_html, "html.parser")
page_soup
gibt ein paar Zeilen href
, und keine der Informationen, die auf der my_url
Seite zur Verfügung steht. Ich bin nur wirklich interessiert an dem ersten Suchergebnis auf der Webseite, also dem vollständigen Namen des Unternehmens: ING Bank N.V., zusammen mit den restlichen Informationen für diese Firma.
Wir können nicht sehen, was Sie bekommen, was Sie erwarten und was fehlt. Können Sie bitte weitere Einzelheiten angeben? – cezar
mehr Details bitte – maestromusica
Die Website enthält Informationen im Suchfeld, die nicht von Beautiful Suppe in der page_soup Objekt aufgenommen wird. Einfach den obigen Code ausführen, der Unterschied ist sofort. –