Ich versuche, bestimmte Klassen aus mehreren URLs zu extrahieren. Die Tags und Klassen bleiben gleich, aber ich brauche mein Python-Programm, um alle zu kratzen, da ich gerade meinen Link eingib.Kratzen mehrere URLs mit schönen Suppe
Hier ist eine Probe meiner Arbeit:
from bs4 import BeautifulSoup
import requests
import pprint
import re
import pyperclip
url = input('insert URL here: ')
#scrape elements
response = requests.get(url)
soup = BeautifulSoup(response.content, "html.parser")
#print titles only
h1 = soup.find("h1", class_= "class-headline")
print(h1.get_text())
Diese für einzelne URLs funktioniert, aber nicht für eine Charge. Danke für die Hilfe. Ich habe viel von dieser Gemeinschaft gelernt.
ich diesen Fehler: Traceback (jüngste Aufforderung zuletzt): File "/Users/Computer/Desktop/test.py", Zeile 7, in Urls = Eingang [ 'https: //website.com/link1','https://website.com/link2 '] TypeError:' builtin_function_or_method'-Objekt ist nicht unterscheidbar –
Werden Sie die Eingabe jeder URL vom Benutzer nehmen? Wenn nein, dann lege einfach alle URLs in die Liste, wie in meiner Antwort gezeigt. Setzen Sie die Liste nicht in die Eingabemethode. – falloutcoder
Ich dachte an Eingabe von Benutzer getrennt durch Zeilen? –