Schreiben Sie eine Funktion, die eine Webseite öffnet und ein Wörterbuch aller Links und deren Text auf dieser Seite zurückgibt. Ein Link wird durch einen HTML-Tag definiert, der wieFunktion, die eine Webseite öffnet und ein Wörterbuch aller Links und deren Text zurückgibt
< ahref = "http://my.computer.com/some/file.html"> Linktext </a>
Der Link sieht alles ist in Anführungszeichen nach thehref =, und der Text ist alles zwischen dem> und dem. Für das obige Beispiel würde der Eintrag in einem Wörterbuch wie folgt aussehen:
"{" http: // my.computer.com/some/file.html ":" link text ", ...}"
Hier ist mein Code soweit, dass ich für ein paar Stunden festgefahren bin. Wie erreiche ich dieses Problem?
import urllib.request
def Urls(webpage):
url = webpage
page = urllib.request.urlopen(url)
url_list = {}
for line in page:
if '<a href=' in line:
Bitte keine regulären Ausdrücke empfehlen HTML zu analysieren. Es gibt stabile Bibliotheken für diese Aufgabe. –