Ich muss einen Web-Crawler in Python schreiben. Ich weiß nicht, wie man eine Seite analysiert und die URLs aus HTML extrahiert. Wohin soll ich gehen und studieren, um ein solches Programm zu schreiben?Wie URLs von einer HTML-Seite in Python zu extrahieren
Mit anderen Worten, gibt es ein einfaches Python-Programm, das als Vorlage für einen generischen Web-Crawler verwendet werden kann? Idealerweise sollte es Module verwenden, die relativ einfach zu verwenden sind und viele Kommentare enthalten sollten, um zu beschreiben, was jede Codezeile macht.