2017-04-02 2 views
0

Ich habe, was ich für einen sehr dumpfer Parser unten brauche. Ich möchte eine Methode erstellen, die eine URL zu einer HTML-Seite (Beispiel: http://www.dictionary.com/browse/example) als einen Parameter aufnimmt und diesen Parser verwendet, um mir alle Daten anzuzeigen, auf die es trifft. Ich brauche niemanden, der mir die Lösung gibt. Beratung wäre jedoch willkommen. Vielen Dank.Wie kann ich Daten aus einem bestimmten HTML-Link mit html.parser in Python extrahieren?

from html.parser import HTMLParser 

class MyHTMLParser(HTMLParser): 

    def handle_data(self, data): 
     print("Encountered some data :", data) 

parser = MyHTMLParser() 
parser.feed('<html><head><title>Test</title></head>' 
      '<body><h1>Parse me!</h1></body></html>') 
+0

https://docs.python.org/2/howto/urllib2.html#fetching-urls löst es Ihr Problem? –

+0

Das war ziemlich hilfreich. Seit Python 2 gab es jedoch sehr viele Änderungen mit diesem Modul. Ich benutze Python 3.6.1. Wenn Sie neugierig sind, schauen Sie sich meine Lösung unten an. Danke für Ihre Hilfe. –

Antwort

0

Dies ist, wie ich Daten von einer URL endete das Extrahieren, in diesem Fall http://python.org/.

from html.parser import HTMLParser 
from urllib.request import urlopen 

class MyHTMLParser(HTMLParser): 
    def handle_data(self, data): 
     print("Encountered some data :", data) 

parser = MyHTMLParser() 
html = urlopen('http://python.org/') 
thing = html.read() 
parser.feed(thing.decode("utf-8")) 
Verwandte Themen