2016-07-01 7 views
0

Ich möchte dies ausführen und den gesamten Text aus den Titeln und href-Attributen erhalten. Der Code läuft, und ich bekomme alle benötigten Daten, aber ich möchte die Ausgaben einem Array zuweisen, und wenn ich versuche, dies zu tun, gibt mir nur die letzte Instanz der Attribute im HTML wahr.Wie kann ich mithilfe von Python Web-Scrapping-Ausgaben einem Array zuweisen?

from bs4 import BeautifulSoup 
import urllib 

r = urllib.urlopen('http://www.genome.jp/kegg-bin/show_pathway?map=hsa05215&show_description=show').read() 
soup = BeautifulSoup((r), "lxml") 
for area in soup.find_all('area', href=True): 
    print area['href'] 
for area in soup.find_all('area', title=True): 
    print area['title'] 

Wenn es hilft, mache ich das, weil ich später eine Liste mit den Daten erstellen werde. Ich fange gerade an zu lernen, deshalb werden zusätzliche Erklärungen sehr geschätzt.

Antwort

1

Sie müssen ist comprehensions l verwenden:

links = [area['href'] for area in soup.find_all('area', href=True)] 
titles = [area['title'] for area in soup.find_all('area', title=True)] 
Verwandte Themen