Python: Wie Text des ersten Anker-Tages zu finden, mit BeautifulSoup

Ich habe eine HTML-Struktur wie diesePython: Wie Text des ersten Anker-Tages zu finden, mit BeautifulSoup

<p class="title"> 
    <a href="abc.com"> 
    Story 
    </a> 
    <span class="domain"> 
    <a href="xyz.com">comments</a> 
    </span> 
</p>

I Text von ersten Anker-Tag extrahiert werden soll, das heißt Story

Hier ist, wie ich

soup = BeautifulSoup(html, 'html.parser') 
soup.prettify() 
for link in soup.find_all(class_='title'): 
     print link.findNext('a').text

und Ausgabe am Beautifulsoup mit Text von Anker-Tag zu extrahieren

Story 

Comments

Aber ich möchte nur Text der ersten Anker-Tag zu extrahieren, das ist Story. Wie kann ich dies mit BeautifulSoup in Python tun?

Quelle

2016-04-27 Sony Khan

Sie können nur den ersten a Tag zugreifen, indem

tun

print link.a.text

link.a.text.strip()

Quelle

2016-04-27 16:53:18 Pythonista

das zusätzliche Leerzeichen Streifen können Sie tun, indem Verkettungs die find() Anrufe und mit get_text() Methode:

soup.find("p", class_="title").a.get_text(strip=True)

wobei .a äquivalent zu .find("a") in BeautifulSoup ist.

Oder mit einem CSS selector:

soup.select_one("p.title > a").get_text(strip=True)

Quelle

2016-04-27 16:53:43 alecxe

Ich habe diesen Fehler Attribute: ‚NoneType‘ Objekt dann kein Attribut ‚get_text‘ –

@ShoaibAkhtar hat, ist die HTML anders aus, was Ihnen präsentiert. – alecxe

Wenn Sie nur den Text des ersten Anker wollen, dann brauchen Sie nicht find die Klasse.

Sie haben nichts über die class="title" gesagt.

In [9]: html = """ 
<p class="title"> 
    <a href="abc.com"> 
    Story 
    </a> 
    <span class="domain"> 
    <a href="xyz.com">comments</a> 
    </span> 
</p> 
""" 
In [10]: soup = BeautifulSoup(html, "html.parser") 
In [11]: soup.a.text.strip() 
Out[11]: u'Story'

Quelle

2016-04-27 16:56:23

angenommen, über HTML-Struktur wiederholt sich mehrere Male dann wie kann ich erste Anchor-Tag in allen Tag finden, deren Klasse ist "Titel" –

Meine Antwort wird immer die allerersten Anchor-Tag unabhängig von Klassen zu finden. Wenn Sie den ersten Anker innerhalb eines Elements mit einer Klasse haben möchten, sehen Sie sich die anderen Antworten an –

Python: Wie Text des ersten Anker-Tages zu finden, mit BeautifulSoup

Antwort

Verwandte Themen