Lassen Sie uns sagen, dass wir HTML so (sorry, ich weiß nicht, wie zum Kopieren und Einfügen Seite Informationen und das ist in einem Intranet):BeautifulSoup: Extrahieren Attribut für verschiedene Elemente
Und Ich möchte den hervorgehobenen Teil für alle Fragen erhalten (dies ist wie eine Stapelüberlaufseite). EDIT: sein klarer, was mich interessiert ist, eine Liste erhalten, die hat:
['question-summary-39968',
'question-summary-40219',
'question-summary-42899',
'question-summary-34348',
'question-summary-32497',
'question-summary-35308',
...]
Jetzt weiß ich, dass eine Arbeitslösung eine Liste Verständnis ist, wo ich tun konnte:
[item["id"] for item in html_df.find_all(class_="question-summary")]
Aber das ist nicht genau das, was ich will. Wie kann ich direkt auf question-summary-41823
für den ersten Artikel zugreifen?
Was ist der Unterschied zwischen soup.select
und soup.get
?
In seiner jetzigen Form löschen, es ist nicht, was Sie‘ Ich versuche zu wählen. 'supp.select()' funktioniert perfekt mit 'CSS' Selektoren. Alle '.question-summary' mit einer' id' => 'supp.select (". Question-summary [id] ")' –
Wie ist das Listenverständnis nicht genau das, was Sie wollen? Muss das Ergebnis anders bestellt werden? – Ryan
Nein, das Listenverständnis gibt mir eine Liste, die für meine Zwecke gut funktionieren wird. Ich versuche nur, BeautifulSoup besser zu verstehen und wie ich direkt auf etwas wie 'question-summary-41823' zugreifen kann. Ist das nicht möglich? – vashts85