6
Ich habe eine Sammlung von HTML-Dateien. Ich möchte sie einzeln nacheinander überarbeiten und den Aufschlag einer bestimmten Klasse bearbeiten. Der Code, den ich bearbeiten mag, ist in der folgenden Form, die folgenden Klassennamen:Austauschen von Tags einer Art mit Tags eines anderen in BeautifulSoup
<td class='thisIsMyClass' colspan=4>
<a id='123' class='thisIsMyOtherClass' href='123'>Put me Elsewhere</a>
Diese mehrmals im selben Dokument mit unterschiedlichem Text anstelle von „Put me Anderswo“ auftreten kann, aber immer die gleiche Klassen.
Ich möchte dies in der Form zu sein, zu ändern:
<font SIZE="3" COLOR="#333333" FACE="Verdana" STYLE="background-color:#ffffff;font-weight: bold;">
<h2>Put Me Elsewhere</h2>
</font>
import os
for filename in os.listdir('dirname'):
replace(filename)
def replace(filename):
tags = soup.find_all(attrs={"thisIsMyClass"})
nicht sicher, wo danach gehen oder wie man mit den Array-Tags umgehen? Jede Hilfe würde sehr geschätzt werden. Danke :)
HTML hat einige Einschränkungen für Kinder in
Antwort
Viel besser und schöner wäre ein Ersatz HTML-String mit einem Platzhalter zu erstellen, finden Sie alle
td
Tags mitthisIsMyClass
Klasse und verwenden.replace_with()
jeweils zu ersetzen:Drucke:
Quelle
2014-12-03 22:12:19 alecxe
Es ist so einfach wie die Zuweisung an die
name
Attribut.Auch die documentation ist dein Freund. Es ist ziemlich umfassend.
Quelle
2014-12-02 03:14:24 ento
Verwandte Themen