Ich möchte den Inhalt in jedem Absatz in HTML mit einem regulären Python-Ausdruck übereinstimmen. Diese Absätze haben immer BR-Tags in ihnen wie so:Passende Text in P-Tags in HTML
<p class="thisClass">this is nice <br /><br /> isn't it?</p>
ich zur Zeit mit diesem Muster:
pattern = re.compile('<p class=\"thisClass\">(.*?)<\/p>')
Dann benutze ich:
pattern.findall(html)
zu finden, die Streichhölzer. Allerdings passt es nur zu zwei von 28 Absätzen, die ich habe, und es sieht so aus, weil diese beiden BR-Tags nicht in ihnen haben und der Rest tut. Was mache ich falsch? Was kann ich tun, um es zu beheben? Vielen Dank!
Oder lieber sollten Sie den Re.DOTALL-Modus verwenden, damit der Punkt auch mit Zeilenumbrüchen übereinstimmt. http://www.regular-expressions.info/python.html –
@Rene, danke, Sie haben Recht meine Antwort behoben –
Vielen Dank für Ihre Antwort! Ich weiß, es ist ein Anfängerfehler;) – sotangochips