Passende Text in P-Tags in HTML

2009-05-28 6 views 2 likes

Ich möchte den Inhalt in jedem Absatz in HTML mit einem regulären Python-Ausdruck übereinstimmen. Diese Absätze haben immer BR-Tags in ihnen wie so:Passende Text in P-Tags in HTML

<p class="thisClass">this is nice <br /><br /> isn't it?</p>

ich zur Zeit mit diesem Muster:

pattern = re.compile('<p class=\"thisClass\">(.*?)<\/p>')

Dann benutze ich:

pattern.findall(html)

zu finden, die Streichhölzer. Allerdings passt es nur zu zwei von 28 Absätzen, die ich habe, und es sieht so aus, weil diese beiden BR-Tags nicht in ihnen haben und der Rest tut. Was mache ich falsch? Was kann ich tun, um es zu beheben? Vielen Dank!

Quelle

2009-05-28 sotangochips

Antwort

Ich glaube nicht, dass es wegen der <br/> scheitert, sondern weil der Absatz über mehrere Zeilen verteilt ist. Verwenden Sie den DOTALL Modus dieses Problem zu beheben:

pattern = re.compile('<p class=\"thisClass\">(.*?)<\/p>', re.DOTALL)

Quelle

2009-05-28 22:22:03

Oder lieber sollten Sie den Re.DOTALL-Modus verwenden, damit der Punkt auch mit Zeilenumbrüchen übereinstimmt. http://www.regular-expressions.info/python.html –

@Rene, danke, Sie haben Recht meine Antwort behoben –

Vielen Dank für Ihre Antwort! Ich weiß, es ist ein Anfängerfehler;) – sotangochips

Es stellt sich heraus, war die Antwort re.S als Flag einschließen, die das ermöglicht „“ Zeichen, um auch Zeilenumbrüche zu erhalten.

pattern = re.compile('<p class=\"thisClass\">(.*?)<\/p>', re.S)

Das funktioniert perfekt.

Quelle

2009-05-28 22:31:34 sotangochips

Das ist eine Abkürzung zum DOTALL-Modus –

Verwandte Themen

1. Passende Word/Text
2. Passende IDs in BeautifulSoup
3. HTML-Ausgabe in Text
4. Passende Platzhalter in Python
5. Konvertieren von HTML-Text in Plain-Text
6. Regex in Java, Gruppe passende
7. HTML-Formatierung in QML Text
8. HTML-Text in ionischer Liste
9. Seltsame Zeichen in HTML-Text
10. HTML-Tabelle in Text konvertieren
11. Text als HTML in Mustache.js
12. Scroll-Text in HTML CSS
13. Make Text erscheinen in HTML
14. text align in html/css
15. passende Datensätze in awk
16. Passende Spalten in Excel
17. Passende Farben in Eclipse
18. Passende untergeordnete Elemente in XSL
19. HTML TEXT
20. Passender Text in HTML ohne Inhalt des Tags
21. Muster passende Strukturtypen in Scala
22. passende Eigenschaft in Agenda-Ansicht
23. Passende ungenaue Firmennamen in Java
24. passende unähnlich Strings in PHP
25. Passende mehrere IDs in R
26. Passende Registerkarte in Textblöcken mit Regex
27. Holen Sie den markierten Text Position in .html() und .text()
28. wie Text in HTML-Tag filtern jQuery
29. HTML \ rich Text in Drupal Knoten Titel?
30. Erhalten Sie Text in HTML-Kommentar-Tag?