Ich brauche Hilfe mit einer Regex, die die ersten beiden Wörter am Anfang findet dann nimmt nur die ersten beiden Sätze nach, trotz wie viele Instanzen im Text auftreten.Need Regex nur die ersten beiden Sätze zu nehmen, auch wenn andere Instanzen auftreten
text = "The Smithsonian museum is home to a variety of different art displays. According various reports art appreciation is on the rise. Blah blah blah blah. The Smithsonian museum blah blah blah. Blah blah blah blah."
Mein Code sieht in etwa wie folgt aus:
(re.findall(r"""((The Smithsonian|The Metropolitan)[^\.]*\.[^\.]*\.)""", text))
Dies ist jedoch mehrere Instanzen und nicht nur die ersten beiden Sätze zurückkehrt, und oft gibt es Müll wie „The Smithsonian,“ am Ende . Können Sie bitte helfen? Vielen Dank!
Vielleicht einen Anker verwenden? '^ (The Smithsonian | The Metropolitan) [^.] * \. [^.] * \.' – 4castle
Müssen Sie Wörter wie "Mr." berücksichtigen? oder "Frau"? – Erutan409