Ich habe ein Textdokument und ich versuche, den Text zwischen den Wörtern "Zusammenfassung" und "Schlüsselwörter" (in R) zu bekommen. Dies ist der Code Ich verwende:Regex: Text zwischen zwei Wörtern erhalten (in R)
gsub(".*abstract\\s*|keywords.*", "\\1", string)
Dies ist jedoch nicht, weil irgendwo anders das Wort im Text nicht funktioniert „abstrakt“ aufgetreten, so habe ich es nicht gierig wie folgt aus (hinzugefügt vor? abstract)
gsub(".*?abstract\\s*|keywords.*", "\\1", string)
aber aus irgendeinem Grunde dauert es jetzt den Text zwischen „abstrakt“ und „keywords“ (das ist, was ich will), sondern auch den Text aus dem zweiten „abstrakt“ erscheinen im Text beginnen, den ganzen Weg bis zum Ende. Irgendwelche Ideen?
Mögliche Duplikat [Auszug Informationen innerhalb aller Klammern in R] (http://stackoverflow.com/questions/8613237/extract-info-inside-all-parenthesis-in-r) – Barker