Erfassen von Wörtern durch den Ausschluss einer Nicht-Erfassung Gruppe von sich wiederholenden Worte

ich alles aus der Zeichenfolge unten extrahieren möchten, außer „von“ und „von“:Erfassen von Wörtern durch den Ausschluss einer Nicht-Erfassung Gruppe von sich wiederholenden Worte

von Old Französisch, von Lateinisch unschuldig, von unschuldig - 'nicht schädlich' (basierend auf nocere 'injure').

Das ist mein regex:

(?:from)(.*)(?:,.from)(.*)

Für diese regex, ich Old French, from Latin innocentia und innocent- ‘not harming’ (based on nocere ‘injure’). als Ergebnis erhalten. Wie bearbeite ich mein Regex-Snippet, damit es den erwarteten Bedingungen entsprechen kann, ohne die nicht erfassende Gruppe zu wiederholen?

sollte das Ergebnis sein:

Old French
Latin innocentia
innocent- ‘not harming’ (based on nocere ‘injure’).

Quelle

2016-07-31 Duy Nguyen

In welcher Sprache sind Sie? –

Ich benutze Knoten JS. –

line="from Old French, from Latin innocentia, from innocent- ‘not harming’ (based on nocere ‘injure’)." 
line.split(/, from|from/)

[ '', 
' Old French', 
' Latin innocentia', 
' innocent- ‘not harming’ (based on nocere ‘injure’).' ]

Das könnte nahe genug sein. Versuchen Sie online: https://repl.it/Chp8

Quelle

2016-07-31 00:46:44 TessellatingHeckler

Vielen Dank! –

Sie können einfach eine Regex verwenden, um die Zeichenfolge zu teilen. Dies wird die gleichen Ergebnisse mit einer höheren Geschwindigkeit als die Backtracking Alptraum .* zurückgeben.

könnten Sie diese Regex verwenden (basierend off Ihr), dies zu tun:

(,.)?from

Mehr Informationen über Aufspaltung here zu finden sind.

Quelle

2016-07-31 00:47:18 Laurel

Danke. Ihre Antwort hat mir auch geholfen. Abgesehen von der Split-Funktion. Gibt es keinen Weg, um pure Regex zu verwenden? –

@DuyNguyen Nicht mit normalen JS regex wiederholt Capture-Gruppen. Siehe hier: http://stackoverflow.com/a/3537914/6083675 – Laurel

Erfassen von Wörtern durch den Ausschluss einer Nicht-Erfassung Gruppe von sich wiederholenden Worte

Antwort

Verwandte Themen