Ich werde Phrasen abrufen, die durch Leerzeichen, Pausen und andere Interpunktionszeichen getrennt sind.UIMA Ruta. Rufen Sie Phrasen auf, die durch WS getrennt sind (Leerzeichen, Unterbrechungen usw.)
Ich habe viel Zeit damit verbracht, herauszufinden, wie das am besten funktioniert.
Option 1. Der einfachste Weg.
DECLARE T1, T2;
"cool rules" -> T1;
"cool rule" -> T2;
Eingang: "123cool Regeln". Ergebnis: T1 und T2 werden ausgelöst;
Option 2. Verwendung von WORDLIST und WORDTABLE.
Let 1.txt Wortliste enthält 2 Reihen:
cool rules
cool
Code für Extraktion ist die folgende
WORDLIST WList = '1.txt';
DECLARE W1;
Document{-> MARKFAST(W1, WList, true, 2)};
Eingang "COOL-Regeln". Ergebnis: nur die erste Zeile wird extrahiert. Ich vermute, dass in diesem Fall geschnittene Regeln nicht ausgelöst werden.
Option 3. Mark Kombination von zwei Token
DECLARE T1;
("cool" "rule") {-> T1};
Eingang: "cool Regeln kühlen Regel 1cool Regel" Ergebnis: 2 Anmerkungen: cool Regel + 1cool Regel. Verlust der Extraktionsgeschwindigkeit in 10 Zeiten.
Option 4. REGEXP passend Vielleicht ist es möglich, solche Muster „cool \\ srule“ passen, aber ich habe keine Ahnung, wie die Art Ausdruck zu definieren. SW * {REGEXP ("cool \\ srule") -> T1} liefert keine Ergebnisse.
Wie Sie sehen, versuche ich eine sehr einfache Aufgabe zu lösen, ist aber noch nicht gelungen. Die Option 3 ist ein wirklich guter Weg, aber der Extraktionsprozess wird 10 Mal langsamer.
Ich muss zugeben, dass ich nicht ganz verstehen, was Sie tun wollen. Der Text des Satzes wichtig? Wie sollte aufgeteilt werden? Der Titel sagt "getrennt durch WS", aber das Beispiel enthält ein Leerzeichen. Kannst du ein Beispiel hinzufügen, unabhängig davon, was du probiert hast? –
Peter, danke für die Antwort. Laut Typhierarchie ist SPACE Kindtyp von WS, oder? – Mike
Ich möchte nur die Reihenfolge der Token extrahieren. Zum Beispiel sollte die Phrase "cool rule" in Texten gefunden werden: "cool rule 1", "etwas coole Regel", "etwas coole Regel!". Aber sollte nicht bei "cool rules" und "1cool rule" gefunden werden. Ist es möglich? Vielen Dank! – Mike