Ich versuche, ein. Txt-Wörterbuch für alle trisyllabic Wurzeln zu suchen, und dann die übereinstimmenden Roots an eine neue TXT-Datei übergeben. Das fragliche Wörterbuch ist eine Rohtextversion von Heaths Nunggubuyu-Wörterbuch. Wenn ich die Datei in Atom (meinem bevorzugten Texteditor) durchsuche, macht der folgende String eine gute Arbeit, die gewünschten Wurzeln auszusondern und jegliches Material aus den Definitionen unter den Stichwörtern (die mit Leerzeichen beginnen) sowie jeglichem Englisch zu eliminieren Wörter und alle dreisilbigen Strings, die durch Bindestrich oder Gleichheitszeichen unterbrochen sind (was bedeutet, dass sie keine monomorphischen Wurzeln sind). Verzeih mir, wenn es klobig aussieht; Ich bin ein absoluter Anfänger. (‚:‘ In dieser Orthographie, Vokallänge wird mit einer angezeigt.., Und es gibt nur drei Vokale ‚a, i, u‘ Keiner der Stichwörter in Großbuchstaben hat)Regex für prosodisch definierte Wörter: Arbeiten in Atom, aber nicht grep
^\S[^aeiousf]*[aiu:]+[^csfaioeu:\-\=\W]+[aiu:]+[^VNcsfaeiou:\-\=]+[aiu:]+[^VcsfNaeiou:]*\b
Ich brauche aber die übereinstimmende Zeichenfolgen, die an eine neue Datei ausgegeben werden sollen. Wenn ich versuche, dieselbe Zeichenfolge in grep (auf einem Mac) zu verwenden, wird nichts gefunden. Ich benutze die Syntax
grep -o "^\S[^aeiousf]*[aiu:]+[^csfaioeu:\-\=\W]+[aiu:]+[^VNcsfaeiou:\-\=]+[aiu:]+[^VcsfNaeiou:]*\b" Dict-nofrontmatter.txt > output.txt
Ich habe versucht, stundenlang gesucht, um herauszufinden, wie aus Atom regex Dialekt übersetzen grep (Mac), ohne Erfolg. Immer wenn es mir gelingt, Matches zu bekommen, sieht das Ergebnis völlig anders aus als ich es erwarte und was ich von Atom bekomme. Ich habe auch einige scheinbar grep-Tools für Atom angeschaut, aber die Dokumentation ist praktisch nicht existent, so dass ich nicht herausfinden kann, was sie überhaupt tun. Was mache ich hier falsch? Sollte ich eine Alternative zu Grep versuchen?
Nach meiner Erfahrung benötigt Grep Regex Backslash vor Sonderzeichen, um sie zu verwenden. Normalerweise braucht man einen Backslash, um einem Charakter zu entkommen ... Ich habe auch beobachtet, dass bei einigen Unix-Distributionen ... – jraynal