Ich muss die Wörter und Sätze in einem Text extrahieren. Zum Beispiel ist der Text:Wie extrahiert man Wörter und Phrasen mit preg_split() in PHP?
Hallo Welt "Japan und China", Amerikaner, Asiaten, "Juden und Christen", und halb-Katholiken, Zeugen Jehovas
Mit preg_split() zurückgegeben werden sollen den folgende:
- Hallo
- Welt
- Japan und China
- Amerikaner
- Asian s
- Juden und Christen
- und
- halb Katholiken
- Jehovas
- Zeugen
Ich brauche die RegEx für das wissen zu arbeiten (oder ist es möglich?). Beachten Sie die Regeln, Phrasen sind in Anführungszeichen eingeschlossen ("). Alphanumerische Zeichen, einfache Anführungszeichen (') und Bindestriche (-) werden als Teil des Wortes betrachtet (deshalb werden" Jehovas "und" Semikatholiken "als ein Wort betrachtet), die Mit Leerzeichen getrennte Leerzeichen werden als einzelne Wörter betrachtet, während andere Symbole, die nicht erwähnt werden, ignoriert werden
Sie '\ S verwenden +', um Striche und Zitate in Betracht gezogen werden. – hjpotter92