Ich spalte unter Zeichenfolge mit mehreren Trennzeichen. Trennzeichen sind:String Splitting mit mehreren Trennzeichen Java
String[] tokens = s.split("[!|?|,|.|_|'|@ |\\s]");
Für die Eingabe:
, . @ ? ! _ ' and white space etc.
Unten ist mein Code
Er ist ein sehr, sehr guter Junge, nicht wahr?
nach Split Erwarteter Ausgang: 10-Token
Er
ist
ein
sehr
sehr
gut
Junge
isn
t
er
Aber ich bin unten ouput bekommen: 11 Token
Er
ist
ein
sehr
sehr
gut
Jungeisn
t
er
Da zwei Delimiter Whitespace und Komma nebeneinander liegen, gibt es 11 Token. Wie bekomme ich die erwartete Ausgabe?
erste Sache zuerst..Zeichenklasse ist ODER-Bedingung für Zeichen..so keine Notwendigkeit der Verwendung von '|' in Zeichenklasse – rock321987
Können Sie genauer mit Ihrem "etc." sein in deinen Begrenzern? Welche anderen Zeichen würden Trennzeichen sein? – 4castle
Sie können String-Tokenization auch verwenden. – denis