dieser Code unten gefunden Text, der zwischen Tags wie <tag></tag>
finden, aber ich versuche, gefunden für Texte beginnen und Endpositionen zu finden, zum Beispiel dieses Code Ergebnis ist:Java Startpositionen zwischen Tags
[apple, orange, pear]
anstelle dieses Ergebnis möchte ich dieses Ergebnis haben:
[5,9], //apple
[33,38], //orange
[44,47], //pear
Code:
public static void main(String[] args) {
final String str = "<tag>apple</tag><b>hello</b><tag>orange</tag><tag>pear</tag>";
System.out.println(Arrays.toString(getTagValues(str).toArray()));
}
private static final Pattern TAG_REGEX = Pattern.compile("<tag>(.+?)</tag>");
private static List<String> getTagValues(final String str) {
final List<String> tagValues = new ArrayList<String>();
final Matcher matcher = TAG_REGEX.matcher(str);
while (matcher.find()) {
tagValues.add(matcher.group(1));
}
return tagValues;
}
wie kann ich Position von Texten auf diesem Teil des Codes beginnen finden:
while (matcher.find()) {
tagValues.add(matcher.group(1));
}
Sie regex nicht XML parsen verwenden, verwenden Java XML-Parsing-Infrastruktur . –
@ tux-world es ist eine schlechte Praxis, Regex für diese Art von Parsing zu verwenden, verwenden Sie XML-Parsing ist sehr einfach und grundlegendes Konzept von Java –