2017-04-19 3 views
0

Ich benutze PDFBox, um den Inhalt einer PDF-Datei zu extrahieren. Danach werde ich mit einer massiven Saite enden.Wie finde ich Teilstrings mit einem bestimmten Muster innerhalb einer Zeichenkette in Java

Nun muss ich alle Teilketten in dieser Zeichenfolge extrahieren, die das Muster XX-XXXX entsprechen (wobei die X eine Zahl oder ein Alphabet sein kann) oder XX YYYY (wobei X ein Alphabet ist, und Y eine Zahl).

Ich versuchte ("([A-Z0-9] {2}) - ([A-Z0-9] {4})"), das XX - XXXX Muster zu entsprechen, aber es gibt mir das nicht zurück erwartete Werte.

+1

"Wie mache ich das?": Lesen Sie über reguläre Ausdrücke, versuchen Sie etwas und wenn es nicht funktioniert, kommen Sie hier zurück, zeigen Sie, was Sie versucht haben und stellen Sie eine spezifische Frage. – Henry

+0

^[A-Z0-9] {2} [-] {1} [A-Z0-9] {4}] * $ Ähnlich kann man auch andere machen – user2173372

Antwort

0

Bitte machen Sie eine kurze Studie über Reguläre Ausdrücke in Java. Danach schauen Sie sich den java.util.regex.Matcher an. Dies hilft sehr bei der Suche nach Text auf der Basis Ihrer Regex. Unten ist ein Link, der Ihnen sehr helfen wird.

Verwandte Themen