2016-05-15 16 views
-1

ich diesen AusdruckWie man einen regulären Ausdruck bekommen

<h3 id="productPageRightSectionTop-authors-h3">de <a id="productPageRightSectionTop-author-lnk" data-id="2316">José Saramago</a>; Ilustração: <a id="productPageRightSectionTop-entidade-lnk">João Caetano</a>&nbsp;</h3> 

habe ich machte diese eine

<h3 id="productPageRightSectionTop-authors-h3">de <a id="productPageRightSectionTop-author-lnk" data-id="[0-9]+">(.+)</a> 

aber wird immer alles und ich will gerade dieser Teil

<a id="productPageRightSectionTop-author-lnk" data-id="2316">José Saramago</a> 

Sie tun habe eine ahnung, wie ich das machen kann?

+0

(http://stackoverflow.com/a/1732454/418066) – Biffen

Antwort

0

Das Problem ist, am Ende der Regex:

data-id="[0-9]+">(.+)</a>

(.+) zu gierig ist und alles danach passen. ändern, dass ein Teil zu:

data-id="[0-9]+">[^<]*</a>

sollte die Auswahl beheben. Der Wähler sollte wie folgt aussehen: [! Sie analysieren nicht HTML mit regex]

<h3 id="productPageRightSectionTop-authors-h3">de <a id="productPageRightSectionTop-author-lnk" data-id="[0-9]+">[^<]*</a>

+0

Sie danken es das Problem gelöst. und es funktioniert erstaunlich. Vielleicht wissen Sie, wie man in der Mitte des Ausdrucks, den wir haben, zum Beispiel% 2F% sucht? – user6236820

+0

Jetzt habe ich diese 'src =" https://images.portoeditora.pt/getresourcesservlet/image?EBbDj3QnkSUjgBOkfaUbsI8xBp%2F033q5Xpv56y8baM5A05y80e0FC%2FSoPzrzcwjT&width=250 "' und ich muss den Link speichern ... wie würdest du es tun? Ich denke, dass es wegen der% ist, dass ich es nicht tun kann, weil ich andere Ausdrücke genau so habe. – user6236820

+0

Um den Link im scr anzupassen, können Sie verwenden: src = "[^"] + "oder wenn Sie es in Variable setzen möchten: src =" ([^ "] +)" – ntotomanov

Verwandte Themen