Ich verwende die folgende Regex, um den Wert src
des ersten Tags img
in einem HTML-Dokument zu erhalten.Regex, um src-Wert von einem img-Tag zu erhalten
string match = "src=(?:\"|\')?(?<imgSrc>[^>]*[^/].(?:jpg|png))(?:\"|\')?"
Jetzt erfasst es insgesamt src
Attribut, das ich nicht brauche. Ich brauche nur die URL innerhalb des src
Attributs. Wie es geht?
er ist nicht auf der Suche nach HTML zu analysieren, sondern einfach einen Wert aus einer einzigen Art von Tag in HTML zu extrahieren. Regexes zeichnen sich in dieser Hinsicht aus. –
@eqbridges: Die Tatsache, dass die Regex, die er sich ausgedacht hat, so kompliziert ist, ist ein Hinweis darauf, dass es der falsche Weg ist, das Problem anzugehen. Dann gibt es die Tatsache, dass es nicht alle möglichen Werte für die src Attribute (dh diejenigen mit 'oder ") übereinstimmen. Analysieren Sie HTML/XML nicht auf diese Weise! Tun Sie es nicht! – Welbog
@Welbog - wenn er Ich brauche nur einen Wert von der img src, ich stimme dem nicht zu: Ein HTML-Parser für eine Aufgabe wie diese ist zu viel. Wenn er etwas besonders Komplexes tun muss, würde ich eher zustimmen. –