Ich habe eine Liste von URLs in einer Datei (jede Zeile = andere Domain) Ich möchte (nicht rekursiv) scannen und wählen Sie zwei Muster, die in verschiedenen Zeilen sind. Nach zwei Tagen versucht - mein Kopf dreht ...grep multiline Muster
, dass der wichtige HTML-Teil ist:
<a href="http://subdomain.domain.tld/">Home</a>
</li>
<li>
<a data-uv-trigger='true' href='mailto:[email protected]'>
Ich brauche die Domain (subdomain.domain.tld) und die E-Mail-Adresse wählen (john @ doe.com). Ich kann die Teile in zwei Schritten (wget/sed).
wget -O - -i urls-to-scan-manuell.txt | sed -n "s/\(.*a href=\"\)\(.*\)\(\">Home.*\)/\2/p"
wget -O - -i urls-to-scan-manuell.txt | sed -n "s/\(.*true' href='mailto\)\(.*\)\('>.*\)/\2/p"
Aber ich mag beiden Teile auf einmal holen und schreiben sie in einer Zeile in eine Datei aus, durch ein Leerzeichen (Leerzeichen) getrennt. Es ist die Multiline-Sache mit Sed, die mich verrückt macht.
Bitte: Ich brauche Ihre Hilfe, würden Sie :)
Danke im Voraus, Rainer.
Arf, ich habe ein Rohrsymbol '|' am Ende der 'sed' und vor der' Paste' vergessen. Habe es jetzt hinzugefügt, überprüfe mein Update. – janos