Wie kann ich Links aus dem Text entfernen? Ich denke, dass ich den sed-Befehl verwenden sollte, aber ich kenne keine genaue Syntax. Links aus dem Text entfernen
Antwort
Dies wird alles in .com
oder .org
Endung entfernen:
sed 's/\s\?\w\+\.\(com\|org\)//g' foo.txt
Eingang:
lallalalala blabla.com babababab hehehe.org.
Ausgang:
lallalalala babababab.
EDIT: Hier ist es in POSIX-Standard. Ich habe auch ein paar mehr Zeichen Fällen entsprechen, wo es Sub-Domains oder Protokolle können (http://
)
sed 's/[[:space:]]\?[A-Za-z0-9_\/\:\.-]\+\.\(com\|org\)//g' foo.txt
Beachten Sie auch, dass dies nicht alle möglichen URL Zeichen oder URLs nicht abdeckt, die eine Ressource nach dem Domain-Suffix Referenz (example.com/query?foo=bar
).
Hinweis, dies entfernt auch ein Leerzeichen vor der URL, wenn es existiert. Wenn dies nicht gewünscht ist, entfernen Sie den '\ s \?' Teil. –
Er nimmt auch GNU sed an - nicht unbedingt ungültig, sollte aber so dokumentiert werden, dass er eine nicht standardmäßige Erweiterung verwendet. –
bearbeitet, um POSIX nur Version einzuschließen –
- 1. aus dem Text entfernen
- 2. Entfernen von Wörtern/Zahlen aus dem Text
- 3. Text aus String entfernen
- 4. Entfernen: Hover Farbe aus dem Text ohne die Farbe
- 5. Entfernen Sie den Spaltennamen aus dem Hover-Text
- 6. JavaScript Entfernen von Copyright-Zeichen aus dem Text
- 7. Entfernen von Duplikaten aus mehreren linken Links
- 8. Alle Links aus den Kategorien entfernen
- 9. Wie Diakritika aus Text entfernen?
- 10. Artikel aus dem Warenkorb entfernen
- 11. Impressionen aus dem Text
- 12. Align Text-Links neben Bilder als Links
- 13. Surface aus dem Anwendungsstapel Entfernen
- 14. Zeitstempelfelder aus dem Schema entfernen
- 15. Entfernen Element aus dem Array
- 16. Entfernen aus dem MEF-Container
- 17. Entfernen von JButtons Text nach dem Klicken
- 18. BBcode-Tags aus dem gesamten Spiel entfernen
- 19. Entfernen Sie alles vor dem URL-Text
- 20. Entfernen von ¶ (pilcrow) aus eingefügtem Text
- 21. QRegExp Zeile mit Text aus QString entfernen
- 22. Text aus der Mitte der URL entfernen
- 23. Wie kann ich Text aus XmlNode entfernen?
- 24. extrahieren Text aus tex, entfernen Latex Tags
- 25. Drehtisch; alte Werte aus dem Slicer entfernen
- 26. Text überläuft nach links
- 27. Artikel nicht aus dem Einkaufswagen entfernen
- 28. jQuery, um Text aus der Liste der Links zu ziehen
- 29. Text über dem Bild Scrollen nach links und rechts
- 30. Irgendwelche internen Links aus Wikipedia-XML-Dateien entfernen?
Sie sollten ein Beispiel zeigen, was Sie haben und was Sie wollen. Meinst du HTML-Links? Was möchten Sie mit dem Rest des HTML in der Datei tun? Sie sollten eine Perl- oder Python-Lib oder ein anderes Tool verwenden, das auf die Bearbeitung von HTML spezialisiert ist. Reguläre Ausdrücke sind [nicht ausreichend] (http://stackoverflow.com/q/1732348/26428#1732454). –
mögliche Duplikate von [Links finden und aus HTML entfernen] (http://stackoverflow.com/questions/1784507/find-links-and-remove-them-from-html) –
Mein Text sieht so aus: lallalalala http: //blabla.com babababab http://hehehe.org. – llokely