Ich habe ein Verzeichnis mit> 1000 .html-Dateien, und möchte sie alle für schlechte Links überprüfen - am besten mit der Konsole. Irgendein Werkzeug, das Sie für solch eine Aufgabe empfehlen können?Was wird verwendet, um HTML-Links in einem großen Projekt unter Linux zu überprüfen?
Antwort
Sie können Links aus HTML-Dateien mit Lynx Textbrowser extrahieren. Bash Scripting um dieses sollte nicht schwierig sein.
würde ich checklink (ein W3C-Projekt)
Solange Sie den Benutzeragenten einstellen und Kopfzeilen akzeptieren (um falsche Fehlercodes von Bot-Detektoren zu vermeiden), sollte dies funktionieren. –
Es würde gut aussehen, aber es ist definitiv nicht für so große Projekte gedacht - es gibt keine Möglichkeit, nur kaputte Links aufzulisten, und die Ausgabe für mein Projekt ist * wirklich * groß. –
Versuchen Sie, die webgrep Kommandozeilen-Tools oder, wenn Sie mit Perl, der HTML::TagReader Modul vom selben Autor bequem sind.
Sie wget
verwenden können, zB
wget -r --spider -o output.log http://somedomain.com
am unteren Rand der output.log Datei, wird es zeigen, ob wget
defekte Links gefunden hat. Sie können das mit awk/grep
Eine alternative ** wget ** -Befehlszeile zum Überprüfen auf defekte Links finden Sie in [dieser Antwort] (http://stackoverflow.com/a/15029100/1497596). Beachten Sie außerdem, dass ein Kommentar, den ich zu dieser Antwort hinterlassen habe, einen Link zu ** wget für Windows ** enthält. – DavidRR
- 1. Was entspricht _emit unter Linux?
- 2. Woher weiß ich, welche serielle Schnittstelle unter Linux verwendet wird?
- 3. Verlinkung von libC++ zu CMake-Projekt unter Linux
- 4. Laravel 5.2 Projekt - Deployment unter Linux
- 5. Gibt es eine Möglichkeit, 3G-Verbindung unter Linux zu überprüfen?
- 6. C++ main() in einem großen OOP Projekt
- 7. Stellen Sie ein Qt-Projekt unter Linux
- 8. Verwenden von ANT, um ein .jar in einem sehr großen Projekt zu generieren
- 9. Konvertieren in PDF/A und Überprüfen der Konformität unter Linux
- 10. Wie überprüfen Sie, ob eine Variable in einem Projekt programmgesteuert verwendet wird?
- 11. Wie wird angular-acl in einem Winkelmeteor-Projekt verwendet?
- 12. Wird C# unter Linux laufen
- 13. Was wird verwendet, um JSON-Antworten in einer Befehlszeile zu verarbeiten?
- 14. Karte, was meine Software auf einem Linux-System verwendet
- 15. Was ist der richtige Ort, um Named Pipes unter Linux zu platzieren?
- 16. Herunterladen von großen Dateien mit PHP mit mod_xsendfile unter Linux
- 17. Verwendung von noweb in einem großen Java-Projekt
- 18. Dokumentenverwaltung unter Linux
- 19. Was sollte verwendet werden, um die Identität in C++ zu überprüfen?
- 20. Wie wird der Speicherverbrauch unter Linux protokolliert?
- 21. Welcher Linux-Systemaufruf wird vom Befehl ls in Linux verwendet, um den Ordner-/Dateinamen anzuzeigen?
- 22. Was bedeutet "Soft/Hard Nofile" unter Linux
- 23. libswiftDemangle.so unter Linux
- 24. Wird stdin unter Linux als Zeichengerät behandelt?
- 25. Möglich, eine .dll unter Linux zu verwenden
- 26. Linux Umbenennungsfunktion wird nicht korrekt verwendet
- 27. Was wird verwendet, um formatierten Text in Xamarin IOS anzuzeigen?
- 28. Wie organisieren Sie Klassen in einem großen Projekt?
- 29. Welche Linux/Unix-Software wird verwendet, um HTML oder PDF in doc zu konvertieren?
- 30. Wie wird Mutex unter Linux erstellt?
analysieren Lynx kann es tun, aber es unterstützt es nicht wirklich. wget ist viel besser für den Zweck geeignet. – reinierpost
Wie erhalten Sie wget, um eine Liste von Links auf einer Seite auszugeben? – Quentin
Es ist eine wirklich coole Idee. Warum habe ich nicht früher daran gedacht? –