Ich möchte einen Webcrawler machen, der .mp3 Links von einer Web site holen kann. Der Inhalt ist jedoch in der Beispielsite http://raagtune.net/ dynamisch. In dieser Site wird der Inhalt von "http://raag.me//music/data/ .. einige zufällige. Mp3" wie können wir die gesamte Website crawlen und alle MP3-Links mit scrapy in Python? Oder gibt es alternative Methoden?Wie man einen Webcrawler in scrapy herstellt, um .mp3 Verbindungen zu holen
-1
A
Antwort
0
Sie können beautifulsoup
Paket von Python verwenden.
import httplib2 from BeautifulSoup import BeautifulSoup, SoupStrainer http = httplib2.Http() status, response = http.request('http://www.nytimes.com')
for link in BeautifulSoup(response, parseOnlyThese=SoupStrainer('a')): if link.has_attr('href'): print link['href']
Genau prüfen, ob diese URL .mp3
in dieser Verbindung hat. Wenn ja, speichern Sie es in der Liste, sonst fahren Sie fort.
Hoffe, das hilft!
Verwandte Themen
- 1. Wie man einen Spielknopf wieder herstellt?
- 2. Wie man php Anwendung herstellt, um Smartcardauthentifizierung zu verlangen
- 3. Wie man einen Anfangsbildschirm herstellt, um zu jedem beweglichen Schirm zu passen oder multiscreens zu stützen
- 4. Webcrawler mehrere Seite Iteration
- 5. Wie man veränderbare Verkleidungen herstellt?
- 6. wie man rootfs in buildroot wieder herstellt
- 7. jQM - Wie man Bildknopf herstellt?
- 8. Wie man Scrapy Spinne macht, um Länderdomains zu verweigern
- 9. Wie man Scrapy erzwingt, um doppelte URL zu kriechen?
- 10. Scrapy: Wie man einen richtigen Wähler
- 11. Wie man Bildknopf in Android herstellt?
- 12. Wie man einen Knopf herstellt, der verschiedene Teile hat?
- 13. Wie man einen mobilen QR-Code-Leser von UWP herstellt?
- 14. Wie man eine wiederverwendbare AngularJs-Komponente herstellt
- 15. Wie man Wörterbuchdatei vom vocab herstellt?
- 16. Neo4j Wie man eine Beziehung herstellt
- 17. Wie kann man SignalR Server Verbindungen einschränken?
- 18. YARD: Wie man eine Verbindung zu einer Klassenmethode herstellt?
- 19. Wie konvertiert man MP3 zu WAV in Python
- 20. Wie benutzt man Grgit um aus der Ferne zu holen?
- 21. Wie scrapy verwenden, um mehrere Seiten zu crawlen?
- 22. CSS: Wie man auswählbare Kästen herstellt?
- 23. Webcrawler überspringen URLs
- 24. Wie spielt man MP3-Dateien in C?
- 25. AngularJS: Wie man öffentliche API auf der Richtlinie herstellt, um vom Prüfer angerufen zu werden?
- 26. Erkennt der Webcrawler Cookies?
- 27. Wie man Jaxrs-Analyzer herstellt, um jogson docs swagger 2 zu erzeugen?
- 28. Wie behandelt man SQLAlchemy-Verbindungen in ProcessPool?
- 29. Scrapy response.xpath Invalid Syntax
- 30. Wie spielt man mp3-Datei in swift3?