Ich habe eine gute Möglichkeit, dies zu implementieren untersucht. Ich arbeite an einem einfachen Website-Crawler, der eine bestimmte Reihe von Websites umgeht und alle MP3-Links in die Datenbank crawlt. Ich möchte die Dateien nicht herunterladen, nur den Link crawlen, indexieren und in der Lage sein, sie zu durchsuchen. Bis jetzt für einige der Seiten bin ich erfolgreich gewesen, aber für einige benutzen sie URL-Weiterleitungen und Sachen, die den Crawler verwirrt.MP3 Link Crawler
irgendwelche Ideen? Wie indexiert beemp3.com alle diese Links?
dank
Dies wird nicht mp3s durchsuchen, sondern nur Seiten mit Verzeichnislisten einschließlich MP3-Dateien. –
yeah und das kriecht auch nicht wirklich .. ich will sehen, ob ein Skript herumgehen und X Menge von Seiten nur für MP3-Dateien indexieren kann. Danke für die Antwort :) –