Ich möchte einige URL analysieren und die Website besuchen und weitere Daten verschrotten.URL für Scraping-Aufgaben analysieren
Grundsätzlich meine aktuellen Code ist:
i = 9
while(i < 118):
dict = {'start': i}
url1 = urllib.urlencode(dict)
url2 = urlparse.urljoin('http://intelligencesquaredus.org/debates/past-debates ', url1)
print url2
i = i + 9
Welche Ergebnisse liefert
http://intelligencesquaredus.org/debates/past-debates/start=9
http://intelligencesquaredus.org/debates/past-debates/start=18
http://intelligencesquaredus.org/debates/past-debates/start=27
Aber ich möchte die Verbindung
http://intelligencesquaredus.org/debates/past-debates?start=9
Jede Hilfe würde geschätzt sein. Vielen Dank im Voraus
Was genau wollen Sie? Sie haben eine while-Schleife, deshalb haben Sie ein Ergebnis mit vielen Links. –
Ergebnisse mit vielen Links ist in Ordnung, das ist das beabsichtigte Verhalten.Ich brauche nur das Format, um korrekt zu sein.Bitte überprüfen Sie noch einmal. –
ok du willst das '' '' anstelle von '/'? –