2017-09-16 2 views
0

Also, ich habe einen Scraper, der BS4 verwendet, um einige Links zu holen und dann bin ich bereit, diese Links herunterzuladen, aber das Problem ist, wenn ich auf den Download-Button klicken startet mein Browser automatisch um die ZIP-Datei herunterzuladen, auf die der Link indirekt zeigt, aber wenn ich den gleichen Link zu urllib gebe, wird immer die Seite anstelle der ZIP-Datei heruntergeladen!Kann eine Datei nicht über urllib herunterladen

Die Verbindung I auskratzen ist: Link I got from scraping

Link zu der Seite, die ich für diesen Link verschrottet: Main Page

Auf dieser Hauptseite, die Verknüpfung einen Text "4931x"

Jetzt hat, wenn Ich klicke den gleichen Link durch den Browser es irgendwie umadressiert: Redirected link

Aber selbst wenn ich urlopen mit dem 3. Link verwende, werde ich wieder auf den ersten Link weitergeleitet!

Ich habe das Gefühl, dass dies eine dumme Frage ist und eine wirklich einfache Lösung haben könnte, aber ich kann mich wirklich nicht damit abfinden. Ich möchte nur die gezippten Untertitel automatisch herunterladen, aber ich kann nicht!

Antwort

1

Während der Netzwerkbereich der Webbrowser-Entwicklungstools angezeigt wird, gibt die ursprüngliche URL eine HTTP 302-Antwort mit einem Standortheader zurück, der an https://www.flixtools.com/en/osflixtools.subtitles-download/subtitles/6647724?source=source_os_landing&campaign=campaign_sub_landing umleitet. Diese Seite enthält diesen HTML-Code: <meta http-equiv="refresh" content="5; URL=//dl.opensubtitles.org/en/download/vrf-108d030f/sub/6647724">. Dies weist Ihren Webbrowser an, nach 5 Sekunden auf diese URL zu navigieren.

Verwandte Themen