2009-06-19 6 views
0

Ich möchte eine CSV-Datei von einer Webseite speichern. Der Link auf der Seite führt jedoch nicht direkt zur Datei, sondern ruft eine Art Javascript auf, das zum Öffnen der Datei führt. Mit anderen Worten, es gibt keine explizite URL-Adresse für die Datei, die ich herunterladen möchte oder zumindest weiß ich nicht, was es sein soll. Ich habe eine Möglichkeit gefunden, eine Datei herunterzuladen, indem ich den Internet Explorer aktiviere, auf die Webseite gehe und den Linkbutton drücke und dann die Datei über das Dialogfeld speichere. Das ist ziemlich hässlich, und ich frage mich, ob es eine elegantere (und schnellere) Methode gibt, eine Datei ohne Internet Explorer zu finden (zB mit der Methode urllib.retrieve) Das Javascript hat die folgende Form (siehe Kommentar) es lässt nicht den Quellcode veröffentlichen ...):Abrufen einer CSV-Datei von der Webseite

"CSV"

Irgendwelche Ideen?

Sasha

+0

Das Javascript hat die folgende Form: CSV Sasha

+0

Die 'einige Adresse', 'einige Parameter' Teil ist der wichtige Teil. Entweder diese Adresse ist die URL für die Datei oder Sie bestimmen anhand des Inhalts dieser Adresse. Wenn Sie FireBug verwenden, können Sie einfach auf Ihre Net-Konsole schauen und direkt sehen, wo die Datei herkommt. – defines

+0

Sie können den Quellcode auch veröffentlichen, indem Sie eine Zeile überspringen und dann vier Leerzeichen davor setzen. – defines

Antwort

1

Sie können sehen, was die JavaScript-Funktion tut, und es sollte Ihnen genau sagen, woher es heruntergeladen ist.

+0

Suchen Sie in der Quelle der Seite für die Funktion "customWindowOpen()" – jjclarkson

+0

War dies ein Kommentar für das ursprüngliche Poster, vielleicht? – Sev

+0

Versucht, die Datei von der Adresse in JavaScript abzurufen. Es gibt eine Datei mit ASPX-Erweiterung, aber keine CSV-Datei zurück. Die Adresse hat die Form http: //www.blabla/blabla/ExcelExport.aspx? Tbl = 0 & Spalten = ... Was mache ich jetzt? Was ist ASPX? – Sasha

0

Ich hatte genau dieses Problem ein Jahr oder zwei zurück; Ich habe die Rhino-Javascript-Engine installiert. Das JavaScript aus dem Zieldokument entfernen und die URL innerhalb von Rhino auswerten und dann das Ergebnis abrufen.

Verwandte Themen