2016-05-12 5 views
0

herunterladen Ich versuche, den Inhalt von Seiten wie this one herunterzuladen und es in eine TXT-Datei für die spätere Verwendung zu schreiben.Versuchen, URL contentt in TXT-Datei mit jsoup

doc = Jsoup.connect(link).userAgent("Mozilla").get(); 
String cityInfo = doc.html();    

int index = cityInfo.indexOf("},"); // keeps just the first object as it has the highest score. 
String cityInfo1 = cityInfo.substring(index+1) + "}]}"; // gets the object in the correct format as some characters are not selected when downloading 
bw1.write(cityInfo1); //saves json object into text file 

Ich erhalte diesen Fehler, und wenn ich die ignoreContentType(true) Methode verwenden, es wird nur loswerden Fehler und meine Textdatei bleibt leer.

"Exception in thread "main" 
org.jsoup.UnsupportedMimeTypeException: Unhandled content type. 
Must be text/*, application/xml, or application/xhtml+xml. 
Mimetype=application/json, URL=http://transport.opendata.ch/v1/locations?query=Aarau" 
+0

Warum Jsoup für Json formatierte Daten verwenden? – Tim

+0

Ich möchte die ganze Seite nur als Text herunterladen und später behandeln. Was würdest du vorschlagen? – BlueWookie

+0

Überprüfen Sie das JSON-Format: https://en.wikipedia.org/wiki/JSON – Tim

Antwort

0

Fügen Sie die ignoreContentType(true):

doc = Jsoup.connect(link).ignoreContentType(true).userAgent("Mozilla").get();

+0

Ich habe es versucht aber trotzdem wird nichts in meine Textdatei geschrieben. Ich bekomme das stattdessen: "Ausnahme im Thread" main "org.jsoup.HttpStatusException: HTTP-Fehler beim Abrufen der URL. Status = 405, URL = http: //transport.opendata.ch/v1/locations? Query = Aarau" – BlueWookie

+0

Ah, dann ist das die Umkehrung - der 405 zeigt an, dass der Server nicht versteht, was Sie liefern, oder nicht bereit ist, einen Typ zurückzugeben, von dem er denkt, dass Sie danach fragen. Die Lösung besteht darin, genauer anzugeben, welchen Inhaltstyp Sie angeben und anfordern. – Lee

+0

Also sollte ich es als nur Text, JSON oder ein anderes Format herunterladen? – BlueWookie