2016-10-10 3 views
1

Ich versuche, den Hauptinhalt eines Artikels aus einem HTML mit boilerpipe Code zu bekommen.Wie bekomme ich den Hauptinhalt eines Artikels aus HTML?

Die neuesten Gläser von here heruntergeladen.

Ich versuche, den folgenden Code zu verwenden:

String article = ""; 
try { 
    article = ArticleExtractor.INSTANCE.getText(url); 
    System.out.println("Article ++++ >>" + article);  
} catch (BoilerpipeProcessingException e) { 
    // TODO Auto-generated catch block 
    e.printStackTrace(); 
} 

Aber das gibt eine leere Zeichenfolge für jede URL. Kann mir jemand dabei helfen?

+0

Und was passiert? –

+0

@MarkusMitterauer Gibt einen leeren String zurück! –

+2

Um [eine gute Frage zu stellen] (http://stackoverflow.com/help/how-to-ask) sollten Sie diese Informationen und die URL, die Sie in der Beschreibung Ihres Problems abfragen, in diese Datei aufnehmen create [ein minimales, vollständiges und überprüfbares Beispiel] (http://stackoverflow.com/help/mcve), –

Antwort

2

Haben Sie versucht, den HTML-Code selbst anstelle der URL zu übergeben? Oder vielleicht gibt es ein Problem mit der Art, wie Ihre URL-Strings formatiert sind.

Verwandte Themen