2016-08-02 1 views
1

Ich möchte die erste Überschrift bekommen und es ausdrucken. Bis jetzt habe ich den HTML-Code durchgesehen und einen Weg gefunden, nach den Überschriften zu suchen.Java: Wie kann ich mit jsoup Überschriften von einer Nachrichtenseite extrahieren?

data-pb-placeholder="Write headline here" 

Dieser Code geht normalerweise jeder Überschrift voran, die ich will. Bisher habe ich ...

Document doc = Jsoup.connect("http://www.washingtonpost.com").get(); 
Element headline = doc.select("headline").first(); 
System.out.println(headline); 

Es gibt nur null aus. Ich bin mir nicht sicher, wie ich den Doc durchsuchen und Schlagzeilen finden kann.

Antwort

1

Es sieht aus wie die Schlagzeilen sind alle unter <div class="headline">. Sie können CSS selectors verwenden, um diese zu targetieren und ihren Textknoten zu extrahieren.

Document doc = Jsoup.connect("http://www.washingtonpost.com").get(); 

    for (Element headline : doc.select("div.headline")) 
     System.out.println(headline.text()); 
Verwandte Themen