2017-05-31 2 views
1

ich den Titel von dieser Website erhalten möchten: http://feeds.foxnews.com/foxnews/latestWie kann ich mit der Jaunt-Bibliothek Daten von einer Website scrappen?

wie in diesem Beispiel:

<title><![CDATA[SUCCESSFUL INTERCEPT Pentagon confirms it shot down ICBM-type target]]></title> 

und es wird der Text wie folgt zeigen:

„ERFOLGREICH INTERCEPT Pentagon es abgeschossen bestätigt ICBM- Typ Ziel US erfolgreichen Raketen abfangen Test leitet, sagt Pentagon“

mein Code hier. Ich habe eine Jaunt-Bibliothek benutzt.

Ich weiß nicht, warum es Text zeigt nur "foxnew.com"

import com.jaunt.JauntException; 
import com.jaunt.UserAgent; 

public class p8_1 
{ 

    public static void main(String[] args) 
    { 
     try 
     { 
      UserAgent userAgent = new UserAgent(); 
      userAgent.visit("http://feeds.foxnews.com/foxnews/latest"); 
      String title = userAgent.doc.findFirst 
("<title><![CDATA[SUCCESSFUL INTERCEPT Pentagon confirms it shot down ICBM-type target]]></title>").getText(); 
       System.out.println("\n " + title); 


     } catch (JauntException e) 
     { 
      System.err.println(e); 
     } 

    } 

} 
+0

Können Sie String title = versuchen userAgent.doc.findFirst ("") .getText() und die Ausgabe teilen? – <span class="text-secondary"> <small> <span></span> </small> </span> </p> </div> </div> </div> <div itemprop="comment" class="post-comment"> <div class="row"> <div class="col-lg-1"><span class="text-secondary">+0</span></div> <div class="col-lg-11"> <p class="commenttext">Ich habe es versucht. Out Put ist der gleiche Show-Text nur "foxnew.com" danke trotzdem :) – <span class="text-secondary"> <small> <a rel="noopener" target="_blank" href="https://stackoverflow.com/users/8057954/">Puppet325</a></span> <span></span> </small> </span> </p> </div> </div> </div> </div> </div> </article> </div> <div class="answer-title"> <span class="text-logo margin-top-sm">A</span> <h2 class="title h4">Antwort</h2> </div> <div class="item-description text-md markdown-body margin-bottom-40 voidso"> <article class="board-top-1 padding-top-10"> <div class="post-col vote-info"> <span class="count">0<i class="fa fa-thumbs-up"></i></span> <i class="fa fa-check fa-2x"></i> </div> <div class="post-offset"> <div class="answer fmt"> <p>Suche nach Elementtypen, keine Werte.</p> <p>Versuchen Sie, die nach dem Titeltext der einzelnen Elemente im Futter zu bekommen:</p> <pre><code class="prettyprint-override">public static void main(String[] args) { try { UserAgent userAgent = new UserAgent(); userAgent.visit("http://feeds.foxnews.com/foxnews/latest"); Elements items = userAgent.doc.findEach("<item>"); Elements titles = items.findEach("<title>"); for (Element title : titles) { String titleText = title.getComment(0).getText(); System.out.println(titleText); } } catch (JauntException e) { System.err.println(e); } } </code></pre> </div> <div class="post-info"> <div class="post-meta row"> <p class="text-secondary col-lg-6"> <span class="source"> <a rel="noopener" target="_blank" href="https://stackoverflow.com/q/44277500">Quelle</a> </span> </p> <p class="text-secondary col-lg-6"> <span class="float-right date"> <span>2017-05-31 06:44:45</span> </p> <p class="col-12"></p> <p class="col-12"></p></div> </div> <!-- comments --> <div class="comments"> <div itemprop="comment" class="post-comment"> <div class="row"> <div class="col-lg-1"><span class="text-secondary">+0</span></div> <div class="col-lg-11"> <p class="commenttext">Vielen Dank :) – <span class="text-secondary"> <small> <a rel="noopener" target="_blank" href="https://stackoverflow.com/users/8057954/">Puppet325</a></span> <span></span> </small> </span> </p> </div> </div> </div> </div> </div> </article> <div> <script async src="//pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script> <ins class="adsbygoogle" style="display:block" data-ad-client="ca-pub-6208739752673518" data-ad-slot="4319274062" data-ad-format="auto" data-full-width-responsive="true"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> </div> </div> <div class="clearfix"> </div> <div class="relative-box"> <div class="relative">Verwandte Themen</div> <ul class="relative_list"> <li> 1. <a href="http://de.voidcc.com/question/p-rpxvdekp-co.html" target="_blank" title="Kannst du eine Angular JS Website scrappen"> Kannst du eine Angular JS Website scrappen </a> </li> <li> 2. <a href="http://de.voidcc.com/question/p-rxxwzdft-cs.html" target="_blank" title="Wie bekomme ich http Daten von einer Website von scapy"> Wie bekomme ich http Daten von einer Website von scapy </a> </li> <li> 3. <a href="http://de.voidcc.com/question/p-svrhnxza-cu.html" target="_blank" title="PHP Daten von der Website scrape"> PHP Daten von der Website scrape </a> </li> <li> 4. <a href="http://de.voidcc.com/question/p-znmpborr-hd.html" target="_blank" title="extrahieren Daten von der Website mit Python"> extrahieren Daten von der Website mit Python </a> </li> <li> 5. <a href="http://de.voidcc.com/question/p-dvesllhy-ko.html" target="_blank" title="Wie bekomme ich Daten von der Website über URL"> Wie bekomme ich Daten von der Website über URL </a> </li> <li> 6. <a href="http://de.voidcc.com/question/p-ujcxzjcz-dx.html" target="_blank" title="Wie kann ich über Racket mit einer Website interagieren?"> Wie kann ich über Racket mit einer Website interagieren? </a> </li> <li> 7. <a href="http://de.voidcc.com/question/p-vscarhio-gs.html" target="_blank" title="Kann ich Daten in Echtzeit von der Website analysieren?"> Kann ich Daten in Echtzeit von der Website analysieren? </a> </li> <li> 8. <a href="http://de.voidcc.com/question/p-szrasxlw-es.html" target="_blank" title="Schreiben Sie eine CSV-Datei mit Python nach dem Scrappen von Text von der Website"> Schreiben Sie eine CSV-Datei mit Python nach dem Scrappen von Text von der Website </a> </li> <li> 9. <a href="http://de.voidcc.com/question/p-sibcghxh-kk.html" target="_blank" title="Trawling Daten von der Website"> Trawling Daten von der Website </a> </li> <li> 10. <a href="http://de.voidcc.com/question/p-ohiswqvb-hd.html" target="_blank" title="Wie kann ich bestimmte Daten von einer Website mit PHP extrahieren?"> Wie kann ich bestimmte Daten von einer Website mit PHP extrahieren? </a> </li> <li> 11. <a href="http://de.voidcc.com/question/p-egblaxju-hz.html" target="_blank" title="Wie man Daten von einer Website mit Excel VBA"> Wie man Daten von einer Website mit Excel VBA </a> </li> <li> 12. <a href="http://de.voidcc.com/question/p-fhlanwnk-co.html" target="_blank" title="Scrapping Daten von der Website mit vba"> Scrapping Daten von der Website mit vba </a> </li> <li> 13. <a href="http://de.voidcc.com/question/p-yukgybdl-ga.html" target="_blank" title="Wie verwerfen Sie Togglet Daten von einer Website mit Python?"> Wie verwerfen Sie Togglet Daten von einer Website mit Python? </a> </li> <li> 14. <a href="http://de.voidcc.com/question/p-csfrdqvq-kg.html" target="_blank" title="Wie kann ich einen eingebetteten Google Kalender von einer URL scrappen?"> Wie kann ich einen eingebetteten Google Kalender von einer URL scrappen? </a> </li> <li> 15. <a href="http://de.voidcc.com/question/p-tptnfymh-ct.html" target="_blank" title="Wie kann ich eine Ruby-Website mit einer Datenbank sichern?"> Wie kann ich eine Ruby-Website mit einer Datenbank sichern? </a> </li> <li> 16. <a href="http://de.voidcc.com/question/p-ydawfbbm-bw.html" target="_blank" title="Wie kann ich einen Screenshot einer Website mit .NET machen?"> Wie kann ich einen Screenshot einer Website mit .NET machen? </a> </li> <li> 17. <a href="http://de.voidcc.com/question/p-wzjduncz-gm.html" target="_blank" title="Kann man mit Pandas HTML-Tabellen über mehrere Webseiten scrappen?"> Kann man mit Pandas HTML-Tabellen über mehrere Webseiten scrappen? </a> </li> <li> 18. <a href="http://de.voidcc.com/question/p-bkojjiiv-bo.html" target="_blank" title="Wie kann ich meine Website mit ie6"> Wie kann ich meine Website mit ie6 </a> </li> <li> 19. <a href="http://de.voidcc.com/question/p-gxhgfvya-eu.html" target="_blank" title="Wie kann ich ein bestimmtes Div von der Website bekommen?"> Wie kann ich ein bestimmtes Div von der Website bekommen? </a> </li> <li> 20. <a href="http://de.voidcc.com/question/p-zygclzmj-bx.html" target="_blank" title="Wie kann ich mich mit Python auf einer Website anmelden?"> Wie kann ich mich mit Python auf einer Website anmelden? </a> </li> <li> 21. <a href="http://de.voidcc.com/question/p-ntpfadap-hp.html" target="_blank" title="Extrahieren von Daten von einer Website (spotify) mit Javascript"> Extrahieren von Daten von einer Website (spotify) mit Javascript </a> </li> <li> 22. <a href="http://de.voidcc.com/question/p-ebrbqmfr-by.html" target="_blank" title="Wie kann ich mich mit Python auf einer Website anmelden?"> Wie kann ich mich mit Python auf einer Website anmelden? </a> </li> <li> 23. <a href="http://de.voidcc.com/question/p-zfiqmncs-gd.html" target="_blank" title="Herunterladen von Dateien von einer Website mit Python"> Herunterladen von Dateien von einer Website mit Python </a> </li> <li> 24. <a href="http://de.voidcc.com/question/p-xsntltdp-t.html" target="_blank" title="Wie kann ich OCR auf einer Website mit PHP implementieren?"> Wie kann ich OCR auf einer Website mit PHP implementieren? </a> </li> <li> 25. <a href="http://de.voidcc.com/question/p-fewgrgoa-be.html" target="_blank" title="Daten von einer bestimmten Website abrufen"> Daten von einer bestimmten Website abrufen </a> </li> <li> 26. <a href="http://de.voidcc.com/question/p-pdmtavup-dd.html" target="_blank" title="Wie kann ich Unterseiten einer anderen Website in Rails analysieren?"> Wie kann ich Unterseiten einer anderen Website in Rails analysieren? </a> </li> <li> 27. <a href="http://de.voidcc.com/question/p-glotfove-bm.html" target="_blank" title="Wie kann ich eine Website Login in ASP.NET simulieren, kratzen dann einige Daten von einer Seite"> Wie kann ich eine Website Login in ASP.NET simulieren, kratzen dann einige Daten von einer Seite </a> </li> <li> 28. <a href="http://de.voidcc.com/question/p-qsrkdclz-gy.html" target="_blank" title="Wie kann ich formulierte Informationen von einer Website scrapen?"> Wie kann ich formulierte Informationen von einer Website scrapen? </a> </li> <li> 29. <a href="http://de.voidcc.com/question/p-gbkswnpe-dz.html" target="_blank" title="Wie kann ich Daten von einer Websocket-URL abrufen?"> Wie kann ich Daten von einer Websocket-URL abrufen? </a> </li> <li> 30. <a href="http://de.voidcc.com/question/p-ryxmfqqb-km.html" target="_blank" title="Abfragen von Daten von der Website"> Abfragen von Daten von der Website </a> </li> </ul> </div> <div> <script async src="//pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script> <ins class="adsbygoogle" style="display:block" data-ad-format="autorelaxed" data-ad-client="ca-pub-6208739752673518" data-ad-slot="3534119089"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> </div> <div class="padding-top-10"></div> </div> </div> <script type="text/javascript" src="http://img2.voidcc.com/voidso/script/side.js?t=1652515422091"></script> <script type="text/javascript" src="http://img2.voidcc.com/voidso/plugin/highlight/highlight.pack.js"></script> <link href="http://img2.voidcc.com/voidso/plugin/highlight/styles/docco.css" media="screen" rel="stylesheet" type="text/css" /> <script type="text/javascript"> $('pre').each(function(i, e) { hljs.highlightBlock(e, "<span class='indent'> </span>", false) }); </script> <div class="col-lg-3 col-md-4 col-sm-5"> <div id="rightTop"> <div class="row"> <script async src="//pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script> <!-- VOIDCC问答侧边栏广告 --> <ins class="adsbygoogle" style="display:block" data-ad-client="ca-pub-6208739752673518" data-ad-slot="3862022848" data-ad-format="auto" data-full-width-responsive="true"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> </div> <div class="row sidebar panel panel-default"> <div class="panel-heading font-bold"> Letzte Frage </div> <div class="m-b-sm m-t-sm clearfix"> <ul class="side_article_list"> <li class="side_article_list_item"> 1. <a href="http://de.voidcc.com/question/p-zypvibum-nq.html" target="_blank" title="Assign IDs Elemente Viz.js TD in der SVG-Elemente erscheinen"> Assign IDs Elemente Viz.js TD in der SVG-Elemente erscheinen </a> </li> <li class="side_article_list_item"> 2. <a href="http://de.voidcc.com/question/p-dpdjychr-nq.html" target="_blank" title="Mxgraph getPrettyXml nicht erhalten benutzerdefinierten Element Wert"> Mxgraph getPrettyXml nicht erhalten benutzerdefinierten Element Wert </a> </li> <li class="side_article_list_item"> 3. <a href="http://de.voidcc.com/question/p-nnhfegam-ns.html" target="_blank" title="XSL ein Attribut mit der Position des umschließenden Elements Aktualisierung"> XSL ein Attribut mit der Position des umschließenden Elements Aktualisierung </a> </li> <li class="side_article_list_item"> 4. <a href="http://de.voidcc.com/question/p-zbmwammt-nn.html" target="_blank" title="Wie kommt man zum letzten Datensatz in den Ergebnissen von ado.locate (Delphi)"> Wie kommt man zum letzten Datensatz in den Ergebnissen von ado.locate (Delphi) </a> </li> <li class="side_article_list_item"> 5. <a href="http://de.voidcc.com/question/p-vuvfeaov-nn.html" target="_blank" title="Daten aufteilen, um Zug- und Testsätze zu erstellen - for loop - Variable in Teilmenge nach Zeile einfügen"> Daten aufteilen, um Zug- und Testsätze zu erstellen - for loop - Variable in Teilmenge nach Zeile einfügen </a> </li> <li class="side_article_list_item"> 6. <a href="http://de.voidcc.com/question/p-mbaexgeh-no.html" target="_blank" title="Javascript, wie JSON Daten mit API Anruf an umgeleitete URL"> Javascript, wie JSON Daten mit API Anruf an umgeleitete URL </a> </li> <li class="side_article_list_item"> 7. <a href="http://de.voidcc.com/question/p-whufvzhv-no.html" target="_blank" title="Add Custom Regularisierung Tensorflow"> Add Custom Regularisierung Tensorflow </a> </li> <li class="side_article_list_item"> 8. <a href="http://de.voidcc.com/question/p-xjwvrdzf-nm.html" target="_blank" title="django Test - wie Antwortdaten für die zukünftige Verwendung erhalten"> django Test - wie Antwortdaten für die zukünftige Verwendung erhalten </a> </li> <li class="side_article_list_item"> 9. <a href="http://de.voidcc.com/question/p-gusbuuhg-nk.html" target="_blank" title="Apache Tomcat-Server auf Nginx hält das Herunterladen .jsp Dateien"> Apache Tomcat-Server auf Nginx hält das Herunterladen .jsp Dateien </a> </li> <li class="side_article_list_item"> 10. <a href="http://de.voidcc.com/question/p-ocqbdmzy-nk.html" target="_blank" title="Perl: Abrufen von Hash-Werten in der Reihenfolge, in der sie erstellt wurden"> Perl: Abrufen von Hash-Werten in der Reihenfolge, in der sie erstellt wurden </a> </li> </ul> </div> </div> </div> <p class="article-nav-bar"></p> <div class="row sidebar article-nav"> <div class="row box_white visible-sm visible-md visible-lg margin-zero"> <div class="top"> <h3 class="title"><i class="glyphicon glyphicon-th-list"></i> Verwandte Themen</h3> </div> <div class="article-relative-content"> <ul class="side_article_list"> <li class="side_article_list_item"> 1. <a href="http://de.voidcc.com/question/p-rpxvdekp-co.html" target="_blank" title="Kannst du eine Angular JS Website scrappen"> Kannst du eine Angular JS Website scrappen </a> </li> <li class="side_article_list_item"> 2. <a href="http://de.voidcc.com/question/p-rxxwzdft-cs.html" target="_blank" title="Wie bekomme ich http Daten von einer Website von scapy"> Wie bekomme ich http Daten von einer Website von scapy </a> </li> <li class="side_article_list_item"> 3. <a href="http://de.voidcc.com/question/p-svrhnxza-cu.html" target="_blank" title="PHP Daten von der Website scrape"> PHP Daten von der Website scrape </a> </li> <li class="side_article_list_item"> 4. <a href="http://de.voidcc.com/question/p-znmpborr-hd.html" target="_blank" title="extrahieren Daten von der Website mit Python"> extrahieren Daten von der Website mit Python </a> </li> <li class="side_article_list_item"> 5. <a href="http://de.voidcc.com/question/p-dvesllhy-ko.html" target="_blank" title="Wie bekomme ich Daten von der Website über URL"> Wie bekomme ich Daten von der Website über URL </a> </li> <li class="side_article_list_item"> 6. <a href="http://de.voidcc.com/question/p-ujcxzjcz-dx.html" target="_blank" title="Wie kann ich über Racket mit einer Website interagieren?"> Wie kann ich über Racket mit einer Website interagieren? </a> </li> <li class="side_article_list_item"> 7. <a href="http://de.voidcc.com/question/p-vscarhio-gs.html" target="_blank" title="Kann ich Daten in Echtzeit von der Website analysieren?"> Kann ich Daten in Echtzeit von der Website analysieren? </a> </li> <li class="side_article_list_item"> 8. <a href="http://de.voidcc.com/question/p-szrasxlw-es.html" target="_blank" title="Schreiben Sie eine CSV-Datei mit Python nach dem Scrappen von Text von der Website"> Schreiben Sie eine CSV-Datei mit Python nach dem Scrappen von Text von der Website </a> </li> <li class="side_article_list_item"> 9. <a href="http://de.voidcc.com/question/p-sibcghxh-kk.html" target="_blank" title="Trawling Daten von der Website"> Trawling Daten von der Website </a> </li> <li class="side_article_list_item"> 10. <a href="http://de.voidcc.com/question/p-ohiswqvb-hd.html" target="_blank" title="Wie kann ich bestimmte Daten von einer Website mit PHP extrahieren?"> Wie kann ich bestimmte Daten von einer Website mit PHP extrahieren? </a> </li> </ul> </div> </div> </div> </div> </div> </div> </div><!-- wrap end--> <!-- footer --> <footer id="footer"> <div class="bg-simple lt"> <div class="container"> <div class="row padder-v m-t"> <div class="col-xs-8"> <ul class="list-inline"> <li><a href="http://de.voidcc.com/contact">Sprechen Sie uns an</a></li> <li>© 2020 DE.VOIDCC.COM</li> <li><a rel="nofollow" href="https://beian.miit.gov.cn/" target="_blank">沪ICP备13005482号-13</a></li> <li><script type="text/javascript" src="https://s9.cnzz.com/z_stat.php?id=1280098168&web_id=1280098168"></script></li> <li><a href="http://cn.voidcc.com/" target="_blank" title="程序问答园区">简体中文</a></li> <li><a href="http://hk.voidcc.com/" target="_blank" title="程序問答園區">繁體中文</a></li> <li><a href="http://ru.voidcc.com/" target="_blank" title="поле вопросов и ответов">Русский</a></li> <li><a href="http://de.voidcc.com/" target="_blank" title="Frage - und - antwort - Park">Deutsch</a></li> <li><a href="http://es.voidcc.com/" target="_blank" title="Preguntas y respuestas">Español</a></li> <li><a href="http://hi.voidcc.com/" target="_blank" title="कार्यक्रम प्रश्न और उत्तर पार्क">हिन्दी</a></li> <li><a href="http://it.voidcc.com/" target="_blank" title="IL Programma di chiedere Park">Italiano</a></li> <li><a href="http://ja.voidcc.com/" target="_blank" title="プログラム問答園区">日本語</a></li> <li><a href="http://ko.voidcc.com/" target="_blank" title="프로그램 문답 단지">한국어</a></li> <li><a href="http://pl.voidcc.com/" target="_blank" title="program o park">Polski</a></li> <li><a href="http://tr.voidcc.com/" target="_blank" title="Program soru ve cevap parkı">Türkçe</a></li> <li><a href="http://vi.voidcc.com/" target="_blank" title="Đáp ứng viên">Tiếng Việt</a></li> <li><a href="http://fr.voidcc.com/" target="_blank" title="Programme interrogation Park">Française</a></li> </ul> </div> </div> </div> </div> </div> </footer> <!-- / footer --> <script async src="https://www.googletagmanager.com/gtag/js?id=UA-77509369-5"></script> <script> window.dataLayer = window.dataLayer || []; function gtag() { dataLayer.push(arguments); } gtag('js', new Date()); gtag('config', 'UA-77509369-5'); </script> <script> var _hmt = _hmt || []; (function () { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?67d4731349f0b00136755b80364ce381"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s); })(); </script> </body> </html>