Ich versuche, ein Programm zu schreiben, das Firmennamen aus einer Textdatei nimmt und sie auf einer Suchmaschinen-Website durchsucht (SECs Edgar-Suche). Bei jeder Suche werden in der Regel 1-10 eindeutige Suchergebnislinks angezeigt. Daher möchte ich curl verwenden, um auf den Link mit dem entsprechenden Firmennamen zu klicken. Die Link-Seite hat eine kurze Zusammenfassung mit dem Begriff "State of incorporation:" und dann den Namen des Staates. Ich hoffe, den Staatsnamen zu analysieren. Ich habe Probleme zu verstehen, wie HTML Parsing und Curl und ihre Klassen zu verwenden. Ich würde jede mögliche Hilfe wie eine kurze Übersicht der Schritte oder nur irgendeinen Rat überhaupt schätzen. Vielen Dank.wie htmlparsing und curl in JAVA für diese Aufgabe zu verwenden ...?
1
A
Antwort
1
Angenommen, der HTML-Code ist ziemlich einfach, verwenden Sie etwas wie die Mozilla Java HTML Parser. Die getting started guide gibt Ihnen weitere Details zum Erstellen des DOM. Java hat builtin APIs zum Herunterladen von Inhalten aus dem Internet, und diese werden wahrscheinlich für Sie ausreichen (anstatt "curl" zu verwenden).
Sobald Sie ein DOM haben, können Sie die Standard-DOM-APIs verwenden, um nach den gewünschten Links und Elementen zu suchen.
Verwandte Themen
- 1. NSURLSession zu Upload Aufgabe als ‚curl‘ ausführen
- 2. Sollte man Cryptographic Message Syntax (CMS) für diese Aufgabe verwenden?
- 3. cURL gleichwertig in JAVA
- 4. Wie sicher zu verwenden und löschen für diese Situation
- 5. Wie startParameters in BuildGradle Aufgabe zu verwenden?
- 6. Wie diese cURL in PHP übergeben?
- 7. was eine effiziente Abfrage für diese Aufgabe
- 8. Ausführung fehlgeschlagen für diese Aufgabe: App: compileDebugJavaWithJavac
- 9. für eine bestimmte Dauer in Java-Looping und bestimmte Aufgabe
- 10. Gradle Aufgabe für Java Spielplatz
- 11. JAVA-Bibliothek für Videokonferenzen und wie libjitsi zu verwenden?
- 12. PHP, wie CURL verwenden
- 13. Java equivallent Code für curl
- 14. Wie in curl Befehlsdaten aus Datei zu verwenden?
- 15. curl Befehl in Java
- 16. FEHLER! diese Aufgabe 'apt_repository' hat zusätzliche Parameter
- 17. CURL: Verwenden von Curl-Befehle für AEM Prod-Instanz
- 18. Wie Rückkehr in Asynchron-Aufgabe verwenden
- 19. Wie Async Aufgabe in Android Tablayout-Aktivität zu verwenden ...?
- 20. Verwenden eines Dienstes für kleine Aufgabe
- 21. Was ist die SQL-Abfrage für diese Aufgabe, um den ersten und letzten Eintrag zu finden?
- 22. Java Hintergrund Aufgabe
- 23. wie curl url header in android verwenden
- 24. Mit curl Befehl in Java
- 25. CURL mit getRuntime.exec() in JAVA
- 26. ClassNotFoundException mit ant's Java-Aufgabe und Klassenpfad
- 27. Der beste Weg, um Java-Aufgabe in Grad zu definieren
- 28. Wie Java Applet in reactjs zu verwenden
- 29. Wie periodische Aufgabe zu erstellen
- 30. Wie kann ich JavaScript verwenden, um diese Gleichung zu lösen?