Ich bin auf der Suche nach einer allgemeinen API/Web Service/Tool/etc ..., die eine bestimmte HTML - Seite zu einem RDF - Diagramm so spezifisch wie möglich (wahrscheinlich mit einer Back - Bone - Ontologie und/oder Mapper).Konvertieren von HTML in RDF
Antwort
Ich verwendete XQuery, um die Daten aus dem gegebenen Satz von Webseiten zu extrahieren. Ich musste benutzerdefinierte Abfragen für die Webseiten schreiben. Ich denke, dies ist der einfachste Ansatz für eine bestimmte Menge von HTML-Dateien. Es ist jedoch offensichtlich nicht gut für den allgemeinen Fall. Für einen anderen Satz von Webseiten müssen andere benutzerdefinierte Abfragen geschrieben werden.
Haben Sie bewiesen GRDDL?
GRDDL ist eine Technik für RDF Erhalten Daten aus XML-Dokumenten und in insbesondere XHTML-Seiten.
Ich benutzte JSoup, um Daten aus HTML zu scraphen. Es verwendet jQuery-Stil der Abfrage von HTML-DOM, mit denen ich bereits vertraut war, so dass es wirklich einfaches Tool für mich war. Ich finanziere es auch ziemlich robust, aber ich brauchte es nur, um 3 Datenquellen zu scrappen, also habe ich noch keine reichen Erfahrungen mit diesem Tool. jsoup
- 1. XQuery: XML in RDF konvertieren
- 2. Hilfe verwandeln RDF in HTML über XSL
- 3. Konvertieren von Klartexteingabe in HTML
- 4. Konvertieren von SQLite in HTML?
- 5. Parsing von RDF in Smalltalk
- 6. PDF in HTML konvertieren
- 7. HTML in BBCode konvertieren
- 8. RDF zu XML-Transformation
- 9. XAML in HTML konvertieren
- 10. Konvertieren von HTML in PDF in PHP?
- 11. Konvertieren von PDF in HTML in PHP?
- 12. Konvertieren von Zeichen in HTML in R
- 13. Parsing RDF von Gutenberg in Python
- 14. rdf: Sammlung in Sparql
- 15. Konvertieren von escaped html zurück in HTML String in Flash
- 16. SPARQL Query rdf Behälter (rdf: Bag)
- 17. HTML in XAML konvertieren
- 18. Konvertieren HTML in Markdown
- 19. Konvertieren von Wiki zu HTML
- 20. RDF in Cytoscape.js visualisieren?
- 21. Konvertieren von HTML in Bild java
- 22. Konvertieren von HTML-Text in Plain-Text
- 23. Konvertieren von HTML-Vorlage in Drupal 7
- 24. Konvertieren von HTML-Element in Dojo-Knoten?
- 25. Konvertieren von HTML in Nur-Text?
- 26. Konvertieren von HTML-Zeit in Java-Zeitobjekt
- 27. Konvertieren von HTML-Entities in UTF-8
- 28. Konvertieren von HTML-Tags in PHP-Array
- 29. Konvertieren von Haml String in HTML
- 30. Übertragung von rdf zu 4store
Haben Sie eine Kontrolle über den Inhalt des HTML-Dokuments? Oder muss es ein beliebiges Dokument sein? – Scott
Es kann ein beliebiges HTML-Dokument sein. Ich muss die Struktur des HTML-Dokuments in ein RDF-Diagramm extrahieren. Wenn die Konvertierung einen Backbone-Mapper/Ontologie verwendet, dann ist es noch besser. – jaxvy
Es sieht so aus, als könnte XSPARQL dies mit einer benutzerdefinierten Abfrage erreichen, die nach einer Ontologie geschrieben wurde ... – jaxvy