2017-02-23 5 views
0

Ich habe CSV-Datei mit den followig Daten (ein kleiner Auszug):Wie automatisiert man die Erstellung von Klassen in der Ontologie?

ITEM_ID FAMILY  SUBFAMILY 
555  Adventure Adventure and extreme sports 
444  Nightlife International restaurants 
333  Adventure Adventure and extreme sports 

Ich habe auch eine Ontologie in OWL-Format, das ich in Protégé erstellt. Ich weiß, dass es möglich ist CSV-Dateien in die Ontologie zu laden, wenn ich bereits alle Klassen erstellt habe (zB "Adventure", "Nightlife" usw. von FAMILY, und "Adventure and extreme sports", "Internationale Restaurants", usw. von SUBFAMILY). Zu diesem Zweck kann ich SPARQL verwenden, um Elemente (ITEM_ID) als Instanzen zu laden.

Meine Frage ist jedoch, ob ich auch die Erstellung von Klassen mit SPARQL und CSV automatisieren kann? Die Idee besteht darin, die manuelle Erstellung von Tausenden von Klassen zu vermeiden, die auf FAMILY und SUBFAMILY basieren und in CSV gespeichert sind.

+2

Eine Liste der Tools finden Sie unter https://www.w3.org/wiki/ConverterToRdf#CSV_.28Comma-Separated_Values.29. Weitere Informationen finden Sie in der W3C-Empfehlung https://www.w3.org/TR/csv2rdf/. Und im Zusammenhang mit http://stackoverflow.com/questions/13147864/how-to-create-an-ontology-from-raw-data-csv – AKSW

Antwort

2

Es gibt tatsächlich viele Möglichkeiten, das zu tun. Hier ein paar ich verwendet habe, so weit:

1. OpenRefine mit RDF-Plug-in

Für Einmal meine bevorzugte Option ausübt ist Open Refine (ehemals Google verfeinern)

Sie importieren können, um Ihre Ontologie, zusammen mit anderen, und verwenden Sie sie, um den Daten Sinn zu geben. Sie wählen Ihren Wurzelknoten. Wenn Sie keine eindeutige ID haben, können Sie sie in einer zusätzlichen Spalte generieren. Root-Knoten, die Sie als URI behandeln müssen, und Sie können sie eingeben (ordnen Sie einer oder mehreren Klassen von Ihrer und anderen Ontologien zu). Dann wählen Sie aus, welche Eigenschaften aus Ihrer Ontologie den Headern der CSV zugeordnet werden sollen, und alle Zellen jeder Spalte werden automatisch: das Objekt des von Ihnen modellierten Dreifachmusters, des von Ihnen gewählten Typs und als URI, Text behandelt , Datum usw. - es gibt eine gute Anzahl von Optionen zur Auswahl. Dann exportieren Sie einfach als RDF/XML oder RDF/Turtle.

Wenn Ihre CSV-Datei sehr groß ist, können Sie den Speicher von Open Refine erweitern. Bis jetzt habe ich es geschafft, CSVs mit ungefähr einer halben Million Zeilen zu konvertieren, da die Spalte ziemlich viele waren, die resultierende Datei hatte eine große Anzahl von Tripeln.

Wenn Sie jedoch große CSV-Dateien verwenden, wird Protégé sie entweder nicht öffnen oder extrem langsam arbeiten.

2. Virtuoso CSV Spongers

Es gibt mehrere Optionen, einschließlich Open Data Spaces Verwendung sowie R2RML.

Verwandte Themen