Ich benutze Jena, um in einer Ontologie gespeicherte Daten abzufragen. Einige der Objekte sind durch eine Zeichenkette gekennzeichnet, aber manchmal ist die exakt gleiche Zeichenkette nicht verfügbar, da ich gescannte Dokumente verarbeite und OCR-Fehler auftreten können. Daher würde ich gerne die ähnlichsten Strings finden. Gibt es eine Möglichkeit, SPARQL für diesen Zweck zu verwenden? Kann ich die Levenshtein-Distanz in SPARQL irgendwie berechnen?SPARQL: Wie findet man ähnliche Strings?
Wenn das nicht möglich ist, kann ich noch die Levenshtein Entfernung in Java berechnen. Ein effizienter Algorithmus würde jedoch immer noch das Ausfiltern irrelevanter Strings mit SPARQL erfordern.
Gibt es eine ähnliche Lösung in Sesam? – Gaurav