Ich hoffe, Solr zu verwenden, um Suchen von Informationen zu analysieren, die von den XML-Akten geparst werden. Diese XML-Dateien sind nicht im Solr-Dokumentformat, daher muss ich sie analysieren und die Felder, die ich brauche, bekommen.Apache Solr, SolrJ vs Datenimport-Handler für das Parsen von XML
Ich bin vertraut mit Java-Programmierung und fragte mich, ob SolrJ eine einfachere Methode als die Verwendung des Data Import Handler wäre. Ich überlege mir, jede XML-Datei durchzugehen und die benötigten Felder zu analysieren. Gibt es einen Nachteil gegenüber einer Methode gegenüber der anderen? Ich stelle mir vor, da ich mit Java vertraut bin, kann es einfacher sein, das XML auf diese Weise zu parsen?
Ich werde wahrscheinlich mehrere Bedingungen und reguläre Ausdrücke benötigen. Wenn überhaupt, eine zuverlässige Möglichkeit, meine Felder aus relativ unstrukturiertem XML zu erhalten.
Wie würde SolrJ mit der Schnittstelle arbeiten? Das heißt, wenn ich mit SolrJ indexiere, kann ich meine Abfragen über die Schnittstelle noch machen?
Und DIH ist wahrscheinlich schneller als jedes Dokument mit SorlJ hinzufügen –