2017-12-20 3 views
1

Ich versuche, die aufgenommenen Daten in Accumulo und Solr aus der gleichen Quelle XML zu vergleichen. Die in Accumulo aufgenommenen Daten sind Legacy-Code, während Solr neuer Code ist. Mit SolrCloud kann ich Daten aus Solr einfach extrahieren und CSV oder JSON auswählen, was leicht lesbar ist. Aber ich weiß nicht, wie ich die Daten in Accumulo einfach anzeigen kann. Ich habe Scan verwendet, um die Daten anzuzeigen, aber es ist nicht leicht lesbar. Gibt es eine Möglichkeit, die Daten in Accumulo in eine CSV-Datei oder Ähnliches zu exportieren, so dass es einfach ist, mit anderen Datensätzen zu lesen/zu vergleichen?Daten in Accumulo vs Solr vergleichen?

Antwort

1

Wie ich es verstehe, ist Apache Solr ein Dokumentenspeicher, der Lucene-Indizes verwendet, um die Suche über eine webbasierte REST-Schnittstelle schnell zu machen. Auf der anderen Seite ist Apache Accumulo ein massiv skalierbarer sortierter Schlüssel/Wert-Speicher, der beliebige Schlüssel/Wert-Paare mit Sicherheitsetiketten auf Zellebene gemäß der Benutzeranwendung speichert, die mit einer Java API abgefragt werden können. Es macht keinen Sinn, die beiden zu vergleichen. Sie sind völlig unterschiedliche Anwendungen. Accumulo ist eine Low-Level-Infrastruktur-Anwendung, auf der Sie komplexe Systeme wie eine Suchmaschine vergleichbar mit Solr erstellen können, aber es ist nicht direkt vergleichbar mit Solr, weil Accumulo keine Suchmaschine ist.

Um Ihre Frage zu beantworten, wie Daten in Accumulo angezeigt werden, ist die Antwort die Java-API. Ich empfehle, mit der Tour auf seiner Webseite zu beginnen, für einige Beispiele, wie man es abfragt. Wie die Daten präsentiert werden und in welcher Form, hängt von der Anwendung ab, die sie in erster Linie aufgenommen hat. Es kann beliebige binäre Daten in Byte-Arrays sein und möglicherweise nicht direkt sichtbar sein; Das hängt von der Anwendung ab. Accumulo ist von der Art der in seinen Schlüssel/Wert-Paaren gespeicherten Daten unabhängig.

Was Sie wahrscheinlich in Ihrer Frage zu beziehen waren, als Sie sagten, „Ich verwendete Scan-Daten, um anzuzeigen“, werden Sie wahrscheinlich in Accumulo Shell zum scan Befehl bezieht wurden. Sie sollten sich wahrscheinlich bewusst sein, dass die Shell nicht die primäre Schnittstelle für die Abfrage ist. Es ist für die Systemadministration und Triage der Datenaufnahme gedacht. Die Java-API ist das primäre Mittel zum Abfragen.

Die Open Source-Community von Accumulo reagiert sehr auf Fragen. Wenn Sie Probleme haben, herauszufinden, wie Sie es am besten für Ihre Bedürfnisse verwenden können, rate ich Ihnen, in ihren Community-Mailinglisten nachzufragen, die Sie auf ihrer Website finden können. StackOverflow eignet sich eher für sehr spezifische Fragen als allgemeine Lernanleitungen.