2016-06-16 19 views
0

Ich versuche Solr zu lernen, aber einige der technischen Details verwirren mich. Ich habe ein großes Dokument, das wie folgt grundsätzlich strukturiert sind:Solr Indizierung mehrere JSON-Objekte

url -> {Some giant json object} 
url -> {another giant json object} 
... 
url -> {another giant json object} 

und es gibt bis 30.000 von ihnen schließen. Ich möchte sie zu solr indizieren. Also habe ich eine schema.xml erstellt, die jedes mögliche Feld hat und ob es indiziert, mehrwertig etc. ist.

Ich frage mich, was ist die allgemeine Struktur von was als nächstes zu tun. Ich verstehe, dass ich die Datei indizieren muss, aber verwende ich einen curl-Befehl für jede Zeile separat? Nur auf der Suche nach einem höheren Verständnis der Dinge, weil die Online-Quellen ein wenig verwirrend für mich sind.

Vielen Dank!

EDIT - Sind Terminalkommandos der schnellste Weg zum Indexieren dieser speziellen Art von Datei? Ich habe das Beispiel aktualisiert und gezeigt, wie die JSON-Datei aussieht.

Antwort

0

Curl-Anfrage

curl 'http://localhost:8983/solr/collection1/update/json/docs' 
'?split=/exams' 
'&f=first:/first' 
'&f=last:/last' 
'&f=grade:/grade' 
'&f=subject:/exams/subject' 
'&f=test:/exams/test' 
'&f=marks:/exams/marks' 
-H 'Content-type:application/json' -d ' 

Dieser Wille Indexdaten als

{ 
    "first": "John", 
    "last": "Doe", 
    "grade": 8, 
    "exams": [ 
     { 
     "subject": "Maths", 
     "test" : "term1", 
     "marks":90}, 
     { 
     "subject": "Biology", 
     "test" : "term1", 
     "marks":86} 
     ] 
}' 

Um mehr zu erfahren über diesen Link -

https://lucidworks.com/blog/2014/08/12/indexing-custom-json-data/

Verwandte Themen