Ich möchte zwei CSV-Dateien in eine Orientdb-Datenbank importieren. Die erste ist die Spitze mit 1 Million Datensätzen. Das zweite sind die Kanten mit 59 Millionen DatensätzeOrientdb - CSV-Import - CSV-Importimport Edge
I zwei json Datei zu importieren:
VERTEX
{
"source": { "file": { "path": "../csvs/metodo01/pesquisador.csv" } },
"extractor": { "row": {} },
"transformers": [
{ "csv": {} },
{ "vertex": { "class": "Pesquisador" } }
],
"loader": {
"orientdb": {
"dbURL": "remote:localhost/dbCemMilM01",
"dbType": "graph",
"batchCommit": 1000,
"classes": [
{"name": "Pesquisador", "extends": "V"}
], "indexes": [
{"class":"Pesquisador", "fields":["psq_id:integer"], "type":"UNIQUE" }
]
}
}
}
Kante
{
"config": {
"log": "info",
"parallel": false
},
"source": {
"file": {
"path": "../csvs/metodo01/a10.csv"
}
},
"extractor": {
"row": {
}
},
"transformers": [{
"csv": {
"separator": ",",
"columnsOnFirstLine": true,
"columns": ["psq_id_from:integer",
"pub_id_to:integer",
"ordem:integer"]
}
},
{
"command": {
"command": "create edge PUBLICOU from (select from Pesquisador where psq_id = ${input.psq_id_from}) to (select from Publicacao where pub_id = ${input.pub_id_to}) set ordem = ${input.ordem} ",
"output": "edge"
}
}],
"loader": {
"orientdb": {
"dbURL": "remote:localhost/dbUmMilhaoM01",
"dbType": "graph",
"standardElementConstraints": false,
"batchCommit": 1000,
"classes": [{
"name": "PUBLICOU",
"extends": "E"
}]
}
}
}
Im Verfahren der Orientdb schlägt Index verwendet, um beschleunigen Sie den Prozess.
Wie mache ich das?
Nur den Befehl erstellen Kante PUBLICOU von (wählen Sie aus Pesquisador wo psq_id = $ {input.psq_id_from}) zu (wählen Sie aus Publicacao wo pub_id = $ {input.pub_id_to}) set ordem = $ {input.ordem}
Haben Sie offizielle Dokumente zur Indexierung gelesen: http://orientdb.com/docs/last/Indexes.html? –