Wenn jemand eine Datenbank auf einer anderen Datenbank aufbaut, wie Twitter es getan hat, erbt diese Datenbank die Einschränkungen und Ineffizienzen der zugrunde liegenden Datenbank?Kann Graphen-Datenbanken Daten effizient über Knoten verteilen?
Ich bin speziell an Titan db interessiert (http://thinkaurelius.com) wegen ihrer Behauptung, die Aufteilung des Dataset effizient über Knoten zu unterstützen.
Sie behaupten, die Verteilung von Daten zwischen Knoten zu unterstützen, wegen der Effizienz von Cassandra. Neo4j behauptet jedoch, dass der Grund dafür, dass sie keine Daten zwischen Knoten verteilen, sondern das gesamte Dataset auf jedem Knoten duplizieren, weil jede Traversierung eines Graphen, die einen Knoten verlässt und sich daher über ein Ethernet-Netzwerk bewegt, viel zu langsam ist praktisch sein.
Da Cassandra keine Kenntnis vom Graphen hat, kann es nicht optimieren, Graph-Traversierungen auf einem Knoten zu halten. Daher liegen die meisten Graph-Traversalen über Knotengrenzen hinweg.
Ist der Anspruch der Titanen, effizient über Knoten zu skalieren, wahr?
Es scheint, dass Titan jede Art von Graphen unterstützt, weil Cassandra (angeblich) nichts über den Graphen weiß - nur die Rohdaten. Leider habe ich nicht ein paar Server zum Testen verwenden. Ich glaube nicht, dass ein Benchmark auf 5 VMs, die auf der gleichen Festplatte laufen, mit einem internen Netzwerk eine faire Möglichkeit ist, dies zu testen. –