2017-01-10 4 views
1

Ich möchte die Möglichkeit der Verwendung von Cassandra, BigTable oder einer Hadoop-Lösung prüfen. Gibt es Orte, die einen aktuellen Vergleich darüber haben, wie diese drei Vergleichstests durchgeführt werden? Ich habe ein paar von vor vielleicht fünf Jahren gefunden, aber ich würde gerne einen besseren Überblick über die drei Datenbanken - ihre Stärken und Schwächen - vor dem Tauchen erhalten.DB-Benchmarks: Cassandra vs. BigTable vs. Hadoop

Antwort

3

YCSB (Yahoo! Cloud Serving Benchmark) ist der Standard für NoSQL-Datenbanken zur Leistungsprüfung. This presentation scheint das Ziel von YCSB Latenz und Skalierbarkeit zu testen.

Zusätzlich zu Latenz und Skalierbarkeit überprüfe ich den Durchsatz (d. H. Die geleistete Arbeit) für hohe Batch-Belastung und die Tail-Latenz für Systeme vom Typ "online", wenn die Server angemessen bereitgestellt werden. Mit Tail Latency meine ich Dinge: wie schnell ist langsam 1% (oder .1%) der Anfragen unter.

Cloud Bigtable put out some YCSB results wenn es zuerst startete (FYI ich arbeite an diesem Produkt).

1
  1. Hadoop ist ein Ökosystem, auf dem viele Arten von Datenbanken laufen. Was ich glaube, dass Sie vergleichen möchten, ist HBase. Es ist langsamer, dass Cassandra in den meisten Benchmarks, die ich gesehen habe, können Sie leicht Benchmarks für den Vergleich dieser beiden finden. Und wenn Sie über Hadoop sprechen, müssen Sie verstehen, dass dies eine viel kompliziertere Umgebung als Cassandra oder BigTable ist.
  2. BigTable kann so ziemlich alles essen, was Sie darauf werfen, zahlen Sie einfach Google und alles wird in Ordnung sein. (Gesehen Benchmark mit 2 Millionen Record/Sekunde schreiben).
  3. Die Cassandra-Architektur basiert auf DynamoDB (AWS) und BigTable-Design. Es ist sehr schnell in Workloads, für die es entwickelt wurde (Sie können viele Benchmarks für 1 Million Schreibvorgänge pro Sekunde finden).
  4. Vertrauen Sie nie Benchmarks im Internet :). Sie müssen es selbst mit Ihren Beispieldaten ausführen. Nicht alle Datenbanken sind für alle Bedürfnisse geeignet. Wenn Sie ein wenig mehr Informationen darüber bereitstellen, welche Arbeitslast auf Datenbanken angewendet werden soll, können Sie hier die Benutzer für die benötigte Datenbank/Datenbank anleiten. (Es gibt viel mehr als die 3, die Sie aufgelistet haben).
Verwandte Themen