Ich möchte die Möglichkeit der Verwendung von Cassandra, BigTable oder einer Hadoop-Lösung prüfen. Gibt es Orte, die einen aktuellen Vergleich darüber haben, wie diese drei Vergleichstests durchgeführt werden? Ich habe ein paar von vor vielleicht fünf Jahren gefunden, aber ich würde gerne einen besseren Überblick über die drei Datenbanken - ihre Stärken und Schwächen - vor dem Tauchen erhalten.DB-Benchmarks: Cassandra vs. BigTable vs. Hadoop
1
A
Antwort
3
YCSB (Yahoo! Cloud Serving Benchmark) ist der Standard für NoSQL-Datenbanken zur Leistungsprüfung. This presentation scheint das Ziel von YCSB Latenz und Skalierbarkeit zu testen.
Zusätzlich zu Latenz und Skalierbarkeit überprüfe ich den Durchsatz (d. H. Die geleistete Arbeit) für hohe Batch-Belastung und die Tail-Latenz für Systeme vom Typ "online", wenn die Server angemessen bereitgestellt werden. Mit Tail Latency meine ich Dinge: wie schnell ist langsam 1% (oder .1%) der Anfragen unter.
Cloud Bigtable put out some YCSB results wenn es zuerst startete (FYI ich arbeite an diesem Produkt).
1
- Hadoop ist ein Ökosystem, auf dem viele Arten von Datenbanken laufen. Was ich glaube, dass Sie vergleichen möchten, ist HBase. Es ist langsamer, dass Cassandra in den meisten Benchmarks, die ich gesehen habe, können Sie leicht Benchmarks für den Vergleich dieser beiden finden. Und wenn Sie über Hadoop sprechen, müssen Sie verstehen, dass dies eine viel kompliziertere Umgebung als Cassandra oder BigTable ist.
- BigTable kann so ziemlich alles essen, was Sie darauf werfen, zahlen Sie einfach Google und alles wird in Ordnung sein. (Gesehen Benchmark mit 2 Millionen Record/Sekunde schreiben).
- Die Cassandra-Architektur basiert auf DynamoDB (AWS) und BigTable-Design. Es ist sehr schnell in Workloads, für die es entwickelt wurde (Sie können viele Benchmarks für 1 Million Schreibvorgänge pro Sekunde finden).
- Vertrauen Sie nie Benchmarks im Internet :). Sie müssen es selbst mit Ihren Beispieldaten ausführen. Nicht alle Datenbanken sind für alle Bedürfnisse geeignet. Wenn Sie ein wenig mehr Informationen darüber bereitstellen, welche Arbeitslast auf Datenbanken angewendet werden soll, können Sie hier die Benutzer für die benötigte Datenbank/Datenbank anleiten. (Es gibt viel mehr als die 3, die Sie aufgelistet haben).
Verwandte Themen
- 1. bigtable vs cassandra vs simpledb vs dynamo gegen couchdb vs hypertable vs riak gegen hbase, was haben sie gemeinsam?
- 2. Hadoop vs Cassandra: Was ist besser für das folgende Szenario?
- 3. db.get() vs db.get_by_key_name() Leistung (GAE BIgtable/Datastore)
- 4. Cassandra: Text vs varchar
- 5. Cassandra vs Riak
- 6. Cassandra Cluster Vs Knoten
- 7. Vergleichen von Cassandra CQL vs Spark/Shark Abfragen vs Hive/Hadoop (DSE-Version)
- 8. Java vs Python auf Hadoop
- 9. Hadoop Immutable vs Datentyp veränderbar
- 10. Oracle Hadoop Connectors vs Sqoop
- 11. Cassandra Indizes vs materialisierte Ansicht
- 12. UTF8Type vs. ByteType Apache Cassandra
- 13. Plain vanilla Hadoop-Installation vs Hadoop-Installation mit Ambari
- 14. Hadoop-Installation auf Ubuntu, Hadoop-Datei VS Hortonworks oder Cloudera
- 15. Hadoop auf EC2 vs. ElasticMapReduce/S3
- 16. Apache Hadoop-Versionen 2.0 vs. 0.23
- 17. Elasticsearch vs hbase/Hadoop für Echtzeit-Statistiken
- 18. Hadoop YARN vs Garn Paketmanager Befehl Konflikt
- 19. Cassandra Java API Treiber- Querybuilder vs PreparedStatements
- 20. Cassandra Reihe vs. Hinzufügen von Spalten: Leistung
- 21. Distributed Data Store - Hazelcast Vs Cassandra
- 22. Unique TimeUUID in Cluster-Umgebung vs. Cassandra
- 23. Cassandra Vs Dynamo Datenbank Primärschlüssel Auswahl
- 24. Cassandra Abfrageausführungs Sequenzierung vs Eventual Consistency Problem
- 25. Hadoop auf Cassandra-Datenbank
- 26. PiG + Cassandra + Hadoop
- 27. Eigenständiger Manager Vs. Garn Vs. Mesos
- 28. hadoop.mapred vs hadoop.mapreduce?
- 29. Klasse vs Paket vs Modul vs Komponente vs Container vs Service vs Plattform in Java Welt
- 30. Hadoop MapReduce vs MPI (vs Spark gegen Mahout vs Mesos) - Wann man einen über den anderen zu verwenden?