2016-03-24 6 views
-1

Ich versuche rund 2 Millionen Datensätze in Cassandra durch Funken zu laden. Spark hat 4 Executoren und Cassandra hat 4 Knoten im Cluster. Aber es dauert ungefähr 20 Minuten, um alle Daten in Cassandra zu speichern. Kann mir bitte jemand helfen, dieses Ding etwas schneller zu machen.Spark Cassandra Write Performance

+1

Dies ist nur 1,6 k schreibt pro Sekunde, die für 4 Knoten von C * ziemlich langsam ist. Sie müssen jedoch viel mehr Informationen angeben, wenn jemand Ihnen helfen kann. Wie lesen Sie die Datensätze Welchen Code verwenden Sie zum Schreiben Welche Art von Hardware sind die Knoten ... – RussS

+0

Eigentlich verwende ich Dataframe, um die Datensätze zu lesen, und alle Knoten haben 7G Speicher – franyfpk

+0

können Sie bitte lassen Ich weiß im Allgemeinen, was ist die Schreibgeschwindigkeit für einen 4-Knoten-Cluster. – franyfpk

Antwort

0

Ok, damit ich einige Probleme mit der Konfiguration

  1. Laufe Cassandra in VM für Performance-Benchmark
  2. Spark-NICHT co-located (also keine Datenlokalität ...)

sehen Im Allgemeinen ist die Installation von Cassandra in einer virtuellen Maschine nicht empfohlen für Leistungs-Benchmark, dies ist ein Anti-Pattern. So ist Ihre langsame Insertionsrate normal, beschweren Sie sich nicht, Sie können nicht bessere Leistung verlangen, während VM verwendet ...

Verwandte Themen