Ich versuche rund 2 Millionen Datensätze in Cassandra durch Funken zu laden. Spark hat 4 Executoren und Cassandra hat 4 Knoten im Cluster. Aber es dauert ungefähr 20 Minuten, um alle Daten in Cassandra zu speichern. Kann mir bitte jemand helfen, dieses Ding etwas schneller zu machen.Spark Cassandra Write Performance
-1
A
Antwort
0
Ok, damit ich einige Probleme mit der Konfiguration
- Laufe Cassandra in VM für Performance-Benchmark
- Spark-NICHT co-located (also keine Datenlokalität ...)
sehen Im Allgemeinen ist die Installation von Cassandra in einer virtuellen Maschine nicht empfohlen für Leistungs-Benchmark, dies ist ein Anti-Pattern. So ist Ihre langsame Insertionsrate normal, beschweren Sie sich nicht, Sie können nicht bessere Leistung verlangen, während VM verwendet ...
Verwandte Themen
- 1. Cassandra Performance Tuning
- 2. Spark-Python Performance Tuning
- 3. Spark und Cassandra Parallelverarbeitung
- 4. Cassandra + Spark für Echtzeitanalyse
- 5. Spark cassandra update/upsert
- 6. Spark + Cassandra Integration
- 7. Cassandra Spark Connector
- 8. Spark SQL Cassandra Datensätze löschen
- 9. Spark-Cassandra-Stecker Daten lesen
- 10. java Spark Streaming nach Cassandra
- 11. Verwendet Spark SQL Cassandra Sekundärindizes?
- 12. In Bezug auf Cassandra Read Performance
- 13. Wie funken Sie mit Cassandra mit Spark-Cassandra-Connector?
- 14. NoClassDefFoundError: org/apache/spark/sql/Datenrahmen in Spark-Cassandra-Connector
- 15. Kompilierungsfehler mit Spark Cassandra-Anschluss und SBT
- 16. Lesen von Cassandra mit Spark Streaming
- 17. Spark Cassandra Anwendung immer im laufenden Betrieb
- 18. Spark liest die Cassandra UDT Spalte
- 19. Probleme mit Datastax Spark-Cassandra-Stecker
- 20. Cassandra mit Spark (pyspark) verbinden/integrieren
- 21. vorschlagen Kostenlose Tools zur Überwachung der Cassandra-Cluster-Performance
- 22. Write-back vs Write-Through
- 23. [Cassandra] Filter auf Zeilenschlüsselebene in Cassandra sql in Spark-Job verursacht die Überkapazität der CPU-Auslastung
- 24. Spark Streaming - Java - JSON von Kafka in Cassandra einfügen
- 25. Cassandra + Solr/Hadoop/Spark - Auswahl der richtigen Werkzeuge
- 26. Spark Cassandra Anwendung schlägt mit RECEIVED SIGNAL 15: SIGTERM
- 27. sql Abfrage zu Spark-Cassandra-Cluster Sparsamkeitsserver gibt nicht
- 28. Spark Cassandra Connector - Bereich Abfrage auf Partition Schlüssel
- 29. Speichern null Werte in Cassandra mit DataStax Spark Connector
- 30. Übermäßige Partitionierung (zu viele Aufgaben) auf Apache Spark/Cassandra Cluster
Dies ist nur 1,6 k schreibt pro Sekunde, die für 4 Knoten von C * ziemlich langsam ist. Sie müssen jedoch viel mehr Informationen angeben, wenn jemand Ihnen helfen kann. Wie lesen Sie die Datensätze Welchen Code verwenden Sie zum Schreiben Welche Art von Hardware sind die Knoten ... – RussS
Eigentlich verwende ich Dataframe, um die Datensätze zu lesen, und alle Knoten haben 7G Speicher – franyfpk
können Sie bitte lassen Ich weiß im Allgemeinen, was ist die Schreibgeschwindigkeit für einen 4-Knoten-Cluster. – franyfpk