Ich füge in Cassandra mit Spark ein.Wie kann ich wissen, dass keine Zeilen mit Spark in Cassandra eingefügt werden
CassandraJavaUtil.javaFunctions(newRDD)
.writerBuilder("dmp", "dmp_user_user_profile_spark1", mapToRow(UserSetGet.class)).saveToCassandra();
logger.info("DataSaved");
Meine Frage ist, wenn RDD 5k Zeilen hat, und beim Einfügen in Cassandra aus irgendeinem Grund schlägt der Auftrag fehl.
Wird es für die Zeilen werden Rollback, die 5k aus
wurden eingesetzt und wenn nicht, wie kann ich wissen, wie viele Zeilen tatsächlich eingefügt ist, so dass ich meine Arbeit von der ausgefallenen Zeile wieder starten kann.
Hallo Abhishek danke für die Antwort, aber das Problem hier ist in der Tabelle gibt es eine Spalte app_count, die bei jedem Update inkrementiert wird. Ich muss also wissen, welche Zeilen aktualisiert wurden, wenn der Fehler auftritt. –
Die Antwort wurde aktualisiert. Oder wahrscheinlich sollten Sie eine zusätzliche Spalte hinzufügen, um diese Art von Dingen in Cassandra zu verfolgen, kann Date oder sogar eine ganze Spalte sein. –
Hallo Abhishek, ich habe genau das selbe gemacht, dh die RDD in feste Längen zu teilen, aber meine Frage war, dass sie in der Mitte des Einfügens fehlschlagen würde. Von 5000 wurden nur 2000 eingefügt und dann ist es fehlgeschlagen. . Meine Tabelle ist riesig, also versuche ich eine zusätzliche Spalte (wie AutoIncrement int) mit zipWithIndex einzuführen. Wie auch immer, danke für die Antwort –