Lassen Sie uns sagen, ich erstellte Datensatz durch verschiedene Transformationen (Join, Karte und etc) und speicherte es in Tabelle A in HBase. Jetzt möchte ich den gleichen Datensatz in anderen Tabellen in HBase mit der Auswahl bestimmter Spalten speichern. Sollte ich in diesem Fall nach dem Speichern in Tabelle A die Persistent-Funktion verwenden? Oder wenn ich nur die Funktion wähle, ist das egal?Spark Persist-Funktion in der Wiederverwendung Datensatz
Zum Beispiel:
Dataset<Row> ds = //computing dataset by different transformations
//save ds to table A in hbase
ds.persist();
Dataset<Row> ds2 = ds.select(col("X"));
//save ds2 to table B in hbase
Dataset<Row> ds3 = ds.select(col("Y"),col("Z"));
//save ds3 to table C in hbase
ds.unpersist();