die beiden Szenarien Betrachten:Mit RDD Transformation und wandelt es in ein Datensatz vor einer Aktion VS Datensatz und seine API
A) Wenn ich eine RDD und verschiedene RDD Transformationen haben, werden sie aufgefordert, und vor dem Alle Aktionen werden ausgeführt. Ich erstelle ein Dataset daraus.
B) Ich erstelle einen Dataset ganz am Anfang und ruft verschiedene Dataset-Methoden auf.
Frage: Wenn die beiden Szenarien produzieren das gleiche Ergebnis logisch - verwendet man RDD Transformation und wandelt es in ein Datensatz direkt vor einer Aktion vs nur mit Dataset und seine Transformation - beide Szenarien tun durch das geht gleiche Optimierungen?