Ich führe einige Anfragen auf Funken mit nur einem Knoten und dann mit 4 Knoten. Und im Funken: 4040 UI sehe ich etwas, das ich nicht verstehe. Zum Beispiel nach dem Ausführen einer Abfrage mit 4 Knoten und überprüfen Sie die Ergebnisse in der Spark UI, in der Registerkarte "Eingabe" erscheint 2,8GB, so Funke lesen 2,8GB von Hadoop.Warum ist der Eingabewert auf Spark UI geringer, wenn wir mehr Knoten verwenden und der Shuffle-Wert gleich bleibt?
Die gleiche Abfrage auf Hadoop mit nur einem Knoten im lokalen Modus erscheint 7,3 GB, der Funke gelesen 7,3 GB von Hadoop. Aber dieser Wert sollte nicht gleich sein? Zum Beispiel bleibt der Wert von shuffle + - gleich in einem Knoten vs. 4. Warum bleibt der Eingabewert nicht gleich? Die gleiche Menge an Daten muss von den hdfs gelesen werden, also verstehe ich nicht. Wissen Sie?
Einzelknoten:
Unterhalb derselben Abfrage auf Mehrfachknoten, wie Sie Eingabe sehen kann, ist weniger aber die Shuffle bleibt + - icual, weißt du, warum?
Sie müssen beschreibender sein mit dem, was Sie fragen. Ich kann Dinge nicht annehmen und antworten. –
Ich frage, wenn ich die gleiche Abfrage mit 1 Arbeiter ausführen, bekomme ich für Beispiel in Eingabe 7GB. Wenn ich dieselbe Abfrage mit 3 Workers ausführe, bekomme ich 2,5GB auf der Input-Registerkarte. Aber die Shuffle bleibt + - das gleiche in der Abfrage Ausführung entweder ich 1 oder 3 Arbeiter verwenden. Und ich verstehe nicht, warum der Shuffle icual ist und der Input unterschiedlich bleibt. – codin
Können Sie Schnappschüsse anbringen, über welchen Unterschied Sie sprechen? –