2017-09-26 1 views
-3

Gibt es eine Möglichkeit, einen APACHE Dataframe zu plotten? Ich habe es herausgefunden, während ich es in einen Pandas-Datenrahmen umwandelte, der viel Zeit in Anspruch nimmt und nicht mein Ziel ist. Ziel ist es insbesondere, eine Map aus einem Apache DataFrame ohne Konvertierung in einen Pandas DataFrame zu plotten. Mit Plotten möchte ich eine Bibliothek wie Matplotlib oder plotly für die Erstellung einer Grafik oder etwas ähnliches verwenden. Irgendwelche Ideen? Danke!Plotten eines Apache DataFrame

Antwort

0

Meinst du Plot Spark-Dataframe?

yourDF.show(100, truncate=false) 

Dies wird zeigen, in Ihrer Anmeldung Ihre Datenrahmen Struktur und Werte (in diesem Fall zuerst 100 Zeilen) die gleichen:

In diesem Fall könnten Sie so etwas wie diese, mit yourDF als Datenrahmen tun So findest du es in Pandas. Mit der Option truncate geben Sie an, dass Sie den gesamten Datenrahmen anstelle einer reduzierten Version anzeigen möchten.

EDIT: um von einem Datenrahmen direkt plotten, überprüfen Sie bitte die plotly lib, o der

display(dataframe) 

Funktion, dokumentiert here.

+0

Natürlich könnte dies etwas Zeit haben, um den Vorgang abzuschließen, da show() auch alle verteilten Daten sammeln muss. –

+0

Ich sollte neu festlegen was ich will. Ich zeichne gerade mit ploty oder matplotlib bestimmte Graphen aus Operationen innerhalb des Spark DataFrame, muss aber immer vorher in einen Pandas Dataframe transformieren. Ist es möglich, dies direkt aus einem Apache Spark DataFrame heraus zu tun? – inneb

+0

Ok! Dann brauchst du Plotly. Ich bearbeite meine Antwort;) –

Verwandte Themen