2016-11-29 6 views
0

Ich möchte ein ähnliches Diagramm wie das veröffentlichte here erhalten. In meinem Datensatz habe ich 3 Funktionen und 1 binäres Ziel. Wenn das Ziel = 0 ist, sollten die Punkte z.B. in rot. Wenn das Ziel = 1 ist, sollten die Punkte z.B. in Blau. Erstellung von scatter_matrix

Wenn ich diesen Code ausführen, sieht es aus wie alle Punkte die gleiche Farbe haben:

from pandas.tools.plotting import scatter_matrix 
scatter_matrix(df, alpha=0.2, figsize=(6, 6), diagonal='kde') 

Wie ich verschiedene Farben angeben, für Sollwerte 0 und 1, so dass ich mögliche Gruppierungen beobachten kann?

Antwort

0

Um diese Daten mit den pandasplotting Tools zu plotten, wie Sie jetzt sind, übergeben Sie color=['blue' if target == 1 else 'red'] als Argument.

Allerdings empfehle ich stattdessen die seabornpairplot Einrichtung verwenden. Dies führt zu einem Diagramm, das dem Tutorial sehr viel näher kommt, und um basierend auf einem Datenpunkt zu kolorieren, müssen Sie nur hue='my_data_column' als Parameter angeben. Cf. here.

+0

Danke für die Idee der Verwendung von 'Seaborn'. Können Sie ein Beispiel geben, wie Sie dieses Paket verwenden können? Ich habe es nie benutzt. – duckertito

+0

In diesem Fall willst du 'seaborn als sns importieren; sns.pairplot (df, figsize = (6, 6), diag_kind = 'kde', hue = 'ziel') ' –

+0

Ok, das Problem ist, dass wenn ich' g = sns.pairplot (df [selected_features], hue = "Ziel") g', dann erscheint die Handlung nicht (ich arbeite in Jupyter). Es sieht so aus, als ob es generiert wird, aber nicht erscheint. Wenn ich 'g.show' mache, gibt es einen Fehler. – duckertito