Ich habe ein Datenrahmen wie folgt aus:Wie führe ich groupby nur die vorhandenen Werte aus?
Platform Genre Score
PC Action 9
PS Adventure 8.5
Xbox Action 9.5....
die Datenrahmen riesig. Ich möchte eine Heatmap visualisieren, die die Plattform auf der x-Achse, das Genre auf y und den Score als Wert zeigt.
Also habe ich versucht, dies:
abc=games.groupby(['platform','genre'])['score'].mean().reset_index()
abc=abc.pivot('platform','genre','score')
sns.heatmap(abc)
Das Problem ist jetzt, da nicht alle die Plattform haben Spiele in allen Genres, die sich ergebende Datenrahmen NaN Werte viel ist zu müssen. Wenn ich abc.dropna() verwende, werden alle Zeilen gelöscht.
Also was soll ich tun, dass nur die relevanten Werte existieren, die nicht NaN sind ??
Zeigen Sie uns ein Beispiel – piRSquared
Ich schwenken Sie auf diese Weise dann sind die Nullwerte unvermeidlich. Wenn Sie die Plattform im Index und Genre in den Spalten haben, dann haben Sie Null-Werte, es sei denn, jedes Genre-Plattform-Paar befindet sich im Datensatz. Ich weiß nicht, wie 'sns.heatmap' funktioniert, aber Sie könnten versuchen, die Nullwerte mit' 0' zu füllen. – JoeCondron