Ich habe eine Reihe von Umfrageantworten, die ich mit Pandas analysieren möchte. Mein Ziel ist es (in diesem Beispiel) das gängigste Geschlecht in jedem Bezirk in den USA zu finden, so dass ich den folgenden Code:Gruppe von mit Modus als Aggregator
import pandas as pd
from scipy import stats
file['sex'].groupby(file['county']).agg([('modeSex', stats.mode)])
Die Ausgabe lautet:
Wie kann Ich entpacke das, um nur den Moduswert und nicht den zweiten Wert zu erhalten, der angibt, wie oft der Modus auftritt? Hier
ist ein Beispiel des Datenrahmens:
county|sex
----------
079 | 1
----------
079 | 2
----------
079 | 2
----------
075 | 1
----------
075 | 1
----------
075 | 1
----------
075 | 2
Wunsch Ausgabe lautet:
county|modeSex
----------
079 | 2
----------
075 | 1
'Datei ['Geschlecht']. Groupby (Datei ['Grafschaft']). Agg ({'ModusSex': Lambda x: stats.mode (x) [ 0] [0]}) 'endete als Gewinner ... Danke! – Josh