Ich muss den Mittelwert und Median für Frequenzen zwischen zwei kategorischen Variablen erhalten. Z.B .:beschreibende Statistiken für zwei kategorische Variablen (Pandas)
Etikett, Brief Num
Foo | A | 1
Foo | B | 2
Foo | C | 4
Bar | A | 2
Bar | G | 3
Bar | N | 1
Bar | P | 2
Cee | B | 1
Cee | B | 2
Cee | C | 4
Cee | D | 5
Zum Beispiel, was ist die mittlere und mittlere Anzahl von Buchstaben pro Etikett. Hier sind 11 Fälle von drei möglichen Markierungen (M = 3,667) und der Median ist 4 (3 foo, 4 bar, 4 cee). Wie kann ich das in Pandas berechnen? Ist es möglich, dies mit einer groupby-Anweisung zu tun? Mein Datensatz ist viel größer als das.
Ich habe eine Frage off topic. Wie importieren Sie die OP-Daten in Ihren Datenrahmen? – bhansa
Ich benutze 'sep =" \ s + \ | \ s + "' und füge '|' zu 'header's manuell hinzu – jezrael
Oder besser ist' sep = "\ s + \ | \ s + | \ s +" '- nicht notwendig add' | 'zu Überschriften – jezrael