Ich habe einen Pandas-Datenrahmen, wo eine Spalte eine Liste aller Kurse ist, die ein Student belegt. Der Index ist die ID des Studenten.Wie finden Sie die gängigsten Sets mit Python?
Ich würde gerne die am häufigsten verwendeten Kurse für alle Studenten finden. Wenn zum Beispiel sieht der Datenrahmen wie folgt aus:
ID | Courses
1 [A, C]
2 [A, C]
3 [A, C]
4 [B, C]
5 [B, C]
6 [K, D]
...
Dann würde ich die Ausgabe wie die häufigsten Sätze und ihre Frequenz zurückkehren, so etwas wie:
{[A,C]: 3, [B,C]: 2}
[pandas.Series.value_counts()] (http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.value_counts.html)? – sascha
Diese Funktion gibt den Fehler zurück: _TypeError: nicht hashbarer Typ: 'list'_ –
Naja ... weil Listen irgendwie nicht hashbar sind (bei veränderbar) :-) Konvertiere sie in Tupel, was immer besser ist. – sascha