Mit klassifizieren:Wie die Zahlen von Wert in Datenrahmen
import pandas as pd
df = pd.DataFrame({'a':[1,2,3,4,5,12,14,121,131,298,299,1001]})
print df.a.mean()
gibt einen Mittelwert aller Zahlen:
157.583333333
Die Hälfte der Zahlen ist kleiner als 100. Ich frage mich, ob es eine Möglichkeit, die Zahlen in die Kategorien zu zerlegen (im Wesentlichen zu klassifizieren). Ich würde die Anzahl der Gruppen angeben, in die die Zahlen eingeordnet werden sollen, und die Funktion würde eine Liste zurückgeben, in der jede Zahl durch den Index der entsprechenden Kategorie ersetzt wird. Also würden die Zahlen kleiner als 100 eine ganzzahlige Kategorie 1 erhalten. Dann würden die Zahlen von 100 - 200 eine Kategorie 2 und usw. erhalten. Im Wesentlichen eine Art Rundungsfunktion, die die Zahlen auf alle im Wertebereich runden würde: von 0 bis 100, von 100,1 bis 200,0 und usw.
„wobei jede Zahl mit der entsprechenden Kategorie-Index ersetzt“. Oder fügen Sie einfach eine Spalte "Kategorie" zum Datenrahmen hinzu? Dann werden Sie die eingegebenen Zahlen nicht verlieren. – Evert