Ich habe ein Pandas Datenframe mit einer Spalte, die reale Daten im Bereich von 0 bis 50 enthält. Sie sind nicht gleichmäßig verteilt.Discretisize Pandas 'Spalte mit der Datenverteilung
Ich kann die Verteilung erhalten: ein.
hist, bins = np.histogram(df["col"])
Was ich möchte jeden Wert mit der Bins' Nummer zu ersetzen, tun, ist es in fällt
Dazu wurde dies funktioniert:
Allerdings, mit einem Datenrahmen mit mehr die 4 Millionen Zeile, ist es ziemlich langsam (50 Minuten). Ich suche nach einem effizienteren Weg dazu. Habt ihr eine bessere Idee?
So einfach, wie ich träume! Vielen Dank! – Xema
@Xema Wäre schön, die Beschleunigung über die ursprüngliche "50min" -Marke zu kennen :) – Divakar
Nun, es war ziemlich sofort! – Xema