Ich versuche, Daten nach ihrer Wahrscheinlichkeit zu indizieren (geschätzt mit einem einfachen Histogramm). Das Ziel besteht darin, Elemente in der Reihe mit einer Wahrscheinlichkeit kleiner als ein Schwellenwert auszuwählen.Pandas: Indexdaten durch ein Histogramm Ergebnis
Ich habe eine Reihe von Integer-Werte, zum Beispiel:
import pandas as pnd
import numpy as np
series = pnd.Series(np.random.poisson(5, size = 100))
dann berechne ich ihr Histogramm wie folgt aus:
tmp = {"series" : series, "count" : np.ones(len(series))}
hist = pnd.DataFrame(tmp).groupby("series").sum()
freq = hist/hist.sum()
So, jetzt habe ich die Frequenzen jedes Ergebnis durch das Ergebnis indiziert und die Reihe der Ergebnisse. Ich habe jetzt zwei Fragen:
- Gibt es eine Möglichkeit zu indizieren
series
durch die Abbildung des Ergebnisses/Frequenz definiert durchfreq
? - Wenn ich das bewerkstellige, wie wähle ich nur Ergebnisse mit einer Häufigkeit größer als ein Wert aus?
Danke.
humm! Nett!! Vielen Dank. –