Wie ist die einfachste Methode zum Auswählen aller Zeilen eines Panda-Datenrahmens, wer ist sym genau doppelt in der gesamten Tabelle vorkommt? Zum Beispiel in der unten stehenden Tabelle, würde Ich mag alle Zeilen mit sym in [ ‚b‘, ‚e‘] wählen, da die value_counts für diese Symbole gleich 2.Pandas: Auswählen von Zeilen basierend auf Wert-Zählungen einer bestimmten Spalte
df=pd.DataFrame({'sym':['a', 'b', 'b', 'c', 'd','d','d','e','e'],'price':np.random.randn(9)})
price sym
0 -0.0129 a
1 -1.2940 b
2 1.8423 b
3 -0.7160 c
4 -2.3216 d
5 -0.0120 d
6 -0.5914 d
7 0.6280 e
8 0.5361 e
df.sym.value_counts()
Out[237]:
d 3
e 2
b 2
c 1
a 1