Ich habe einen Datenrahmen in der folgenden Form:Erhalten Beobachtungen basierend auf Perzentilwert in Python Pandas
d1 = {'City_ID': ['City_1','City_1','City_1','City_1','City_2','City_3','City_3','City_3','City_3','City_3'],
'Indiv_ID': ['Indiv_1','Indiv_2','Indiv_3','Indiv_4','Indiv_5','Indiv_6','Indiv_7','Indiv_8','Indiv_9','Indiv_10'],
'Expenditure_by_earning': [0.11, 0.66, 0.51, 0.43, 0.46,0.8, 0.14, 0.06, 0.64, 0.95]}
Die eigentliche Datensatz enthält über 1000 Städte mit mehreren Personen obwohl einige Städte nur 1 Beobachtung enthalten. Ich würde gern Einzelpersonen in jeder Stadt erhalten, deren Ausgaben, indem sie Wert verdienen, weniger als 25% Perzentil und mehr als 75% Perzentil für diese Stadt sind.
Die Ausgabe in diesem Fall ich erwarten würde:
City_ID Indiv_ID Expenditure_by_earning Percentile
City_1 Indiv_1 0.11 25
City_1 Indiv_2 0.66 75
City_3 Indiv_7 0.06 25
City_3 Indiv_8 0.14 25
City_3 Indiv_6 0.8 75
City_3 Indiv_10 0.95 75
Hinweis: City 2 eliminiert wird.
Würde jemand mir helfen, wie dies mit Python zu erreichen? Danke.
ehrfürchtig. Sehr geschätzt. – Prometheus