Ich konnte Funktion nicht finden, um Top n% automatisch zu bekommen, also sortierte ich größte und kleinste Werte und berechnete Zahlen zu Top 25% und Minimum 25% Bereiche. Ich möchte eine Flagge in einer neuen Spalte erstellen, die besagt, dass dieser Kunde in den oberen 25% des Umsatzes liegt.Python erstellen neue Spalte mit Top-Werten (%) mit anderen Spaltenwerte
from heapq import nsmallest
top_max = avg_cust_data.nlargest(10806, ['user_spendings'])
top_min = avg_cust_data.nsmallest(10806, ['user_spendings'])
avg_cust_data['spendings_flag'] = np.where(avg_cust_data['user_spendings'] = top_max, 'Top Max',
np.where(avg_cust_data['user_spendings'] = top_min, 'Top Min', 'AVG'))
Was 'avg_cust_data' ist? Wenn es Pandas DataFrame ist, versuchen Sie 'avg_cust_data ['user_sendings']. Describe()' – ArunDhaJ
Ja, es ist ein DataFrame, aber ich möchte ein Flags in neue Spalte 'spendings_flag' erstellen und Werte 'top max', 'top min 'oder' avg 'basierend auf Werten von' user_spendings '. – user2702405