Wie kann ich binäre Dummy-Variablen in Python erstellen, die den Wert 0
annehmen, wenn das Gehalt einer Person unter dem Median der Gehaltsstufe liegt und ansonsten auf 1
eingestellt ist? Ich verstehe nicht, wie man es macht, wenn Gehalt über oder unter.Wie kann ich eine Dummy-Variable in Python mit einer Bedingung unterhalb oder oberhalb des Medians erstellen?
ich versucht, dieses
df['Salary'] = (df['Salary'] > df['Salary'].median()) & (df['Salary'] < df['Salary'].median())
Aber es gibt keinen Ausgang.
Davor habe ich versucht, dies:
df['Salary'].median()
df_Salary = pd.get_dummies(df['Salary'].median())
df_new = pd.concat([df, df_Salary], axis=1)
df_new
Und erhielt diese
Gender Exp Salary 74000.0
0 Female 15 78200 1
1 Female 12 66400 NaN
2 Female 3 6000 NaN
...
Vielen Dank! Aber als ich versucht habe, wie Sie sagten, ist ein Fehler aufgetreten. ValueError: Der Wahrheitswert einer Serie ist mehrdeutig. Verwenden Sie a.empty, a.bool(), a.item(), a.any() oder a.all(). ' – jul094
Nun, das ist ein Problem mit was auch immer 'df [' Gehalt '] 'und' df [' Gehalt ']. Median() 'ist. Ohne zu wissen, was das ist, kann ich Ihnen keine spezifischere Hilfe geben, aber es würde scheinen, 'df ['Gehalt'] 'ist ein Array von Werten und Python weiß nicht, wie man die Gültigkeit einer Reihe von Wahr und Falsch bewertet . Du brauchst vielleicht etwas wie Listenverstehen, wo du 'df ['Gehalt'] = [0 wenn Gehalt
zephyr