Ich benutze Pandas, um einige Analyseübungen durchzuführen. Ich möchte eine neue Spalte erstellen, dass der Wert die Summe von zwei Zeilen ist. Der ursprüngliche Datensatz wird wie folgt ...Erstelle Spalte unter zwei Bedingungen mit Pandas
Admit Gender Dept Freq
0 Admitted Male A 512
1 Rejected Male A 313
2 Admitted Female A 89
3 Rejected Female A 19
4 Admitted Male B 353
5 Rejected Male B 207
6 Admitted Female B 17
7 Rejected Female B 8
8 Admitted Male C 120
9 Rejected Male C 205
10 Admitted Female C 202
11 Rejected Female C 391
12 Admitted Male D 138
13 Rejected Male D 279
14 Admitted Female D 131
15 Rejected Female D 244
16 Admitted Male E 53
17 Rejected Male E 138
18 Admitted Female E 94
19 Rejected Female E 299
20 Admitted Male F 22
21 Rejected Male F 351
22 Admitted Female F 24
23 Rejected Female F 317
ich eine neue Spalte unter Verwendung der folgenden Datenrahmen erstellen möchten ...
Dept Gender Freq
0 A Female 108
1 A Male 825
2 B Female 25
3 B Male 560
4 C Female 593
5 C Male 325
6 D Female 375
7 D Male 417
8 E Female 393
9 E Male 191
10 F Female 341
11 F Male 373
ich eine neue Spalte in der ersten Daten erstellen möchten Rahmen unter Verwendung der Freq
Spalte des zweiten Datenrahmens. Ich muss den 108
Wert einfügen if Detp and Gender
sind die gleichen in beiden Datenrahmen. Der neue Datenrahmen sollte so aussehen ...
Admit Gender Dept Freq Total
0 Admitted Male A 512 825
1 Rejected Male A 313 825
2 Admitted Female A 89 108
3 Rejected Female A 19 108
4 Admitted Male B 353 560
5 Rejected Male B 207 560
6 Admitted Female B 17 25
7 Rejected Female B 8 25
Ich habe den folgenden Code versucht ...
for i in data.iterrows():
for j in total_freq.iterrows():
if i[1].Gender == total_freq.Gender & i[1].Dept == total_freq.Dept:
data['Total'] = total_freq.Freq
ich folgende Fehlermeldung erhalten ... TypeError: cannot compare a dtyped [object] array with a scalar of type [bool]
Jede Hilfe zu die Spalte mit den korrekten Werten erstellen?