Ich habe ein Datenrahmen genannt df
Spalte GENDER
, AGE
und ID
und anderen Spalten, und es ist ein weiterer Datenrahmen genannt df_2
die GENDER
nur 3 Spalten hat auch AGE
und ID
. Ich möchte den Wert GENDER
und AGE
in df
mit Werten von df_2
aktualisieren.Fater Update Pandas Dataframe
So sind meine Ideen
df_id = df.ID.tolist()
df_2_id = df_2.ID.tolist()
df = df.set_index('ID')
df_2 = df_2.set_index('ID')
# all the ids in df_2_id are in df_id
for id in tqdm.tqdm_notebook(df_2_id):
df.loc[id, 'GENDER'] = df_2.loc[id, 'GENDER']
df.loc[id, 'AGE'] = df_2.loc[id, 'AGE']
jedoch nur die für Schleife 17,2 Iterationen pro Sekunde hat, und es dauert etwa 2 Stunden, um die Daten zu aktualisieren. Wie kann ich es schneller machen?
nicht Pandas mit würde es schneller – Flika205
nicht 'df [ 'Geschlecht'] = df_2 [ 'Geschlecht']' 'dann df [ 'AGE'] = df_2 [ 'alte']' Arbeit? Warum benutzen Sie eine For-Schleife über 'ID'? –
@ juanpa.arrivillaga, da die 'df' und' df_2' unterschiedliche Formen haben. –