Ich weiß nicht, um dieses Problem zu nähern. Ich habe einen Datenrahmen, dieIterativer Vergleich mit Pandas
cuenta_bancaria nombre_empresa perfil_cobranza usuario_id usuario_web
5545 a 123 500199 5012
5551 a 123 500199 3321
5551 a 55 500199 5541
5551 b 55 500199 5246
wie diese aussieht, was ich tun muß, ist zwischen jeder Zeile pro usuario_id laufen und prüfen, ob es ein Unterschied zwischen jeder Zeile, und erstellen Sie einen neuen Datensatz mit der Zeile geändert und die usuario_web verantwortlich für diese Änderung, einen Datenrahmen zu erzeugen, die wie folgt aussieht:
usuario_id cambio usuario_web
500199 cuenta_bancaria 3321
500199 perfil_cobranza 5541
500199 nombre_empresa 5246
gibt es eine Möglichkeit, dies zu tun? Ich arbeite mit Pandas auf Python und dieses Dataset könnte etwas groß sein, sagen wir etwa 10000 Zeilen, sortiert nach usuario_id.
Vielen Dank für jeden Hinweis.
'überprüfen, ob es einen Unterschied zwischen den einzelnen Zeilen gibt 'in Bezug auf welche Spalten? Das ist wichtig. –
Vergessen, das hinzuzufügen. Ich muss in diesem Fall nombre_empresa, perfil_cobranza und cuenta_bancaria vergleichen. Nehmen wir an, das Feld cuenta_bancaria hat sich zwischen Zeile 1 und Zeile 2 geändert, also muss ich es auf den neuen Datenrahmen setzen. Dann vergleiche erneut die Zeile 2 und Zeile 3 und überprüfe die Differenz, in diesem Fall auf perfil_cobranza, und lege das auf den neuen Datenrahmen. –
Was passiert, wenn sich mehr als eine Spalte ändert? –