Wie würde ich diese grundlegende Tabelle mit Pandas drehen?
Was ich will, ist dies:
visit_id atc_1 atc_2 atc_3 atc_4 atc_5 atc_6 atc_7
48944282 A02AG J01CA04 J095AX02 N02BE01 R05X NaN NaN
48944305 A02AG A03AX13 N02BE01 R05X NaN NaN NaN
Ich weiß nicht, wie viele atc_1 ... atc_7 ... atc_100 Spalten wird es im voraus sein müssen?. Ich muss nur alle zugehörigen atc_codes
in einer Zeile mit jedem visit_id
sammeln.
Das scheint wie ein group_by
und dann ein pivot
aber ich habe es viele Male versucht und ist fehlgeschlagen. Ich habe auch versucht, ein la SQL mit Pandas merge
() selbst zu verbinden, aber das funktioniert auch nicht.
Das Endergebnis ist, dass ich atc_1
, atc_7
, ... atc_100
zu einem langen atc_code
zusammenfügen werde. Dieser Verbund atc_code
wird meine Spalte "Y
" oder "Labels" meines Datasets sein, die ich vorherzusagen versuche.
Vielen Dank!
ist es sicher zu sagen, dass, ob in 4 Minuten oder 40 Jahren, ich nie in der Lage gewesen wäre, damit zu kommen. Danke, auch wenn ich es (noch) nicht ganz verstehe – user798719
Gib mir eine Sekunde, ich füge eine Erklärung hinzu. – jezrael