Ich möchte meine DataFrame durch spezifische Spalte gruppieren und dann eine sklearn Vorverarbeitung MinMaxScaler anwenden und speichern Sie das Scaler-Objekt.Pandas groupby in Kombination mit sklearn preprocessing
Mein zur Zeit der Ausgangspunkt:
import pandas as pd
from sklearn import preprocessing
scaler = {}
groups = df.groupby('ID')
for name, group in groups:
scr = preprocessing.MinMaxScaler()
scr.fit(group)
scaler.update({name: scr})
group = scr.transform(group)
Ist dies möglich mit df.groupby('ID').transform
?
UPDATE
Von meiner ursprünglichen Datenrahmen
pd.DataFrame(dict(ID=list('AAABBB'),
VL=(0,10,10,100,100,200))
Ich möchte alle Spalten auf ID basiert skalieren. In diesem Beispiel:
A 0.0
A 1.0
A 1.0
B 0.0
B 0.0
B 1.0
mit den Informationen/Scaler-Objekt (mit Sitz initialisiert)
preprocessing.MinMaxScaler().fit(...)