Ich versuche MultiLabelBinarizer
in sklearn zu verwenden. Ich habe eine Pandas-Serie und möchte diese Serie als Eingabe für die Fit-Funktion MultiLabelBinarizer
eingeben. Ich sehe jedoch, dass die Anpassung von MultiLabelBinarizer eine Eingabe von Formular iterable of iterables
benötigt. Ich bin mir nicht sicher, wie ich die Pandas-Serie in den gewünschten Typ konvertieren kann.Konvertieren Pandas-Serie zu iterierbaren iterables
import pandas as pd
from sklearn.preprocessing import MultiLabelBinarizer
data = pd.read_csv("somecsvFile")
y = pd.DataFrame(data['class'])
mlb = MultiLabelBinarizer()
y = mlb.fit(???)
Ich habe versucht, es zu numpy Array zu konvertieren, versuchte mit Iter-Funktion von Pandas, aber nichts scheint zu funktionieren.
Bitte schlagen Sie mir einen Weg vor.
Dank
Edit1: Ausgabe von print(data['class'].head(10))
ist:
0 func
1 func
2 func
3 non func
4 func
5 func
6 non func
7 non func
8 non func
9 func
Name: status_group, dtype: object
Wie sieht Ihr Datenrahmen aus? Diese Lösung ist einfach, ich muss nur wissen, welche Spalten Ihr df hat. –
Können Sie eine Ausgabe von 'print (data ['class']. Head (10))'? – MaxU
@ cᴏʟᴅsᴘᴇᴇᴅ - Bearbeitete Frage, um die Ausgabe des Kopfes hinzuzufügen. –