Ich benutze eine Pandas-Serie und versuche, es in eine Hot-Encodierung zu konvertieren. Ich verwende die describe
Methode, um zu überprüfen, wie viele eindeutige Kategorien die Serie hat. Die Ausgabe lautet:Pandas get_dummies generiert mehrere Spalten für die gleiche Funktion
input['pattern'].describe(include='all')
count 9725
unique 7
top 1
freq 4580
Name: pattern, dtype: object
Wenn ich versuche:
x = pd.get_dummies(input['pattern'])
x.describe(include= 'all')
ich 18 Klassen mit 12 Klassen, die vollständig Nullen sind. Wie kam es, dass get_dummies
Klassen erzeugte, die nicht einmal in der Eingabe vorkamen?
Ich habe keine Ahnung, was Ihr Problem ist, da ich Ihre Daten nicht sehen kann. Kannst du etwas dagegen tun? –
Meine Daten sind nur Zahlen in einem Objektformat wie [0, 0, 5, 6, ....]. Es hatte ursprünglich 18 Klassen, aber alle hohen Klassen wurden in Klasse '6' geändert und die Beschreibungsmethode bestätigt dies. Alle hoch generierten Klassen sind alle Nullen. –
Es tut mir leid, ich verstehe immer noch nicht, und Ihre Erklärung hilft nicht viel. Alle Get Dummies konvertieren Ihre Spalte in einen Datenrahmen von Codierungen. Zählen Sie die Anzahl der Spalten - das ist die Anzahl der einzigartigen Funktionen, die Sie haben. Der Aufruf von 'describe' auf dem Ausgang macht wenig Sinn, da es nur 0s und 1s ist. –