ich einen Ersatz-Array haben, dieWie eine spärliche oder NxM-Matrix erstellen mit scikits lernen
N M
a cat
b cat
c cat
a dog
d dog
e dog
Ich muss repräsentieren in diesem Format sieht wie folgt aus:
cat dog
a 1 1
b 1 0
c 1 0
d 0 1
e 0 1
Mit scikits-lernen tue ich das?
Meine Rohdaten sieht wie folgt aus:
[{"N":"a"},{"M":"cat"},{"N":"a"},{"M":"dog"}...]
Die Zellen, sondern binär und wird für nmf algo verwendet werden.
Wenn ich laufen die folgenden:
data = [{"N":"a"},{"M":"cat"},{"N":"a"},{"M":"dog"}]
v = DictVectorizer(sparse=False)
[[ 0. 0. 1.]
[ 1. 0. 0.]
[ 0. 0. 1.]
[ 0. 1. 0.]]
aber es sollte so aussehen:
1 1
Dank
Sie können ein Label-Encoder verwenden. Alternativ laden Sie Ihre Daten in einen dünn besetzten Datenrahmen und rufen 'get_dummies' auf. Hast du Pandas? –