2017-10-31 2 views
0

Es gibt wenige Spalten, die aus Testwerten bestehen, z. B. die verwendete Zahlungsweise und welche Art von Rabatt verwendet wurde. Wenige der Einträge, die ich einfügen, um eine Idee zu bekommen.Wie konvertiert man die Objektspalte für die Clusteranalyse in Python in numerisch?

Mode_of_payment   discount_used 
ICICI CREDIT CARD   FGShoppingFest 
Payback    FGShoppingFest,T24Club 
CASH    FGShoppingFest,BBProfitClub 
CASH    FGShoppingFest,Payback 
ICICI CREDIT CARD    FGShoppingFest 
CreditNote    FGShoppingFest 
CASH    FGShoppingFest,Payback 
CASH    FGShoppingFest,T24Club,Payback 
Cash Back    FGShoppingFest 
Cash Back    FGShoppingFest,T24Club,Payback 
Cash Back    FGShoppingFest,T24Club 
CASH    FGShoppingFest,Payback 

Informationen über diese Spalten - Was die Art der Bezahlung verwendet wird und in der Rabatt-Säule verwendet - es kann auf einem Produkt Einzel Rabatt oder mehr Rabatte angewandt werden.

Ich möchte Informationen aus diesen Spalten extrahieren, damit Clustering angewendet werden kann. Wie konvertiert man es in numerische Daten?

Antwort

0

Nicht. Wählen Sie einen Ansatz, der keine numerischen Variablen erfordert, wenn Ihre Daten nicht numerisch sind.

Während Sie mit Dummy-Variablen codieren können, erwarten die meisten Clustering-Algorithmen wie k-bedeutet kontinuierliche Variablen. Sie können nicht einfach einen symbolischen Wert in eine sinnvolle kontinuierliche Variable umwandeln.

+0

Aber numerische Spalten sind sehr wenige und das sind PIN-Code, Speicherstandort-ID, Produkt gekauft ID.Es gibt keine kontinuierliche Funktion außer einem Preis des Produkts. Glauben Sie nicht, dass diese Funktionen einen guten Einblick geben, da die numerischen Variablen nicht viel beitragen würden? –

+0

Das habe ich nicht gesagt. Ich sagte, wählen Sie einen geeigneten Algorithmus für die Art von Daten, die Sie haben, nicht vorgeben, Ihre Daten sind für einen Algorithmus geeignet, wenn es eindeutig nicht ist ... –

+0

Aber die Aufgabe ist von Clustering. Ich kann die wenigen Zeilen dieser CSV-Datei nicht einfügen. –

Verwandte Themen