Es gibt wenige Spalten, die aus Testwerten bestehen, z. B. die verwendete Zahlungsweise und welche Art von Rabatt verwendet wurde. Wenige der Einträge, die ich einfügen, um eine Idee zu bekommen.Wie konvertiert man die Objektspalte für die Clusteranalyse in Python in numerisch?
Mode_of_payment discount_used
ICICI CREDIT CARD FGShoppingFest
Payback FGShoppingFest,T24Club
CASH FGShoppingFest,BBProfitClub
CASH FGShoppingFest,Payback
ICICI CREDIT CARD FGShoppingFest
CreditNote FGShoppingFest
CASH FGShoppingFest,Payback
CASH FGShoppingFest,T24Club,Payback
Cash Back FGShoppingFest
Cash Back FGShoppingFest,T24Club,Payback
Cash Back FGShoppingFest,T24Club
CASH FGShoppingFest,Payback
Informationen über diese Spalten - Was die Art der Bezahlung verwendet wird und in der Rabatt-Säule verwendet - es kann auf einem Produkt Einzel Rabatt oder mehr Rabatte angewandt werden.
Ich möchte Informationen aus diesen Spalten extrahieren, damit Clustering angewendet werden kann. Wie konvertiert man es in numerische Daten?
Aber numerische Spalten sind sehr wenige und das sind PIN-Code, Speicherstandort-ID, Produkt gekauft ID.Es gibt keine kontinuierliche Funktion außer einem Preis des Produkts. Glauben Sie nicht, dass diese Funktionen einen guten Einblick geben, da die numerischen Variablen nicht viel beitragen würden? –
Das habe ich nicht gesagt. Ich sagte, wählen Sie einen geeigneten Algorithmus für die Art von Daten, die Sie haben, nicht vorgeben, Ihre Daten sind für einen Algorithmus geeignet, wenn es eindeutig nicht ist ... –
Aber die Aufgabe ist von Clustering. Ich kann die wenigen Zeilen dieser CSV-Datei nicht einfügen. –