2016-04-28 7 views
1

Ich habe einen Datensatz, der Besuchshistorie von Kunden enthält.Lernen, das Verhalten zukünftiger Kunden aus der Historie vorherzusagen

Sie enthält drei Spalten im Datensatz, einschließlich Kunden-ID, AM/PM (Besuch bei AM oder PM) und Weekday/Weekend (Besuch am Wochentag oder am Wochenende).

Ich möchte aus diesem Datensatz lernen und die Top 50 Kunden auswählen, die die größte Chance haben, in bestimmten Eingaben (wie AM/Weekday) zu besuchen.

Momentan erzeuge ich ein Modell für jeden Kunden, indem ich ein Einklassen-SVM verwende (ich habe nur positive (Besuchs-) Daten). Da die Ein-Klassen-SVM nur eine binäre Ausgabe hat, kann ich nur sagen, dass der bestimmte Kunde bestimmte Eingaben besucht oder nicht, anstatt die Top-50-Kunden auszuwählen.

Ich frage mich, ob es einen Algorithmus gibt, der von einem Positiv-Nur-Datensatz lernen kann und einen Score oder eine Wahrscheinlichkeit wie Ausgabe geben kann?

+1

Dies ist eine Frage zu Data Science Stack Exchange (http://datascience.stackexchange.com/). Sie könnten dort mehr spezialisierte Meinung bekommen. Vielleicht möchten Sie auch einen Blick darauf werfen: https://pkghosh.wordpress.com/2015/07/06/customer-conversion-prediction-with-markov-chain-classifier/ – armatita

Antwort

0

Das ist ein Subkategorie-Problem innerhalb des maschinellen Lernens. Sie können eine Menge lernen, diese Umfrage zu lesen: "Ein-Klassen-Klassifikation: Taxonomie des Studiums und Überprüfung von Techniken" (http://arxiv.org/pdf/1312.0049.pdf). Ich hoffe es hilft.

Verwandte Themen