2016-04-18 9 views
-1

Ich bin ein Student mit Rapidminer, und ich mache ein Projekt mit Yummly What's Cooking Datensatz (https://www.kaggle.com/c/whats-cooking/data). Der Datensatz umfasst 20 verschiedene Küchentypen (z. B. Italienisch, Chinesisch, Indisch usw.).Assoziationsregeln für Textdatei

Unser Ziel ist es, ein Data-Mining-Modell zu entwickeln, das die Art der Küche zukünftiger Gerichte durch Analyse der Zutatenliste des Gerichts identifiziert. Dazu verwenden wir Assoziationsregeln. Trotzdem bekomme ich "keine Regeln gefunden" und habe keine Ahnung warum. Ich denke, das hat etwas damit zu tun, dass meine Attribute als Text formatiert sind und nicht den nominalen Binomialoperator verwenden, aber ich bin mir nicht sicher, wie ich das beheben soll.

Derzeit mein Prozess sieht aus wie ....

Daten -> wählen Sie Eigenschaften - FP Wachstum> -> erstellen Verband

Regeln Können Sie helfen?

Antwort

0

Gemäß der Dokumentation für den FP-Growth-Operator müssen alle Attribute im Beispielsatz binomial sein.

Ich gebe zu - ich habe die Daten nicht direkt angeschaut, weil ich kein Konto auf Kaggle registrieren wollte, also bin ich mir nicht sicher, wie genau es formatiert ist, aber Sie würden wahrscheinlich festlegen möchten die Art der Küche als Etikett und dann jedes der verbleibenden Attribute repräsentieren jede Zutat, die in einem oder mehreren der Rezepte enthalten ist. Jedes Gericht hätte eine 1 in der Spalte, wenn die Zutat verwendet wird, und eine 0, wenn sie nicht verwendet wird. (Abhängig vom ursprünglichen Format der Daten, da Sie den Text erwähnt haben, können Sie die Textverarbeitungserweiterung ausprobieren, die ein Beispielset erstellen kann, wie ich es gerade beschrieben habe.) Wenn Sie dann die 0s und 1s zu konvertieren Binomial, sollten Sie in der Lage sein, FP-Growth zu verwenden.