2017-08-09 6 views
0

Ich benutze den Apori-Algorithmus in R mit Arules. Ich habe eine riesige Menge an Daten für mich, und ich möchte, wenn überhaupt, keine Stichprobe verwenden. Ich muss wirklich nur Regeln sehen, die mit Gegenständen verbunden sind, die nicht oft verkauft werden.Arules, Unterstützung innerhalb eines Bereichs

Der Code, den ich jetzt bin mit ist:

basket_rules < - apriori (Daten, Parameter = list (sup = 0,7, conf = 0,2, target = "Regeln", Liste (MINLEN = 4, maxlen = 7))

ich will nur Regeln mit geringer Unterstützung, sondern wegen der Größe und der Art meiner Daten kann ich nicht bekommen es irgendein niedriger als 0,7 Ist es möglich, aa Reihe von Support zurückzukehren, um Speicherplatz zu sparen.

zum Beispiel so etwas wie: Liste (sup < = .05 und> =. 0001)

Alle anderen Ideen zur Begrenzung der Speichernutzung während der Ausführung des Avori sind sehr geschätzt.

Antwort

1

Die Art der Unterstützung (Abwärtsschließung) ermöglicht es Ihnen nicht, nur Itemsets/Regeln mit einer Unterstützung in einem bestimmten Bereich effizient zu generieren. Sie müssen immer zuerst alle häufigen Artikelsets erstellen und dann in der R-Implementierung in arules filtern. Es könnte Implementierungen von FP-Growth oder ähnlichen Algorithmen geben, die für Ihr Problem speichereffizienter sind.

Eine andere Möglichkeit, dieses Problem anzugehen, besteht darin, die Daten genauer zu betrachten. Vielleicht haben Sie mehrere Artikel, die in vielen Transaktionen vorkommen. Diese Elemente sind möglicherweise nicht interessant für Sie und Sie können sie vor den Miningregeln entfernen.

+0

Toller Rat! Ich habe einige der gebräuchlichsten Artikel gelöscht und das hat mir viel näher gebracht, wo ich sein möchte. Vielen Dank. – Coopa

Verwandte Themen