2017-01-30 2 views
-1

Ich möchte gerne häufiges Muster aus meinen Daten gewinnen. Mein Datensatz ist jedoch sehr groß. Zuerst muss ich es in Transaktionsdatenbankformat umwandeln. Die Sache ist, dass es in meiner Datenbank (500000 Datensätze) 402 einzigartige wiederkehrende Elemente gibt. Überall sehe ich fp-Wachstum Beispiele mit einem Datensatz von max 8 Zeichen (A, B, C, D, E, F, G, H), aber ich muss 402 einzigartige Gegenstände darstellen. Kann ich für diesen Algorithmus eine Kombination alphabetischer Zeichen verwenden? Oder gibt es andere Ansätze? Danke JungsWas sind die Eingabedaten für FP-Growth?

Antwort

1

Hängt von Ihrer Implementierung ab.

Aber es ist ziemlich Standard, um Dinge wie "Milch" und nicht nur einen Brief Artikel zu ermöglichen.

Verwandte Themen