2017-02-27 5 views
0

In Hierarchical Dirichlet Process gibt der Autor eine Interpretation von HDP mit chinesischen Restaurant Franchise. Es heißt, dass jedes Restaurant viele Tische hat und verschiedene Tische ein gemeinsames Gericht in einem Restaurant teilen. Das Gericht hier können wir als ein Thema in dem Dokument betrachten, dann wie Tabellen in jedem Dokument zu verstehen? Ich denke, verschiedene Tische sollten verschiedene Gerichte bestellen, wenn zwei Tische mit dem gleichen Gericht, dann warum nicht zu einem zusammenführen? Danke vielmals.Wie versteht man "Tabellen" im hierarchischen Dirichlet-Prozess (HDP)?

enter image description here

Antwort

0

Im chinesischen Restaurant Franchise (CRF) ist jedes Dokument ein Restaurant, ist jedes Wort ein Kunde, und Cluster-Parameter sind Gerichte auf Tabellen von einem globalen Menü serviert. Ein Kunde betritt ein Restaurant und sitzt an einem Tisch mit einer Wahrscheinlichkeit, die proportional zu der Anzahl von Kunden ist, die bereits an einem Tisch sind, oder er sitzt an einem neuen Tisch mit Wahrscheinlichkeits-Alpha. Neuen Tabellen wird dann ein bestimmtes Gericht mit einer Wahrscheinlichkeit zugeordnet, die proportional zu der Anzahl von Tabellen ist, die bereits dieses Gericht servieren, oder einem neuen Gericht mit Wahrscheinlichkeits-Gamma.

So haben wir für jeden Kunden einen Index, der den Kunden auf die Tabelle abbildet und für jede Tabelle haben wir einen Index, der die Tabelle auf eines der Gerichte abbildet. Ein Gibbs-Abtastalgorithmus tastet zuerst Tabellen ab, die Daten zugeordnet sind, und tastet dann mit jeder Tabelle verbundene Schüsseln ab. Für weitere Details siehe Yee Whye Teh's implementation.

Verwandte Themen