1

Ich möchte die Semantik/Ähnlichkeit von Benutzer-Tags finden.Algorithmen zum Finden der Entfernung/Ähnlichkeit zwischen den Benutzer-Tags?

Jeder Benutzer kann maximal vier Tags verwenden. Zum Beispiel, Benutzer-1 ["Maschinelles Lernen", "Fotografie", "Data Science", "neuronales Netzwerk"], Benutzer-2 ["Maschinelles Lernen", "Data Science", "Statistik", "Mathematik"], User-2 ["Geophysik", "Maschinelles Lernen", "Kunst und Drucken", "Mathematik"].

Tags sind aus einer breiten Palette von Fähigkeiten. Ich möchte die Entfernung/Ähnlichkeit zwischen den Tags finden. Zum Beispiel: "Maschinelles Lernen", "Data Science" und "neuronales Netzwerk" sind nahe beieinander, ähnlich "Fotografie" und "Kunst und Druck" wären nahe beieinander.

Ich dachte daran, Word2Vec zu verwenden. Aber ich zögere, es in der Produktion zu verwenden, da ich es mit tausend Kategorien von Fähigkeitsdokumenten trainieren muss. Nicht nur, dass Benutzer im wirklichen Leben ihre Tags immer ändern/aktualisieren. Daher möchte ich einen dynamischen Algorithmus erstellen/entwickeln, der entsprechend dem Benutzer-Tag angepasst wird.

Ich bin ein Neuling in der Welt des maschinellen Lernens.

Antwort

1

Jedes Tag kann als BitMap (BitSet) dargestellt werden, ein einzelnes Bit repräsentiert einen bestimmten Benutzer mit diesem Tag oder nicht. Dann können Sie einige Ähnlichkeitsfunktionen wie Jaccard oder Ochiai

verwenden
Verwandte Themen