Ich habe Probleme mit der Satzvorhersage. Ich dachte, ich wollte Co-Vorkommen verwenden, um das zu lösen, aber jetzt, da ich es versucht habe, bin ich nicht sicher, ob es das richtige Werkzeug ist.Co-Vorkommen für Satzvorhersage
Ich habe eine Datenbank mit einigen Daten (jede Spalte zu einem bestimmten Element entspricht, wobei jede Reihe an jeden Satz entspricht), zB:
data:
[[1 0 1 1]
[1 1 1 1]
[1 0 1 1]]
I berechnen die Kookkurrenzmatrix:
cooccur_matrix:
[[0 1 3 3]
[1 0 1 1]
[3 1 0 3]
[3 1 3 0]]
Und jetzt habe ich einen unvollständigen Satz:
target:
[1 0 1 1]
das Punktprodukt meiner Co-Auftritts Matrix und das ist:
prediction:
[6 3 6 6]
Aber das ist überhaupt nicht das, was ich will. Was ich versuche, um wieder so etwas wie dieses:
prediction:
[1 0.33 1 1]
Oder:
prediction:
[0 0.33 0 0]
Irgendwelche Gedanken auf, was ich falsch mache? Ich bin ziemlich neu bei ML-Konzepten, und das scheint ein ziemlich einfaches Problem zu sein.
Apriori-Algorithmus zu starten. Der normale Empfehlungssystemalgorithmus würde ebenfalls funktionieren. – Mai
@Mai Ich dachte, die Methode, die ich benutze, ist, was ein normales Empfehlungssystem verwendet, ist es nicht? – theanine
Ich glaube nicht, dass Sie das Skalarprodukt der Konkurrenz nehmen würden, sondern die Zeilen oder Spalten der Rohmatrix nach der Normalisierung. Das ist Benutzer-Benutzer oder Artikel-Element CF. Sie können auch SVD ++ ausprobieren und so weiter. Ich bin mit inhaltsbasierten Methoden nicht vertraut, daher weiß ich nicht, auf welche Methode Sie sich beziehen. – Mai