2016-04-17 7 views
0

Ich habe Probleme mit der Satzvorhersage. Ich dachte, ich wollte Co-Vorkommen verwenden, um das zu lösen, aber jetzt, da ich es versucht habe, bin ich nicht sicher, ob es das richtige Werkzeug ist.Co-Vorkommen für Satzvorhersage

Ich habe eine Datenbank mit einigen Daten (jede Spalte zu einem bestimmten Element entspricht, wobei jede Reihe an jeden Satz entspricht), zB:

data: 
[[1 0 1 1] 
[1 1 1 1] 
[1 0 1 1]] 

I berechnen die Kookkurrenzmatrix:

cooccur_matrix: 
[[0 1 3 3] 
[1 0 1 1] 
[3 1 0 3] 
[3 1 3 0]] 

Und jetzt habe ich einen unvollständigen Satz:

target: 
[1 0 1 1] 

das Punktprodukt meiner Co-Auftritts Matrix und das ist:

prediction: 
[6 3 6 6] 

Aber das ist überhaupt nicht das, was ich will. Was ich versuche, um wieder so etwas wie dieses:

prediction: 
[1 0.33 1 1] 

Oder:

prediction: 
[0 0.33 0 0] 

Irgendwelche Gedanken auf, was ich falsch mache? Ich bin ziemlich neu bei ML-Konzepten, und das scheint ein ziemlich einfaches Problem zu sein.

+0

Apriori-Algorithmus zu starten. Der normale Empfehlungssystemalgorithmus würde ebenfalls funktionieren. – Mai

+0

@Mai Ich dachte, die Methode, die ich benutze, ist, was ein normales Empfehlungssystem verwendet, ist es nicht? – theanine

+0

Ich glaube nicht, dass Sie das Skalarprodukt der Konkurrenz nehmen würden, sondern die Zeilen oder Spalten der Rohmatrix nach der Normalisierung. Das ist Benutzer-Benutzer oder Artikel-Element CF. Sie können auch SVD ++ ausprobieren und so weiter. Ich bin mit inhaltsbasierten Methoden nicht vertraut, daher weiß ich nicht, auf welche Methode Sie sich beziehen. – Mai

Antwort

0

Es scheint wie, was ich wirklich brauchte, war Kosinusähnlichkeit, die auf eine Co-occurrence Matrix angewendet wurde. Dies scheint gut zu funktionieren (war aber sehr schwer zu lösen).

Verwandte Themen