2017-11-01 9 views
0

ich so newbie bin und vielen Dank im Voraus für die Beratungdiagonal Wert in Kookkurrenzmatrix

Ich möchte Co-Auftritts-Matrix machen, und anschließend Link unten

How to use R to create a word co-occurrence matrix

aber Ich kann nicht verstehen, warum der Wert von AA 10 in der Matrix unter ist. Es sollte 4 sein, nicht wahr? denn es gibt vier A

dat < - read.table (text = 'film tag1 tag2 TAG3

  • 1 AAA

  • 2 ACF

  • 3 BDC ', Kopfzeile = T)

crossprod (as.matrix (mtabulate (as.data.frame (t (dat [-1])))))

() ACFBD

A 10 1 1 0 0

C 1 2 1 1 1

F 1 1 1 0 0

B 0 1 0 1 1

D 0 1 0 1 1

Antwort

0

Die Lösung, die Sie verwenden, setzt voraus, dass jedes Tag nur einmal pro Film erscheint. Soweit ich weiß, handelt es sich um die Definition einer Co-Occupations-Matrix. Daher wird jedes A in der ersten Zeile als zusammen mit sich selbst und mit den anderen zwei A s gezählt gezählt, was zu insgesamt zehn Fällen führt, wenn die A in der zweiten Zeile eingerechnet wird.

+0

Vielen Dank! Ich habe es – Charley

+0

@ Charley Gern geschehen. Sie können diese Antwort als akzeptiert markieren, indem Sie auf das Häkchen-Symbol unter der Anzahl der Stimmen klicken. – Haem