Ich versuche, eine Co-Occupancy-Matrix zu erstellen, um zu sehen, welche Keywords in meiner Datenbank häufig zusammen zugeordnet sind.Erstellen einer Co-Occupancy-Matrix aus einer .csv
Die Daten sehen so aus, es ist eine .csv-Datei.
id, keywords
1, apple;pear
2, apple;cherry
3, pear;cherry
4, apple;cherry
Und ich möchte so etwas wie dieses
apple pear cherry
apple 0 1 2
pear 1 0 1
cherry 2 1 0
Das Ziel erreichen wäre dann d3.js zu verwenden, um die Matrix zu visualisieren.
Ich habe dies in der R
-Tag veröffentlicht, weil ich es ein bisschen vorher für einige Klassen verwendet habe, also bin ich kein kompletter Neuling. Ich habe bei der Suche nach Lösungen gesehen, dass es auch möglich ist, Python zu verwenden, aber ich habe es nie in meinem Leben berührt.
Ich fand [auf diese Weise] (https://www.r-bloggers.com/turning-keywords-into -a-co-occurrence-network /) es zu tun, das scheint perfekt zu funktionieren für das, was ich tun will! –