Ich habe ein Stück Sätze und ich möchte die ungerichtete Kantenliste des Wortes Co-Auftreten und die Häufigkeit von jeder Kante zu sehen. Ich habe mir das tm
Paket angeschaut, aber ähnliche Funktionen nicht gefunden. Gibt es ein Paket/Skript, das ich verwenden kann? Danke vielmals!Build Wort Co-Vorkommen Kantenliste in R
Hinweis: Ein Wort tritt nicht zusammen mit sich auf. Ein Wort, das zweimal oder öfter erscheint, kommt mit anderen Wörtern nur einmal im selben Satz vor.
DF:
sentence_id text
1 a b c d e
2 a b b e
3 b c d
4 a e
5 a
6 a a a
OUTPUT
word1 word2 freq
a b 2
a c 1
a d 1
a e 3
b c 2
b d 2
b e 2
c d 2
c e 1
d e 1
@TylerRinker danke! Genau die Ausgabe sollte die gleiche bleiben wie Zeile 5 hat nur 'a' und in Zeile 6 'a' nicht mit sich selbst auftreten. – leoce