Ich weiß, wie Bigramm und Trigramm Kollokationen mit NLTK und ich wenden sie an meine eigenen Korpora. Der Code ist unten.NLTK Kollokationen für bestimmte Wörter
Ich bin mir aber nicht sicher über (1) wie man die Kollokationen für ein bestimmtes Wort bekommt? (2) Hat NLTK eine Kollokationsmetrik basierend auf dem Log-Likelihood-Verhältnis?
import nltk
from nltk.collocations import *
from nltk.tokenize import word_tokenize
text = "this is a foo bar bar black sheep foo bar bar black sheep foo bar bar black sheep shep bar bar black sentence"
trigram_measures = nltk.collocations.TrigramAssocMeasures()
finder = TrigramCollocationFinder.from_words(word_tokenize(text))
for i in finder.score_ngrams(trigram_measures.pmi):
print i