Ich schreibe ein R Skript und verwende Bibliothek (Ngram).Warum gibt die Funktion ngrams() eindeutige Bigramme?
nehme ich eine Zeichenfolge haben,
„gut qualiti Hundefutter gekauft Sever vital Hundefutter Produkt gut qualiti Produkt wie Eintopf Prozess Fleisch aussehen gefunden riechen besser Labrador besser finicki appreci Produkt“
und möchte Bi-Gramm finden.
Die ngram Bibliothek gibt mir Bi-Gramm wie folgt:
„appreci Produkt“ „-Prozess Fleisch“ „Lebensmittelprodukt“ „Lebensmittel gekauft“ „qualiti dog“ „Produkt gefunden“ „Produkt look“ „aussehen wie „‚wie Eintopf‘‚good qualiti‘‚labrador finicki‘‚gekauft Sever‘‚qualiti Produkt‘‚besser labrador‘ ‚Hundefutter‘‚riecht besser‘‚vital‘‚Fleischgeruch‘‚gefunden gut‘“ sever vital "" Eintopf Prozess "" kann Hund "" finicki appreci "" Produkt besser "
Da der Satz" Hundefutter "zwei Mal enthält, möchte ich dieses Bi-Gramm zwei Mal. Aber ich bekomme es einmal!
Gibt es eine Option in der Bibliothek oder eine andere Bibliothek, die alle Bi-Gramm meines Satzes in R gibt?