Dieser Code durchläuft jedes Wort in word.words() aus der nltk-Bibliothek und schiebt dann das Wort in ein Array. Dann prüft es jedes Wort in dem Array, um zu sehen, ob es ein tatsächliches Wort ist, indem es die gleiche Bibliothek verwendet, und irgendwie sind viele Wörter seltsame Wörter, die überhaupt nicht real sind, wie "adighe". Was ist denn hier los?Words.word() aus dem nltk-Korpus enthält scheinbar seltsame nicht gültige Wörter
import nltk
from nltk.corpus import words
test_array = []
for i in words.words():
i = i.lower()
test_array.append(i)
for i in test_array:
if i not in words.words():
print(i)
Ah, danke. Nicht sicher, warum ich nicht versucht habe, die Zeile i = i.lower() zu entfernen. Danke trotzdem. –