Ich versuche, Substantive aus Text mit Python Nltk-Paket zu extrahieren. Es hat mehr oder weniger funktioniert. Aber ich frage mich, wie man den nicht-alphabetischen Charakter am Ende der Wörter loswerden kann? Bitte beachten Sie das folgende Beispiel.Wie man das nicht alphabetische Zeichen am Ende des Wortes loswerden mit Python Nltk
from nltk.tag import pos_tag
x = "Back, Back: Back"
tagged_sent = pos_tag(x.split())
y = [word for word,pos in tagged_sent if pos == 'NNP']
Dann nimmt y Wert
['Back,', 'Back:', 'Back']
Was ich wirklich
['Back', 'Back', 'Back']