Ich möchte eine Liste von Satz in Token, aber behalten negierte Verben als eindeutige Wörter.Python: Apostroph mit Verben
t = """As aren't good. Bs are good"""
print(word_tokenize(t))
['As', 'are', "n't", 'good', '.', 'Bs', 'are', 'good']
Ich möchte "sind nicht" und "sind" getrennt haben. Mit word_tokenize bekomme ich "nicht". Gleiches gilt für andere negierte Formen wie (Konnte nicht, nicht, usw.).
Wie kann ich es tun? Vielen Dank im Voraus
Vielen Dank für Ihre Antwort. – Elly