Python: Apostroph mit Verben

Ich möchte eine Liste von Satz in Token, aber behalten negierte Verben als eindeutige Wörter.Python: Apostroph mit Verben

t = """As aren't good. Bs are good""" 
print(word_tokenize(t)) 
['As', 'are', "n't", 'good', '.', 'Bs', 'are', 'good']

Ich möchte "sind nicht" und "sind" getrennt haben. Mit word_tokenize bekomme ich "nicht". Gleiches gilt für andere negierte Formen wie (Konnte nicht, nicht, usw.).

Wie kann ich es tun? Vielen Dank im Voraus

Quelle

2017-11-11 Elly

Wenn Sie einzelne Wörter aus einem durch Leerzeichen getrennten Satz extrahieren möchten, verwenden Sie die Methode split() von Python.

t = "As aren't good. Bs are good" 
print (t.split()) 
['As', "aren't", 'good.', 'Bs', 'are', 'good']

Sie können auch andere Trennzeichen in der split() Methode angeben. wenn Sie Ihre Zeichenfolge tokenize basiert auf einer Vollstopp wollten, könnten Sie so etwas wie dies zum Beispiel tun:

print (t.split(".")) 
["As aren't good", ' Bs are good']

Lesen Sie die Dokumentation here.

Quelle

2017-11-11 12:03:51

Vielen Dank für Ihre Antwort. – Elly

Verwenden Sie Split von Re-Modul. https://docs.python.org/2/library/re.html

import re 
t = "As aren't good. Bs are good" 
list(filter(None,re.split(r"[\s+.]",t)))

Ausgang:

['As', "aren't", 'good', 'Bs', 'are', 'good']

Quelle

2017-11-11 12:09:41 jimidime

Python: Apostroph mit Verben

Antwort

Verwandte Themen