Ich versuche, alle Wörter mit weniger als 4 Zeichen aus jedem Skalarwert in einer Pandas-Serie zu entfernen. Was ist der beste Weg, es zu tun? Hier ist mein gescheiterter Versuch:Entfernen Sie Wörter weniger als 4 Zeichen aus Pandas Series
df['text'] = df['text'].str.join(word for word in df['text'].str.split() if len(word)>3)
ich die folgende Fehlermeldung angezeigt:
AttributeError: 'generator' object has no attribute 'join'
ich anhand meines Versuch aus diesem Beitrag in Bezug auf das gleiches in einem String: Remove small words using Python
Randbemerkung: Wenn es besser ist, meine Wörter zu symbolisieren, bevor Sie sie mit weniger als 4 Zeichen entfernen, lassen Sie es mich bitte wissen.
EDIT: Jeder skalare Wert enthält Sätze, also möchte ich für alle Wörter weniger als eine Länge von 4 innerhalb des Wertes entfernen.
halte ich würde @piRSquared akzeptieren 's Lösung. Es ist mehr "pandonisch", ich fühle mich. Es wäre jedoch interessant, einige Leistungsvergleiche zu machen und den Schnellsten zu gewinnen! –