2016-10-31 4 views
0

Verwendung von Python und Datenrahmen Modul:NaN Wert, erste Zeichen in Zeichenfolge

df 

|ID 
|250000.9T1.008 
|821000.9S1.006 
|352300.144 

mit Python 3, Ich versuche, eine neue Spalte in einem Datenrahmen zu erstellen, die die ersten 6 Zeichen von Takes ID-Spalte Ich verwende die folgende Codezeile, dies zu tun:

df['ID1'] = df['ID'].str[:6] 

Ergebnis:

|ID    |ID1 
|250000.9T1.008 |250000 
|821000.9S1.006 |821000 
|352300.144  |NaN 

Meine Vermutung ist, dass eine Datentyp Problem mit dem dritten ID ist, da es keinen Brief enthält vielleicht wird es als int gelesen? Jede Hilfe wird geschätzt.

Antwort

1

Versuchen Sie Folgendes:

df['ID1'] = df['ID'].apply(lambda x: str(x)[:6]) 
+0

Das funktionierte. Vielen Dank! – sschade

+0

Gern geschehen;) – MMF

Verwandte Themen