2013-12-10 11 views
143

Ich habe einen Datenrahmen, aus dem ich einige Zeilen entfernen. Als Ergebnis bekomme ich einen Datenrahmen, in dem der Index ungefähr so ​​ist: [1,5,6,10,11] und ich möchte ihn auf [0,1,2,3,4] zurücksetzen. Wie kann ich es tun?Wie setze ich den Index in einem Pandas-Datenrahmen zurück?

ADDED

Die folgende scheint zu funktionieren:

df = df.reset_index() 
del df['index'] 

Die folgende nicht funktioniert:

df = df.reindex() 

Antwort

318

reset_index() ist das, was Sie suchen. Wenn Sie nicht wollen, es als eine Spalte gespeichert, dann tun:

df = df.reset_index(drop=True) 
+47

+1 für 'drop = True' – Rhubarb

+53

Anstatt das Datenframe der gleichen Variablen neu zuzuweisen, können Sie das' inplace = True' Argument setzen. – ahuelamo

+1

Beachten Sie, dass die Methode im Falle von 'inplace = True' keine gibt – alyaxey

8

Andere Lösungen sind assign RangeIndex oder range:

df.index = pd.RangeIndex(len(df.index)) 

df.index = range(len(df.index)) 

Es ist schneller:

df = pd.DataFrame({'a':[8,7], 'c':[2,4]}, index=[7,8]) 
df = pd.concat([df]*10000) 
print (df.head()) 

In [298]: %timeit df1 = df.reset_index(drop=True) 
The slowest run took 7.26 times longer than the fastest. This could mean that an intermediate result is being cached. 
10000 loops, best of 3: 105 µs per loop 

In [299]: %timeit df.index = pd.RangeIndex(len(df.index)) 
The slowest run took 15.05 times longer than the fastest. This could mean that an intermediate result is being cached. 
100000 loops, best of 3: 7.84 µs per loop 

In [300]: %timeit df.index = range(len(df.index)) 
The slowest run took 7.10 times longer than the fastest. This could mean that an intermediate result is being cached. 
100000 loops, best of 3: 14.2 µs per loop 
+0

@Outcast Source - Die schnellste ist 'len (df.index)', 381ns vs 'df.shape' 1.17us. Oyr etwas fehlt? – jezrael

Verwandte Themen