2013-05-22 29 views
12

Wenn wir einen bekannten Wert in einer Spalte haben, wie können wir seinen Indexwert erhalten? Zum Beispiel:In PANDAS, wie man den Index eines bekannten Wertes erhält?

In [148]: a = pd.DataFrame(np.arange(10).reshape(5,2),columns=['c1','c2']) 
In [149]: a 
Out[149]: 
    c1 c2 
0 0 1 
1 2 3 
2 4 5 
........ 

Wie wir wissen, können wir einen Wert durch den entsprechenden Index erhalten, so.

In [151]: a.ix[0,1] In [152]: a.c2[0] In [154]: a.c2.ix[0] <-- use index 
Out[151]: 1   Out[152]: 1   Out[154]: 1   <-- get value 

Aber wie bekommt man den Index nach Wert?

Antwort

24

Es könnte mehr als eine Indexkarte, um Ihren Wert, ist es sinnvoll, eine Liste zurückzukehren:

In [48]: a 
Out[48]: 
    c1 c2 
0 0 1 
1 2 3 
2 4 5 
3 6 7 
4 8 9 

In [49]: a.c1[a.c1 == 8].index.tolist() 
Out[49]: [4] 
+0

Ein Index kann nicht eindeutige Einträge haben, warum sagen Sie es mehr Sinn macht, eine Liste zurückzukehren? –

+0

Hmm, ich denke es ist falsch. Wenn alle Indizes eindeutig sind, können wir den einzelnen Index erhalten durch 'a.c1 [a.c1 == 8] .index.tolist() [0]' – waitingkuo

+0

danke für Ihre Antwort, es ist ein gutes Ideal. Ich habe nicht berücksichtigt, dass Index-Objekt in einfache Liste .thanks agagin umgewandelt werden kann. – user2407991

4

umgekehrt numpy.where mit():

import numpy as np 
import pandas as pd 

In [800]: df = pd.DataFrame(np.arange(10).reshape(5,2),columns=['c1','c2']) 

In [801]: df 
Out[801]: 
    c1 c2 
0 0 1 
1 2 3 
2 4 5 
3 6 7 
4 8 9 

In [802]: np.where(df["c1"]==6) 
Out[802]: (array([3]),) 

In [803]: indices = list(np.where(df["c1"]==6)[0]) 

In [804]: df.iloc[indices] 
Out[804]: 
    c1 c2 
3 6 7 

In [805]: df.iloc[indices].index 
Out[805]: Int64Index([3], dtype='int64') 

In [806]: df.iloc[indices].index.tolist() 
Out[806]: [3] 
3

mit Hilfe des .loc [] Accessor:

In [25]: a.loc[a['c1'] == 8].index[0] 
Out[25]: 4 

auch die get_loc verwenden() durch 'c1' Einstellung als der Index. Dies ändert den ursprünglichen Datenrahmen nicht.

In [17]: a.set_index('c1').index.get_loc(8) 
Out[17]: 4 
0

Um die Index-Wert zu erhalten, einfach .index [0] bis zum Ende einer Abfrage hinzuzufügen. Dadurch wird der Index der ersten Zeile des Ergebnis zurück ...

Also, um Ihre Datenrahmen angewendet:

In [1]: a[a['c2'] == 1].index[0]  In [2]: a[a['c1'] > 7].index[0] 
Out[1]: 0       Out[2]: 4       

Wo die Abfrage mehr als eine Zeile zurückgibt, können die zusätzlichen Index Ergebnisse sein Zugriff durch Angabe des gewünschten Index, z .index [n]

In [3]: a[a['c2'] >= 7].index[1]  In [4]: a[(a['c2'] > 1) & (a['c1'] < 8)].index[2] 
Out[3]: 4       Out[4]: 3 
Verwandte Themen