2016-09-17 7 views
3

Ich habe einen Datenrahmen aus Kaggle San Fransico Gehälter extrahiert: https://www.kaggle.com/kaggle/sf-salaries und ich möchte eine Reihe der Werte einer Spalte, zum Beispiel 'Status' erstellen.Erstellen Sie ein Set aus einer Serie in Pandas

Dies ist, was ich versucht habe, aber es bringt eine Liste aller Datensätze anstelle des Satzes (sf ist, wie ich den Datenrahmen nenne).

a=set(sf['Status']) 
print a 

Laut dieser Webseite sollte dies funktionieren. How to construct a set out of list items in python?

+0

Warum tsay 'a' ist eine Liste? – tacaswell

+0

vielleicht habe ich den Begriff falsch verwendet, ich beziehe mich darauf, dass er mir alle Werte aus der Spalte gibt, ohne sich darum zu kümmern, ob es zum Beispiel reine nans ist –

Antwort

15

Wenn Sie nur eine Liste der eindeutigen Werte erhalten möchten, können Sie einfach unique Methode verwenden. Wenn Sie Python wollen das Set haben, dann tun set(some_series)

In [1]: s = pd.Series([1, 2, 3, 1, 1, 4]) 

In [2]: s.unique() 
Out[2]: array([1, 2, 3, 4]) 

In [3]: set(s) 
Out[3]: {1, 2, 3, 4} 

Wenn Sie jedoch Datenrahmen haben, nur Serie wählen aus ihm heraus (some_data_frame['<col_name>']).

Verwandte Themen