Wie rufe ich unique auf einem dask DataFrame auf?So rufen Sie unique() auf dask DataFrame
bekomme ich folgende Fehlermeldung, wenn ich versuche, es auf die gleiche Weise zu nennen, wie für einen regelmäßigen Pandas Datenrahmen:
In [27]: len(np.unique(ddf[['col1','col2']].values))
AttributeError Traceback (most recent call last)
<ipython-input-27-34c0d3097aab> in <module>()
----> 1 len(np.unique(ddf[['col1','col2']].values))
/dir/anaconda2/lib/python2.7/site-packages/dask/dataframe/core.pyc in __getattr__(self, key)
1924 return self._constructor_sliced(merge(self.dask, dsk), name,
1925 meta, self.divisions)
-> 1926 raise AttributeError("'DataFrame' object has no attribute %r" % key)
1927
1928 def __dir__(self):
AttributeError: 'DataFrame' object has no attribute 'values'
Will nicht 'len (np.unique (DDF [[ 'col1', 'col2']]))' in sich Arbeit? –
Nein, es gibt nur 1 zurück. Dies liegt daran, dass die Ausgabe 'np.unique (ddf [['col1', 'col2']])' 'array ([dd.DataFrame], dtype = object) ' –
femibyte
Was ist das gewünschte Ergebnis? Entfernen von doppelten Zeilen durch zwei Spalten Untermenge? – thebeancounter