2013-06-08 9 views
128

So verstehe ich vollständig, wie man resample verwendet, aber die Dokumentation macht keinen guten Job, die Optionen zu erklären.pandas resample Dokumentation

So sind die meisten Optionen in der resample Funktion sind ziemlich geradlinig mit Ausnahme dieser beiden:

  • Regel: die Offset-String oder ein Objekt Ziel Umwandlung darstellt
  • wie: string, Verfahren zum Down- oder Wieder- Probenahme, standardmäßig auf ‚bedeutet‘

so an wie viele Beispiele aus der Suche, wie ich online fand ich für Regel sehen Sie 'D' für Tag, 'xMin' für Minuten tun können, 'xL' für Millisekunden, aber das ist alles, was ich finden konnte.

, wie ich folgendes gesehen haben: 'first', np.max, 'last', 'mean' und 'n1n2n3n4...nx' wobei nx den ersten Buchstaben jedes Spaltenindex ist.

Also gibt es irgendwo in der Dokumentation, die ich vermisse, dass jede Option für pandas.resample Regel anzeigt und wie Eingänge? Wenn ja, wo, weil ich es nicht finden konnte. Wenn nein, was sind alle Optionen für sie?

+6

Für Wanderer Googles, für das Resampling mit 'wie = 'last'' und' how = 'first'': Vergessen Sie nicht, 'closed =' left ', label =' left' 'hinzuzufügen. [link] (https://github.com/pydata/pandas/issues/1998) –

+0

@ NasserAl-Wohaibi Ich bin ziemlich zuversichtlich, dass Ihr Kommentar oben ein Hinweis darauf ist, dass diese Optionen helfen können, die folgende Frage vollständig zu beantworten. Sind Sie schon einmal auf dieses Problem gestoßen? http://stackoverflow.com/questions/26247301/causal-resampling-values-within-time-window-until-now –

+0

how = 'last' ist jetzt veraltet zugunsten von 'resample (...). last() ' – shadi

Antwort

200
B  business day frequency 
C  custom business day frequency (experimental) 
D  calendar day frequency 
W  weekly frequency 
M  month end frequency 
SM  semi-month end frequency (15th and end of month) 
BM  business month end frequency 
CBM  custom business month end frequency 
MS  month start frequency 
SMS  semi-month start frequency (1st and 15th) 
BMS  business month start frequency 
CBMS custom business month start frequency 
Q  quarter end frequency 
BQ  business quarter endfrequency 
QS  quarter start frequency 
BQS  business quarter start frequency 
A  year end frequency 
BA  business year end frequency 
AS  year start frequency 
BAS  business year start frequency 
BH  business hour frequency 
H  hourly frequency 
T  minutely frequency 
S  secondly frequency 
L  milliseonds 
U  microseconds 
N  nanoseconds 

Siehe timeseries documentation. Es enthält eine Liste von offsets (und 'anchored' offsets) und einen Abschnitt über resampling.

Beachten Sie, dass es nicht eine Liste aller verschiedenen how Optionen ist, weil es jede NumPy Array-Funktion und eine beliebige Funktion sein kann, die über groupby dispatching verfügbar ist, können nach dem Namen how übergeben werden.

+1

" ... weil es eine beliebige NumPy-Array-Funktion sein kann und ... "- Ja, ich habe das in den Dokumenten gelesen, aber gibt es irgendwo Dokumentation, die genau erklärt, was genau diese Funktion tun soll und was sie zu tun hat mit dem Resampling ...? Ich fühle mich hier ziemlich verloren. – jhin

+0

Dies sollte in allen relevanten Dokumentationsbereichen wie Resample verlinkt sein. Hier ist der Link zu den Abkürzungen: http://pandas.pydata.org/pandas-docs/stable/timeseries.html#offset-aliases – wordsforthewise

63

Es gibt mehr zu bieten als das, aber du bist wahrscheinlich für diese Liste suchen:

B business day frequency 
C custom business day frequency (experimental) 
D calendar day frequency 
W weekly frequency 
M month end frequency 
BM business month end frequency 
MS month start frequency 
BMS business month start frequency 
Q quarter end frequency 
BQ business quarter endfrequency 
QS quarter start frequency 
BQS business quarter start frequency 
A year end frequency 
BA business year end frequency 
AS year start frequency 
BAS business year start frequency 
H hourly frequency 
T minutely frequency 
S secondly frequency 
L milliseconds 
U microseconds 

Quelle: http://pandas.pydata.org/pandas-docs/stable/timeseries.html#offset-aliases

+4

Warum gibt es nicht die 'Min' (wie die '5Min' in der Dokumentation)? – ziyuang