Was genau ist die lexsort_depth eines Multi-Index-Dataframe?

2014-11-25 6 views 13 likes

Was genau ist die lexsort_depth eines Multi-Index-Datenrahmens? Warum muss es für die Indexierung sortiert werden?Was genau ist die lexsort_depth eines Multi-Index-Dataframe?

Zum Beispiel habe ich festgestellt, dass nach manuell einen Multi-Index-Datenrahmen df mit Säulen Gebäude in drei Ebenen organisiert, wenn ich versuche zu tun:

idx = pd.IndexSlice 
df[idx['foo', 'bar']]

ich:

KeyError: 'Key length (2) was greater than MultiIndex lexsort depth (0)'

und an diesem Punkt, df.columns.lexsort_depth ist 0

, jedoch, wenn ich, wie empfohlen here und here:

df = df.sortlevel(0,axis=1)

dann die Querschnitts Indizierung funktioniert. Warum? Was genau ist lexsort_depth, und warum Sortierung mit sortlevel diese Art der Indexierung behebt?

Quelle

2014-11-25 Amelio Vazquez-Reina

Antwort

lexsort_depth ist die Anzahl der Ebenen eines Multi-Index, die lexikalisch sortiert sind. Das heißt, in einer a-b-c-1-2-3-Reihenfolge (normale Sortierreihenfolge).

So Element Indizierung wird Arbeit, wenn ein Multi-Index nicht sortiert ist, aber die Lookups können durchaus etwas langsamer sein (in 0.15.2, wird dies ein PerformanceWarning zeigt diese Art von Lookups zu tun, siehe here

unabhängig für die Ebene

der Grund, dass in der Regel eine gute Idee, das Sortieren ist, dass Pandas der Lage ist, um herauszufinden, Hash-basierte Indizierung zu verwenden, wo die Lage in einem bestimmten Niveau ist,. dann können Sie diese Indexer zu verwenden, das Finale zu finden Standorte.

Pandas nutzt np.searchsorted diese Orte zu finden, wenn seine sortiert. Wenn es nicht sortiert, dann muss man auf verschiedene (langsamere) Methoden zurückgreifen.

here ist der Code, der dies tut.

Quelle

2014-11-26 00:38:38 Jeff

Verwandte Themen

1. Was genau ist Papagei?
2. Was genau ist Java?
3. Was genau ist OData?
4. Was genau ist Gemfire?
5. Was genau ist libpng?
6. Was genau ist JSON?
7. Was genau ist Athen?
8. Was genau ist ContextStaticAttribute?
9. Was genau ist Augmentationspfad?
10. Was genau ist Werkzeug?
11. Was genau ist DEFAULT_COMPRESSION?
12. Was genau ist Container.DataItem?
13. Was genau ist sun.jnu.encoding?
14. Was genau ist PLINQ?
15. Was genau ist Rake?
16. Was genau ist die LLVM C++ API
17. Was genau ist die php.ini memory_limit?
18. Was genau ist die NHibernate-Sitzung?
19. Was genau ist ein ViewModel?
20. Was genau ist Appdomain recycling
21. Was genau ist eine "Konsole"?
22. Was genau ist dieser Fehler?
23. Was genau ist ein Stream?
24. Was genau ist ein Fremdschlüssel?
25. Was genau ist "ID == EditorInfo.IME_NULL"?
26. Was genau ist ein Regenbogenangriff?
27. Was genau ist selenese html?
28. Was genau ist ".alert span"?
29. Was genau ist ein Speicherseitenfehler?
30. Was genau ist ein "Schlüsselbehälter"?