Was ist das Äquivalent zu einer R Factor variable in Python pandas?Ältestes Äquivalent einer Faktorvariablen in Python Pandas
21
A
Antwort
18
Diese Frage scheint von einem Jahr zurück zu sein, aber da es noch offen ist, hier ist ein Update. Pandas hat categorical
dtype und es funktioniert sehr ähnlich factors
in R. finden Sie unter diesem Link für weitere Informationen eingeführt:
http://pandas-docs.github.io/pandas-docs-travis/categorical.html
einen Ausschnitt aus dem Link oben Reproduktion zeigt, wie ein „Faktor“ Variable in erstellen Pandas.
In [1]: s = Series(["a","b","c","a"], dtype="category")
In [2]: s
Out[2]:
0 a
1 b
2 c
3 a
dtype: category
Categories (3, object): [a < b < c]
6
Wenn Sie Modellierung usw. machen wollen, viele Leckereien für Faktor innerhalb der patsy library. Ich gebe zu, selbst damit zu kämpfen. Ich fand these slides hilfreich. Ich wünschte, ich könnte ein besseres Beispiel geben, aber das ist soweit ich es mir selbst gemacht habe.
-1
C# array containing category data
V # array containing numerical data
H = np.unique(C)
mydict = {}
for h in H:
mydict[h] = V[C==h]
boxplot(mydict.values(), labels=mydict.keys())
Verwandte Themen
- 1. R dcast Äquivalent in Python Pandas
- 2. Pandas - Äquivalent str.contains() in Pandas Abfrage
- 3. Aufteilen einer Datendatei in Python oder Pandas
- 4. Excel SVERWEIS Äquivalent in Pandas
- 5. Pandas-Äquivalent von np.where
- 6. Äquivalent von R/ifelse in Python/Pandas? Zeichenfolge-Spalten vergleichen?
- 7. Sapply Äquivalent in Python?
- 8. Plot Histogramme über Faktorvariablen
- 9. Yii Holtes ältestes Objekt aus db - findByAttributes
- 10. Plotten CDF einer Pandas-Serie in Python
- 11. Konstruieren einer Co-Vorkommensmatrix in Python Pandas
- 12. Äquivalent für LinkedHashMap in Python
- 13. Perl __DATA__ äquivalent in Python
- 14. python - strtotime äquivalent?
- 15. Python Äquivalent zu phpinfo()
- 16. Python: Java wirft Äquivalent in Python
- 17. Äquivalent für inject() in Python?
- 18. Python Dekorateur Äquivalent in PHP
- 19. MATLAB ksdensity Äquivalent in Python
- 20. .NET DataSet Äquivalent in Python
- 21. Machen Sie Frequenzhistogramm für Faktorvariablen
- 22. Wie wählt man alle Faktorvariablen in R
- 23. Python Pandas Conditional Summiert
- 24. Python-Äquivalent von Jstack?
- 25. "Anti-Merge" in Pandas (Python)
- 26. Python Pandas Datenrahmen: Sammeln Werte einer Spalte
- 27. Was ist das Äquivalent einer C# -Task in Python
- 28. Python-Äquivalent von PropertyUtilsBean
- 29. Äquivalent von "in" Schlüsselwort oder Unterabfrage in Pandas
- 30. DataFrame-Umwandlung in Python-Pandas
See [diese] (https://groups.google.com/forum/#!msg/pydata/figElKrdwcI/dISL07Id7dUJ). Es scheint, dass das pandas.Factor als Faktorspalten hinzugefügt hat. Aber ich denke nicht, dass dies genau gleich ist, insbesondere bei fehlenden Daten. – agstudy
http://stackoverflow.com/questions/7813132/convert-array-of-string-category-to-array-of-int-from-a-pandas-dataframe – Raufio