Wie kann ich Hauptkomponentenanalyse aus Daten in einem Pandas Dataframe berechnen?Hauptkomponentenanalyse mit Pandas Datenrahmen
Antwort
Die meisten sklearn Objekte arbeiten mit pandas
Datenrahmen gut, würde so etwas für Sie arbeiten?
import pandas as pd
import numpy as np
from sklearn.decomposition import PCA
df = pd.DataFrame(data=np.random.normal(0, 1, (20, 10)))
pca = PCA(n_components=5)
pca.fit(df)
Sie können die Komponenten zugreifen, sich mit
pca.components_
Das funktioniert super. Nur eine Ergänzung, die von Interesse sein könnte: Es ist oft praktisch, am Ende mit einem DataFrame zu enden, im Gegensatz zu einem Array. Um das zu tun, würde man etwas tun wie: pandas.DataFrame (pca.transform (df), Spalten = ['PCA% i'% i für i im Bereich (n_components)], index = df.index), wo ich habe Setze n_components = 5. Außerdem haben Sie einen Tippfehler im Text über dem Code, "Panadas" sollten "Pandas" sein. :) – Moot
- 1. Hauptkomponentenanalyse
- 2. Speicherleck mit Pandas Datenrahmen
- 3. Hauptkomponentenanalyse mit Eigenbibliothek
- 4. Pandas: create Datenrahmen value_counts mit
- 5. Pandas: Probleme mit verschmelzenden Datenrahmen
- 6. Plot Pandas Datenrahmen mit NaNs
- 7. Gruppierung Pandas Datenrahmen mit Bedingungen
- 8. Mit str.contains auf Pandas Datenrahmen
- 9. Kombiniere eine Liste von Pandas Datenrahmen zu einem Pandas Datenrahmen
- 10. Pandas: 2 Datenrahmen verschmelzen
- 11. Subsetting gestapelt Pandas Datenrahmen
- 12. Umbenennungsindex eines Pandas Datenrahmen
- 13. Pandas und Großer Datenrahmen
- 14. Pandas Datenrahmen cartesianischen verbinden
- 15. pandas: Einen Datenrahmen normalisieren
- 16. Verschachtelte Datenrahmen in Pandas
- 17. Format eines Pandas Datenrahmen
- 18. Pandas Datenrahmen extrahieren Strings
- 19. Pandas Datenrahmen zu AnguarJS
- 20. Pandas Datenrahmen insgesamt Reihe
- 21. Py Pandas .format (Datenrahmen)
- 22. Pandas: Zusammenführen von Datenrahmen
- 23. Fehlerfilterlisten in Pandas Datenrahmen
- 24. Pandas Datenrahmen vektorisiert Probenahme
- 25. Pandas: Update() Datenrahmen Problem
- 26. Datenrahmen in Pandas verschmelzen
- 27. Füllung kontinuierliche Pandas Datenrahmen aus Sparse Datenrahmen
- 28. Listen Datenrahmen für Pandas
- 29. Verständnis Pandas Datenrahmen Indizierung
- 30. Farbnummern in Pandas Datenrahmen
Nicht sicher, warum dies „Meinung basiert“? – BenDundee