Ich verwende die Agglomeration von Scikit-Lernfunktionen, um ein hierarchisches Clustering-Verfahren für Features und nicht für die Beobachtungen zu verwenden.Feature-Agglomeration: Wie werden die Features abgerufen, aus denen die Cluster bestehen?
Dies ist mein Code:
from sklearn import cluster
import pandas as pd
#load the data
df = pd.read_csv('C:/Documents/data.csv')
agglo = cluster.FeatureAgglomeration(n_clusters=5)
agglo.fit(df)
df_reduced = agglo.transform(df)
Meine ursprüngliche df die Form hatte (990, 15), nach dem Merkmal Agglomeration mit, jetzt df_reduced hat (990, 5).
Wie finden Sie nun heraus, wie die ursprünglichen 15 Features zusammen geclustert wurden? Mit anderen Worten, welche originalen Features von df bilden jedes der 5 neuen Features in df_reduced?