Datensatz ist Pandas Datenrahmen. Dies ist sklearn.cluster.KMeansWird Pandas Dataframe-Objekt mit Sklearn Kmeans Clustering arbeiten?
km = KMeans(n_clusters = n_Clusters)
km.fit(dataset)
prediction = km.predict(dataset)
Dies ist, wie ich entscheiden, welche Unternehmen gehört zu den Cluster:
for i in range(len(prediction)):
cluster_fit_dict[dataset.index[i]] = prediction[i]
Dies ist, wie Daten-Set aussieht:
A 1 2 3 4 5 6
B 2 3 4 5 6 7
C 1 4 2 7 8 1
...
wo A, B , C sind Indizes
Ist dies die richtige Art der Verwendung von K-Means?
Ihre Frage ist ein wenig unklar, sklearn akzeptiert numpy Arrays als Eingänge im Allgemeinen und so Pandas Datenrahmen sind kompatibel, in bestimmten Fällen habe ich festgestellt, dass Sie für ein numpy Array zurück fragen müssen so: 'df.values' oder df. col.values' als Beispiel, also sollte es im Prinzip funktionieren, bitte versuchen Sie es und wenn Sie einen Haken haben kommen Sie zurück mit Code und Daten – EdChum