Ich habe eine Ähnlichkeitsmatrix zwischen vier Benutzern. Ich möchte eine agglomerative Clusterbildung durchführen. der Code wie folgt aus:sklearn agglomerative Clustering Eingangsdaten
lena = np.matrix('1 1 0 0;1 1 0 0;0 0 1 0.2;0 0 0.2 1')
X = np.reshape(lena, (-1, 1))
print("Compute structured hierarchical clustering...")
st = time.time()
n_clusters = 3 # number of regionsle
ward = AgglomerativeClustering(n_clusters=n_clusters,
linkage='complete').fit(X)
print ward
label = np.reshape(ward.labels_, lena.shape)
print("Elapsed time: ", time.time() - st)
print("Number of pixels: ", label.size)
print("Number of clusters: ", np.unique(label).size)
print label
das Druckergebnis des Etiketts ist wie:
[[1 1 0 0]
[1 1 0 0]
[0 0 1 2]
[0 0 2 1]]
Bedeutet das, es ein Listen möglicher Cluster Ergebnis ergibt, können wir eine von ihnen wählen? wie die Wahl von: [0,0,2,1]. Wenn es falsch ist, könnten Sie mir sagen, wie man den agglomerativen Algorithmus basierend auf Ähnlichkeit durchführt? Wenn es richtig ist, ist die Ähnlichkeitsmatrix riesig, wie kann ich das optimale Clusterergebnis aus einer riesigen Liste auswählen?
Dank
Aber was, wenn er ein hierarchisches Clustering benötigt? – Itay