Ich versuche, den NLTK KMeans Cluster zu verwenden, um einige Vektoren zu clustern. Ich habe einige 10-dimensionalen Vektoren, wenn ich versuchte, sie gruppieren, NLTK manchmal Fehler wie diese gibt:AssertionError bei Verwendung von NLTK KMeans Clustering
Traceback (most recent call last):
File "/home/yhz82415/workspace/Grouping/src/Driver.py", line 27, in <module>
main()
File "/home/yhz82415/workspace/Grouping/src/Driver.py", line 20, in main
KMeans(numClusters, dictionary)
File "/home/yhz82415/workspace/Grouping/src/Tools.py", line 78, in KMeans
clusters=clusterer.cluster(vectors, True)
File "/usr/local/lib/python2.7/dist-packages/nltk/cluster/util.py", line 51, in cluster
self.cluster_vectorspace(vectors, trace)
File "/usr/local/lib/python2.7/dist-packages/nltk/cluster/kmeans.py", line 70, in cluster_vectorspace
self._cluster_vectorspace(vectors, trace)
File "/usr/local/lib/python2.7/dist-packages/nltk/cluster/kmeans.py", line 109, in _cluster_vectorspace
new_means = map(self._centroid, clusters)
File "/usr/local/lib/python2.7/dist-packages/nltk/cluster/kmeans.py", line 149, in _centroid
assert len(cluster) > 0
AssertionError
Und der Fehler nicht immer kommen, manchmal tut es, manchmal nicht.
Ich habe den Demo-Code versucht, es funktioniert gut.
Hat jemand Tipps?
Vielen Dank im Voraus