2017-07-20 4 views
0

In Beispiel Code von Kmeans von Tensorflow,Kmeans Beispiel (tf.expand_dims)

, wenn die Verwendung der Funktion 'tf.expand_dims' (fügt eine Dimension von 1 in eine Form des Tensors.) In point_expanded, centroids_expanded vor berechnen tf.reduce_sum.

Warum haben diese verschiedene Indizes (0, 1) im zweiten Parameter?

import numpy as np 
import tensorflow as tf 
points_n = 200 
clusters_n = 3 
iteration_n = 100 
points = tf.constant(np.random.uniform(0, 10, (points_n, 2))) 
centroids = tf.Variable(tf.slice(tf.random_shuffle(points), [0, 0],[clusters_n, -1])) 
points_expanded = tf.expand_dims(points, 0) 
centroids_expanded = tf.expand_dims(centroids, 1) 
distances = tf.reduce_sum(tf.square(tf.subtract(points_expanded, centroids_expanded)), 2) 
assignments = tf.argmin(distances, 0) 
means = [] 
for c in range(clusters_n): 
    means.append(tf.reduce_mean(tf.gather(points,tf.reshape(tf.where(tf.equal(assignments, c)), [1, -1])), reduction_indices=[1])) 
new_centroids = tf.concat(means,0) 
update_centroids = tf.assign(centroids, new_centroids) 
init = tf.global_variables_initializer() 
with tf.Session() as sess: 
    sess.run(init) 
    for step in range(iteration_n): 
    [_, centroid_values, points_values, assignment_values] = sess.run([update_centroids, centroids, points, assignments]) 
    print("centroids" + "\n", centroid_values) 
plt.scatter(points_values[:, 0], points_values[:, 1], c=assignment_values, s=50, alpha=0.5) 
plt.plot(centroid_values[:, 0], centroid_values[:, 1], 'kx', markersize=15) 
plt.show() 

Antwort

0

Dies wird durchgeführt, um jeden Schwerpunkt von jedem Punkt zu subtrahieren. Stellen Sie zunächst sicher, dass Sie den Begriff des Rundsendens verstehen (https://docs.scipy.org/doc/numpy/user/basics.broadcasting.html) , der von tftract (https://www.tensorflow.org/api_docs/python/tf/subtract) verknüpft ist. Dann müssen Sie nur die Formen points, expanded_points, centroids und expanded_centroids zeichnen und verstehen, welche Werte wo "gesendet" werden. Sobald Sie das tun, werden Sie sehen, dass Broadcasting Ihnen erlaubt, genau das zu berechnen, was Sie wollen - subtrahieren Sie jeden Punkt von jedem Zentroid.

Da es sich um eine Plausibilitätsprüfung handelt, da 200 Punkte, 3 Schwerpunkte und jeder 2D ist, sollten wir 200 * 3 * 2 Unterschiede haben. Das ist genau das, was wir bekommen:

In [53]: points 
Out[53]: <tf.Tensor 'Const:0' shape=(200, 2) dtype=float64> 

In [54]: points_expanded 
Out[54]: <tf.Tensor 'ExpandDims_4:0' shape=(1, 200, 2) dtype=float64> 

In [55]: centroids 
Out[55]: <tf.Variable 'Variable:0' shape=(3, 2) dtype=float64_ref> 

In [56]: centroids_expanded 
Out[56]: <tf.Tensor 'ExpandDims_5:0' shape=(3, 1, 2) dtype=float64> 

In [57]: tf.subtract(points_expanded, centroids_expanded) 
Out[57]: <tf.Tensor 'Sub_5:0' shape=(3, 200, 2) dtype=float64> 

Wenn Sie Probleme haben, die Formen zeichnen, Sie (1, 200, 2) der Übertragung der expanded_points mit Dimension denken kann (3, 200, 2) als das Kopieren der 200x2-Matrix 3-mal entlang der ersten Dimension zu dimensionieren. Die 3x2-Matrix in centroids_expanded (der Form (3, 1, 2)) wird 200 mal entlang der zweiten Dimension kopiert.

+0

Vielen Dank für die nette Erklärung – Lazyer