2017-10-15 2 views

Antwort

3

Sie können dot und norm Methoden verwenden, um dies zu berechnen ziemlich leicht:

from pyspark.ml.linalg import Vectors 
x = Vectors.dense([1,2,3]) 
y = Vectors.dense([2,3,5]) 

1 - x.dot(y)/(x.norm(2)*y.norm(2)) 
# 0.0028235350472619603 

Mit scipy:

from scipy.spatial.distance import cosine 
​ 
x = np.array([1,2,3]) 
y = np.array([2,3,5]) 

cosine(x, y) 
# 0.0028235350472619603 
+1

Dank @Psidom, es funktioniert – Chao

Verwandte Themen