Ist es möglich, dass diese beiden Korrelationen unterschiedlich sind?pandas spearman Korrelation seltsam?
Pandas Version 0.18.1
from pandas import Series
a = ['Arsenal', 'Leicester', 'Man City', 'Tottenham', 'Crystal Palace']
b = ['Arsenal', 'Leicester', 'Man City', 'Tottenham', 'Man United']
c = ['Arsenal', 'Leicester', 'Man City', 'Tottenham', 'Man United']
d = ['Arsenal', 'Leicester', 'Man City', 'Tottenham', 'West Ham']
Series(a).corr(Series(b), method="spearman")
0.69999999999999996
Series(c).corr(Series(d), method="spearman")
0.8999999999999998
python 3.5.2 und anaconda 4.4.1 –
pandas muss diese Strings irgendwie ordnen und sie werden alphabetisch geordnet. Teams können daher je nach dem, was andere Teams sind, unterschiedlich eingestuft werden. Pandas berechnet "richtig", aber das ist nicht die Operation, die Sie wollten. –
Ich bin kein Statistiker, aber muss keine Korrelation in zwei Zahlenreihen durchgeführt werden? Was erwartest du als Ausgabe? In Pandas 0.19.2 stürzt der obige Beispielcode ab, da Zeichenfolgen keine Gleitkommazahlen sind. – nico