为什么我在 python 的 spearman 相关中得到 nan

我正在使用 scipy 来计算相关性。我计算斯皮尔曼相关性的代码如下。

from scipy import stats
sequence_1 = [1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0]
sequence_2 = [0, 0.009783728115345005, 0, 0, 0.0019759230121848587, 0.0007535430349118562, 0.0002661781514710257, 0, 0, 0.0007835762419683435]
myspearman = stats.spearmanr(sequence_1,sequence_2)
print(myspearman)

我从代码中得到以下结果。

SpearmanrResult(correlation=nan, pvalue=nan)

尽管在这个话题中有一些问题，但它们并没有回答我的问题。

我的问题如下。

我想以某种方式获得相关性的值。从这个意义上说，nan 的等效值是什么？
我的另一个问题是；有没有办法避免这种情况并在 python 中获取实际值？

如果需要，我很乐意提供更多细节。

python

推荐答案

为什么 spearmanr 输出 NaN ？

sequence_1 没有变化，因此它的标准差等于 0，这将导致 spearmanr() 函数中的零除，从而返回 NaN。

在这种情况下，NaN 的等效值是多少？

从数学上来说，当两个列表中的一个的标准偏差等于零时，Spearman 相关系数是未定义的（其中随机变量的所有实例取完全相同的值）。我建议您研究一下这里的公式，以便更好地理解为什么这不简单！

有没有办法避免这种情况并在 Python 中获得实际值？

由于实际值是未定义的，因此您确实可以使用 NaN 获得正确的值。但是，您可能希望依赖其他公式来解决此类问题，例如两个变量之间的协方差 - 在这种情况下，协方差将等于零。