对于线性相关系数(Pearson r)的另一潜在的问题是相关的类型。Pearson r 仅仅是用来测量两变量线性相关关系;线性偏离会增加偏离回归线的总平方和,即使这些偏离能够体现两变量之间真正关系。存在非线性关系的可能性是为什么散点图作为估计关联的必要步骤的另一原因。下图显示了两变量存在强相关,但不能用线性方程描述出来。
测量非线性关联
如果遇到非线性的强关联,该怎么办(从散点图中知道)?这个问题的回答并不简单,因为没有类似Pearson r 这样易于使用的系数用于解决非线性关联。如果曲线是单调的(递减或递增),可以将其中一个或两个变量都进行转化,进行曲线直线化,然后再次计算相关系数。例如这种方法典型的例子即使将某一范围末尾值进行压缩的对数转化。如果关联是单调的,另一种方法是使用仅对等级型变量敏感的非参数性的关联系数(如Spearman R,见Nonparametrics and Distribution Fitting),这种情形就忽视了单调的可直线化曲线的特性。非参数关联一般来说其敏感性较差,有时甚至得不到结果。但是上述两种较为准确的方法并不能轻易使用,需要对数据进行大量的研究,因此必须: