归一化是一种简化计算的方式,即将有量纲的表达式,经过变换,化为无量纲的表达式,成为标量。 在多种计算中都经常用到这种方法(百度百科)。
假设有一组数列,或者说向量(1,2,3,4)
一、使用无穷范数归一化
无穷范数是指这组数列中最大的数,即4,归一化后结果为(1/4,2/4,3/4,4/4)。
假设(1,2,3,4)是某国不同阶层人均月收入,而(3,4,6,8)是另一国不同阶层的人均月收入。比较两国的贫富差距,一种方法是4-1=3,8-3=5,得出绝对贫富差分别为3和5.另一种方法是使用无穷级数进行归一化,得出其他阶层相对最高收入阶层的收入占比1/4和3/8.
二、使用Frobenius范数归一化
Frobenius范数(也称2范数)是指这列数列的平方和再开根号,即
,归一化后结果为(1/4.96,2/4.96,3/4.96)。
当该数列为欧式空间中的向量或点时,可以使用该归一化方法,比如,在文本处理过程中,假设数列为某一文本中四个不同的词的计数结果,则可以使用该数列表示该文本。当另一文本包含同样的四个词汇时,可以得到另一个数列,比如(2,4,6,8)。显然,影响计数结果的一个重要因素是文本长度,因此为了消除文本长度对统计结果的影响,通常使用2范数进行归一化。
三、Frobenius范数的推广
2范数可以推广到任意范数的归一化,其一般计算方法为:
其中,当n=1时,是最常见的归一化方式——将数列归一化到0~1之间。
|