1、写在前面
vegan包中的decostand()函数为群落生态学研究提供了一些流行的(和有效的)标准化方法。有关decostand()函数标准化的一些标准化方法可以看我的另一篇笔记:R语言入门:vegan包使用decostand()函数标准化方法
由于在网络上没有找到关于这两个转化的公式表示,而官方给出的解释又较为复杂,因此写了这篇笔记,帮助理解,方便日后复习查阅。
进行样方标准化时,可采用:"Hellinger"转化和"normalize"转化(弦转化)。
2、Hellinger转化
2.1 Hellinger转化过程解释
函数将使用边际总数来对数据进行标准化。对于每个值将被除以该行或列的总和,以使得每个值在标准化后的行或列的总加和为1,在此之后对结果取平方根,即Hellinger转化。也可以理解为:“total”标准化后取平方根,即hellinger转化。
2.2 Hellinger转化的公示表示
Hellinger转化的对象是一系列的列向量或者行向量,总归来说是对几串数字的计算,假设这里处理的是一个m行n列的矩阵(m X n),其中,m为样本/观测/样方/重复,n为物种。需要对其进行样方标准化,即对行进行标准化,这里采用Hellinger转化(标准化)。
若以其中一行举例(x1,x2,x3,x4,…,xn),则对于每一个元素xi标准化过程可以表示为:
2.3 Hellinger转化的代码实现
x.hel <- decostand(x, "hellinger", MARGIN, range.global, logbase = 2, na.rm=FALSE, ...)
注:若仅仅进行样方标准化,输入下面代码即可:
x.hel <- decostand(x, "hellinger")
参数说明:
- x: 群落数据,类似矩阵的对象,用于进行标准化处理。
- method: 标准化方法。
- MARGIN: 如果默认不可接受,则为边界。这里默认为1,即对行向量进行标准化。
- range.global: 在 method = "range" 中找到范围的矩阵。这允许在数据的子集之间使用相同的范围。 MARGIN 的维度必须与 x 匹配。
- logbase: 在 method = "log" 中使用的对数基数。
- na.rm: 忽略行或列标准化中的缺失值。
- zap: 使接近零的值成为精确的零,以避免负值和夸张的物种丰富度估计。
3、Normalize转化
3.1 Normalize转化过程解释
每行或每列的值都会被缩放,使得每行的平方和为1。这个转化也称为"弦转化" chord。
3.2 Normalize转化的公示表示
弦转化的对象是一系列的列向量或者行向量,总归来说是对几串数字的计算,假设这里处理的是一个m行n列的矩阵(m X n),其中,m为样本/观测/样方/重复,n为物种。需要对其进行样方标准化,即对行进行标准化,这里采用normalize转化(标准化)。
若以其中一行举例(x1,x2,x3,x4,…,xn),则对于每一个元素xi标准化过程可以表示为:
3.3 Normalize转化的代码实现
x.norm <- decostand(x, "normalize", MARGIN, range.global, logbase = 2, na.rm=FALSE, ...)
注:若仅仅进行样方标准化,输入下面代码即可:
x.norm <- decostand(x, "normalize")
参数说明(跟上面一样):
- x: 群落数据,类似矩阵的对象,用于进行标准化处理。
- method: 标准化方法。
- MARGIN: 如果默认不可接受,则为边界。这里默认为1,即对行向量进行标准化。
- range.global: 在 method = "range" 中找到范围的矩阵。这允许在数据的子集之间使用相同的范围。 MARGIN 的维度必须与 x 匹配。
- logbase: 在 method = "log" 中使用的对数基数。
- na.rm: 忽略行或列标准化中的缺失值。
- zap: 使接近零的值成为精确的零,以避免负值和夸张的物种丰富度估计。
4、Hellinger转化和弦转化的关系
根据上面公式表示,不难理解,Hellinger转化等同于数据先平方根转化后再进行弦转化。反过来说,弦转化是多度数据平方后的Hellinger转化。
参考:赖江山.《数量生态学——R语言的应用》. 北京:高等教育出版社
Package vegan version 2.6-4