样本间距离说明
样本间距离是指样本之间的相似程度,可以通过数学方法估算。如前所述,样本间越相似,距离数值越小。
计算微生物群体样本间距离的方法有多种(eg: Jaccard、Bray-Curtis、Unifrac等。),这些算法主要分为两大类别:
OTU间是否关联
OTU是否加权
基于独立OTU
基于系统发生数
加权
Bray-Curtis
Weighted Unifrac
非加权
Jaccard
Unweighted Unifrac
基于独立OTU vs 基于系统发生树
二代测序当中,我们对16s rDNA某个区域进行测序后,会根据序列的相似度定义OTU。这个时候,基于独立OTU的计算方式认为OTU之间不存在进化上的联系,每个OTU间的关系平等。
而基于系统发生树计算的方法,会根据16s的序列信息对OTU进行进化树分类, 因此不同OTU之间的距离实际上有“远近”之分。
加权vs非加权
利用非加权的计算方法,主要考虑的是物种的有无,即如果两个群体的物种类型都一致,表示两个群体的β多样性最小。而加权方法,则同时考虑物种有无和物种丰度两个问题。
-
a物种
b物种
A群体
3
2
B群体
2
3
上表通过非加权方法计算,因为A群体与B群体的物种组成完全一致,都只由物种a和b组成,因此它们之间的β多样性为0。但通过加权方法计算,虽然A与B群体的组成一致,但物种a和b的数目却不同,因此两个群体的β多样性则并非一致(bray-curtis=1-2*(2+2)/(5+5)=0.2)。